![]() ![]() |
語料、語料庫與語料庫語言學 |
作者:admin 文章來源:本站原創(chuàng) 點擊數(shù) 更新時間:2011-11-16 文章錄入:admin 責任編輯:admin |
|
語料、語料庫與語料庫語言學 ■語料 簡單地,“語料”就是語言材料,包括口語材料,也包括書面語材料。語料的原始來源可能是教材、報紙、綜合性刊物、專業(yè)刊物、圖書等。語料所涉及的學科門類也比較復雜,比如包括: ◆人文與社會科學類 政法類:哲學 政治 宗教 法律 歷史類:歷史 考古 民族 社會類:社會學 心理 語言文字 教育 文藝理論 新聞 民俗 經(jīng)濟類:工業(yè)經(jīng)濟 農(nóng)業(yè)經(jīng)濟 政治經(jīng)濟 財貿(mào)經(jīng)濟 藝術類:音樂 美術 舞蹈 戲劇 文學類:小說 散文 傳記 報告文學 科幻 口語 軍體類:軍事 體育 生活類 ◆自然科學類 數(shù)理類、生化類、天文地理類、海洋氣象類、農(nóng)林類、醫(yī)藥衛(wèi)生類 ◆綜合類 行政公文類:請示 報告 批復 命令 指示 布告 紀要 通知等 章程法規(guī)類:章程 條例 細則 制度 公約 辦法 法律條文等 司法文書類:訴訟 辯護詞 控告信 委托書等 商業(yè)文告類:說明 廣告 調查報告 經(jīng)濟合同等 禮儀辭令類:歡迎詞 賀電 訃告 唁電 慰問信 祝酒詞等 實用文書類:請假條 檢討 申請書 請愿書等 ■語料庫 語料庫(corpus)簡單地說,就是眾多語料的集合體。它是指按照一定的語言學原則,運用隨機抽樣方,收集自然出現(xiàn)的連續(xù)語言運用文本或話語片段而建成的具有一定容量的大型電子文本庫。 語料庫通常具有以下三個基本特征: ◆語料庫中存放的是在語言的實際使用中真實出現(xiàn)過的語言材料。 ◆語料庫是承載語言知識的基礎資源,但并不等于語言知識。 ◆真實語料需要經(jīng)過加工(分析和處理)才能成為有用的資源。 ■語料庫語言學 語料庫語言學是一門新型科學,它指的是在文本語料的基礎上進行語言研究的一門學科。語料庫語言學以大量精心采集而來的真實文本(authentic texts)為研究素材,主要通過概率統(tǒng)計的方法得出結論,因此語料庫語言學從本質上講是實證性的(empirical)。 下面是國外一些語言學家對“語料庫語言學”的定義: ◆根據(jù)篇章材料對語言的研究稱為語料庫語言學。(K. A ijmer & B. itenberg, 1991) ◆基于現(xiàn)實生活中語言運用的實例進行的語言研究稱為語料庫語言學。(T.McEnery & A.Wilson, 1996) ◆以語料為語言描寫的起點或以語料為驗證有關語言的假說的方法稱為語料庫語言學。(D.Crystal, 1991) |
![]() ![]() |