|
語料、語料庫與語料庫語言學 | |||
作者:admin 文章來源:本站原創 點擊數: 更新時間:2011-11-16 |
|
||
說明:引用此文請注明出處,并務請保留后面的有效鏈接地址,謝謝!
語料、語料庫與語料庫語言學 ■語料 簡單地,“語料”就是語言材料,包括口語材料,也包括書面語材料。語料的原始來源可能是教材、報紙、綜合性刊物、專業刊物、圖書等。語料所涉及的學科門類也比較復雜,比如包括: ◆人文與社會科學類 政法類:哲學 政治 宗教 法律 歷史類:歷史 考古 民族 社會類:社會學 心理 語言文字 教育 文藝理論 新聞 民俗 經濟類:工業經濟 農業經濟 政治經濟 財貿經濟 藝術類:音樂 美術 舞蹈 戲劇 文學類:小說 散文 傳記 報告文學 科幻 口語 軍體類:軍事 體育 生活類 ◆自然科學類 數理類、生化類、天文地理類、海洋氣象類、農林類、醫藥衛生類 ◆綜合類 行政公文類:請示 報告 批復 命令 指示 布告 紀要 通知等 章程法規類:章程 條例 細則 制度 公約 辦法 法律條文等 司法文書類:訴訟 辯護詞 控告信 委托書等 商業文告類:說明 廣告 調查報告 經濟合同等 禮儀辭令類:歡迎詞 賀電 訃告 唁電 慰問信 祝酒詞等 實用文書類:請假條 檢討 申請書 請愿書等 ■語料庫 語料庫(corpus)簡單地說,就是眾多語料的集合體。它是指按照一定的語言學原則,運用隨機抽樣方,收集自然出現的連續語言運用文本或話語片段而建成的具有一定容量的大型電子文本庫。 語料庫通常具有以下三個基本特征: ◆語料庫中存放的是在語言的實際使用中真實出現過的語言材料。 ◆語料庫是承載語言知識的基礎資源,但并不等于語言知識。 ◆真實語料需要經過加工(分析和處理)才能成為有用的資源。 ■語料庫語言學 語料庫語言學是一門新型科學,它指的是在文本語料的基礎上進行語言研究的一門學科。語料庫語言學以大量精心采集而來的真實文本(authentic texts)為研究素材,主要通過概率統計的方法得出結論,因此語料庫語言學從本質上講是實證性的(empirical)。 下面是國外一些語言學家對“語料庫語言學”的定義: ◆根據篇章材料對語言的研究稱為語料庫語言學。(K. A ijmer & B. itenberg, 1991) ◆基于現實生活中語言運用的實例進行的語言研究稱為語料庫語言學。(T.McEnery & A.Wilson, 1996) ◆以語料為語言描寫的起點或以語料為驗證有關語言的假說的方法稱為語料庫語言學。(D.Crystal, 1991) |
|||
文章錄入:admin 責任編輯:admin | |||
【發表評論】【加入收藏】【告訴好友】【打印此文】【關閉窗口】 |
|
||||||
| 網站地圖 | 版權申明 | 設為首頁 | 加入收藏 | 會員中心 | 取回密碼 | 友情鏈接 | 用戶留言 | 管理登錄 | ||||
|