語料庫語言學
維基百科,自由的 encyclopedia
語料庫語言學(英語:corpus linguistics)是基於語言運用的實例(即語料庫)的語言研究。語料庫語言學可以對自然語言進行語法與句法分析,還可以研究它與其他語言的關係。語料庫最初由手工完成,而現在主要是由電子計算機自動完成。
語料庫語言學家相信,可靠的語言分析需建立在新鮮的語料、自然的語言環境,和最小的實驗干擾之上。在語料庫語言學中,語料標註的意義眾說紛紜,從約翰·辛克萊(John McHardy Sinclair)[1]主張最少量的標註,並允許文本「為自己說話」,到「英語用法調查組」(設在倫敦大學學院)[2]鼓勵更多的標註,並認為它是通向更完備和嚴謹的語言理解的道路。