語料庫信息技术名词,大批量电子化自然语言样本所构成的集合 / 維基百科,自由的 encyclopedia 語料庫一詞在語言學上意指大量的文本,通常經過整理,具有既定格式與標記。 根據語料庫的特徵,可以分為單語語料庫、雙語語料庫、平行語料庫等,根據語料的來源,可以分為書面語語料庫、口語語料庫、作文語料庫、學習者語料庫、古文書語料庫等。[1]
語料庫一詞在語言學上意指大量的文本,通常經過整理,具有既定格式與標記。 根據語料庫的特徵,可以分為單語語料庫、雙語語料庫、平行語料庫等,根據語料的來源,可以分為書面語語料庫、口語語料庫、作文語料庫、學習者語料庫、古文書語料庫等。[1]