语料库
信息技术名词,大批量电子化自然语言样本所构成的集合 / 维基百科,自由的 encyclopedia
语料库一词在语言学上意指大量的文本,通常经过整理,具有既定格式与标记。
根据语料库的特征,可以分为单语语料库、双语语料库、平行语料库等,根据语料的来源,可以分为书面语语料库、口语语料库、作文语料库、学习者语料库、古文书语料库等。[1]
语料库一词在语言学上意指大量的文本,通常经过整理,具有既定格式与标记。
根据语料库的特征,可以分为单语语料库、双语语料库、平行语料库等,根据语料的来源,可以分为书面语语料库、口语语料库、作文语料库、学习者语料库、古文书语料库等。[1]