中文信息处理
维基百科,自由的 encyclopedia
中文资讯处理是指用电脑对中文的音、形、义等资讯进行处理和加工。中文资讯处理是自然语言资讯处理的一个分支,是一门与电脑科学、语言学、数学、资讯学、声学等多种学科相关联的综合性学科。资讯处理技术在现代有广泛的应用,从1980年代开始,中文资讯处理进入了快速发展阶段,并极大地提高了中文社会的资讯处理效率。
中文资讯处理分为汉字资讯处理与汉语资讯处理两部分,具体内容包括对字、词、句、篇章的输入、存储、传输、输出、识别、转换、压缩、检索、分析、理解和生成等方面的处理技术。
基于历史、国家疆域、政治等各种问题,中文资讯处理系统所需要处理的文字,有时不仅包括汉文(繁简体汉字),也包括藏文、蒙文、壮文、维吾尔文等大量中国少数民族的文字,周边国家的日语假名、谚文,还包括古汉语文字、西夏文、契丹文等各种不同的文字。
中文资讯处理可以从硬件及软件两方面去看,以下详述中文资讯处理的发展历史、现况及未来发展等多方面的面貌。