中文信息处理
维基百科,自由的 encyclopedia
中文信息处理是指用电子计算机对中文的音、形、义等信息进行处理和加工。中文信息处理是自然语言信息处理的一个分支,是一门与计算机科学、语言学、数学、信息学、声学等多种学科相关联的综合性学科。信息处理技术在现代有广泛的应用,从1980年代开始,中文信息处理进入了快速发展阶段,并极大地提高了中文社会的信息处理效率。
中文信息处理分为汉字信息处理与汉语信息处理两部分,具体内容包括对字、词、句、篇章的输入、存储、传输、输出、识别、转换、压缩、检索、分析、理解和生成等方面的处理技术。
基于历史、国家疆域、政治等各种问题,中文信息处理系统所需要处理的文字,有时不仅包括汉文(繁简体汉字),也包括藏文、蒙文、壮文、维吾尔文等大量中国少数民族的文字,周边国家的日语假名、谚文,还包括古汉语文字、西夏文、契丹文等各种不同的文字。
中文信息处理可以从硬体及软体两方面去看,以下详述中文信息处理的发展历史、现况及未来发展等多方面的面貌。