中文資訊處理
維基百科,自由的 encyclopedia
中文資訊處理是指用電腦對中文的音、形、義等資訊進行處理和加工。中文資訊處理是自然語言資訊處理的一個分支,是一門與電腦科學、語言學、數學、資訊科學、聲學等多種學科相關聯的綜合性學科。資訊處理技術在現代有廣泛的應用,從1980年代開始,中文資訊處理進入了快速發展階段,並極大地提高了中文社會的資訊處理效率。
中文資訊處理分為漢字資訊處理與漢語資訊處理兩部分,具體內容包括對字、詞、句、篇章的輸入、儲存、傳輸、輸出、辨識、轉換、壓縮、檢索、分析、理解和生成等方面的處理技術。
基於歷史、國家疆域、政治等各種問題,中文資訊處理系統所需要處理的文字,有時不僅包括漢文(繁簡體漢字),也包括藏文、蒙文、壯文、維吾爾文等大量中國少數民族的文字,周邊國家的日語假名、諺文,還包括古漢語文字、西夏文、契丹文等各種不同的文字。
中文資訊處理可以從硬件及軟件兩方面去看,以下詳述中文資訊處理的發展歷史、現況及未來發展等多方面的面貌。