Google神經機器翻譯系統(英語:Google Neural Machine Translation,簡寫:GNMT),是Google開發的神經機器翻譯(NMT)系統,於2016年11月推出,它使用類神經網路來提高Google翻譯的流暢度和準確性。[1][2][3]Google神經機器翻譯系統通過應用基於實例的英語Example-based machine translation(EBMT)機器翻譯方法來改進翻譯品質,系統會從數百萬個範例中學習。[2]翻譯系統提出的系統學習架構首先通過Google翻譯支援的一百多種語言進行了測試。[2]隨著大型端到端英語End-to-end principle框架的發展,系統會隨著時間的推移學習,做出更好,更自然的翻譯。[1]GNMT能夠一次翻譯整句句子,而不是逐字翻譯。[2][4]

歷史

谷歌大腦項目於2011年由Google研究員傑夫·迪恩格雷戈·科拉多斯坦福大學電腦科學教授吳恩達Google X秘密實驗室成立。[5][6][7]吳恩達的工作令Google和史丹佛大學取得了突破。[8]

2016年9月,Google研究團隊宣布開發Google神經機器翻譯系統,同年11月,Google翻譯停止使用其自2007年10月以來一直使用的專有統計機器翻譯(SMT)技術,開始使用神經機器翻譯(NMT)。[1][9][10][11][12][13]

Google翻譯的NMT系統使用了一種能夠深度學習的大型人造神經網路。[1][2][3]GNMT使用通過使用數百萬更廣泛的來源來推斷出最相關的翻譯,提高翻譯的品質。然後將結果重新排列並組成基於人類語言的語法翻譯。GNMT提出的系統學習架構通過Google翻譯支援的語言進行了測試。GNMT沒有建立自己的普遍語言,而是針對許多語言之間發現的共同點,因此心理學家語言學家電腦科學家對此更感興趣。[14]2016年,Google翻譯的其中八種語言開始嘗試使用此系統,包括英語法語德語西班牙語葡萄牙語中文日語韓語土耳其語[15]2017年3月,增加了俄語印地語越南語[16]同月,因谷歌翻譯社群的幫助下,添加了對希伯來語阿拉伯語的支援。[17]2017年4月底,增加了9種印度語言的支援,包括印度語孟加拉語馬拉地語古吉拉特語旁遮普語泰米爾語泰盧固語馬拉雅拉姆語康納達語[18]

零點(Zero-shot)翻譯

GNMT系統改進了以前的Google翻譯系統,GNMT系統可以處理「零點翻譯」,即直接將一種語言翻譯成另一種語言(例如中文日文)。以前Google翻譯會先將源語言英語Source language翻譯成英文,然後將英文翻譯成目標語言英語target language,而不是直接從一種語言翻譯成另一種語言。[4]

參考文獻

外部連結

Wikiwand in your browser!

Seamless Wikipedia browsing. On steroids.

Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.

Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.