Топ питань
Часова шкала
Чат
Перспективи
Нейронний машинний переклад Google
З Вікіпедії, вільної енциклопедії
Remove ads
Нейронний машинний переклад Google (GNMT) — це система нейронного машинного перекладу (NMT), розроблена компанією Google і представлена в листопаді 2016 року, яка використовує штучну нейронну мережу для підвищення швидкості і якості перекладу в Google Перекладачі[1][2][3].
GNMT підвищує якість перекладу, застосовуючи метод машинного перекладу що базується на прикладах (EBMT), у якому система «навчається на мільйонах прикладів». Архітектура системного навчання GNMT була вперше випробувана на більш ніж ста мовах, що підтримуються Google Перекладачем. Завдяки потужній внутрішній структурі система з часом вчиться створювати якісніші й природніші переклади. GNMT здатна перекладати речення в цілому, а не частинами. GNMT здатна виконувати інтерлінгвальний машинний переклад, кодуючи семантику речення замість того, щоб запам'ятовувати переклади окремих фраз[4].
Remove ads
Історія
Узагальнити
Перспектива
Проєкт Google Brain був створений у 2011 році в «секретній дослідницькій лабораторії Google X» Джеффом Діном, співробітником Google, Грегом Коррадо, дослідником із Google, та Ендрю Ином, професором комп'ютерних наук Стенфордського університету[5][6][7]. Робота Ина лягла в основу одного з найбільших технологічних проривів у Google і Стенфорді[8].
У вересні 2016 року дослідницька група Google оголосила про розробку системи перекладу GNMT, і до листопада Google Перекладач почав використовувати нейронний машинний переклад (NMT) замість колишніх статистичних методів (SMT)[9][10][11], які використовувалися з жовтня 2007 року всередині власної закритої SMT-системи[12][13].
Система NMT всередині Google Перекладача використовує велику штучну нейронну мережу, придатну для глибокого навчання[1][2][3]. Вивчаючи мільйони прикладів, GNMT покращує якість перекладу, використовуючи ширший контекст для виведення найякіснішого перекладу. Потім результат перебудовується й пристосовується для відповідності граматиці людської мови.
GNMT не створила свою внутрішню універсальну мову, а скоріше прагнула знайти спільне між багатьма мовами, що має бути цікаво більше для психологів і лінгвістів, ніж для фахівців у галузі інформатики[14]. Новий механізм перекладу був включений в обидві сторони для дев'яти мов: англійської, іспанської, китайської, корейської, німецької, португальської, турецької, французької та японської у 2016 році[1]. У березні 2017 року були додані ще три мови: в'єтнамська, російська та хінді[15]. У тому ж місяці за допомогою спільноти Google Перекладача була додана підтримка арабської мови та івриту[16]. Далі наприкінці квітня 2017 року було додано підтримку дев'яти індійських мов, а саме: бенгалі, гуджараті, каннада, малаялам, маратхі, пенджабі, тамільської, телугу та гінді[17].
Remove ads
Мови, що підтримуються GNMT
Узагальнити
Перспектива
Нижче наведено список мовних пар, у яких для перекладу використовується модель нейронного машинного перекладу Google (NMT). Станом на липень 2017 року для всіх мов підтримується тільки переклад на англійську мову і назад[18]:
Remove ads
Прямий переклад
Стверджується, що система GNMT краще попереднього варіанту Google Перекладача тим, що вона може виконувати «прямий переклад», тобто перекладати з однієї мови на іншу безпосередньо (наприклад, з японської на корейську). Раніше Google Перекладач спочатку перекладав з початкової мови на англійську, а потім з англійської на кінцеву мову замість прямого перекладу з однієї мови на іншу[4].
Див. також
- Машинний переклад на основі прикладів
- Машинний переклад на основі правил[en]
- Порівняння застосунків для машинного перекладу[en]
- Статистичний машинний переклад
- Штучний інтелект
- Кешувальна модель мови[en]
- Обчислювальна лінгвістика
- Автоматизований переклад
- Історія машинного перекладу
- Список перспективних технологій
- Список науково-дослідних лабораторій машинного перекладу[en]
- Нейронний машинний переклад
- Машинний переклад
- Універсальний перекладач[en]
Remove ads
Примітки
Посилання
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads