Недавно разработчики Google Translate сильно улучшили качество перевода с помощью нейросетей. Для технооптимистов это стало поводом похоронить очередную профессию - мол, скоро переводчики будут не нужны, программы будут переводить тексты не хуже людей. Но не всё так просто.
Известный учёный и писатель Дуглас Хофштадтер в своём эссе на Atlantic указывает на слабые места машинного перевода. Текст для машины - просто набор слов и знаков. Компьютер не может понимать текст, слова в машине не преобразуются в идеи и образы. Вспомните мысленный эксперимент с китайской комнатой. Машинный переводчик - это как раз такая китайская комната.
Нейросети не спасают ситуацию. Даже с ними машинный перевод - это просто отображение статистических закономерностей и фактов, вроде «чаще всего фраза Х в языке 1 переводится на язык 2 как Y». Для многих случаев этого достаточно - с помощью Google Translate я читаю в интернете статьи на языках, которых не знаю, и это действительно похоже на магию. Но настоящий перевод - это не просто статистический анализ слов, это пересказывание мыслей и идей на другом языке.
Хофштадтер показывает, как хваленый нейросетевой Google Translate не справляется с простыми предложениями - путает местоимения, не понимает редко употребляемые выражения, не чувствует контекст. Для идеального машинного перевода нам рано или поздно придётся научить машину понимать текст, и это, по мнению Хофштадтера, один из главных вызовов, которые стоят перед разработчиками переводчиков. Текст очень хорошо написан, рекомендую потратить полчаса своего времени и прочитать его.
Хороший пост в тему: разработчик Яндекса рассказывает о проблемах машинного перевода
Как Google Translate перевели на новый уровень с помощью нейросетей
Большой текст с историей машинного перевода
Известный учёный и писатель Дуглас Хофштадтер в своём эссе на Atlantic указывает на слабые места машинного перевода. Текст для машины - просто набор слов и знаков. Компьютер не может понимать текст, слова в машине не преобразуются в идеи и образы. Вспомните мысленный эксперимент с китайской комнатой. Машинный переводчик - это как раз такая китайская комната.
Нейросети не спасают ситуацию. Даже с ними машинный перевод - это просто отображение статистических закономерностей и фактов, вроде «чаще всего фраза Х в языке 1 переводится на язык 2 как Y». Для многих случаев этого достаточно - с помощью Google Translate я читаю в интернете статьи на языках, которых не знаю, и это действительно похоже на магию. Но настоящий перевод - это не просто статистический анализ слов, это пересказывание мыслей и идей на другом языке.
Хофштадтер показывает, как хваленый нейросетевой Google Translate не справляется с простыми предложениями - путает местоимения, не понимает редко употребляемые выражения, не чувствует контекст. Для идеального машинного перевода нам рано или поздно придётся научить машину понимать текст, и это, по мнению Хофштадтера, один из главных вызовов, которые стоят перед разработчиками переводчиков. Текст очень хорошо написан, рекомендую потратить полчаса своего времени и прочитать его.
Хороший пост в тему: разработчик Яндекса рассказывает о проблемах машинного перевода
Как Google Translate перевели на новый уровень с помощью нейросетей
Большой текст с историей машинного перевода