Почему Google Переводчик и аналоги работают неидеально: как устроены их алгоритмы

Содержание

Код ошибки 74005 гугл переводчик

Почему Google Переводчик и аналоги работают неидеально: как устроены их алгоритмы

Над автоматическими переводчиками начали работать ещё в середине XX века. После одного из успешных экспериментов в газетах писали, что скоро ручной перевод будет не нужен — переводчиков-людей заменят машины. С тех пор прошло 70 лет, но автоматический перевод всё ещё делает глупые и грубые ошибки. Что с ним не так?

Почему раньше онлайн-переводчиками было невозможно пользоваться без смеха

Ещё 5-7 лет назад любой онлайн-переводчик выдавал наборы фраз, в которых с трудом можно было уловить смысл текста. Если вы переводили с иностранного языка на родной, то это можно было исправить. Но при переводе с родного языка на иностранный сразу было видно, что поработал Google Translate или другой переводчик. Виной всему была сама технология — статистический машинный перевод.

Чтобы лучше понимать, почему переводчики раньше были такими топорными, давайте коротко пройдёмся по основным технологиям, которые использовались для обработки текстов на разных языках. Работа над автоматизированными системами перевода начались ещё в середине XX века. Сначала в них использовали правила, которые составляли лингвисты. Их количество было огромным, а результат работы всё равно провальным. Переводчики не справлялись с многозначными словами и не понимали устойчивые выражения.

Разочарование от первых систем перевода было таким большим, что почти 30 лет никто не вкладывал в эту сферу большие деньги. Всё изменилось в начале 1990-х годов, когда одна из исследовательских групп компании IBM разработала новую переводную модель. Ключевая идея технологии — концепция канала с ошибками, которая рассматривает текст на языке A как зашифрованный текст на языке Б. Задача переводчика — расшифровать фрагмент.

Основой для модели IBM стали документы канадского правительства, написанные на английском и французском языках. Именно эта пара стала первой, над которой стали работать специалисты. Они собрали вероятности для всех сочетаний слов определённой длины на одном языке и вероятности для соответствия каждого из таких сочетаний сочетанию на другом языке. Фактически алгоритм пытается найти самую частотную фразу на языке А, которая имеет хоть какое-то отношение к фразе на языке Б.

Система статистического машинного перевода IBM стала прорывной. С появлением интернета у специалистов появился доступ к огромному количеству данных на разных языках. Исследователи сконцентрировались на сборе корпуса параллельных текстов — одинаковых документов, написанных на разных языках. Это протоколы международных организаций, научные материалы, публицистика. При их изучении устанавливалось соответствие предложений и слов. Например, при сравнении текстов на разных языках система понимает, что «cat» и «кошка» — вероятные переводы друг друга.

В статистической модели машинного перевода каждому слову и фразе соответствует числовой идентификатор, который определяет частоту использования в языке. При переводе предложение разбивается на независимые части. Для каждого элемента этого массива подбирается потенциальный перевод. Затем система собирает несколько вариантов предложения на другом языке и выбирает из них оптимальный с точки зрения сочетаемости слов.

Но машинный перевод всё равно работал неидеально. Главная проблема состояла в том, что слова и фразы переводились независимо. Переводчики не учитывали контекст и даже не согласовывали части предложения. Другая проблема — нехватка параллельных текстов. Из-за этого сложно установить соответствие. В качестве универсального связующего языка в статистическом машинном переводе используется английский.

Результат получается близким к натуральным, но даже в такой короткой цепочке могут возникнуть ошибки из-за многозначных слов.

Нейросети сделали перевод заметно лучше — иногда его сложно отличить от человеческого

Нейросети тоже анализируют массив параллельных текстов — в этом смысле ничего не изменилось. Но вместо простых идентификаторов при нейросетевом подходе используется векторное представление. Каждый вектор состоит из чисел, которые характеризуют слово по лексическим и семантическим признакам.

При статистическом машинном переводе исходное предложение разбивается на слова и фразы, после чего система ищет для них соответствие в другом языке. При нейросетевом переводе предложение переводится целиком. Оно превращается в векторное пространство, где у каждого слова есть вектор длиной в несколько сотен чисел. Нейросеть определяет взаимосвязь между словами, даже если они находятся в разных концах предложения. Поэтому перевод получается более натуральным.

Почему Google Переводчик и аналоги работают неидеально: как устроены их алгоритмы

Несмотря на появление нейросетевого подхода, от статистического машинного анализа пока полностью не отказались. Например, в Яндекс. Переводчике используется гибридная модель перевода, которая включает статистический и нейросетевой подходы. После обработки текста двумя моделями в работу включается алгоритм, который выбирает лучший вариант.

Перевод стал лучше, но всё ещё очень много ошибок. Нейросети не справляются?

Количество ошибок в переводе зависит от многих факторов. Среди них — родство языков и объём данных, на которых была обучена нейросеть.

Например, алгоритмы Google Translate обучали на языковых парах «английский — испанский» и «английский — французский». Судя по результатам исследования, профессиональные переводчики оценили качество обработки текста в этих парах почти на уровне человеческого перевода.

Почему Google Переводчик и аналоги работают неидеально: как устроены их алгоритмы

Чем ближе языки друг к другу по структуре, тем выше точность перевода. Но если взять языки из разных систем — например, русский и японский, то здесь универсальные переводчики начинают хромать.

При нейросетевом переводе тоже используется корпус параллельных текстов. Соответственно, сохраняется проблема с нехваткой данных. Если параллельных текстов не хватает для перевода, в ход идёт язык-посредник — английский. Из-за этого возникают неточности. Вы можете сами это легко проверить, если переведёте предложение последовательно на несколько языков.

Например, вот перевод одного из абзацев из этой статьи: русский — английский — монгольский — венгерский — русский. Было так:

«Количество ошибок в переводе зависит от многих факторов. Среди них — родство языков и объём данных, на которых была обучена нейросеть».

Почему Google Переводчик и аналоги работают неидеально: как устроены их алгоритмы

Перевод получился корявым. С другой стороны, это абсолютно бессмысленный эксперимент. Вряд ли в реальной жизни кому-то требуется такая цепочка. Но результаты проверки как раз показывают, что происходит с переводом, когда между языками не хватает параллельных текстов.

Как можно улучшить работу онлайн-переводчиков

По словам разработчиков из команды Яндекса по машинному переводу, один из перспективных путей улучшения качества переводчиков — усиление роли контекста. Он может включать предыдущее предложение, информацию о сущностях и лицах, упомянутых в тексте, сведения о том, из какого места на веб-странице взят фрагмент.

Любой специалист по переводу скажет, что чем больше контекста или справочной информации, тем проще обрабатывать текст. Это легко проверить. Когда вы учите язык и начинаете на нём читать книги или смотреть фильмы, то часть слов понимаете просто из контекста.

Как это работает на примере онлайн-переводчика? Самая очевидная ситуация — система при переводе обращает внимание на предыдущее предложение. Как минимум это позволяет решить проблему с местоимениями. Учитывая контекст предыдущего предложения, переводчик выбирает правильный род для подлежащего или дополнения.

Почему Google Переводчик и аналоги работают неидеально: как устроены их алгоритмы

Улучшить качество перевода помогает также добавление в обучающий массив аудио и видео. Сейчас разработчики собирают данные. Например, если в приложении Google Translate запустить режим «Преобразование речи в текст», то появится предупреждение о том, что сделанная вами аудиозапись будет отправлена на обработку в Google. Компания может хранить расшифровку аудио в течение определённого времени в целях улучшения «Переводчика».

Сложность обработки аудиозаписей в том, что в них часто нет контекста. Когда люди разговаривают друг с другом, даже через переводчика, они используют и другие способы коммуникации — например, жестикулируют. Однако добавление аудио всё равно приносит пользу — чем больше данных, тем точнее перевод.

Помогают сделать сервисы лучше и люди. Например, в Яндексе работает группа лингвистической экспертизы, в которую входят редакторы-эксперты и переводчики. Они передают тексты в выборку для машинного обучения.

Google предлагает пользователям стать участниками сообщества «Переводчика», чтобы улучшать качество переводов и добавлять новые языки. Участники сообщества проверяют переводы. Варианты с высокими оценками от специалистов показываются со специальным значком — вы наверняка его видели.

Почему Google Переводчик и аналоги работают неидеально: как устроены их алгоритмы

Внести свою лепту в развитие «Google Переводчика» может каждый. Например, можно нажать на кнопку «Редактировать перевод» и предложить свой вариант. Он будет отправлен на рассмотрение участникам сообщества. Если они проголосуют за ваш вариант как за корректный, то он станет основным в переводчике.

Чтобы голосовать за варианты перевода и добавлять свои фразы, нажмите на кнопку «Сообщество» на главной странице Google Translate. Система предложит выбрать два языка. После этого вы сможете выбирать корректные варианты и делать онлайн-переводчик лучше.

Почему Google Переводчик и аналоги работают неидеально: как устроены их алгоритмы

Сейчас работа Google Translate, Яндекс. Переводчика и других подобных сервисов всё ещё кажется неидеальной. Но если оглянуться назад, то они стали переводить тексты намного точнее. По крайней мере, их возможностей уже сейчас достаточно для того, чтобы свободно общаться с носителями разных языков.

Как в Google Chrome включить и отключить переводчик: почему не переводит

В интернете только 20-30% информации доступно или переведено на русский язык, большая её часть существует только в оригинале: на английском, немецком и т. п. Чтобы ознакомиться с содержимым на незнакомом языке, можем включить перевод страницы в Гугл Хром, сам переводчик уже интегрирован в браузер, его нужно лишь запустить. Один из сервисов Google – это популярнейший в мире языковой преобразователь, который вмещает сотни различных языков и отличается довольно точным переводом. Именно он встроен в веб-обозреватель Гугл. Наша основная задача – познакомить читателя с основными возможностями переводчика и способами управления.

как включить перевод страницы в гугл хром

Что представляет собой переводчик Гугл Хром

Если максимально упростить представление, то переводчик Google Chrome – это огромный словарь. Библиотека вмещает миллионы слов, фраз и выражений с их правильным переводом. Её наполняет сообщество. Каждому пользователю предлагается возможность уточнить правильность перевода на родной язык. Наиболее частый вариант обычно и используется переводчиком. Уже миллионы людей помогли совершенствоваться сервису Гугл, что положительно сказалось на качестве его работы.

Более того, искусственный интеллект автоматически анализирует страницы на английском и прочих известных языках. Редко встречаемые конструкции и фразы, вызывающие сомнения, отправляются на проверку людям.

За года существования сервиса качество перевода улучшилось многократно. Раньше он умел только переводить отдельные слова и самые распространённые выражения. Попытка перевода текста часто приводила к получению набора несвязных конструкций. Сейчас количество неверных и неудобочитаемых элементов после перевода страниц в Гугл Хром существенно снизилось, их доля составляет 5-30% в зависимости от тематики и сложности текста.

Как работает встроенный переводчик в Гугл Хром

Принцип элементарен, но требует больших ресурсов, которыми Google обладает. Приблизительно алгоритм работы выглядит так:

Только в виде текста процедура выглядит долгой, на самом деле браузер Гугл Хром может перевести страницу за секунду-две, а иногда и быстрее. Чтобы сократить время ожидания, смена языка выполняется поэтапно. Сначала затрагивается первый фрагмент, который сейчас находится в фокусе веб-обозревателя. После пролистывания страницы вниз, переводится вторая часть текста. Так происходит до того момента, пока содержимое не закончится.

Как сделать перевод страницы в Гугл Хром для конкретного сайта

Google Chrome переводчик представлен в двух видах: в качестве встроенного компонента веб-обозревателя и в роли отдельного веб-сервиса. Оба варианта можем использовать для выполнения смены языка содержимого на целевой странице. Обычно удобнее всего использовать предустановленный элемент браузера, так как его можем настроить на автоматический перевод страниц для Гугл Хрома и не нужно открывать отдельных сайтов. Однако, во время использования поисковой системы, быстрее выполнить перевод через специальный сервис.

Важно! Чтобы встроенный компонент заработал, предварительно нужно его включить. По умолчанию он уже активен, но в случае изменения параметров, его придётся снова запустить.

Как включить переводчик в Гугл Хром:

Метод 1: используем всплывающую подсказку

переводчик гугл хром

Самый простой способ перевести страницу в браузере Гугл Хром – нажать на кнопку «Перевести». Уведомление «Перевести эту страницу» появляется при загрузке сайтов на иностранных языках. Дав разрешение функции выполнить перемену языка содержимого, контент через несколько секунд отобразится в удобочитаемом виде.

Метод 2: через контекстное меню

В случае отсутствия подсказки, перевод в Гугл Хром можем инициировать вручную за два клика.

Как перевести страницу Google Chrome:

Метод 3: при помощи ярлыка в поисковой строке

переводчик в гугл хром как включить

Фирменный перевод Google Chrome можем активировать и через поисковую строку. Значок переводчика отображается в правой её части. Если на него нажать один раз, отобразится аналогичное уведомление, как при первом запуске сайта. Остаётся только подтвердить действие кнопкой «Перевести».

Метод 4: через сайт Гугл Переводчика

Универсальный сервис-переводчик подходит не только для браузера Гугл Хром, также работает и в остальных веб-обозревателях. То, что услуга не привязана к конкретному ПО – это её основной плюс.

Как перевести страницу на русский в Google Chrome, Opera, Яндекс. Браузере, Mozilla Firefox и пр.:

как включить перевод в гугл хром

Как включить автоперевод в Google Chrome

Если нет особых познаний в иностранных языках, но использовать содержимое зарубежных сайтов приходится часто, можем настроить автоматический перевод страниц в Гугл Хром. Есть возможность персонализировать переводчик таким образом, чтобы автоперевод в Google Chrome выполнялся для английского, немецкого, французского и других языков.

Быстрый способ

Особенность метода в том, что активировать перевод страницы на русский в Гугл Хром можем выполнить только с основного языка сайта, на котором находимся. Доступа к настройке прочих языков способ не обеспечивает.

Как включить автоматический переводчик в Гугл Хром:

Более точный метод

Достоинство способа – можем персонализировать автоматический переводчик сайтов для Гугл Хром с разных языков. Не нужно искать, например, французский сайт, чтобы включить автоперевод с этого языка и т. п.

Как в Гугл Хром включить стандартный переводчик страниц в автоматический режим:

Как переводить сайты в Гугл Хром через дополнения

В сети существует ряд расширений для перевода страниц в Гугл Хром. Они скорее служат альтернативой, чем заменой стандартному переводчику. Обычно их используем для уточнения перевода. Если какой-то фрагмент из предустановленного элемента кажется неточным, можем запустить аддон. Из нескольких переводов уже проще подобрать более удачный по смыслу вариант.

Способ 1: используя дополнение Гугл Переводчик

Существует расширение для Chrome – Google переводчик, которое устанавливается поверх встроенного аналога, но абсолютно с ним не конфликтует. Особенность дополнения в том, что плагин Гугл переводчика для Хром не выполняет автоматическую смену языка содержимого. Существует 2 варианта использования расширения: перевод фраз или целых страниц.

Как перевести фрагмент контента через расширение Гугл переводчик для Chrome:

Ещё можем скопировать содержимое, нажать на изображение преобразователя языка в меню расширений и вставить текст в строку.

Как использовать расширение переводчика сайтов для Гугл Хром:

По поводу использования Google Translator есть несколько нюансов:

Способ 2: через LinguaLeo English Translator

Есть возможность скачать и установить расширение-переводчик для Гугл Хром от известного сайта по изучению английского языка. Дополнение не позволяет выполнять полный перевод содержимого страницы, но даёт возможность смотреть значение любого неизвестного слова и предлагает выполнять смену языка для целых фраз. В первом случае достаточно выделить слово, его перевод автоматически отобразится рядом, при чём покажется сразу несколько значений слова.

Как использовать онлайн-переводчик в Гугл Хром:

Способ 3: посредством ImTranslator

Расширение-переводчик для Гугл Хром под названием ImTranslator отличается от конкурентов возможностью быстрого получения текста на доступном для понимания языке в нескольких вариантах. Дополнение может сделать перевод любого содержимого в браузере Google Chrome через: сервис от Гугл, Microsoft, Translator и Yandex. Чтобы получить разные варианты, достаточно переключиться между сервисами одним кликом. Таким образом приложение позволяет получить наиболее точное истолкование содержимого.

Способ 4: при помощи Яндекс. Переводчика

Как включить перевод в Гугл Хром на Android

Есть несколько вариантов выполнить перевод страницы в Google Chrome на смартфоне:

Почему не работает переводчик в Google Chrome

Существует несколько известных причин, по которым не работает переводчик в Гугл Хром, и большая часть из них поддаются ручному исправлению.

Почему не переводит Гугл Хром:

Как отключить автоматический перевод в Гугл Хром

Чтобы убрать автоперевод в Гугл Хром, нужно выполнить абсолютно идентичные действия, как и в случае с его включением, а именно открыть меню переводчика (из поисковой строки) нажать на «Параметры» и кликнуть на «Всегда переводить английский» или другой язык. Флажок с пункта исчезнет и автоперевод перестанет тревожить. Однако, постоянные предложения сменить язык продолжат поступать.

Избавиться от назойливых сообщений от переводчика можем несколькими способами:

Теперь мы умеем выполнять перевод сайтов в Гугл Хром разными способами и при помощи различных сервисов. Осталось подобрать самый подходящий вариант для поставленных задач, и использовать его. Также мы рассмотрели, почему зависает переводчик и как это можем исправить. Если же окно перевода только мешает, предлагаем отключить его.

Источники:

https://trashbox. ru/link/how-online-translators-works

https://guidecomp. ru/kak-v-google-chrome-vklyuchit-i-otklyuchit-perevod-stranits-pochemu-ne-rabotaet. html

Понравилась статья? Поделиться с друзьями:
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: