Корпорация Google добавила в свой онлайн-переводчик Google Translate 110 новых языков, сообщается в пресс-релизе компании.
«Google Translate устраняет языковые барьеры, помогая людям общаться и лучше понимать окружающий мир. Мы постоянно применяем новейшие технологии, чтобы больше людей могли получить доступ к этому инструменту <…>. Мы используем искусственный интеллект, чтобы расширить спектр поддерживаемых языков. Благодаря нашей языковой модели PaLM 2 мы добавим в Google Translate 110 новых языков, что станет крупнейшим расширением за всю историю», — говорится в заявлении компании.
В Google также отметили, что на добавленных языках говорят более 614 миллионов человек, или около 8% населения планеты. Около четверти новых языков — африканские.
Как пояснили в корпорации, выбрать единственно «правильный» вариант написания и включить его в переводчик невозможно, так как в языках есть множество диалектов и стандартов правописания.
«Наш подход заключается в том, чтобы приоритезировать часто используемый вариант каждого языка. Например, цыганский — это язык, который имеет множество диалектов по всей Европе. Наши модели создают текст, наиболее близкий к влакс-цыганскому, на котором говорят в юго-восточной Европе. Но в нем также присутствуют элементы других диалектов», — отметили в компании.
В базу Google-переводчика, помимо прочих, добавили и языки народов, проживающих в России. В частности, аварский, башкирский, бурятский, чеченский, чувашский, осетинский, удмуртский, тувинский, якутский, крымско-татарский.