Новости Google Translate потерял лидерство? Китайские модели Hunyuan-MT от Tencent превзошли западных конкурентов в 30 из 31 языковых пар

NewsMaker

I'm just a script
Премиум
20,323
46
8 Ноя 2022
Новый ИИ-переводчик выиграл тест WMT25.


x4p7sz5hj9hmbxh209m3dn55ktzxqfv3.jpg


Китайская компания Tencent открыла исходный код новой серии языковых моделей Hunyuan-MT, специально оптимизированных для задач перевода. Разработчики утверждают, что алгоритмы демонстрируют более высокие результаты, чем Google Translate, на популярном бенчмарке WMT25.

В серию входят четыре модели, включая два флагмана — Hunyuan-MT-7B и Hunyuan-MT-Chimera-7B, каждая из которых содержит 7 миллиардов параметров. Помимо них представлены две сжатые версии, использующие меньше памяти, но работающие с небольшой потерей качества перевода.

Для обучения Tencent использовала четыре набора данных. Два из них включали тексты на 33 языках без переводов, а два других — несколько миллионов пар фраз и их переводов. Такой подход позволил объединить знание языков с общей эрудицией.

Эффективность моделей проверили с помощью теста MMLU-Pro, предназначенного для оценки общих знаний. Hunyuan-MT показала более высокие результаты, чем Llama-3-8B-Base, несмотря на меньший объём параметров.

После начального обучения модели прошли дополнительный этап с применением обучения с подкреплением. Tencent предоставляла им задания и обратную связь по качеству перевода, что позволило повысить точность.

Качество оценивалось отдельной системой ИИ, которая анализировала смысловое соответствие перевода оригиналу и корректность использования терминологии в разных областях.

Первая модель серии, Hunyuan-MT-7B, построена на классической архитектуре языковых моделей. Вариант Chimera-7B использует ансамблевый метод — несколько нейросетей обрабатывают запрос одновременно, а затем их ответы объединяются в итоговый вариант с более высоким качеством.

В тестах WMT25, сравнивающих переводы по 31 языковой паре, Hunyuan-MT превзошла Google Translate в 30 случаях. По отдельным парам результат оказался на 65% выше.

Кроме того, серия Tencent показала лучшие результаты, чем GPT-4.1 и Claude 4 Sonnet от Anthropic, в большинстве языковых пар того же бенчмарка.
 
Источник новости
www.securitylab.ru

Похожие темы