Топ-100 Статистический машинный перевод - разновидность машинног..
Назад

Статистический машинный перевод - разновидность машинного ..

Статистический машинный перевод
                                     

Статистический машинный перевод

Статистический машинный перевод - разновидность машинного перевода, где перевод генерируется на основе статистических моделей, параметры которых являются производными от анализа двуязычных корпусов текста.

Статистический машинный перевод-это отличие от машинного перевода, основанную на правилах Rule-Based Machine Translation RBMT (Правило, на основе машинного перевода RBMTБЫЛ) и примеры Example-Based MT EBMT (Пример на основе ЕВМТ Т).

Первые идеи статистического машинного перевода был опубликован Уоррен Уивер Warren Weaver (Уоррен Уивер), в 1949 году. "Вторая волна" - начало 1990-х, IBM. "Третья волна" - Google (Гугл), Microsoft (Майкрософт), Language Weaver (Язык Уивер), Яндекс.

Разработчики систем машинного перевода, чтобы улучшить качество введем некоторые "сквозные" правила, тем самым превращая чисто статистическая система гибридного машинного перевода. добавляя некоторые правила, то есть, создание гибридных систем, улучшает качество переводов, особенно при недостаточном объеме входных данных, используемых для построения индекса машинный переводчик.

                                     

1. Языковые модели. (Language models)

Как языковые модели в статистической перевод системы используются в основном для различных модификаций н-г модель, утверждая, что "грамматичность" выбор следующего слова в формировании текста определяется только по тому, что n-1 слова идут перед ним.

  • N-граммы. (N-grams)
  • - Достоинства: - высокое качество перевода для фраз, которые целиком помещаются в n-граммную модель.
  • - Недостатки: - качественный перевод возможен только для фраз, которые целиком помещаются в n-граммную модель.
                                     

2. Статистические модели перевода. (Statistical models of translation)

  • По словам Word-based translation (Слово-перевод) - WBT (ВБТ).
  • По синтаксису Syntax-based translation (Синтаксис-на основе перевода) - SBT (СБТ).
  • По иерархическим фразам Hierarchical phrase-based translation (Иерархическая фраза-перевод) - HPBT.
  • По фразам Phrase-based translation (Фраза-перевод) - PBT (ПБТ).