Топ-100 Машинный перевод на основе трансформации является разнов..
Назад

Машинный перевод на основе трансформации является разнови ..

Машинный перевод на основе трансформации
                                     

Машинный перевод на основе трансформации

Машинный перевод на основе трансформации является разновидностью машинного перевода. В настоящее время это один из наиболее распространённых методов машинного перевода. В отличие от более простой модели прямого MП, MП на основе трансформации разделяет процесс перевод на три этапа: анализ текста на исходном языке для определения его грамматической структуры, перевод результирующей структуры в структуру, подходящую для производства текста на языке перевода, и генерацию текста. Таким образом, системы МП на основе трансформации способны использовать знания исходного языка и языка перевода.

                                     

1. Устройство. (Device)

Основе перевода на основе преобразования и межъязыковой машинный перевод-это же идея о том, что для того, чтобы осуществить перевод, необходимо получить промежуточное представление. Он может быть использован, чтобы исправить смысл первоначального предложения, затем построить правильный перевод. В межъязыковой МП это промежуточное представление должно быть независимым от языка оригинала и языка перевода, в то время как в случае с МП, основанные на передаче, есть определенная степень зависимости от конкретных языковых пар. способы работы МП систем на основе преобразования существенным образом различаются, но в целом они следуют той же схеме: применение набора лингвистических правил, определение соответствий между структурой исходного языка и языка. первый этап включает анализ входного текста с точки зрения морфологии и синтаксиса иногда семантика создать промежуточное представление. из полученных представлений с помощью двуязычных словарей и грамматических правил построения образовали перевод. эта стратегия позволяет получить достаточно качественный перевод с верности оригинальные заказ 90% однако, точность сильно зависит от языковой пары и определяется степень близости двух конкретных языков.

                                     

2. Процесс перевода. (The translation process)

В системе МП на основе правил, оригинальный текст впервые анализируется с точки зрения морфологии и синтаксиса с целью получения синтаксическое представление. Это представление может быть в дальнейшем изменены в сторону меньшей спецификация, в связи с необходимостью сосредоточить внимание на наиболее важных для перевода фрагменты, игнорируя прочая информация. В процессе окончательной трансформации представительство по-прежнему присутствует на языке оригинала преобразуется в представление одного и того же уровня специфичности в языке. Эти два представления называются промежуточными представлений. процесс преобразования представлений в целевом языке в тексте состоит из тех же этапов производится в обратном порядке.

                                     

3. Анализ и трансформация. (Analysis and transformation)

Пока не будет окончательного результата, может обратиться к различным методам анализа и преобразований. вместе с статистических подходов может быть увеличено число создания гибридных систем. выбрать методы и приоритеты в значительной степени зависят от устройства системы. однако, большинство существующих систем должны включать по крайней мере следующие шаги:

  • Морфологическая трансформация. На основе данных, полученных на этапе структурной трансформации создаются окончательные готовые формы на языке перевода.
  • Лексическая трансформация. Процесс главным образом включает перевод словарного значения. Производится поиск начальной формы слова в словаре и выбор перевода.
  • Структурная трансформация. В отличие от предыдущих этапов, где речь шла о словах, на данном этапе речь идёт об образованиях более крупного порядка, таких как фразы и фрагменты текста. Характерными особенностями этого этапа являются необходимость согласования грамматических категорий, таких как род и число, а также изменения порядка слов или фраз.
  • Лексическая категоризация. В любом тексте могут присутствовать слова, имеющие более одного значения, что создаёт неоднозначность в процессе анализа. Лексическая категоризация обращает внимание на контекст, в котором употреблено слово, чтобы попытаться определить его верное значение. Данный процесс может включать в себя маркирование частей речи, а также разрешение смысловой омонимии.
  • Морфологический анализ. Поверхностные формы входного текста классифицируются по принадлежности к частям речи существительное, глагол и т. д. и по грамматическим категориям. Как правило, на данном этапе проводятся все возможные виды анализа для каждой из поверхностных форм одновременно со словарной формой слова.


                                     

4. Виды трансформаций. (The types of transformations)

Одной из главных особенностей Т систем на основе трансформации является этап, на котором промежуточное представление исходного языка в промежуточное представление текста на изучаемом языке. этот процесс может происходить на одном уровне лингвистического анализа или между ними. уровни ниже:

  • Глубокая семантика трансформация. На этом уровне создается семантическое представление, зависящее от исходного языка. Оно может состоять из нескольких структур, передающих определённый смысл. На данном уровне трансформации, как правило, происходит создание предикатов. Также перевод обычно требует структурной трансформации. Этот уровень используется для перевода между языками, которые отдаленно связаны друг с другом.
  • Поверхностная синтаксическая трансформация. Этот уровень характеризуется передачей синтаксических структур между исходным языком и языком перевода. Он применим к языкам одного типа или принадлежащим одной семье, например, если говорить о романских языках, между испанским, каталонский, французским, итальянкой и т. д.