Топ-100 Машинный перевод на основе примеров - это метод машинног..
Назад

Машинный перевод на основе примеров - это метод машинного ..

Машинный перевод на основе примеров
                                     

Машинный перевод на основе примеров

Машинный перевод на основе примеров - это метод машинного перевода, который часто характеризуется использованием двуязычного корпуса с параллельными текстами в качестве основной базы знаний во время выполнения перевода. По сути, это перевод по аналогии, который может рассматриваться как применение метода рассуждений на основе прецедентов к машинному обучению.

                                     

1. Перевод по аналогии. (Translation by analogy)

В основу машинного перевода в примерах-это идея перевода по аналогии. в связи с процессом человеческого перевода, идея о том, что перевод выполняется по аналогии-это отказ от идеи, что люди переводят предложения, делая глубокий лингвистический анализ. вместо того, эта идея основана на убеждении, что люди переводят сначала изучив предложения на отдельные фразы, затем перевести эти фразы, и, наконец, правильно написать эти фрагменты в одно длинное предложение. перевод фразы осуществляется по аналогии с предыдущими переводами. принцип перевода по аналогии кодируется в машинный перевод на основе примеров примеры переводов, которые используются для обучения такой системы. Другие подходы к машинному переводу, в том числе статистического машинного перевода, двуязычной также использовать случай для изучения процесса перевода.

                                     

2. История. (History)

Машинный перевод на основе примеров была впервые предложена Макото Нагао в 1984 году. Нагао отметил, что этот вид перевода специально адаптирована для перевода, когда речь идет о двух совершенно разных языках, таких как английский и японский. В этом случае приговор может быть переведена на несколько хорошо структурированных предложений на другом языке, поэтому нет смысла делать глубокий лингвистический анализ, характерный для машинного перевода на основе правил.

                                     

3. Алгоритм работы. (The algorithm works)

В общем, система EBMT (ЕВМТ) состоит из трех компонентов: согласование, рекомбинации и выравнивание.

  • Выравнивание: Чтобы полностью соответствовать грамматике целевого языка и уменьшить количество несоответствий в выходных данных, необходимо выполнить некоторую последующую обработку, например, согласование подлежащего с глаголом.
  • Поиск соответствий: В соответствующем компоненте выполняется поиск множества примеров перевода для определения схожих фрагментов текстов в исходном предложении.
  • Рекомбинация: На данном этапе фрагменты текста, извлечённые на этапе соответствий, объединяются для создания целого предложения. Основываясь на структуре хранения примеров, процесс объединения может потребовать конкретные процедуры для объединения текстовых единиц. Например, если примеры хранятся в древовидной структуре, для образования выходных данных следует использовать метод унификации древовидных структур.
                                     

4. Пример. (Example)

Пример двуязычного корпуса

Системы машинного перевода основанные на примерах состоят из двуязычных параллельных корпусов, содержащих пары предложений, как в Примере в таблице выше. пару фраз содержащие предложения на одном языке с их переводами на другой. Этот пример показывает пример минимальной пары, что означает, что эти предложения различаются только в одном элементе. эти предложения упростить запоминание переводов частей предложения. например, системы машинного перевода на основе примеров характеризуется тремя перевода единиц из приведенного выше примера:

  • Red umbrella (красный зонтик) соответствует akai kasa (акаи Каса).
  • How much is that (Сколько стоит) X? соответствует Ano X waikuradesuka (АНО х waikuradesuka).
  • Small camera (маленькая камера) соответствует chiisai kamera (chiisai камера).

Слагающих эти блоки могут быть использованы для создания новых переводов в будущем. например, если мы учили, используя текст, который содержит фразу: President Kennedy was shot (Президент Кеннеди был застрелен) dead during the parade (умер во время парада) и The convict escaped on (Осужденный сбежал на) July 15th (15 июля), мы могли бы перевести предложение The convict was shot (Осужденный был расстрелян) dead during the parade (умер во время парада), заменив соответствующие части предложений.

                                     

5. Фразовые глаголы. (Phrasal verbs)

Машинного перевода основанные на примерах лучше всего подходит для таких явлениях подъязыка как. фразовые глаголы фразовые глаголы имеют весьма контекстно-зависимые значения. они распространены на английском языке и состоят из глагола следует наречие и / или предлог, называют частицы, состоящие из глагола. фразовые глаголы образуют специализированный контекстно-специфическое значение, которое не может быть выведено из значения составляющих. когда они слово-в-слово перевод с исходного языка на целевой почти всегда возникает неопределенность. В качестве примера, рассмотреть фразовый глагол "put on" и ее значение в хинди - урду. он может быть использован в любой из следующих способов:

  • Ram put on the lights (света). Switched on (Включается) перевод на хинди - урду: Jalana.
  • Ram put on a cap (шапка). Wear (Носить) перевод на хинди - урду: Pahenna.