Топ-100 Синхронный автоматический перевод - моментальный машинны..
Назад

Синхронный автоматический перевод - моментальный машинный ..

                                     

Синхронный автоматический перевод

Синхронный автоматический перевод - "моментальный" машинный перевод речи, с одного естественного языка на другой, с помощью специальных программных и технических средств. Так же называется направление научных исследований, связанных с построением подобных систем.

В отличие от печати текста или искусственных сигналов и естественную речь не допускает простого и однозначного деления на элементы, так как они не имеют четких физических границ. границы слов в потоке речи автоматически могут быть определены в ходе признания выборе оптимальной последовательности слово, наилучшим образом согласуется с входным потоком речи по акустическим, лингвистическим, семантическим и другим критериям.

                                     

1. История. (History)

Июнь 2012 года - программа для автоматического синхронного перевода, технологического института Карлсруэ, федеральная земля Баден-Вюртемберг, Германия.

Октябрь 2012 (Года 2012) - автоматический, почти синхронный голосовой перевод с английского на китайский. разработан Microsoft (Майкрософт). системы машинного обучения на основе искусственных нейронных сетей Deep Neural Networks (Глубокие Нейронные Сети), которая сокращает непонимание до каждого седьмого или восьмого слово. но самым большим достижением является генерация речи с сохранением модуляций голоса говорящего.

Ноябрь 2012 (Года 2012) - открытый сервис, японский оператор мобильной связи NTT Docomo (МегаФон), позволяет абонентам, говорящим на разных языках общаться в режиме реального времени. Языки, поддерживаемые сервисом: японский, английский, корейский, японский, китайский.

Май 2015 года - есть Blabber Messenger (Скороговоркою Посланник), который преобразует речь на 14 языками, и чат на 88.

                                     

2. Принцип работы. (The principle of operation)

Процесс электронного перевода речи S2S Real-Time Translation (С2С перевод в реальном времени), как правило, включает следующие три этапа):

  • Синтез речи TTS (ТТС) - text-to-speech (текст-в-речь) - технология, которая даёт возможность произнести текст голосом, приближенным к естественному.
  • Машинный перевод MAT (machine translation MAT) - Machine-Assisted (Машины-Помощь) Translation, - автоматический перевод текста с одного языка на другой.
  • Автоматическое распознавание речи ASR (АСР) - automatic speech recognition (автоматическое распознавание речи) - преобразование речи в текст.

Говоря языком A говорит в микрофон, а система распознавания речи модуль признает А. модуль автоматического перевода преобразует эту строку. первые системы были заменены каждое слово с соответствующим словом в языке B. более сложные системы не использовать дословный перевод, и учитывать весь контекст фразы, чтобы произвести адекватный перевод. в результате передачи передается в модуль синтеза речи, которая оценивает произношение и интонацию, соответствующий ряд слов из массива речевых данных языка B. данные, относящиеся к выбранной фразы связаны и необходимы для пользователей, языковой форме В.

                                     

2.1. Принцип работы. Системы перевода речи. (System speech translation)

Системы перевода речи ST - Speech Translation (Перевод Слова), состоит из двух основных компонентов: автоматического распознавания речи ASR (АСР) - automatic speech recognition (автоматическое распознавание речи) и машинного перевода MAT - Machine-Assisted Translation (Машинный Перевод) различаются:

  • По принципу "клиент-сервер" client-server OnLine service (клиент-сервер сервис онлайн).
  • Работающие "на клиенте" client-based (клиента).

Признание непрерывной спонтанной речи - конечная цель всех усилий, направленных на АСР. АСР части, привязки или ее отсутствия к голосу конкретного человека.

Если рассматривать классическую схему "наука-технологии-практические системы", наиболее серьезные проблемы, которые будут состоять из практической системы автоматического распознавания и понимания речи, возникающие из условий:

  • - произвольный, наивный пользователь.
  • - наличие акустических помех и искажений, в том числе меняющихся.
  • - наличие речевых помех.
  • - спонтанная речь, сопровождаемая аграмматизмами и речевым "мусором".

Общая классификация систем распознавания речи. см.

Традиционно, системы машинного перевода делятся на категории:

  • Statistical Machine Translation SMT (Статистический машинный перевод СМТ) - статистический машинный перевод - разновидность машинного перевода текста, основанная на сравнении больших объёмов языковых пар.
  • Hybrid Machine Translation SMT (Гибридный машинный перевод СМТ) + RBMT - Гибридные модели "… где ожидается прорыв в качестве перевода".
  • Example-Based MT EBMT (Пример на основе ЕВМТ Т) - системы на примерах двух текстов, один из которых является переводом другого.
  • Rule-Based Machine Translation RBMT (Правило, на основе машинного перевода RBMTБЫЛ) - системы, основанные на правилах, которые описывают языковые структуры и их преобразования.

Границы между системами Example-based (Пример на основе) и Rule-based (На основе правил) не очень понятно, так как использование словарей и правилами работы со словарями.



                                     

2.2. Принцип работы. Статистический машинный перевод. (Statistical machine translation)

Статистический машинный перевод, основанный на поиске наиболее вероятного перевода предложения с использованием данных из билингвального случае Parallel Corpora (Параллельных Корпусов) - Bitext. В результате перевода компьютер не использовать лингвистические алгоритмы и вычисляет вероятность использования слова или выражения. слово или последовательность слов, которая обладает оптимальной вероятности считаются наиболее адекватный перевод исходного текста и на компьютере подставить в полученный текст. В статистический машинный перевод задача не перевод, а задача декодирования.

Типичная архитектура статистических систем МТ.

  • Одноязычный корпус язык перевода.
  • Языковая модель (Language model) - набор n-грамм последовательностей словоформ длины n из корпуса текстов.
  • Фразовая таблица (Phrasal table) - таблица соответствий фраз исходного корпуса и корпуса переводов с некоторыми статистическими коэффициентами.
  • Параллельный корпус. (A parallel corpus)
  • Статистический декодер (Statistical decoder) - среди всех возможных вариантов перевода, выбирает наиболее вероятный.

Как языковые модели в статистических систем перевода используются в основном для различных модификаций н-г модель, утверждая, что выбор следующего слова в формировании текста определяется только какия-1слов идти впереди него.

  • N-граммы. (N-grams)
  • - Достоинства: - высокое качество перевода, для фраз, которые целиком помещаются в n-граммную модель.
  • - Недостатки: - качественный перевод возможен только для фраз, которые целиком помещаются в n-граммную модель.

Преимущества SMT (СМТ)

  • Легко добавлять новые направления перевода.
  • Гладкость перевода. (The smoothness of the translation)
  • Быстрая настройка. (Quick setup)

Недостатки SMT (СМТ)

  • Нестабильность перевода. (The instability of transfer)
  • Параллельных корпусов. (Parallel corpora)
  • Многочисленные грамматические ошибки. (The numerous grammatical errors)

Системах, которые не используют обучения называют систему "Speaker Independent". Системы, использующие обучения "Speaker Dependent" системы.

                                     

2.3. Принцип работы. Системы МП, основанные на правилах "Rule-Based". (System MP based on rules "Rule-Based")

Системы машинного перевода на основе правил Rule-Based Machine Translation (Правило, На Основе Машинного Перевода) являются:

  • Интерлингвистические системы Interlingua- (Интерлингва) промежуточный язык описания смысла.
  • Трансферные системы Transfer (Перевод) - преобразуют структуры входного языка в грамматические конструкции выходного языка.
  • Системы пословного перевода. (System word by word translation)

Компоненты типичной RBMT:

  • Лингвистические базы данных: (Linguistic databases) - двуязычные словари, - файлы имен, транслитерации, - морфологические таблицы.
  • Модуль перевода: (The translation module) - грамматические правила, - алгоритмы перевода.

Особенности систем RBMT:

  • Недостатки: (Disadvantages) - трудоемкость и длительность разработки, - необходимость поддерживать и актуализировать лингвистические БД, - "машинный акцент" при переводе.
  • Преимущества: (Advantages) - синтаксическая и морфологическая точность, - стабильность и предсказуемость результата, - возможность настройки на предметную область.
                                     

2.4. Принцип работы. Гибридные модели SMT + RBMT. (The hybrid model SMT RBMT)

Гибридная технология:

  • Обучение: Параллельный корпус->, Обучение: (Education: Parallel corpus-> Training) - Модель языка, - Данные для постредактирования, - Правила синтеза, - Словарь терминологии.
  • Эксплуатация: Гибридный перевод. (Operation: Hybrid translation)

Этапы гибридной технологии:

  • Эксплуатация на основе натренированной системы.
  • Обучение RBMT на основе параллельного корпуса с использованием статистических технологий.
                                     

2.5. Принцип работы. Системы синтеза речи. (The speech synthesis system)

Типичная архитектура "Text-to-Speech" System (Система).

  • Анализ просодики: (Analysis of prosodic) - Шаг & Длительность словосочетаний.
  • Анализ текста: (Text analysis) - Определение структуры текста, - Нормализация текста, - Лингвистический анализ.
  • Фонетический анализ: (Phonetic analysis) - Графо - Фонетическое преобразование.
  • Синтез речи Speech Synthesis: (Синтез Речи) - Рендеринг голоса.

В свою очередь, синтез речи подразделяются на две группы:

  • Синтез по правилам. (The synthesis according to rules)
  • Параметрический синтез. (Parametric synthesis)
  • Предметно-ориентированный синтез. (Domain-specific synthesis)
  • Конкатенативный, или компиляционный компилятивный синтез.
                                     

3. Шумоочистка. (Noise reduction)

Источники шума в системах речи: - шум от микрофонов, кабелей, АЦП, аналого-цифровой преобразователь, внешние шумы, возникающие в среде языка.

Классификация шума по поводу их характеристик:

  • Периодический / непериодический шум.
  • Речевой шум, состоящий из голосов людей, окружающих говорящего.
  • Ширина диапазона частот, в котором распределяется энергия шума: (the width of the frequency range, where distributed energy noise) - широкополосные ширина полосы частот более 1 кГц и узкополосные шумы ширина полосы частот менее 1 кГц.

Наиболее опасные по своему влиянию на речевом сигнале и самые упрямые шума является белый шум: - непериодические спектральная плотность шума равномерно распределяется по всей частотной области.

В области распознавания речи в шуме, существуют следующие подходы:

  • Распознавание зашумленного сигнала без его предварительного улучшения, при котором изучается, каким же образом человек распознает и понимает зашумленную речь, ведь он не производит предварительной фильтрации речевого сигнала для того, чтобы очистить его от шума.
  • Сначала избавляются от шума, а затем распознают очищенный речевой сигнал. Эта концепция обычно используется при разработке систем шумоочистки в качестве дополнительного модуля систем распознавания.
  • Разработчики не обращают внимания на шум.

Методы обеспечения помехоустойчивости:

  • Сводятся либо к выделению некоторых инвариантных относительно шума признаков, либо к обучению в условиях шума или модификации эталонов распознавания с использованием оценки уровня шумов.

Слабым местом этих методов является ненадежная работа системы распознавания настроена для распознавания шумов, при отсутствии шумов, а также сильная зависимость от физических характеристик шума.

  • Вычисление коэффициентов линейного предсказания. В качестве элементов эталонов, вместо численных значений используются вероятностные распределения среднее математическое, дисперсия.
  • Очистка полезного сигнала от посторонних шумов, с использованием массивов микрофонов, моделирующих направленный микрофон с переменным лучом направления простейший метод "задержки и суммирования" или более сложный с модификацией весов микрофонов.
  • Цифровая обработкой сигнала: (Digital signal processing) - методы маскировки шумов и методы шумоподавления с использованием нескольких микрофонов например, очистка от низкочастотных шумов с использованием микрофона с одной стороны устройства и высокочастотных - с другой стороны.
                                     

4. Модели и методы оптимизации. (Models and methods of optimization)

Большинство существующих метрик автоматической оценки машинного перевода, основанные на сравнении с человеческой ссылкой.

При обучении Speech Translation System (Системы Перевода Речи), использовались следующие методы оптимизации качества и скорости перевода:

  • Каскадное ASR / WER (АСР / ОКАЗАЛИС) с MT / BLEU (Т / БЛЮ).

Автоматического распознавания речи ASR (АСР) - automatic speech recognition (автоматическое распознавание речи)

  • ASR / PER Position-independent Word Error (АСР / в положении-независимый слове ошибка) Rate- вероятность ошибок позиционно-независимых слов в разных предложениях.
  • ASR / CSR Command Success Rate (Ставка команды АСР / успех КСО) - вероятность успешного выполнения команды.
  • ASR / WER Word Error Rate (Частота ошибок АСР / ВВЭР слово) - вероятность ошибки в кодовом слове.

Машинный перевод MAT - Machine-Assisted Translation (Машинный Перевод)

  • MT / BLEU Bilingual Evaluation Understudy (Т / Блю двуязычный оценки дублер) - вероятность совпадение перевода с образцом.
                                     

5. Особенности. (Features)

Помимо проблем, связанных с перевод текста, синхронный перевод речи имеет дело с особыми проблемами, в том числе и бессвязность речи, менее строгую грамматику разговорного языка, неясными границами слова разговорной речи и коррекции ошибок распознавания речи. кроме того, синхронный перевод имеет свои преимущества по сравнению с текстом перевода, в том числе менее сложную структуру разговорный язык и менее лексики в устной речи.

                                     

6. Стандарты. (Standards)

Когда многие страны начинают исследовать и развить речь перевод, необходимо стандартизировать интерфейсы и форматы данных, чтобы гарантировать, что системы являются взаимно совместимыми.

Международные совместные исследования создается перевод слова консорциумов:

  • A-STAR Asia-Pacific (А-звезда Азиатско-Тихоокеанского региона) - для Азиатско-Тихоокеанского региона.
  • C-STAR Consortium for Speech Translation (С-звезда консорциума для перевода речи) Advanced Research (Исследования) - международный консорциум по переводу речи для объединенного исследования речевого перевода.

Они были созданы как международные совместные научно-исследовательские организации для форматов дизайн двуязычных стандартов, которые являются важными для продвижения научных исследований, технологии и стандартизации интерфейсов и форматов данных для подключения модуля перевода речи на международном уровне.

                                     

7. Оценки качества перевода. (Evaluation of translation quality)

  • BLEU Bilingual Evaluation Understudy (Блю двуязычный оценки дублер) - алгоритм оценки-оптимизации качества текста, машинного перевода.
  • WER Word Error Rate (Частота ошибок ВВЭР слово) - алгоритм оценки-оптимизации качества текста, машинного перевода.
  • Классификатор "Речь / не речь" speech / non-speech (речевых / неречевых) - определяющий вероятность правильного распознавания речи. Компромисс между определением, голос как шум или шум как голос Type I and type II errors (Тип I и ошибки типа II).