ОГЛАВЛЕНИЕ
ВВЕДЕНИЕ ..................................................................................................................... 5
ГЛАВА 1 ПРЕДРЕДАКТИРОВАНИЕ КАК ПЕРСПЕКТИВНОЕ НАПРАВЛЕНИЕ
РАЗВИТИЯ СИСТЕМ МАШИННОГО ПЕРЕВОДА ............................. 14
1.1 Развитие систем машинного перевода .................................................................. 14
1.1.1 Анализ на основе ТРИЗ-эволюционного подхода .................................... 15
1.1.2 ТРИЗ-эволюционный анализ систем МП .................................................. 18
1.2 Интерактивный перевод и предредактирование .................................................. 33
1.3 Методы предредактирования для повышения качества машинного перевода . 36
1.3.1 Правила для авторов по написанию исходных текстов .............................. 36
1.3.2 Концепция контролируемого языка .............................................................. 36
1.3.3 Предредактирование, основанное на правилах ........................................... 37
1.3.4 Решение задачи перефразирования как способ предредактирования ....... 38
ГЛАВА 2 МАТЕМАТИЧЕСКАЯ МОДЕЛЬ ОПТИМИЗАЦИОННОГО
ПРЕДРЕДАКТИРОВАНИЯ ....................................................................... 40
2.1 Обобщенная математическая модель процесса перевода ................................... 40
2.1.1 Термины и определения ................................................................................ 41
2.1.2 Оценка задачи перевода ................................................................................. 48
2.1.3 Предредактирование исходного текста ........................................................ 50
2.1.4 Перевод ........................................................................................................... 52
2.1.5 Оценка качества перевода ............................................................................. 53
2.1.6 Постредактирование переведенного текста ................................................. 56
2.1.7 Обучение переводчика ................................................................................... 57
2.1.8 Обобщенная модель перевода ....................................................................... 59
2.2 Математическая модель поиска весов значимости признаков текста ............... 60
2.3 Математическая постановка задачи машинного перевода ................................. 61
2.4 Математическая постановка задачи оптимизационного предредактирования . 64
2.5 Метод градиентного спуска для решения задачи автоматического
оптимизационного предредактирования .............................................................. 67
3
ГЛАВА 3 МЕТОДИКА РЕАЛИЗАЦИИ ОПТИМИЗАЦИОННОГО
ПРЕДРЕДАКТИРОВАНИЯ ....................................................................... 69
3.1 Модель оптимизационного предредактирования ................................................ 69
3.2 Обучение модели оптимизационного предредактирования ............................... 70
3.3 Обучение модели оценки сложности задачи перевода ....................................... 72
ГЛАВА 4 ПРОГРАММНЫЙ КОМПЛЕКС ОПТИМИЗАЦИОННОГО
ПРЕДРЕДАКТИРОВАНИЯ УЗКОСПЕЦИАЛЬНЫХ
РУССКОЯЗЫЧНЫХ ТЕКСТОВ ДЛЯ ИХ ПЕРЕВОДА НА
АНГЛИЙСКИЙ ЯЗЫК ............................................................................... 76
4.1 Архитектура программного комплекса и его подсистем .................................... 76
4.1.1 Модуль автоматической очистки сырых данных из памятей переводов
CAT для тренировки языковой модели ...................................................... 78
4.1.2 Модули машинного перевода ........................................................................ 78
4.1.3 Модуль оценки качества машинного перевода ............................................ 79
4.1.4 Модуль препроцессинга текстовых данных для взвешенной оценки
параметров русскоязычного текста ............................................................ 79
4.1.5 Модуль вероятностной оценки сложности переводческой задачи для
систем машинного перевода ....................................................................... 82
4.1.6 Предредактор русскоязычных узкоспециальных текстов для систем
машинного перевода .................................................................................... 86
4.2 Данные для обучения и тестирования программного комплекса ...................... 87
4.2.1 База данных структурного анализа предложений технических
русскоязычных текстов ................................................................................ 87
4.2.2 Корпус параллельных двуязычных текстов нефтегазовой тематики для
тренировки языковых моделей в задачах перефразирования
узкоспециальных технических русскоязычных текстов и повышения
качества их перевода на английский язык ................................................. 89
4.3 Тестирование программного комплекса ............................................................... 90
4.3.1 Постановка задачи тестирования ................................................................. 90
4.3.2 Начальные условия и границы проведения тестирования ........................ 90
4
4.3.3 Методология и план тестирования ............................................................... 91
4.3.4 Результаты тестирования .............................................................................. 92
4.4 Внедрение программного комплекса в контур автоматизации процессов
переводческой деятельности ................................................................................. 96
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ .................................................. 103
ПРИЛОЖЕНИЕ А Охранные документы на результаты интеллектуальной
деятельности ............................................................................... 115
ПРИЛОЖЕНИЕ Б Акт о внедрении (использовании) результатов кандидатской
диссертационной работы ........................................................... 125



