Математическая модель, алгоритмы и программный комплекс для повышения качества машинного перевода узкоспециальных технических текстов на английский язык

Математическая модель, алгоритмы и программный комплекс для повышения качества машинного перевода узкоспециальных технических текстов на английский язык

 Специальность 1.2.2. -Математическое моделирование, численные методы и комплексы программ Диссертация на соискание учёной степени кандидата технических наук

Автор
Животова Алена Анатольевна
Год
2024
  • 99 000 UZS

Оглавление диссертации

ОГЛАВЛЕНИЕ

ВВЕДЕНИЕ ..................................................................................................................... 5
ГЛАВА 1 ПРЕДРЕДАКТИРОВАНИЕ КАК ПЕРСПЕКТИВНОЕ НАПРАВЛЕНИЕ
РАЗВИТИЯ СИСТЕМ МАШИННОГО ПЕРЕВОДА ............................. 14
1.1 Развитие систем машинного перевода .................................................................. 14
1.1.1 Анализ на основе ТРИЗ-эволюционного подхода .................................... 15
1.1.2 ТРИЗ-эволюционный анализ систем МП .................................................. 18
1.2 Интерактивный перевод и предредактирование .................................................. 33
1.3 Методы предредактирования для повышения качества машинного перевода . 36
1.3.1 Правила для авторов по написанию исходных текстов .............................. 36
1.3.2 Концепция контролируемого языка .............................................................. 36
1.3.3 Предредактирование, основанное на правилах ........................................... 37
1.3.4 Решение задачи перефразирования как способ предредактирования ....... 38
ГЛАВА 2 МАТЕМАТИЧЕСКАЯ МОДЕЛЬ ОПТИМИЗАЦИОННОГО
ПРЕДРЕДАКТИРОВАНИЯ ....................................................................... 40
2.1 Обобщенная математическая модель процесса перевода ................................... 40
2.1.1 Термины и определения ................................................................................ 41
2.1.2 Оценка задачи перевода ................................................................................. 48
2.1.3 Предредактирование исходного текста ........................................................ 50
2.1.4 Перевод ........................................................................................................... 52
2.1.5 Оценка качества перевода ............................................................................. 53
2.1.6 Постредактирование переведенного текста ................................................. 56
2.1.7 Обучение переводчика ................................................................................... 57
2.1.8 Обобщенная модель перевода ....................................................................... 59
2.2 Математическая модель поиска весов значимости признаков текста ............... 60
2.3 Математическая постановка задачи машинного перевода ................................. 61
2.4 Математическая постановка задачи оптимизационного предредактирования . 64
2.5 Метод градиентного спуска для решения задачи автоматического
оптимизационного предредактирования .............................................................. 67
3

ГЛАВА 3 МЕТОДИКА РЕАЛИЗАЦИИ ОПТИМИЗАЦИОННОГО
ПРЕДРЕДАКТИРОВАНИЯ ....................................................................... 69
3.1 Модель оптимизационного предредактирования ................................................ 69
3.2 Обучение модели оптимизационного предредактирования ............................... 70
3.3 Обучение модели оценки сложности задачи перевода ....................................... 72
ГЛАВА 4 ПРОГРАММНЫЙ КОМПЛЕКС ОПТИМИЗАЦИОННОГО
ПРЕДРЕДАКТИРОВАНИЯ УЗКОСПЕЦИАЛЬНЫХ
РУССКОЯЗЫЧНЫХ ТЕКСТОВ ДЛЯ ИХ ПЕРЕВОДА НА
АНГЛИЙСКИЙ ЯЗЫК ............................................................................... 76
4.1 Архитектура программного комплекса и его подсистем .................................... 76
4.1.1 Модуль автоматической очистки сырых данных из памятей переводов
CAT для тренировки языковой модели ...................................................... 78
4.1.2 Модули машинного перевода ........................................................................ 78
4.1.3 Модуль оценки качества машинного перевода ............................................ 79
4.1.4 Модуль препроцессинга текстовых данных для взвешенной оценки
параметров русскоязычного текста ............................................................ 79
4.1.5 Модуль вероятностной оценки сложности переводческой задачи для
систем машинного перевода ....................................................................... 82
4.1.6 Предредактор русскоязычных узкоспециальных текстов для систем
машинного перевода .................................................................................... 86
4.2 Данные для обучения и тестирования программного комплекса ...................... 87
4.2.1 База данных структурного анализа предложений технических
русскоязычных текстов ................................................................................ 87
4.2.2 Корпус параллельных двуязычных текстов нефтегазовой тематики для
тренировки языковых моделей в задачах перефразирования
узкоспециальных технических русскоязычных текстов и повышения
качества их перевода на английский язык ................................................. 89
4.3 Тестирование программного комплекса ............................................................... 90
4.3.1 Постановка задачи тестирования ................................................................. 90
4.3.2 Начальные условия и границы проведения тестирования ........................ 90
4

4.3.3 Методология и план тестирования ............................................................... 91
4.3.4 Результаты тестирования .............................................................................. 92
4.4 Внедрение программного комплекса в контур автоматизации процессов
переводческой деятельности ................................................................................. 96
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ .................................................. 103
ПРИЛОЖЕНИЕ А Охранные документы на результаты интеллектуальной
деятельности ............................................................................... 115
ПРИЛОЖЕНИЕ Б Акт о внедрении (использовании) результатов кандидатской
диссертационной работы ........................................................... 125

Рекомендуем вам товары

99 000 UZS
Автор
Зайцева Анастасия Константиновна
Количество страниц
180
Год
2024
99 000 UZS
Автор
Клюсик Оксана Николаевна
Количество страниц
106
Год
2024
99 000 UZS
Автор
Малышкина Дарья Андреевна
Количество страниц
172
Год
2024
99 000 UZS
Автор
Нестерова Юлия Владимировна
Количество страниц
478
Год
2024
Модули для Opencart 2, Опенкарт 3