Купить диссертацию Исследование и разработка методов сжатия текста на арабском языке

Оглавление диссертации

Введение
Глава 1. Сущность и необходимость сжатия текстов 12
1.1. Важность и эффективность использования текстового сжатия 12
1.2. Предмет текстового сжатия 15
1.3. Область применения методов сжатия текстов на практике 16
1.4. Алгоритм Шеннона - Фано 20
1.5. Алгоритм Хаффмена 24
1.6. Адаптивное кодирование Хаффмена 29
1.7. Арифметическое кодирование 34
Глава 2. Анализ статистики арабских и английских текстовых сообщений 39
2.1. Измерение информации в компьютерной системе 39
2.2. Энтропия — мера количества информации 40
2.3. Сравнительная характеристика степени сжатия текстов на арабском и английском языках 41
2.4. Статистический подход к сжатию текстов через моделирование и кодирование 45
2.5. Моделирование естественного языка 47
2.6. Анализ вероятности появления очередных символов в арабских текстах 48
2.7. Сравнительный анализ арабских и английских текстов 52
Глава 3. Методы кодирования и декодирования с использованием обобщенного статистического распределения символов алфавита 59
3.1. Методика кодирования по модели сообщения первого порядка59
3.2. Методика декодирования 61
3.3. Сравнительная характеристика разных способов сжатия 69
3.4. Сравнение предлагаемого метода с другими способами сжатия по модели высокого порядка 76
3.5. Описание алгоритмов программ 78
3.5.1. Общая схема программы 78
3.5.2. Процедуры подсчета диграмм и триграмм 86
3.5.3. Процедуры построения деревьев для диграмм и триграмм 88
Выводы к главе 3 91
Глава 4. Вопросы практической реализации кодека с моделью источника сообщения высокого порядка 92
4.1. Структурная схема кодека 92
4.2. Выбор элементной базы 93
4.3. Микроконтроллер PIC16F877 94
4.4. Микросхема статистического ОЗУ 62256 97
4.5. Программатор PIC-контроллеров 99
Выводы к главе 4 101
Заключение 102
Список литературы 103
Приложение 1