Введение
Глава 1. Теоретические сведения 13
1.1. Обзор литературы по теме 13
1.2. Общая постановка задачи 22
1.3. О потерях дохода при близких и удаленных математических ожиданиях 26
1.4. Выводы к первой главе 29
Глава 2. Пороговые стратегии управления 30
2.1. Стратегия управления с одним порогом 30
2.2. Решение задачи о «двуруком бандите» для бинарной случайной среды 33
2.3. Решение задачи о «двуруком бандите» для среды с нормально распределенными доходами 38
2.4. Проверка гипотезы об оптимальности пороговой стратегии, найденной для единичной дисперсии, для сред с нормально распределенными доходами с попарно различными дисперсиями 41
2.5. Оптимизация алгоритма «двурукого бандита» 41
2.6. Модификация пороговой стратегии. Двухпороговая стратегия управления 44
2.7. Формулировка цели управления 47
2.8. Моделирование двухпороговых стратегий 48
2.9. Моделирование двухпороговой стратегии в бинарной случайной среде 50
2.10. Двухпороговая стратегия управления в случайной среде с нормально распределенными доходами 53
2.11. Выводы ко второй главе 56
Глава 3. Управление в случайной среде, использующее основную теорему теории игр 58
3.1. Связь минимаксного и байесовского подходов и основная теорема теории игр 58
3.2. Вывод уравнений для вычисления байесовских рисков с попарно одинаковыми различными на действиях дисперсиями 59
3.3. Нахождение байесовских потерь и стратегий, численная оптимизация 62
3.4. Моделирование методом Монте-Карло 65
3.5. Проверка гипотезы об оптимальности байесовской стратегии, найденной для единичной дисперсии, для класса сред с различными дисперсиями 66
3.6. Случай попарно различных дисперсий 68
3.7. Численная оптимизация байесовских рисков при различных попарно разных дисперсиях 75
3.8. Выводы к третьей главе 75
Глава 4. Программный комплекс 77
4.1. Программа TwoArmed 77
4.2. Программ Bayes 84
4.3. Выводы к четвертой главе 87
Заключение 88
Литература


