Уважаемые коллеги!
31 марта в 15:00 состоится заседание научного семинара отдела «Информационные технологии управления и моделирования информационных систем» (рук. отдела - д.ф.-м.н. В.И. Синицин).
На заседании семинара будет представлен доклад на тему "Задача о гауссовском одноруком бандите с двумя неизвестными параметрами и ее приложения к пакетной обработке данных".
Докладчик: доктор физико-математических наук, профессор Александр Валерианович Колногоров (Новгородский государственный университет имени Ярослава Мудрого, Институт электронных и информационных систем, кафедра прикладной математики и информатики)
Аннотация доклада
Рассматривается задача об одноруком бандите применительно к обработке данных, в предположении, что существует два альтернативных метода обработки, и эффективность второго метода априори неизвестна. Эффективность характеризует, например, вероятность успешной обработки единицы данных. В процессе управления необходимо определить, является ли второй метод более эффективным, чем первый, и обеспечить преимущественное применение наиболее эффективного метода. Особенностью рассматриваемого подхода является то, что данные обрабатываются пакетами, а для управления используются совокупные доходы в пакетах. Если размеры пакетов достаточно велики, то, согласно центральной предельной теореме, доходы в пакетах приблизительно гауссовские.
Задача рассматривается в минимаксной постановке, причем в соответствии с основной теоремой теории игр минимаксные стратегия и риск ищутся как байесовские, вычисленные относительно наихудшего априорного распределения параметров. Важным свойством пакетной обработки является то, что она обеспечивает качество управления не хуже, чем оптимальная обработка данных по одному, если количество данных и количество пакетов достаточно велики. Например, при разбиении данных на 50 пакетов минимаксный риск растет только на 2%. При этом дисперсии доходов можно считать известными, так как их можно оценить во время обработки начальных пакетов и затем использовать эти оценки для управления, а минимаксный риск мало меняется при малом изменении дисперсий.
В случае пакетов умеренных объемов оценивать неизвестные дисперсии следует уже не только на начальном этапе, но на протяжении всего процесса управления. Эта ситуация аналогична тому, что в статистике при оценке средних в выборках большого объема используют нормальное распределение, в которое подставляют оценку дисперсии, но в выборках умеренных и малых объемов используют распределение Стьюдента. Математически задача описывается теперь гауссовским одноруким бандитом с обоими неизвестными параметрами. С использованием априорного распределения неизвестных параметров, соответствующих применению второго действия, получено рекуррентное уравнение типа Беллмана для определения соответствующей байесовской стратегии и байесовского риска. Минимаксные стратегия и риск ищутся в соответствии с основной теоремой теории игр как байесовские, соответствующие наихудшему априорному распределению.
Заседание состоится по адресу: ул. Вавилова, д. 44, корп. 2, пом. 538.