Сотрудники ФИЦ ИУ РАН приняли участие в конференции AAAI 2024

C 20 по 27 февраля в Ванкувере (Канада) проходила 37-я конференция по искусственному интеллекту AAAI 2024. Конференции AAAI являются одним из наиболее значимых и авторитетных академических событий в мире искусственного интеллекта, входящим в календарь ведущих исследователей в этой области (что подтверждается высшей оценкой A* в рейтинге конференций Core). 

На AAAI 2024 были представлены 3 работы сотрудников отдела 71 ФИЦ ИУ РАН, все они посвящены тематике многоагентного планирования траекторий. О работах рассказывает один из их со-авторов, ведущий научный сотрудник ФИЦ ИУ РАН – Константин Яковлев.

"Тематика многоагентного планирования давно и активно развивается в нашем отделе. Работы, принятые на AAAI’24 затрагивают два сюжета. Первый касается случая, когда присутствует централизованной планировщик, который должен распределить членов группы по заданным целям и построить безопасные маршруты их достижения [1]. Мы с аспирантом из МФТИ предложили новый эффективный алгоритм решения этой задачи, обладающий строгими теоретическими гарантиями, в частности – гарантиями оптимальности решения (минимизируется время достижения последним агентом цели)."

"Второй сюжет в наших работах – децентрализованная постановка задачи, когда каждый агент полагается лишь на собственные наблюдения [2,3]. В этом случае для того, чтобы решить задачу, каждому агенту необходимо руководствоваться нетривиальной стратегией принятия решений, которая соблюдает баланс между эгоизмом (каждый агент стремится к цели) и кооперативностью (иногда агенту нужно уступать, чтобы другие агенты могли пройти к своим целям). Традиционные методы плохо справляются с этой задачей, поэтому в своих работах мы, совместно с коллегами из AIRI и МФТИ, предлагаем алгоритмы, оригинально сочетающие в себе техники эвристического поиска, поиска Монте-Карло по дереву, обучения с подкреплением.

По результатам многочисленных экспериментальных исследований предлагаемые нами методы превосходят существующие аналоги по целому ряду показателей эффективности. Особенно мы гордимся тем, что обобщающая способность наших методов заметно выше, чем у конкурентов, т.к. именно это качество традиционно считается наиболее уязвимым местом обучаемых подходов. Они зачастую показывают хорошие результаты на данных, которые схожи с теми, на которых происходило обучение, но при этом их производительность заметно падает при решении задач, отличных от обучающих. Наши методы хорошо адаптируются к совершенно различным задачам, что делает их более универсальными и перспективными в плане практического использования."

Ниже ссылки на доклады:
[1] Ali Z., Yakovlev K. Improved Anonymous Multi-Agent Path Finding Algorithm
[2] Skrynnik A., Andreychuk A., Nesterova M., Yakovlev K., Panov A. Learn to Follow: Decentralized Lifelong Multi-Agent Pathfinding via Planning and Learning
[3] Skrynnik A., Andreychuk A., Yakovlev K., Panov A. Decentralized Monte Carlo Tree Search for Partially Observable Multi-Agent Pathfinding