Специалисты Facebook и учёные университета Карнеги-Меллона создали покерного бота, способного побеждать топ-профессионалов в турнирной версии игры для шести игроков. Открытие является важной вехой в сфере искусственного интеллекта, ведь с его помощью можно трансформировать покер в прибыльный бизнес. Покерный бот уже обыграл игроков в самом популярном виде покера – техасском холдеме – в версии игры с шестью игроками в течение 10 тысяч раздач.

Чтобы овладеть мастерством покера на этом уровне, ИИ обучался с нуля, без каких-либо указаний со стороны опытных игроков-людей. Бота назвали Плюрибус (Pluribus), и он обыграл таких известных мастеров покера, как четырёхкратный чемпион мира Даррен Элиас (Darren Elias), а также чемпионов главного турнира World Series of Poker Криса «Иисуса» Фергюсона (Chris «Jesus» Ferguson) и Грега Мерсона (Greg Merson).

Статью об открытии опубликовал журнал Science, а научный мир уже успел назвать его важным этапом развития искусственного интеллекта. Важно оно и для бизнеса – ведь в крупных проектах, как и в покере, участникам рынка приходится делать стратегический выбор в условиях неопределённости и отсутствия точного прогноза результата.

Ноам Браун (Noam Brown), один из авторов исследования, подчеркнул, что большинство реальных стратегических взаимодействий в бизнесе подразумевают наличие информации из нескольких источников, а также участие двух и более сторон. Маневрирование в подобном информационном поле – задача, идеально подходящая для интеллектуальных систем типа Pluribus. Ещё одна возможная сфера применения программы – кибербезопасность, например, в том случае, когда у противодействующих сторон неточная информация о возможностях и намерениях противника. Пока что разработчики не имеют намерения коммерциализировать технологию.

Игры давно используют для обучения ИИ. Они развивают способность к рассуждению и в упрощённой форме моделируют некоторые схемы принятия решений, встречающиеся в реальном мире. Игры – идеальная среда для подкрепляющего обучения (познание на опыте, а не на вложенных извне данных). Чтобы такое ПО могло понять, является ли определенное действие полезным, очки в покере выступают для программы аналогом вознаграждения.

Долгое время воплощением рациональности, интеллекта и стратегии человеческого ума считались шахматы. Однако в 1997 году алгоритм IBM DeepBlue обыграл всемирно известного гроссмейстера Гари Каспарова. После шахмат наступил черёд Го. В 2016 году AlphaGo, алгоритм, созданный компанией DeepMind (дочерней фирмой Google Alphabet Inc.), победил Ли Седола (Lee Sedol), лучшего в мире игрока в Го. Эта игра является для искусственного интеллекта гораздо более сложной задачей, поскольку в ней присутствует большее количество комбинаций ходов, и игроки выбирают ходы как интуитивно, так и методом вычисления. В древнем Китае, где возникла игра Го, она считалась одним из четырёх основных искусств, которые должен был освоить каждый учёный.

Покер, в свою очередь, имеет намного менее благородную репутацию. В нём применяют и логику, и обман, и интеллект. Поэтому эта игра намного ближе к тому, как человек принимает решения в реальном мире. В двухсторонних играх с помощью математики можно высчитать оптимальную стратегию игры (известна как равновесие Нэша), и она приведет, по крайней мере, к безубыточности. В покере, который является многопользовательской игрой, равновесия Нэша не существует либо оно слишком сложно для вычисления.

Для работы Pluribus необходимо 512 Гбайт рабочей памяти (примерно столько же требуется для работы мощного игрового ноутбука) и 128 400 часов обучения. Стоимость этой вычислительной мощности ИИ ранее могла доходить до сотен тысяч и даже до миллиона долларов. Но по оценкам исследовательской группы, при нынешних ценах на облачные вычисления обучение Pluribus обошлось менее, чем в 150 долларов. После обучения алгоритм стал настолько легким, что учёные смогли запустить его на обычном ноутбуке на 128 ГБ.

В ближайших планах разработчиков – адаптация Pluribus для будущих покерных турниров, а также использование для разработки бизнес-стратегий.

Автор: Елена Семенчук


Читайте также:

Nulogy планирует сделать Канаду мировым лидером «умной» логистики

Компания Tech Mahindra презентовала HR-помощника – робота-ассистента K2

Комментарии