Фахівці Facebook і вчені університету Карнегі-Меллона створили покерного бота, здатного перемагати топ-професіоналів в турнірній версії гри для шести гравців. Відкриття є важливою віхою в сфері штучного інтелекту, адже з його допомогою можна трансформувати покер в прибутковий бізнес. Покерний бот вже обіграв гравців в найпопулярнішому виді покеру – техаському холдемі – у версії гри з шістьма гравцями протягом 10 тисяч роздач.

Щоб оволодіти майстерністю покера на цьому рівні, ШІ навчався з нуля, без будь-яких вказівок з боку досвідчених гравців-людей. Бота назвали Плюрібус (Pluribus), і він обіграв таких відомих майстрів покеру, як чотириразовий чемпіон світу Даррен Еліас (Darren Elias), а також чемпіонів головного турніру World Series of Poker Кріса «Ісуса» Фергюсона (Chris «Jesus» Ferguson) і Грега Мерсона (Greg Merson).

Статтю про відкриття опублікував журнал Science, а науковий світ вже встиг назвати його важливим етапом розвитку штучного інтелекту. Важливе воно і для бізнесу – адже у великих проектах, як і в покері, учасникам ринку доводиться робити стратегічний вибір в умовах невизначеності та відсутності точного прогнозу результату.

Ноам Браун (Noam Brown), один з авторів дослідження, підкреслив, що більшість реальних стратегічних взаємодій у бізнесі зумовлені наявністю інформації з декількох джерел, а також участю двох і більше сторін. Маневрування в подібному інформаційному полі – завдання, яка ідеально підходить для інтелектуальних систем типу Pluribus. Ще одна можлива сфера застосування програми – кібербезпека, наприклад, в тому випадку, коли у протидіючих сторін неточна інформація про можливості і наміри противника. Поки що розробники не мають наміру комерціалізувати технологію.

Ігри давно використовують для навчання ШІ. Вони розвивають здатність до міркування і в спрощеній формі моделюють деякі схеми прийняття рішень, що зустрічаються в реальному світі. Ігри – ідеальне середовище для підкріплюючого навчання (пізнання на досвіді, а не на вкладених ззовні даних). Щоб таке ПЗ могло зрозуміти, чи є певна дія корисною, бали у покері виступають для програми аналогом винагороди.

Довгий час втіленням раціональності, інтелекту і стратегії людського розуму вважалися шахи. Однак у 1997 році алгоритм IBM DeepBlue обіграв всесвітньо відомого гросмейстера Гарі Каспарова. Після шахів настала черга Го. У 2016 році AlphaGo, алгоритм, створений компанією DeepMind (дочірньою фірмою Google Alphabet Inc.), переміг Лі Седола (Lee Sedol), кращого в світі гравця в Го. Ця гра є для штучного інтелекту набагато більш складним завданням, оскільки в ній присутня більша кількість комбінацій ходів, і гравці вибирають ходи як інтуїтивно, так і методом обчислення. У стародавньому Китаї, де виникла гра Го, вона вважалася одним з чотирьох основних мистецтв, які повинен був освоїти кожен вчений.

Покер, в свою чергу, має набагато менш благородну репутацію. У ньому застосовують і логіку, і обман, і інтелект. Тому ця гра набагато ближче до того, як людина приймає рішення в реальному світі. У двосторонніх іграх за допомогою математики можна вирахувати оптимальну стратегію гри (відома як рівновага Неша), і вона приведе, хоча б до беззбитковості. У покері, який є багатокористувацької грою, рівноваги Неша не існує або вона занадто складна для обчислення.

Для роботи Pluribus необхідно 512 Гбайт робочої пам’яті (приблизно стільки ж потрібно для роботи потужного ігрового ноутбука) і 128 400 годин навчання. Вартість цієї обчислювальної потужності ШІ раніше могла доходити до сотень тисяч і навіть до мільйона доларів. Але за оцінками дослідницької групи, при нинішніх цінах на хмарні обчислення навчання Pluribus обійшлося менш, ніж у 150 доларів. Після навчання алгоритм став настільки легким, що вчені змогли запустити його на звичайному ноутбуці на 128 ГБ.

У найближчих планах розробників – адаптація Pluribus до майбутніх покерних турнірів, а також використання для розробки бізнес-стратегій.

Автор: Олена Семенчук


Читайте також:

Nulogy планує зробити Канаду світовим лідером «розумної» логістики

Компанія Tech Mahindra презентувала HR-помічника – робота-асистента K2

Коментарi