Исследовательская группа компании DeepMind, принадлежащая Google, вместе с учеными Лондонского университетского колледжа разработала программу на основе искусственного интеллекта AlphaZero, которая может самообучаться игре в шахматы, го и сёги и обыгрывать компьютерные программы и интеллектуальные системы. Результаты исследования были опубликованы в издании Science.

С момента поединка суперкомпьютера Deep Blue и всемирно известного шахматиста Гари Каспарова прошло более 20 лет. В поединке “машина-человек” победа досталась компьютеру, и она стала прямым доказательством развития вычислительной и логической мощности интеллектуальных машин. С тех пор компьютеры становились всё умнее, но могли победить человека только в одной игре.

AlphaZero способен обыграть человека сразу в трёх играх, более того, в программа заложен навык “самообучения” – на основании опыта предыдущих игр она совершенствует свои игровые умения. Исследователи называют AlphaZero системой обучения с подкреплением. Способ её обучения не похож на тот, какой обычно использует человек: в систему вводится базовый набор правил, затем компьютер начинает играть сам с собой. Действие повторяется несколько раз, до тех пор, пока тактика игры компьютера становится идеальной.

В ходе обучения система AlphaZero определяла удачные и неудачные комбинации ходов, а также использовала метод Монте-Карло для поиска наиболее выигрышных схем игрового алгоритма. Пройдя все этапы обучения, ИИ стал готовым к игре с другими компьютерами и, наконец, дошел до уровня мастерства, дающего возможность играть с человеком. Техническая “начинка” AlphaZero – 5000 тензорных процессоров, делающих машину эквивалентной по возможностям большим суперкомпьютерам. Весь цикл обучения от нуля до уровня профи занял у системы ИИ менее 24 часов.

Во время экспериментальных игр с другими “умными” системами, AlphaZero обыграла в шахматы Stockfish всего за 4 часа, в сёги – программу Elmo через 2 часа, а в го ИИ обыграл свою же версию, победившую в 2016 году легендарного игрока Ли Седола в результате 30-часового поединка. В ходе каждого этапа обучения на доске было проработано 4096 игровых позиций.

Шахматы, го и сёги – это игры, идеально подходящие для развития технологии искусственного интеллекта. Разработчики прогнозируют, что следующим этапом в развитии систем AI станет освоение популярных видеоигр и покера.

 

Читайте также:

Facebook разрабатывает аі, который ускорит процедуру МРТ-сканирования в 10 раз

Роботы никогда не заменят учителей, но повысять уровень образования детей

В MIT создали чип, способный ускорить работу нейросетей в 7 раз

Комментарии