Дослідницька група компанії DeepMind, що належить Google, разом з вченими Лондонського університетського коледжу розробила програму на основі штучного інтелекту AlphaZero, яка може самонавчатися грі в шахи, го і сьогі та обігравати комп’ютерні програми і інтелектуальні системи. Результати дослідження були опубліковані в журналі Science.

З моменту поєдинку суперкомп’ютера Deep Blue і всесвітньо відомого шахіста Гарі Каспарова пройшло більше 20 років. У поєдинку “машина-людина” перемога дісталася комп’ютеру, і вона стала прямим доказом розвитку обчислювальної і логічної потужності інтелектуальних машин. З тих пір комп’ютери ставали все розумнішими, але могли перемогти людину тільки в одній грі.

AlphaZero здатний обіграти людини відразу в трьох іграх, більш того, в програму закладено навичку “самонавчання” – на підставі досвіду попередніх ігор вона удосконалює свої ігрові вміння. Дослідники називають AlphaZero системою навчання з підкріпленням. Спосіб її навчання не схожий на той, який зазвичай використовує людина: в систему вводиться базовий набір правил, потім комп’ютер починає грати сам із собою. Дія повторюється кілька разів, до тих пір, поки тактика гри комп’ютера не стає ідеальною.

В ході навчання система AlphaZero визначала вдалі і невдалі комбінації ходів, а також використовувала метод Монте-Карло для пошуку найбільш виграшних схем ігрового алгоритму. Пройшовши всі етапи навчання, ШІ став готовим до гри з іншими комп’ютерами і, нарешті, дійшов до рівня майстерності, що дає можливість грати з людиною. Технічна “начинка” AlphaZero – 5000 тензорних процесорів, які роблять машину еквівалентною за можливостями великим суперкомп’ютерам. Весь цикл навчання від нуля до рівня профі зайняв у системи ШІ менше 24 годин.

Під час експериментальних ігор з іншими “розумними” системами, AlphaZero обіграла в шахи Stockfish всього за 4 години, в сьогі – програму Elmo через 2 години, а у го ШІ обіграв свою ж версію, яка перемогла в 2016 році легендарного гравця Лі Седола, в результаті 30-годинного поєдинку. В ході кожного етапу навчання на дошці було опрацьовано 4096 ігрових позицій.

Шахи, го і сьогі – це ігри, що ідеально підходять для розвитку технології штучного інтелекту. Розробники прогнозують, що наступним етапом у розвитку систем AI стане освоєння популярних відеоігор та покеру.

 

Читайте також:

Facebook розробляє штучний інтелект, який прискорить процедуру МРТ-сканування у 10 разів

Роботи ніколи не замінять вчителів, але підвищать рівень освіти дітей

У MIT створили чіп, здатний прискорити роботу нейромереж у 7 разів

Коментарi