Метод Google для игры в го стал самообучаемым

Метод Google для игры в го стал самообучаемым

Профессионалы довольно популярной компании DeepMind, которая относительно недавно принялась изучать моральную и этическую стороны искусственного интеллекта, разработали новейшую, усовершенствованную версию алгоритма AlphaGo для игры в го.

В DeepMind подчеркнули, что избавили метод от ограничений человеческого разума. Версии Zero люди не нужны. Его предшественник, AlphaGo, обучался у людей и выигрывал наилучших игроков в го.

Перепечатывание материалов портала возможно только c указанием активной ссылки на сайт.
Редакция не несет ответственности за содержание рекламных баннеров.
Полное либо частичное использование материалов запрещено.
Рекламный отдел: contact@kinoinfa.ru.

Ученые говорят, что они ничего не программировали об игре го кроме правил данной игры. Ни одной! В отличие от AlphaGo, у Zero всего одна нейросеть вмсто 2-х, однако и данного хватило. Она начинала с бессмысленных ходов, однако уже после 4,9 млн партий выучила игру настолько тщательно, что смогла в сухую обыграть уникальный AlphaGo, одержав 100 уверенных побед. На 21 день она уже могла потягаться с не менее совершенным алгоритмом AlphaGo Master, одолевшим лучшего в мире игрока в го Кэ Цзе данной весной, а спустя 40 дней нейростеть превзошла всех собственных предшественников. Во время пробных испытаний новая программа обыграла собственный прошлый вариант, тот, который в свое время одержал победу над Ли Седолем, безусловно «всухую», с невероятным счетом 100:0. ИИ AlphaGo Zero на протяжении 3-х дней наблюдал за игрой людей, проводил анализ.

В DeepMind отмечают, что благодаря такому шагу избавили искусственный интеллект от ограничений человеческого разума. В конце концов AlphaGo Zero стал делать ходы, которые нетипичны даже для профессиональных игроков.

Рекомендуем почитать