AlphaZero, новий проект Google, громить Stockfish в матчі з 100 партій

Вчора шахи змінилися назавжди. Можливо, не тільки шахи, а й весь світ.

Рік тому програма AlphaGo сенсаційно обіграла найсильнішого в світі гравця в го, а тепер штучний інтелект AlphaZero розгромив найсильніший за рейтингом шаховий движок .

Stockfish, який використовують для домашньої підготовки більшість гравців, переможець Чемпіонату TCEC 2016 року і Чемпіонату Chess.com серед комп'ютерних програм 2017 року , Виявився явно слабкіше. У матчі з 100 партій AlphaZero здобув 28 перемог при 72 нічиїх і жодного разу не програв.

До речі, AlphaZero витратив всього чотири години на "вивчення" шахів. Вибачте, люди, але вам за ним не наздогнати.

Все вірно - програмісти AlphaZero, що розробляється DeepMind, підрозділом Google, створили його на основі механізму " машинного навчання ", Точніше," навчання з підкріпленням ". Простіше кажучи, AlphaZero не вивчав шахи в традиційному розумінні. У нього немає ні дебютної книги, ні ендшпільних таблиць, ні складних алгоритмів для оцінки сили центральних і флангових пішаків.

У нього немає ні дебютної книги, ні ендшпільних таблиць, ні складних алгоритмів для оцінки сили центральних і флангових пішаків

Штаб-квартира Google у Лондоні зсередини, підрозділ DeepMind розташоване на восьмому поверсі. | Фотографія Марії Ємельянової / Chess.com.

Його роботу можна порівняти з роботом, який може використовувати тисячі запчастин, але не знає принципу роботи двигуна внутрішнього згоряння, - він перебирає можливі комбінації, поки не побудує Феррарі, і для цього йому потрібно менше часу, ніж займає перегляд трилогії "Володар кілець". За чотири години програма зіграла сама з собою безліч партій, ставши своїм власним вчителем.

Поки що команда програмістів мовчить. Вони не дали Chess.com коментарів, посилаючись на те, що доповідь "поки знаходиться на розгляді", але тут ви можете прочитати його повний текст . У дослідну групу входить Деміс Хассабіс, кандидат в майстри з Англії і співзасновник DeepMind (придбаний Google в 2014). Хассабіс, який брав участь в турнірі тандемів ProBiz на відкритті London Chess Classic, зараз знаходиться на конференції Neural Information Processing Systems (Нейронні системи обробки інформації) в Каліфорнії, в якості співавтора доповіді на іншу тему .

Хассабіс, який брав участь   в турнірі тандемів ProBiz   на відкритті London Chess Classic, зараз знаходиться на конференції Neural Information Processing Systems (Нейронні системи обробки інформації) в Каліфорнії,   в якості співавтора доповіді на іншу тему

Деміс Хассабіс грає в парі з Майклом Адамсом на турнірі в штаб-квартирі Google в Лондоні кілька днів тому. | Фотографія Марії Ємельянової / Chess.com.

Зате з Chess.com охоче поділився своїми думками шахіст, що володіє великим особистим досвідом гри проти шахових комп'ютерів. МГ Гаррі Каспаров не здивований, що компанія DeepMind перейшла від го до шахів.

"Це помітне досягнення, хоча воно і було очікувано після AlphaGo", - заявив він Chess.com. "Воно наближається до 'типу-Б', людиноподібній підходу до шахів, яким Клон Шеннон і Алан Тьюринг мріяли замінити суцільний перебір".

Одна з 10 обраних партій, які наводяться в статті.

Подібно до людини, AlphaZero розглядає менше позицій, ніж її попередниці. У звіті заявлено, що вона оцінює "всього" 80 тисяч позицій в секунду в порівнянні з 70 мільйонами в секунду у Stockfish.

МГ Петер-Хайне Нільсен, багаторічний секундант чемпіона світу МГ Магнуса Карлсена, відкрив своє захоплення, сближающее його з президентом ФІДЕ: інопланетян. Він заявив Chess.com: "Прочитавши доповідь і, особливо, переглянувши партії, я подумав:" Мені завжди було цікаво, що було б, якби більше розумний вигляд висадився на нашій планеті і показав нам своє мистецтво шахової гри. Здається, тепер я знаю, як це ".

Інтерв'ю Chess.com з Нільсеном про новини про AlphaZero.

Ми також дізналися, про значущість переваги виступкі, по крайней мере, для штучного інтелекту. 25 з 28 перемог AlphaZero здобув білими (хоча результат + 3 = 47-0 чорними проти Stockfish, чий рейтинг перевищує 3400, також непоганий).

У звіті показано і наскільки часто движок вибирав ті чи інші дебюти в міру навчання. Вибачте, любителі староіндійській захисту, але ви не в фаворі. Інтерес до французької захисту також згас згодом, а ось прагнення грати ферзевий гамбіт і, особливо, англійське початок тільки зростала.

Інтерес до французької захисту також згас згодом, а ось прагнення грати ферзевий гамбіт і, особливо, англійське початок тільки зростала

Частота дебютів, застосовуваних AlphaZero в фазі "навчання". Ілюстрація з наукової доповіді AlphaZero .

Що б ви зробили на місці не відає втоми істоти, тільки що освоїв гру з 1400-річною історією? Взялися б за іншу. Після матчу зі Stockfish програма AlphaZero витратила на "навчання" всього дві години і перемогла "Elmo", найсильнішого з комп'ютерних движків для гри в сьогі.

Застосування цієї інноваційної самонавчальної програми, зрозуміло, не обмежена іграми.

"Завжди вважалося, що в шахах від машини потрібно занадто багато емпіричних знань, щоб ті могли грати сильно 'з нуля', взагалі не використовуючи людські знання", - сказав Каспаров. "Звичайно, мені буде цікаво подивитися, що ми зможемо дізнатися про шахи за допомогою AlphaZero, який відкриває величезні перспективи машинного навчання в цілому-машини можуть знаходити закономірності, недоступні для людей. Очевидно, що наслідки простягаються далеко за межі шахів і інших ігор. Здатність машини відкривати і перевершувати знання складних закритих систем, накопичені людством за століття, - це інструмент, який змінює світ ".

Гаррі Каспаров і Деміс Хассабіс на турнірі ProBiz в Лондоні. | Фотографія Марії Ємельянової / Chess.com.

Журналісти Chess.com опитали вісім з десяти учасників турніру в Лондоні про їхнє ставлення до матчу програм. Відео з інтерв'ю буде розміщено на сайті пізніше.

Найбільш різко критикував умови матчу МГ Хікару Накамура. Зараз йде гаряча дискусія про обчислювальної потужності супротивників, але Накамура вважає, що важливіше було інше.

Американський гросмейстер назвав матч "нечесним", вказавши, що для оптимальної роботи движок Stockfish повинен використовувати дебютну книгу. Накамура не думає, що з її допомогою Stockfish виграв би матч, але розрив у рахунку був би набагато менше.

"Я впевнений, що сам Господь бог не набрав би проти Stockfish 75 відсотків очок білими без будь-якої фори", - прокоментував він результат AlphaZero білими: 25 перемог і 25 нічиїх.

МГ Ларрі Кауфман, провідний шаховий консультант движка Komodo, сподівається побачити, наскільки добре працює нова програма на персональних комп'ютерах, не користуючись обчислювальними потужностями Google. Він також повторив висловлені Накамурою заперечення з приводу того, що Stockfish грав без своїх звичайних дебютних знань.

"Звичайно, це майже неймовірно", сказав він, - "так, я чув про досягнення AlphaGo Zero в грі го і очікував, що станеться щось подібне, враховуючи, що в команді розробників є шахіст Деміс Хассабіс. Однак, незрозуміло, чи зможе чи програма AlphaZero грати в шахи на звичайному комп'ютері, і наскільки добре у неї це вийде. Можливо, сучасне переважання шахових движків, що використовують мінімаксне функцію, наближається до кінця, але поки проголошувати це занадто рано. Варто зазначити, що за час навчання AlphaZero де- факто створила власну дебютну ю книгу, тому було б справедливіше використовувати її проти движка з хорошою дебютної книгою ".

Чи не торкаючись умов матчу, Нільсен замислюється, в яких ще областях може застосовуватися даний тип навчання.

"[Це] сучасний штучний інтелект", - сказав гросмейстер. "Він йде від чогось на кшталт шахів до проблем, гідним нобелівських премій і навіть більшого. Думаю, нам пощастило, що вони вирішили витратити чотири години шахи, але наслідки цього відкриття куди більш значні".

Що б ви зробили на місці не відає втоми істоти, тільки що освоїв гру з 1400-річною історією?