Про це повідомляє НВ.

Як зазначають журналісти Science Alert, програмі потрібно лише чотири години, щоб освоїти всі шахові знання людства.

Після того, як алгоритм AlphaZero ознайомили тільки з правилами шахів, без стратегії, всього за чотири години він освоїв гру в так, що зміг обіграти найбільш рейтингову шахову програму – Stockfish. У серії 100 ігор проти Stockfish, AlphaZero виграв 25 ігор, граючи білими і три гри, граючи чорними. Решта партій завершилися внічию, перемог у Stockfish не було.

«Тепер ми знаємо, хто наш новий король. Це, безсумнівно, буде революціонізувати гру, але необхідно думати про те, як це може бути застосовано поза шахами», – зізнався дослідник шахів Девід Kремелі, голова сайту Chessable.

Алгоритм AlphaZero був створений на базі напрацювань за програмами AlphaGo і AlphaGo Zero, які раніше стали абсолютними чемпіонами в грі. AlphaZero розглядає менше позицій, ніж її попередниці. У звіті заявлено, що вона оцінює 80 тисяч позицій в секунду в порівнянні з 70 мільйонами в секунду у Stockfish.

На відміну від попередніх програм від DeepMind, AlphaZero створювався як алгоритм, здатний навчитися відразу декільком завданням-іграм, а не однієї. Для цього алгоритм не вчили перемагати, а давали тільки базові знання про правила гри. AlphaZero потім грав сам із собою і самостійно виробляв тактику.

«Я завжди задавався питанням, як це було б, якби більш розвинені види висадилися на Землі і показали нам, як вони грають в шахи. Тепер я це побачив», – сказав гросмейстер Пітер Хайне Нільсен, коментуючи результати AlphaZero.

 

«Вголос»