компьютеры и го
Feb. 29th, 2012 09:48 pmПридется, кажется, расстаться еще с одним привычным и уютным знанием о мире: что компьютеры, хоть в шахматы уже давно всех побеждают, очень плохо играют в Го. Оказывается, именно в этой области в последние несколько лет случился рывок вверх (англ.)
Новая программа Zen19 играет на уровне 5-го любительского дана; статья объясняет, что это примерно 100-е место среди всех игроков в Америке. И это во много раз лучше того, как программы играли еще лет 5 назад.
Конечно, еще есть профессиональные даны, и в Японии, Корее и Китае живут, я думаю, много тысяч игроков, играющих лучше этой программы - но огромный прогресс налицо. При этом обидно, что этот прогресс достигнут по сути дела тем же путем, каким компьютеры победили в шахматах - путем слепого бездумного перебора. Только в Го это перебор вероятностный, методом Монте-Карло (в статье это подробнее объясняется).
Было бы намного интереснее, если бы компьютеры учились лучше играть в Го путем "понимания" хотя бы в некотором смысле, путем, похожим на человеческое мышление об этой игре. К сожалению, не похоже, чтобы нынешний чемпион Zen19 включал в себя "глубокие" знания об игре (его исходники недоступны, так что в точности неизвестно). Более того, подход Монте-Карло очень удобно разбивать на параллельные потоки. Это значит, что с ростом вычислительной мощности сила Zen19 скорее всего будет еще расти и расти. И возможно, именно такой подход в итоге победит всех игроков-людей, как это уже произошло в шахматах.
Новая программа Zen19 играет на уровне 5-го любительского дана; статья объясняет, что это примерно 100-е место среди всех игроков в Америке. И это во много раз лучше того, как программы играли еще лет 5 назад.
Конечно, еще есть профессиональные даны, и в Японии, Корее и Китае живут, я думаю, много тысяч игроков, играющих лучше этой программы - но огромный прогресс налицо. При этом обидно, что этот прогресс достигнут по сути дела тем же путем, каким компьютеры победили в шахматах - путем слепого бездумного перебора. Только в Го это перебор вероятностный, методом Монте-Карло (в статье это подробнее объясняется).
Было бы намного интереснее, если бы компьютеры учились лучше играть в Го путем "понимания" хотя бы в некотором смысле, путем, похожим на человеческое мышление об этой игре. К сожалению, не похоже, чтобы нынешний чемпион Zen19 включал в себя "глубокие" знания об игре (его исходники недоступны, так что в точности неизвестно). Более того, подход Монте-Карло очень удобно разбивать на параллельные потоки. Это значит, что с ростом вычислительной мощности сила Zen19 скорее всего будет еще расти и расти. И возможно, именно такой подход в итоге победит всех игроков-людей, как это уже произошло в шахматах.
no subject
Date: 2012-02-29 08:02 pm (UTC)Я когда-то пробовал писать программу, которая бы в шашки "думала". Рассуждал так: сильный шашист смотрит на позицию и подсознательно вспоминает множество аналогичных. И понимает: в таких позициях принято играть так-то. Можно попробовать оценить схожесть позиций. Я брал множество бессмысленных параметров вроде суммы расстояний от шашек до разных прямых с разными весами. И надеялся, что можно как-то выделить множество позиций, где надо играть одним образом, от множества позиций, где надо играть другим образом. Ничего не вышло. Но при каком-то уровне развития вычислительной мощности уже может быть и выйдет.
no subject
Date: 2012-02-29 08:03 pm (UTC)тем же путем, каким компьютеры победили в шахматах - путем слепого бездумного перебора
Я полагаю, что гроссмейстеры играют в шахматы точно так же - именно путем слепого бездумного массивно параллельного перебора, и слепая бездумность этого перебора - причина того, что сознанием факт перебора не осознаётся.
no subject
Date: 2012-02-29 08:04 pm (UTC)интроспекция, все-таки, не слишком надежная вещь, мне кажется.
no subject
Date: 2012-02-29 08:05 pm (UTC)no subject
Date: 2012-02-29 08:08 pm (UTC)В определенной степени, это наблюдается и в научных численных расчетах.
no subject
Date: 2012-02-29 08:15 pm (UTC)(*) можно возразить что на бессознательном уровне и оценки - перебор, но мы этого не осознаем, но мне кажется это не так.
no subject
Date: 2012-02-29 08:16 pm (UTC)путем слепого бездумного перебора
Date: 2012-02-29 08:17 pm (UTC)no subject
Date: 2012-02-29 08:17 pm (UTC)гроссмейстеры играют в шахматы
Date: 2012-02-29 08:19 pm (UTC)2. Оценка позиции.
3. Создание планов игры, рассмотрение возможных планов, направлений атаки и защиты.
4. Расчет конкретных продолжений игры.
no subject
Date: 2012-02-29 08:20 pm (UTC)no subject
Date: 2012-02-29 08:21 pm (UTC)no subject
Date: 2012-02-29 08:21 pm (UTC)no subject
Date: 2012-02-29 08:23 pm (UTC)no subject
Date: 2012-02-29 08:23 pm (UTC)http://xkcd.com/1002/
Re: гроссмейстеры играют в шахматы
Date: 2012-02-29 08:24 pm (UTC)no subject
Date: 2012-02-29 08:24 pm (UTC)no subject
Date: 2012-02-29 08:25 pm (UTC)no subject
Date: 2012-02-29 08:33 pm (UTC)no subject
Date: 2012-02-29 08:34 pm (UTC)no subject
Date: 2012-02-29 08:41 pm (UTC)Мой опыт с подобными knn-алгоритмами подсказывает, что бывает трудно найти "правильные" метрики. Ещё труднее при ограниченных вычислительных ресурсах оптимизировать веса. А если набрать наугад слишком много метрик/измерений, то начинается curse of dimensionality. В общем, там много подводных камней.
no subject
Date: 2012-02-29 08:46 pm (UTC)так что конечно ура программистам что двигают вперёд науку, но игра от этого лучше не станет.
no subject
Date: 2012-02-29 09:01 pm (UTC)no subject
Date: 2012-02-29 09:25 pm (UTC)no subject
Date: 2012-02-29 10:00 pm (UTC)То есть у человека есть понятие "задачи" которая в данный момент перед ним.
Кстати в шахматах один из основных skills - умение переопределить задачу (вовремя поняв когда предыдущая не оправдалась.
В целом, я думаю что если выписать все варианты рассмотренные компьютером в данной партии, то их окажется значительно больше чем рассматривает и гроссмейстер и перворазрядник.