avva: (Default)
[personal profile] avva
Придется, кажется, расстаться еще с одним привычным и уютным знанием о мире: что компьютеры, хоть в шахматы уже давно всех побеждают, очень плохо играют в Го. Оказывается, именно в этой области в последние несколько лет случился рывок вверх (англ.)

Новая программа Zen19 играет на уровне 5-го любительского дана; статья объясняет, что это примерно 100-е место среди всех игроков в Америке. И это во много раз лучше того, как программы играли еще лет 5 назад.

Конечно, еще есть профессиональные даны, и в Японии, Корее и Китае живут, я думаю, много тысяч игроков, играющих лучше этой программы - но огромный прогресс налицо. При этом обидно, что этот прогресс достигнут по сути дела тем же путем, каким компьютеры победили в шахматах - путем слепого бездумного перебора. Только в Го это перебор вероятностный, методом Монте-Карло (в статье это подробнее объясняется).

Было бы намного интереснее, если бы компьютеры учились лучше играть в Го путем "понимания" хотя бы в некотором смысле, путем, похожим на человеческое мышление об этой игре. К сожалению, не похоже, чтобы нынешний чемпион Zen19 включал в себя "глубокие" знания об игре (его исходники недоступны, так что в точности неизвестно). Более того, подход Монте-Карло очень удобно разбивать на параллельные потоки. Это значит, что с ростом вычислительной мощности сила Zen19 скорее всего будет еще расти и расти. И возможно, именно такой подход в итоге победит всех игроков-людей, как это уже произошло в шахматах.
Page 1 of 4 << [1] [2] [3] [4] >>

Date: 2012-02-29 08:02 pm (UTC)
From: [identity profile] gaz-v-pol.livejournal.com
Остался последний бастион, шведские шахматы (bughouse). В них компьютер ещё не скоро (никогда?) не научится играть лучше человека.

Я когда-то пробовал писать программу, которая бы в шашки "думала". Рассуждал так: сильный шашист смотрит на позицию и подсознательно вспоминает множество аналогичных. И понимает: в таких позициях принято играть так-то. Можно попробовать оценить схожесть позиций. Я брал множество бессмысленных параметров вроде суммы расстояний от шашек до разных прямых с разными весами. И надеялся, что можно как-то выделить множество позиций, где надо играть одним образом, от множества позиций, где надо играть другим образом. Ничего не вышло. Но при каком-то уровне развития вычислительной мощности уже может быть и выйдет.

Date: 2012-02-29 08:03 pm (UTC)
From: [identity profile] spamsink.livejournal.com
Осталось теперь применить этот подход к Аримаа, пока не поздно получить $10000. :)

тем же путем, каким компьютеры победили в шахматах - путем слепого бездумного перебора

Я полагаю, что гроссмейстеры играют в шахматы точно так же - именно путем слепого бездумного массивно параллельного перебора, и слепая бездумность этого перебора - причина того, что сознанием факт перебора не осознаётся.

Date: 2012-02-29 08:04 pm (UTC)
From: [identity profile] vsopvs.livejournal.com
мне всегда интересно, есть ли, кроме интроспекции, доказательство того, что человеческий мозг играет в Го не путем слепого бездумного перебора?

интроспекция, все-таки, не слишком надежная вещь, мне кажется.

Date: 2012-02-29 08:05 pm (UTC)
From: [identity profile] gdt.livejournal.com
хотел написать, что верю в бридж, но решил перед этим проверить, как обстоят дела. а дела, оказывается, уже и с бриджем обстоят неважно.

Date: 2012-02-29 08:08 pm (UTC)
From: [identity profile] dmpogo.livejournal.com
Да, обидно что решение приходит просто за счет "brute force".
В определенной степени, это наблюдается и в научных численных расчетах.

Date: 2012-02-29 08:15 pm (UTC)
From: [identity profile] dmpogo.livejournal.com
В человеческом мозге перебор присутствует, но сочетается с быстрыми оценками (*) Мне кажется что баланс перебора/оценки свойственный человеческому мозгу компьютерами не был повторен, а наборот было понято что что при достачной мощности, оценками можно все меньще заниматься. В этом смысле современные программы отошли от человеческих пропорций.

(*) можно возразить что на бессознательном уровне и оценки - перебор, но мы этого не осознаем, но мне кажется это не так.

Date: 2012-02-29 08:16 pm (UTC)
From: [identity profile] dmpogo.livejournal.com
Я не думаю что в мозгу происходит параллельный расчет первого хода h2-h3 до конечной позиции, и лишь потом выбирается е2-е4
From: [identity profile] osherovmikhail.livejournal.com
Современные компьютеры играют в шахматы отнюдь не методом слепого бездумного перебора. Михаил Ботвинник пытался построить "Думающую" машину, в его годы шахматные компьютеры действовали простым перебором. Сейчас программы-победители не только перебирают ходы, но и частично думают. Применяются многие методы - и Бритва Оккама, чтобы машина не думала лишнего и не тратила время, стандартные эндшпили, оценки силы фигур, оценки позиции. Полностью принципы Ботвинника, в том числе неточная цель игры, оценка позиции, не применяются, но метод траекторий фигур - применяется. И т. д.

Date: 2012-02-29 08:17 pm (UTC)
From: [identity profile] vsopvs.livejournal.com
да, я именно про это и спрашивал. ведь интроспекция - как раз и есть то, что "нам кажется".
From: [identity profile] osherovmikhail.livejournal.com
1. Объем шахматной памяти, библиотека дебютов и окончаний - в голове.

2. Оценка позиции.

3. Создание планов игры, рассмотрение возможных планов, направлений атаки и защиты.

4. Расчет конкретных продолжений игры.

Date: 2012-02-29 08:20 pm (UTC)
From: [identity profile] osherovmikhail.livejournal.com
Шашечные программы уже существуют.

Date: 2012-02-29 08:21 pm (UTC)
From: [identity profile] bvlb.livejournal.com
А мне недавно попадалась лекция, в начале которой упоминается о том, что легендарный TD-Gammon переписали с использованием линейного классификатора вместо нейронной сети, а он, зараза, играет в нарды, как и раньше, на уровне чемпионов мира. Тогда я и подумал, кстати, что ГО недолго осталось.

Date: 2012-02-29 08:21 pm (UTC)
From: [identity profile] saccovanzetti.livejournal.com
Думающие?

Date: 2012-02-29 08:23 pm (UTC)
From: [identity profile] bvlb.livejournal.com
мы использует перебор вместе с эвристиками, другое дело откуда и как мы их берем.

Date: 2012-02-29 08:23 pm (UTC)
From: [identity profile] sensemaking.livejournal.com
Картинка в тему об уютном знанием о мире (с объяснением какие игры остаются людям :)
http://xkcd.com/1002/
From: [identity profile] spamsink.livejournal.com
Все, кроме пункта 1, допускает подсознательный перебор.

Date: 2012-02-29 08:24 pm (UTC)
From: [identity profile] beldmit.livejournal.com
А чем легендарен TD-Gammon?

Date: 2012-02-29 08:25 pm (UTC)
From: [identity profile] spamsink.livejournal.com
Библиотеки дебютов никто не отменял, но их одних совершенно недостаточно для игры в силу гроссмейстера.

Date: 2012-02-29 08:33 pm (UTC)
From: [identity profile] deadkittten.livejournal.com
Мне что-то кажется, что эта "плохая игра в Го" была в основном связана не со сложностью игры, а с тем, что раньше основные силы были брошены на шахматы. Теперь время и для других игр настало...

Date: 2012-02-29 08:34 pm (UTC)
From: [identity profile] mm-aa.livejournal.com
Судя по всему последний бастион пока - бридж.

Date: 2012-02-29 08:41 pm (UTC)
From: [identity profile] dmitriy mandel (from livejournal.com)
Я правильно понял, что вы построили что-то типа k-nearest neighbor algorithm на некоем многомерном пространстве? Вы тренировали программу на какой-то базе данных реальных шашечных партий или просто пытались определить сходства между позициями из теоретических соображений?

Мой опыт с подобными knn-алгоритмами подсказывает, что бывает трудно найти "правильные" метрики. Ещё труднее при ограниченных вычислительных ресурсах оптимизировать веса. А если набрать наугад слишком много метрик/измерений, то начинается curse of dimensionality. В общем, там много подводных камней.

Date: 2012-02-29 08:46 pm (UTC)
From: [identity profile] melkore.livejournal.com
меня закидают помидорами если я скажу, что Го это не нужно? мне всегда казалось что максимальное удовольствие от этой игры получаешь от ощущения стиля и характера оппонента, и она куда более личная чем шахматы.
так что конечно ура программистам что двигают вперёд науку, но игра от этого лучше не станет.

Date: 2012-02-29 09:01 pm (UTC)
From: [identity profile] bvlb.livejournal.com
с него пошли в 90х активные эксперименты с reinforcement learning и многие решения, которые играют в разные игры на уровне людей-чемпионов и т.п.

Date: 2012-02-29 09:25 pm (UTC)
From: [identity profile] azlozi.livejournal.com
Не понадобились думающие, описаны все комбинации, человек проигрывает всегда.

Date: 2012-02-29 10:00 pm (UTC)
From: [identity profile] dmpogo.livejournal.com
Речь не только о дебютах. И в процессе игры есть ходы, не имеющие отношения к задаче, на которые не обращаешь внимание (иногда зря :) )
То есть у человека есть понятие "задачи" которая в данный момент перед ним.
Кстати в шахматах один из основных skills - умение переопределить задачу (вовремя поняв когда предыдущая не оправдалась.

В целом, я думаю что если выписать все варианты рассмотренные компьютером в данной партии, то их окажется значительно больше чем рассматривает и гроссмейстер и перворазрядник.
Page 1 of 4 << [1] [2] [3] [4] >>

December 2025

S M T W T F S
  123 4 56
78 9 10 11 1213
1415 1617181920
21 22 23 24 2526 27
28293031   

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Dec. 28th, 2025 05:53 pm
Powered by Dreamwidth Studios