avva | компьютерные новости

Несколько накопившихся ссылок из мира компьютерных наук. Будет интересно программистам и сочувствующим, наверное.

1. В области машинного обучения есть тема интересная "враждебных примеров". Это когда вы, предположим, натренировали нейронную сеть так, что она почти без ошибок называет, какое животное на картинке; но оказывается, что можно взять, скажем, фотографию щенка, которую она распознает, и изменить совсем немного, так, что на ней все еще тот же щенок, ни один человек не спутает ни с чем другим - но нейронная сеть теперь уверена, что это бегемот. В каком-то смысле это демонстрирует уязвимость лучших на сегодня алгоритмов, хотя об этом тоже есть разные мнения (например, можно сказать, что зрительные иллюзии - похожее явление у людей; но там все же другое - это отдельный класс картинок, а не так, что любую картинку можно исказить совсем немного).

https://arxiv.org/abs/1710.08864 в этой недавней статье показывают, что можно находить враждебные примеры, в которых меняется всего один пиксель (в картинке 32x32), и нейронная сеть меняет свою классификацию.

http://www.labsix.org/physical-objects-that-fool-neural-nets/ тут строят враждебные примеры, которые остаются враждебными даже при съемке с разных ракурсов. Делают игрушечную черепашку, которую гуглевский алгоритм распознает как ружье, как ее ни верти и не двигай.

2. 15 Years of Chess Engine Development. Интересный пост на реддите, автор которого запустил четыре разные версии шахматных программ за последние 15 лет - на одном и том же компьютере (ноутбуке 2006-го года, замедленном примерно до скоростей 2002-го года). Результат, для меня по крайней мере, очень анти-интуитивный - прогресс в качестве игры шахматных программ за эти 15 лет был гигантский, и лучшая из них победила Deep Fritz 2002 года (в то время сыгравший вничью с чемпионом мира Крамником) со счетом 99 побед и одна ничья из 100 партий. То есть не только огромный рывок в скорости самих компьютеров с 2002 года обеспечивает неоспоримую победу машин над людьми в шахматах, но и сами программы, даже если бы скорость оставалась такой же, тоже ее обеспечивают. У меня нет хорошего понимания, откуда программы последних лет "выжимают" такое чудовищное алгоритмическое преимущество.

3. Скотт Ааронсон дает ссылку на новую книгу Ави Видгерсона (очень известного ученого в области CS) Mathematics and Computation, выложенную на его сайте. Это панорамный обзор всей области теории сложности (computational complexity), включая сюда и знаменитые нерешенные задачи типа P/NP, и квантовые вычисления, и основы машинного обучения, и многое еще. Без доказательств - это обзор, а не учебник - и написано вроде бы ясным языком и с интересными объяснениями. Я до сих пор только мельком успел посмотреть, но обязательно хочу прочитать.

Flat | Top-Level Comments Only

From:

deep-econom.livejournal.com

как раз тут был пост вчера противоположный вашему, чей оптимизм я совсем не разделяю )
https://ailev.livejournal.com/1383892.html

From: (Anonymous)

Нет никакого машинного обучения. Есть куча давно известных вещей, надерганных из математики и объединенных под модной грантоемкой вывеской "машинное обучение".

Также хорошо известно, как строить "враждебные примеры", правда в девичестве это не так называлось.

Итого - статья может быть интересна только тем, кто не видит лежащей за "машинным обучением" математики.

From:

kray-zemli.livejournal.com

Я думаю, проблема заключается в неверных подходах к обучению.

Человек старается выделить какие-то главные признаки, характеризующие отличие между классами. Нейросеть же тупая и не знает, какие признаки объекта главные, а какие второстепенные.

Это такая разновидность переобучения. В случае с черепахой, очевидно, нейросеть зацепилась за какие-то характерные для винтовок особенности ориентации волокон в деревянном цевье по отношению к металлическому стволу. Эти особенности используются в оружии из практических соображений, но не являются его определяющими критериями.

Причина переобучения здесь в том, что, во-первых, никто и не заставляет выделять главные признаки объектов, а во-вторых, в обучающей выборке отсутствуют примеры, в которых главные признаки позволили бы опознать объект, а второстепенные детали лишь сбивали бы с толку.

С одной стороны, результат выглядит как чудо, когда человек не может отличить объекты (в силу слабой выраженности главных признаков), а нейросеть может (зацепившись за какие-то детали). С другой, имеем такие вот трюки с обманом -- цепляясь за второстепенные детали, нейросеть не понимает сути объектов.

From:

ffedd-ya.livejournal.com

По 2 - исследование любопытное, но вывод "If Fritz was roughly the same strength as Kramnik in Bahrain, it is clear that Houdini 6 on the same machine would have completely crushed Kramnik in the match. " неверен.

Есть такой термин - "неудобный соперник", когда у двух шахматистов А и В сила (измененная против остальных игроков) примерно одинакова, но вот в личных встречах В побеждает А с разгромных счётом (то есть B неудобный соперник для А)
Обычно такое бывает, когда В более силен в том, что А считает своей сильной характеристикой: А пытается обыграть В в обычном своём стиле, используя свою сильную характеристику, но выясняется, что В ещё сильнее в ней.
И так много раз, пока А не сообразит, что надо менять свой стиль игры, при обычном стиле разгром будет продолжаться.

А каждая шахматная программа новой версии - неудобный соперник для программы старой версии, потому что стиль схож.
И для шахматных программ характерно то, что их игра друг против друга показывает бОльшую разницу в силе, чем игра против человека.
Если шахматная программа А1 набрала против человека X 50%, а против шахматной программы A2 - 25%, то в мачте A2 и X результат не будет 75% на 25%, а где-то может быть 55% на 45%.

From: (Anonymous)

Более того, нередка нетразнитивная ситуация, когда А сильнее B, B сильнее С, но С сильнее А.

Именно поэтому в спорте, включая шахматы, сплошь и рядом используется чемпионатская (все со всеми, хотя бы в пределах "группы"), а не кубковая (проигравший выбывает) система...

From:

akor168.livejournal.com

По поводу (2) насколько я понимаю, там все лучше и лучше настраивают гипер-параметры оценки позиции. То есть, например, то, что захват центра однозначно полезная эвристика, никто спорить не будет, но вот вопрос насколько конкретно "в граммах" это стоит в той или иной позиции.

From:

akor168.livejournal.com

На Ютуб несколько человек постоянно обозревают игры движков с друг другом и при том что качество комментариев так себе, но то, что машины сейчас играют фантастически сильно именно в позиционном смысле, абсолютно очевидно буквально после просмотра нескольких партий.

From:

avva.livejournal.com

Интересно, спасибо!

From:

akor168.livejournal.com

https://geektimes.ru/post/271614/

Мне вот эта статья очень понравилась по теме.

From:

dmpogo.livejournal.com

Да чуть не проще просто код прочитать. Весь stockfish8 (в открытом доступе) - всего 10 тысяч строк включая комментари

From:

son-0f-morning.livejournal.com

Насколько я, ни разу не специалист по шахматам, понимаю -- это просто следствие высокого качества и скорости тестирования.

В момент, когда компьютеры начали играть на уровне человека (и лучше) -- кратно сократился цикл "изменение-тестирование-коммит".

Что позволило очень быстро накапливать "качество" игрового движка: как за счёт проверки содержательных предположений (например: а что если варьировать глубину поиска в зависимости от позиции), так и за счёт просто многопараметрической (пере)оптимизацию параметров.

From:

cema.livejournal.com

Thanks for number 3!

From:

once-for-all.livejournal.com

Как же надо раскормить бедного щенка!

From: (Anonymous)

you made my day...

From:

marknn.livejournal.com

по поводу 1) я думаю что людей враждебные примеры тоже сущестуют, причем возможно что например они могут быть уникальными для каждого,то есьт один будет видеть бегемота, а все остальные щенка. Конечно не с одним пикселом, но на уровне шума я думаю легко. Просто пока мы не умеем их находить, ибо оптимизировать под мозг еще не научились.

From:

dmitrmax.livejournal.com

Старая детсадовская шутка, когда задаешь ребенку несколько очевидных вопросов про цвет белых предметов, и после третьего ответа "белый" спрашиваешь: "а что пьет корова?". Я не припоминаю, чтобы по крайней мере дети (а на самом деле и многие взрослые) не отвечали "молоко".

From:

aosypov.livejournal.com

да, отличный пример.

еще похож вопрос, как правильно - у рыбов нет зубов или у рыб нет зуб?

From:

kray-zemli.livejournal.com

Ну во-первых, зубы у рыб всё-таки бывают.

From:

aosypov.livejournal.com

ВотЪ!

From:

dmitrmax.livejournal.com

Это немного другой пример. Тут выбор как бы ограничен двумя неправильными вариантами. В случае с молоком - тут никто за язык не тянет.

From:

aosypov.livejournal.com

а я и не говорил, что пример идентичный :)

ну и ложное ограничение выбора, конечно, это известная вещь.

Edited Date: 2017-11-02 11:02 am (UTC)

From:

kray-zemli.livejournal.com

Как это не умеем? Вся маскировка на этом построена.

From:

garkara.livejournal.com

не знаю, подходит ли это под определение враждебного примера, но есть вот такая картинка с двумя лицами

https://i.pinimg.com/564x/02/4a/e3/024ae37341b2f791d0babd49609f861b--optical-illusions-pictures-eye-illusions.jpg

с близкого расстояния наш мозг видит злое лицо слева и доброе справа, а с далекого - наоборот

From: (Anonymous)

платье синее или золотое?

From:

occuserpens.livejournal.com

[The results show that 73.8% of the test images can be crafted to adversarial images with modification just on one pixel with 98.7% confidence on average. ]

я так понимаю, что это разгром

From:

akor168.livejournal.com

Чтобы найти подобные примеры надо специально строить их генератор, который еще и сам отдельно обучается на их генерацию. Это не то чтобы взяли случайный пиксель...

From:

occuserpens.livejournal.com

Конечно. В криптографии это называется успешная атака

Edited Date: 2017-11-02 04:01 am (UTC)

From:

aosypov.livejournal.com

хорошо, что дошло дело до реальной работы до того, как в аэропорту не расстреляли кого-нибудь с игрушечной черепашкой

From: (Anonymous)

nice try

https://meduza.io/news/2017/10/22/v-izraile-palestintsa-zaderzhali-iz-za-zapisi-dobroe-utro-v-feysbuke-algoritm-perevel-ee-kak-atakuyte-ih

From:

kray-zemli.livejournal.com

Самое обидное, что если такую ошибку сделает полицейский -- ему прямая дорога в дурку. А если искусственная нейросеть -- то виноватого потом не найдёшь, будет классифицировано как несчастный случай.

From:

eldhenn

А это ещё одно когнитивное искажение у человека - считать, что с нахождением виноватого проблема решается.

From:

kray-zemli.livejournal.com

С нахождением виноватого проблема не всегда решается, но освобождение заведомо виноватого от ответственности всегда служит дурным примером остальным.

From:

eldhenn

История это подтверждает, как мы видим? Уголовных преступлений больше не существует?

From:

kray-zemli.livejournal.com

История подтверждает непрерывно. Никого не волнует, что там понаписано в законах. Всех волнует реальная правоприменительная практика, реальные шансы быть привлеченным к ответственности.

From:

eldhenn

Прям вот всех...

From:

alexcohn.livejournal.com

Эта же проблема у автомобиля без водителя. Если такая машина задавит пешехода, кто виноват? И как быть, если нужно принимать этическое решение (девочка перебегает дорогу, нужно либо давить её, либо сворачивать на тротуар, где стоит старушка)?

From:

kray-zemli.livejournal.com

С этической проблемой вроде разобрались: виноват нарушающий правила. ПДД предписывает аварийную остановку в ситуации с девочкой. Сбил девочку -- её проблемы, она нарушила правила. А сбил старушку -- виноват сам, потому что совершил авантюрный выходящий за рамки ПДД уклонительный манёвр.

From:

biovizir.livejournal.com

Спасибо!

From:

aka-mik.livejournal.com

"У меня нет хорошего понимания, откуда программы последних лет "выжимают" такое чудовищное алгоритмическое преимущество"

Ваш код за 15 лет совсем не улучшился?

PS Эх, помню как-то писал оптимальный раскрой на генетических алгоритмах, ну написал, но как-то медленно работал, оптимизировал в одном месте - стало в 100 раз быстрее работать, в другом - еще в 100 раз...

From: (Anonymous)

Ну так Deep Fritz же не ламеры писали.

Я подозреваю, дело в оптимизации всяких мелких параметров (на сколько пунктов круче иметь коня на d5, чем на b5?), для чего используются распределенные сети с невиданной ранее суммарной мощностью. В коде Stockfish дофига и больше магических значений, у них есть т. н. Fishnet для оптимизации оных.

From:

jmyshanya.livejournal.com

"враждебные примеры"?

это же зенитные суры аль-эфесби!

From:

999999.livejournal.com

я наивный сочуствующий с ulterior motives, поговорите со мной пожалуйста жестами
1. значит ли это, что фичей экстрагировать здесь (в этих 500 измерениях, где в многообразие класса можно Вклиниться) неоткуда?

Edited Date: 2017-11-03 03:29 am (UTC)

From: (Anonymous)

В тему шахмат. Может видели уже: https://github.com/bolknote/SedChess

ЖЖ удалил, так что анонимно, извинтиляюсь

From:

failhigh.livejournal.com

Был очень внутри всей кухни шахматных программ.
В начале 0х выстрелила Рыбка.
Райлих придумал чудесное простое отсечение, оптимизировал на C++ темплейтами много чего и программа, у которой оценка Piece Square Table вдруг начала рубить всех.

До него был Фрукт и Шреддер с похожими идеями - Rule Based не рулит, отсекать нужно брютальнее.

По слухам постоянной оптимизацией лучшие росли на .5 эло в день.

Тупо состарилось поколение великих ассемблерщиков (Морш и т.д.).

Еще был прекрасный скандал, когда какие-то клоуны из Росcии клонировали Рыбку, попались на этом, изворачивались и т.д.

DD за считанные недели до смерти поражал запалом при обсуждении фишек Komodo.

С 10х немного поменял ориентиры, но не вижу причин, почему все должно утихнуть. Денег в этой отрасли примерно всегда одинаково. Она не хайповая уже с середины 90х, зато железо для тестов все дешевеет.

Edited Date: 2017-11-07 05:10 pm (UTC)