avva: (Default)
[personal profile] avva
Несколько накопившихся ссылок из мира компьютерных наук. Будет интересно программистам и сочувствующим, наверное.

1. В области машинного обучения есть тема интересная "враждебных примеров". Это когда вы, предположим, натренировали нейронную сеть так, что она почти без ошибок называет, какое животное на картинке; но оказывается, что можно взять, скажем, фотографию щенка, которую она распознает, и изменить совсем немного, так, что на ней все еще тот же щенок, ни один человек не спутает ни с чем другим - но нейронная сеть теперь уверена, что это бегемот. В каком-то смысле это демонстрирует уязвимость лучших на сегодня алгоритмов, хотя об этом тоже есть разные мнения (например, можно сказать, что зрительные иллюзии - похожее явление у людей; но там все же другое - это отдельный класс картинок, а не так, что любую картинку можно исказить совсем немного).

https://arxiv.org/abs/1710.08864 в этой недавней статье показывают, что можно находить враждебные примеры, в которых меняется всего один пиксель (в картинке 32x32), и нейронная сеть меняет свою классификацию.

http://www.labsix.org/physical-objects-that-fool-neural-nets/ тут строят враждебные примеры, которые остаются враждебными даже при съемке с разных ракурсов. Делают игрушечную черепашку, которую гуглевский алгоритм распознает как ружье, как ее ни верти и не двигай.

2. 15 Years of Chess Engine Development. Интересный пост на реддите, автор которого запустил четыре разные версии шахматных программ за последние 15 лет - на одном и том же компьютере (ноутбуке 2006-го года, замедленном примерно до скоростей 2002-го года). Результат, для меня по крайней мере, очень анти-интуитивный - прогресс в качестве игры шахматных программ за эти 15 лет был гигантский, и лучшая из них победила Deep Fritz 2002 года (в то время сыгравший вничью с чемпионом мира Крамником) со счетом 99 побед и одна ничья из 100 партий. То есть не только огромный рывок в скорости самих компьютеров с 2002 года обеспечивает неоспоримую победу машин над людьми в шахматах, но и сами программы, даже если бы скорость оставалась такой же, тоже ее обеспечивают. У меня нет хорошего понимания, откуда программы последних лет "выжимают" такое чудовищное алгоритмическое преимущество.

3. Скотт Ааронсон дает ссылку на новую книгу Ави Видгерсона (очень известного ученого в области CS) Mathematics and Computation, выложенную на его сайте. Это панорамный обзор всей области теории сложности (computational complexity), включая сюда и знаменитые нерешенные задачи типа P/NP, и квантовые вычисления, и основы машинного обучения, и многое еще. Без доказательств - это обзор, а не учебник - и написано вроде бы ясным языком и с интересными объяснениями. Я до сих пор только мельком успел посмотреть, но обязательно хочу прочитать.

Date: 2017-11-01 06:00 pm (UTC)
From: [identity profile] deep-econom.livejournal.com
как раз тут был пост вчера противоположный вашему, чей оптимизм я совсем не разделяю )
https://ailev.livejournal.com/1383892.html

Date: 2017-11-01 06:07 pm (UTC)
From: (Anonymous)
Нет никакого машинного обучения. Есть куча давно известных вещей, надерганных из математики и объединенных под модной грантоемкой вывеской "машинное обучение".

Также хорошо известно, как строить "враждебные примеры", правда в девичестве это не так называлось.

Итого - статья может быть интересна только тем, кто не видит лежащей за "машинным обучением" математики.

Date: 2017-11-02 04:45 am (UTC)
From: [identity profile] kray-zemli.livejournal.com
Я думаю, проблема заключается в неверных подходах к обучению.

Человек старается выделить какие-то главные признаки, характеризующие отличие между классами. Нейросеть же тупая и не знает, какие признаки объекта главные, а какие второстепенные.

Это такая разновидность переобучения. В случае с черепахой, очевидно, нейросеть зацепилась за какие-то характерные для винтовок особенности ориентации волокон в деревянном цевье по отношению к металлическому стволу. Эти особенности используются в оружии из практических соображений, но не являются его определяющими критериями.

Причина переобучения здесь в том, что, во-первых, никто и не заставляет выделять главные признаки объектов, а во-вторых, в обучающей выборке отсутствуют примеры, в которых главные признаки позволили бы опознать объект, а второстепенные детали лишь сбивали бы с толку.

С одной стороны, результат выглядит как чудо, когда человек не может отличить объекты (в силу слабой выраженности главных признаков), а нейросеть может (зацепившись за какие-то детали). С другой, имеем такие вот трюки с обманом -- цепляясь за второстепенные детали, нейросеть не понимает сути объектов.

Date: 2017-11-01 06:15 pm (UTC)
From: [identity profile] ffedd-ya.livejournal.com
По 2 - исследование любопытное, но вывод "If Fritz was roughly the same strength as Kramnik in Bahrain, it is clear that Houdini 6 on the same machine would have completely crushed Kramnik in the match. " неверен.


Есть такой термин - "неудобный соперник", когда у двух шахматистов А и В сила (измененная против остальных игроков) примерно одинакова, но вот в личных встречах В побеждает А с разгромных счётом (то есть B неудобный соперник для А)
Обычно такое бывает, когда В более силен в том, что А считает своей сильной характеристикой: А пытается обыграть В в обычном своём стиле, используя свою сильную характеристику, но выясняется, что В ещё сильнее в ней.
И так много раз, пока А не сообразит, что надо менять свой стиль игры, при обычном стиле разгром будет продолжаться.



А каждая шахматная программа новой версии - неудобный соперник для программы старой версии, потому что стиль схож.
И для шахматных программ характерно то, что их игра друг против друга показывает бОльшую разницу в силе, чем игра против человека.
Если шахматная программа А1 набрала против человека X 50%, а против шахматной программы A2 - 25%, то в мачте A2 и X результат не будет 75% на 25%, а где-то может быть 55% на 45%.

Date: 2017-11-02 05:59 am (UTC)
From: (Anonymous)
Более того, нередка нетразнитивная ситуация, когда А сильнее B, B сильнее С, но С сильнее А.

Именно поэтому в спорте, включая шахматы, сплошь и рядом используется чемпионатская (все со всеми, хотя бы в пределах "группы"), а не кубковая (проигравший выбывает) система...

Date: 2017-11-01 06:48 pm (UTC)
From: [identity profile] akor168.livejournal.com
По поводу (2) насколько я понимаю, там все лучше и лучше настраивают гипер-параметры оценки позиции. То есть, например, то, что захват центра однозначно полезная эвристика, никто спорить не будет, но вот вопрос насколько конкретно "в граммах" это стоит в той или иной позиции.

Date: 2017-11-01 06:53 pm (UTC)
From: [identity profile] akor168.livejournal.com
На Ютуб несколько человек постоянно обозревают игры движков с друг другом и при том что качество комментариев так себе, но то, что машины сейчас играют фантастически сильно именно в позиционном смысле, абсолютно очевидно буквально после просмотра нескольких партий.

Date: 2017-11-01 08:03 pm (UTC)
From: [identity profile] avva.livejournal.com
Интересно, спасибо!

Date: 2017-11-01 08:14 pm (UTC)
From: [identity profile] akor168.livejournal.com
https://geektimes.ru/post/271614/

Мне вот эта статья очень понравилась по теме.

Date: 2017-11-02 02:11 am (UTC)
From: [identity profile] dmpogo.livejournal.com
Да чуть не проще просто код прочитать. Весь stockfish8 (в открытом доступе) - всего 10 тысяч строк включая комментари
From: [identity profile] son-0f-morning.livejournal.com
Насколько я, ни разу не специалист по шахматам, понимаю -- это просто следствие высокого качества и скорости тестирования.

В момент, когда компьютеры начали играть на уровне человека (и лучше) -- кратно сократился цикл "изменение-тестирование-коммит".

Что позволило очень быстро накапливать "качество" игрового движка: как за счёт проверки содержательных предположений (например: а что если варьировать глубину поиска в зависимости от позиции), так и за счёт просто многопараметрической (пере)оптимизацию параметров.

Date: 2017-11-01 07:40 pm (UTC)
From: [identity profile] cema.livejournal.com
Thanks for number 3!

Date: 2017-11-01 09:47 pm (UTC)
From: [identity profile] once-for-all.livejournal.com

Как же надо раскормить бедного щенка!

Date: 2017-11-02 06:01 am (UTC)
From: (Anonymous)
you made my day...

Date: 2017-11-01 10:37 pm (UTC)
From: [identity profile] marknn.livejournal.com
по поводу 1) я думаю что людей враждебные примеры тоже сущестуют, причем возможно что например они могут быть уникальными для каждого,то есьт один будет видеть бегемота, а все остальные щенка. Конечно не с одним пикселом, но на уровне шума я думаю легко. Просто пока мы не умеем их находить, ибо оптимизировать под мозг еще не научились.

Date: 2017-11-02 12:29 am (UTC)
From: [identity profile] dmitrmax.livejournal.com
Старая детсадовская шутка, когда задаешь ребенку несколько очевидных вопросов про цвет белых предметов, и после третьего ответа "белый" спрашиваешь: "а что пьет корова?". Я не припоминаю, чтобы по крайней мере дети (а на самом деле и многие взрослые) не отвечали "молоко".

Date: 2017-11-02 02:36 am (UTC)
From: [identity profile] aosypov.livejournal.com
да, отличный пример.

еще похож вопрос, как правильно - у рыбов нет зубов или у рыб нет зуб?

Date: 2017-11-02 06:35 am (UTC)
From: [identity profile] kray-zemli.livejournal.com
Ну во-первых, зубы у рыб всё-таки бывают.

Date: 2017-11-02 06:40 am (UTC)
From: [identity profile] aosypov.livejournal.com
ВотЪ!

Date: 2017-11-02 10:46 am (UTC)
From: [identity profile] dmitrmax.livejournal.com
Это немного другой пример. Тут выбор как бы ограничен двумя неправильными вариантами. В случае с молоком - тут никто за язык не тянет.

Date: 2017-11-02 11:01 am (UTC)
From: [identity profile] aosypov.livejournal.com
а я и не говорил, что пример идентичный :)

ну и ложное ограничение выбора, конечно, это известная вещь.
Edited Date: 2017-11-02 11:02 am (UTC)

Date: 2017-11-02 04:57 am (UTC)
From: [identity profile] kray-zemli.livejournal.com
Как это не умеем? Вся маскировка на этом построена.

Date: 2017-11-05 09:18 pm (UTC)
From: [identity profile] garkara.livejournal.com
не знаю, подходит ли это под определение враждебного примера, но есть вот такая картинка с двумя лицами

https://i.pinimg.com/564x/02/4a/e3/024ae37341b2f791d0babd49609f861b--optical-illusions-pictures-eye-illusions.jpg

с близкого расстояния наш мозг видит злое лицо слева и доброе справа, а с далекого - наоборот

Date: 2017-11-01 11:32 pm (UTC)
From: (Anonymous)
платье синее или золотое?

Date: 2017-11-02 02:38 am (UTC)
From: [identity profile] occuserpens.livejournal.com
[The results show that 73.8% of the test images can be crafted to adversarial images with modification just on one pixel with 98.7% confidence on average. ]

я так понимаю, что это разгром

Date: 2017-11-02 02:53 am (UTC)
From: [identity profile] akor168.livejournal.com
Чтобы найти подобные примеры надо специально строить их генератор, который еще и сам отдельно обучается на их генерацию. Это не то чтобы взяли случайный пиксель...

Date: 2017-11-02 04:01 am (UTC)
From: [identity profile] occuserpens.livejournal.com
Конечно. В криптографии это называется успешная атака
Edited Date: 2017-11-02 04:01 am (UTC)

Date: 2017-11-02 02:39 am (UTC)
From: [identity profile] aosypov.livejournal.com
хорошо, что дошло дело до реальной работы до того, как в аэропорту не расстреляли кого-нибудь с игрушечной черепашкой

Date: 2017-11-02 04:52 am (UTC)
From: (Anonymous)
nice try

https://meduza.io/news/2017/10/22/v-izraile-palestintsa-zaderzhali-iz-za-zapisi-dobroe-utro-v-feysbuke-algoritm-perevel-ee-kak-atakuyte-ih

Date: 2017-11-02 05:02 am (UTC)
From: [identity profile] kray-zemli.livejournal.com
Самое обидное, что если такую ошибку сделает полицейский -- ему прямая дорога в дурку. А если искусственная нейросеть -- то виноватого потом не найдёшь, будет классифицировано как несчастный случай.

Date: 2017-11-02 05:10 am (UTC)
eldhenn: (Default)
From: [personal profile] eldhenn
А это ещё одно когнитивное искажение у человека - считать, что с нахождением виноватого проблема решается.

Date: 2017-11-02 06:35 am (UTC)
From: [identity profile] kray-zemli.livejournal.com
С нахождением виноватого проблема не всегда решается, но освобождение заведомо виноватого от ответственности всегда служит дурным примером остальным.

Date: 2017-11-02 06:53 am (UTC)
eldhenn: (Default)
From: [personal profile] eldhenn
История это подтверждает, как мы видим? Уголовных преступлений больше не существует?

Date: 2017-11-02 07:30 am (UTC)
From: [identity profile] kray-zemli.livejournal.com
История подтверждает непрерывно. Никого не волнует, что там понаписано в законах. Всех волнует реальная правоприменительная практика, реальные шансы быть привлеченным к ответственности.

Date: 2017-11-02 08:47 am (UTC)
eldhenn: (Default)
From: [personal profile] eldhenn
Прям вот всех...

Date: 2017-11-02 10:08 am (UTC)
ext_454496: (Default)
From: [identity profile] alexcohn.livejournal.com
Эта же проблема у автомобиля без водителя. Если такая машина задавит пешехода, кто виноват? И как быть, если нужно принимать этическое решение (девочка перебегает дорогу, нужно либо давить её, либо сворачивать на тротуар, где стоит старушка)?

Date: 2017-11-02 01:37 pm (UTC)
From: [identity profile] kray-zemli.livejournal.com
С этической проблемой вроде разобрались: виноват нарушающий правила. ПДД предписывает аварийную остановку в ситуации с девочкой. Сбил девочку -- её проблемы, она нарушила правила. А сбил старушку -- виноват сам, потому что совершил авантюрный выходящий за рамки ПДД уклонительный манёвр.

Date: 2017-11-02 05:59 am (UTC)
From: [identity profile] biovizir.livejournal.com
Спасибо!

Date: 2017-11-02 07:18 am (UTC)
From: [identity profile] aka-mik.livejournal.com
"У меня нет хорошего понимания, откуда программы последних лет "выжимают" такое чудовищное алгоритмическое преимущество"

Ваш код за 15 лет совсем не улучшился?

PS Эх, помню как-то писал оптимальный раскрой на генетических алгоритмах, ну написал, но как-то медленно работал, оптимизировал в одном месте - стало в 100 раз быстрее работать, в другом - еще в 100 раз...

Date: 2017-11-03 02:17 am (UTC)
From: (Anonymous)
Ну так Deep Fritz же не ламеры писали.

Я подозреваю, дело в оптимизации всяких мелких параметров (на сколько пунктов круче иметь коня на d5, чем на b5?), для чего используются распределенные сети с невиданной ранее суммарной мощностью. В коде Stockfish дофига и больше магических значений, у них есть т. н. Fishnet для оптимизации оных.

Date: 2017-11-02 07:25 am (UTC)
From: [identity profile] jmyshanya.livejournal.com

"враждебные примеры"?


это же зенитные суры аль-эфесби!

Date: 2017-11-03 03:28 am (UTC)
From: [identity profile] 999999.livejournal.com
я наивный сочуствующий с ulterior motives, поговорите со мной пожалуйста жестами
1. значит ли это, что фичей экстрагировать здесь (в этих 500 измерениях, где в многообразие класса можно Вклиниться) неоткуда?
Edited Date: 2017-11-03 03:29 am (UTC)

Date: 2017-11-04 06:57 am (UTC)
From: (Anonymous)
В тему шахмат. Может видели уже: https://github.com/bolknote/SedChess

ЖЖ удалил, так что анонимно, извинтиляюсь

Шахматы

Date: 2017-11-07 05:01 pm (UTC)
From: [identity profile] failhigh.livejournal.com
Был очень внутри всей кухни шахматных программ.
В начале 0х выстрелила Рыбка.
Райлих придумал чудесное простое отсечение, оптимизировал на C++ темплейтами много чего и программа, у которой оценка Piece Square Table вдруг начала рубить всех.

До него был Фрукт и Шреддер с похожими идеями - Rule Based не рулит, отсекать нужно брютальнее.

По слухам постоянной оптимизацией лучшие росли на .5 эло в день.

Тупо состарилось поколение великих ассемблерщиков (Морш и т.д.).

Еще был прекрасный скандал, когда какие-то клоуны из Росcии клонировали Рыбку, попались на этом, изворачивались и т.д.

DD за считанные недели до смерти поражал запалом при обсуждении фишек Komodo.

С 10х немного поменял ориентиры, но не вижу причин, почему все должно утихнуть. Денег в этой отрасли примерно всегда одинаково. Она не хайповая уже с середины 90х, зато железо для тестов все дешевеет.
Edited Date: 2017-11-07 05:10 pm (UTC)

December 2025

S M T W T F S
  123 4 56
78 9 10 11 1213
1415 1617181920
21 22 23 24 2526 27
2829 30 31   

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jan. 2nd, 2026 01:39 am
Powered by Dreamwidth Studios