avva | software 2.0

Андрей Карпати, известный специалист в области глубокого обучения, написал небольшую заметку Software 2.0, заслуживающую прочтения, мне кажется.

Карпати пишет, что новое поколение нейронных сетей, которое совершило и продолжает совершать гигантский рывок по своим возможностям с 2012 года, можно считать не столько полезной техникой, сколько новым видом программирование. В отличие от обычного программирования, Software 1.0, в котором программист дает компьютеру точную и обычно весьма сложную по своей иерархии последовательность инструкций (алгоритм), в Software 2.0 мы начинаем с многочисленных примеров того, как наша программа должна себя вести, а потом находим "программу" (являющуюся по сути набором весов для всех узлов нейронной сети) в виде достаточно хорошего приближения к этой цели. Конечно, далеко не все задачи поддаются такому способу решения, по крайней мере сейчас, но, как пишет Карпати,

"It turns out that a large portion of real-world problems have the property that it is significantly easier to collect the data than to explicitly write the program."

(например, намного легче собрать несколько десятков тысяч фотографий кошек и собак, и обозначить для каждой правильно, кошка на ней или собака, чем написать алгоритм - иерархическую программу в смысле Software 1.0 - который "смотрит" на картинку, анализирует ее и решает, кошка там или собака)

Название "Software 2.0" это всего лишь лозунг, и я не испытываю к нему сильных чувств; но то, что Карпати смотрит на это, как на совершенно новый и отдельный способ программирования, позволяет ему кратко и убедительно рассказать как о его достоинствах по сравнению с "Software 1.0", так и о недостатках. Не буду пересказывать здесь целиком и так краткую заметку Карпати, но отмечу отдельно меткую характеристику одного из недостатов - того, что нейронные сети часто дают нам лучшее решение, чем другие методы, но намного менее "прозрачное" и поддающееся объяснению:

"Across many applications areas, we’ll be left with a choice of using a 90% accurate model we understand, or 99% accurate model we don’t."

Именно этот недостаток вызывает в последние годы опасения некоторых исследователей насчет опасности того, что более глубокие знания и понимания их конкретных областей сменяются на, иронически говоря, более поверхностное использование глубоких нейронных сетей, которое дает лучшие практические результаты, но тормозит теоретическое понимание темы.

Page 1 of 3 << [1] [2] [3] >>

Threaded | Top-Level Comments Only

From:

dmpogo.livejournal.com

Именно этот недостаток вызывает в последние годы опасения некоторых исследователей насчет опасности того, что более глубокие знания и понимания их конкретных областей сменяются на, иронически говоря, более поверхностное использование глубоких нейронных сетей, которое дает лучшие практические результаты, но тормозит теоретическое понимание темы.

Этот вопрос уже поднимался и где аналитические методы сменялись компьютерным моделированием при помощи Software 1.0. И в этом смысле Software 2.0 менее опасна чем Software 1.0, поскольку в большей степени избегает вкладывания интерпретации в самом начале, и более похоже просто на сбор данных, чем собственно наш мозг на первой стадии познания и занимается

Edited Date: 2017-12-01 03:18 pm (UTC)

From:

muh2.livejournal.com

Есть шанс, что разовьется компьютерная нейрология из которой будут черпать тематические знания.

Чтение предмета по потрохам нейронных сетей.

From:

vitus_wagner

> "Across many applications areas, we’ll be left with a choice of using a 90% accurate model we understand, or 99% accurate model we don’t."

Что-то это мне напоминает конец XVI века, когда модель солнечной системы Коперника, более простая содержательно, давала худшие предсказания положения планет на небосводе чем модель Птолемея с хитровывернутыми эпициклами.

Или борьбу фиксистов с мобилистами в геологии, завершившуюся уже на моей памяти.

То есть ситуация когда эмпирическая модель, которая нас не приближает к пониманию устройства мира дает лучшее согласие с экспериментом, чем модель которая понятна - далеко не новость в истории науки.

From:

dims12.livejournal.com

"Программирование", ИМХО, это выбор гиперпараметров и, в первую очередь, топологии сети. А подбор весов -- это уже исполнение программы.

From:

sunch.livejournal.com

Делов-то - загрузить в машину примеры проблем, где у нас есть глубокое теоретическое понимание темы, и пусть выводит нам с 99% точностью новые понимания!

(шутка. По крайней мере пока у нас нет AGI - шутка)

From:

999999.livejournal.com

у нас может быть на 90% точная мифология (ну, о всяких приложениях где что-что что-то синтаксис дискурс семантика) (а что, у греков очень точная) или на 99% эффективная естественная наука, т.е. не Вы ли кидали ссыль где информатик говорит что теперь модель (или он говорил о сети; но модель тоже) объект научного исследования
(я каску нашел)

From:

spamsink

Пока software 2.0 не станет устойчиво к adversarial examples, оно будет годно преимущественно (или только) для игрушек.

From: (Anonymous)

Ой ну прямо. Вот возьмите свой, прямо скажем, мозг. Он что, устойчив к adversarial examples? Хрена лысого он устойчив, любая оптическая иллюзия тому примером, тысячи их. Однако как-то справляется же (я надеюсь).

From:

ninazino.livejournal.com

Распознавание речи, например, вообще невозможно более-менее адекватно запрограммировать, уже очень давно использовались Hidden Markov Models, которые тоже обучались, а не «программировались», и ничего. Сейчас, с нейронными сетями, распознавание переживает бум, и никого не волнует тот факт, что веса нейронам приписываются не вручную:))

From:

ninazino.livejournal.com

ЗЫ: по поводу «знания» как основы эффективного программирования распознавания речи ходит апокрифическая байка, что Йелинек якобы говорил: аккуратность распознавания вырастает всякий раз, когда я уволю парочку лингвистов.:))

From:

ninazino.livejournal.com

То есть? Какие игрушки, когда сейчас все распознавание образов на этом построено?

From:

spamsink

Ну да, к некоторым неустойчив. На том многое построено, от кинематографии до престидижитации.

Но кота от десктоп-компьютера отличает даже после замены нескольких пикселей; не говорит про панду, что это гиббон, и т.п.

From:

spamsink

Пока это распознавание образов не используется для контроля доступа к деньгам, секретам и пр. - это всё игрушки. А если начнет использоваться - тут-то желающие экспениментировать с adversarial examples на свет и вылезут.

From:

ninazino.livejournal.com

Ну вот в Айфоне X распознавание лица есть ключ к данным на Айфоне, и пока ничего. А там много чего хранится.

И можно подумать, что другие ключи для контроля над деньгами не взламывают.

И последнее: не все то, что не может использоваться для контроля доступа к деньгам -- игрушки.

From:

alaev.livejournal.com

Веселуха начнётся, когда вы в нейронную сеть, управляющую машиной, загоните массу ценной информации, а она примется давить пешеходов.

From:

kray-zemli.livejournal.com

Айфон -- что, не игрушка? Вся эта нейросетевая чушь, построенная на лженауке-матане (не работающем на реальных данных), махом сдуется после первого же серьёзного проёба. Между инсталляцией и массовым практичным изделием пропасть.

From:

ninazino.livejournal.com

То есть Вы полагаете, что программа, написанная программистами по правилами, никакому влиянию хакеров не подвержена. Блажен, кто верует:))

From:

ninazino.livejournal.com

Как страшно жить:))

From:

alaev.livejournal.com

Конечно, я так не думаю. Однако программы, построенные по известным правилам, можно тестировать, опираясь на эти правила. А хакеров ещё и в тюрьму посадить можно.

Если же "программа" строит сама себя, как её тестировать, не очень-то понятно. То есть понятно, что надо подсчитывать трупы на дорогах, у кого получилось меньше, тот и молодец. Но...

From:

livelight

Забавный был бы вираж эволюции.
Сначала возникают нейронные сети.
Потом они осваивают речь, линейный дискурс, аристотелеву логику, системы логического вывода и прочую теорему Гёделя.
Потом они пишут линейные, чёткие и логичные программы.
Потом делают (в том числе с помощью этих программ) нейронную сеть.
Которую потом долго и мучительно обучают линейному дискурсу, чтобы она логически выводила теории.

From:

livelight

Представил: поймали, например, шпиона, долго били по лицу и требовали выдать пароль от его айфона, где всё хранится. А пароль - его лицо, и в битом виде оно для опознавания не годится. А он потом в камере сам себе новые синяки ставит, чтобы и дальше инфа не доставалась никому.

From:

livelight

Я однажды стал жертвой очень яркого нарушения нормального делания в состоянии остановки внутреннего диалога и несколько минут, с расстояния не более полутора метров, наблюдал за удивительно большой белой птицей, изучая особенности ее строения и повадок. Когда ошибочное делание прекратилось, было очень странно обнаружить на месте птицы причудливо скомканный газетный лист.
Конечно, в делании иллюзий нет ничего особо необычного. Поражает в таких случаях особая, я бы даже сказал, нарочитая грубость ошибок тоналя - при хорошем освещении и на совсем небольшом расстоянии превратить скомканную бумагу в птицу, у которой были не только крылья и перья, но даже глаза!

(С) Алексей Ксендзюк

From:

avva.livejournal.com

Software 1.0 неустойчиво к багам, дыркам в security и троянам, и ничего, почему-то вся цивилизация на нем висит.

From:

mr-k-bx.livejournal.com

Да.

From:

jmyshanya.livejournal.com

Интересно, скоро ИИ натаскают на решение проблем Смейла?

Page 1 of 3 << [1] [2] [3] >>

Threaded | Top-Level Comments Only

Profile

avva

Website

February 2026

S	M	T	W	T	F	S
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28

Page Summary

Style Credit

Style: Neutral Good for Practicality by timeasmymeasure

Expand Cut Tags

No cut tags

Page generated Feb. 25th, 2026 04:16 am

Ни о какой безапелляционности в моих высказываниях не может быть и речи!

(...)

software 2.0

software 2.0

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

Profile

February 2026

Most Popular Tags

Page Summary

Style Credit

Expand Cut Tags