avva: (Default)
[personal profile] avva
Я не жалею, что написал о проблеме Монти Холла вчера, т.к. в результате перечитал еще раз википедию и несколько статей, и понял об этом вопросе что-то, чего не понимал раньше.

Итак, давайте вернемся к вопросу и сформулируем его еще раз. Есть три двери, за одной автомобиль, за другими двумя козы. Обозначим двери 1,2,3. Вы выбираете одну из дверей - пусть определенности ради это будет дверь номер 1. Ведущий, который знает, где находится автомобиль, открывает одну из оставшихся двух дверей, причем заранее известно, что он специально откроет дверь, за которой стоит коза. Он так и делает - предположим, он открыл дверь номер 3, и за ней коза. Теперь у вас есть шанс сменить свой выбор с первой двери на вторую. Стоит ли вам так поступить?

Я не буду заново объяснять, почему правильный ответ - "да, стоит, если сменить выбор, то с вероятностью 2/3 выиграешь автомобиль". Если вы с этим несогласны, почитайте Википедию, или английскую Википедию, или триста комментов у [livejournal.com profile] object'а, итд. итд. Давайте предположим, что мы все согласны с тем, что при смене выбора вероятность выигрыша оказывается 2/3 (66.6%), а не 1/2 (50%). Я хочу обсудить теперь два более тонких вопроса.

Во-первых, не все, кто знают правильный ответ, отдают себе отчет в том, насколько важно правило, что ведущий всегда специально открывает дверь с козой. Что если изменить это правило, и сказать, например, что ведущий открывает одну из оставшихся двух дверей наугад - если автомобиль, то мы отменяем всю попытку, а если коза, то предлагаем игроку сменить выбор, как раньше? Если сделать так, что вероятность выигрыша при смене выбора действительно оказывается 50%, а не 66.6% - т.е. менять выбор незачем (непонимание этого обстоятельства можно считать путаницей Монти Холла второго порядка, в отличие от более обычной путаницы, когда человек думает, что в обычном условии ответ 50%). В отличие от обычного условия, когда действия ведущего "не добавляют информации" (ведь он всегда может найти дверь с козой, чтобы открыть ее), в этой формулировке тот факт, что ведущий открыл дверь с козой, добавляет новую информацию - ведь ему мог попасться автомобиль, но не попался! - и меняет вероятности для двух других дверей. Чтобы убедиться в этом, можно расписать все возможности и посчитать количество вариантов. См. также программу [livejournal.com profile] object'а, которая это наглядно демонстритует во втором эксперименте.

Во-вторых, вот новая (для меня) информация. Что происходит - в обычной, "правильной" формулировке задачи - когда ведущий может открыть как вторую, так и третью дверь, потому что за обеими козы? Например, он выбирает наугад одну из них. Так вот, то, что он выбирает наугад, должно быть частью условия, иначе ответ необязательно равен 2/3! Подчеркну еще раз, чтобы не было путаницы: здесь речь идет не о выборе, какую дверь открыть вообще (как в прошлом абзаце), а только в случае, когда за обеими козы. Если ведущий в этом случае выбирает дверь не случайно - например, если он почему-то предпочитает дверь номер 3, может, она к нему ближе - тогда вероятность выигрыша не будет равна ровно 2/3, хотя она все равно будет где-то между 50% и 100%.

На самом деле то, что я только что написал, не совсем верно. Чтобы все прояснить, надо сначала все усложнить. Дело в том, что главный вопрос - какова вероятность выигрыша? - можно задать двумя разными способами, и это будут на самом деле две разные (хоть и очень похожие!) задачи. Вот эти два способа:

1. Предположим, какой-то игрок всегда выбирает сменить свой выбор. Пускай он это делает много раз, каждый раз после того, как ведущий открывает какую-то дверь с козой согласно условиям. В каком проценте случаев он выиграет?

2. Предположим, вы выбрали дверь 1, и ведущий открыл дверь 3 с козой согласно условиям. Какова вероятность выиграть, если вы сейчас смените дверь?

Эти две формулировки выглядят очень похожими, но на самом деле они разные. Эту разницу можно объяснить вот как. Обычно говорят, что выбор ведущего "не добавляет информации", потому что ведущий всегда может открыть дверь с козой согласно условиям. В первой формулировке задачи это действительно верно. Но во второй формулировке это всего лишь почти верно, потому что мы знаем, что открыта дверь номер 3, а не номер 2. Это хоть и небольшая, но дополнительная информация, и если у ведущего есть какие-то предпочтения в этом вопросе, они могут повлиять на вероятность выигрыша. Говоря математическим языком, во второй задаче речь идет об условной вероятности выигрыша при том обстоятельстве, что открыта дверь номер 3. В первой задаче речь идет о "просто" вероятности выигрыша, никакой условности в ней нет ("условная вероятность" означает "вероятность того, что случилось событие X, при условии, что верно обстоятельство Y").

Вот конкретный пример. Предположим, ведущий, если у него есть возможность, всегда предпочтет открыть дверь номер 2. Предположим, что вы теперь видите, что он открыл дверь номер 3. Тогда вероятность выигрыша при смене выбора для вас верна 100% - автомобиль точно находится за дверью номер 2, иначе ведущий бы ее открыл.

А если наоборот, ведущий всегда предпочтет, если возможно, третью дверь? Тогда, если мы видим, что он открыл третью дверь, вероятность выигрыша всего 50%. Это потому, что информация об открытой третьей двери берет на себя весь вес возможности "автомобиль за первой дверью" - ведь в таком случае ведущий всегда откроет третью дверь. Третья дверь будет открыть всегда и если автомобиль за первой, и если автомобиль за второй, так что информация об этом сохраняет исходно равные шансы этих двух возможностей.

Если же ведущий выбирает дверь (когда за обеими козы) наугад, то вероятность выигрыша действительно равна 66.6%, как в "правильном" решении.

В чем тут разница с первой задачей, из двух вышеописанных вариантов? В ней ответ всегда 66.6%, вне зависимости от предпочтений ведущего. Почему, как это объяснить? Дело в том, что она включает в себя и те случаи, когда ведущий открыл дверь номер 3, и те случаи, когда ведущий открыл номер 2. В ней мы действительно не получаем никакой новой информации. Например, предположим опять, что ведущий всегда стремится открыть третью дверь, если можно. Тогда: если известно, что открыта вторая дверь, то вероятность (условная) выигрыша при смене равна 100%. Если известно, что открыта третья дверь, то вероятность (условная) выигрыша при смене равна 50%. А если мы сделаем тысячу разных попыток, то в части из них ведущий откроет вторую дверь (когда у него не будет выбора, потому что автомобиль за третьей), в остальных случаях откроет третью. Доля выигрышей среди тех случаев, где открыл вторую, будет 100%, среди тех, где открыл третью - 50%, а доля выигрыша вообще, из всех попыток - все равно будет 66.6%.

Обычно, когда формулируют задачу Монти Холла, то формулируют именно задачу с условной вероятностью - т.е. "что мне теперь делать, если при мне открыли дверь с козой?". Так вот, чтобы правильным ответом было 2/3, такая формулировка должна включать в себя условие "когда ведущий выбирает между двумя дверьми с козами, он выбирает случайно". А всякие компьютерные проверки чаще всего, наоборот, проверяют первый вариант, в котором ответ всегда 2/3 (напр. программа [livejournal.com profile] object'а такова). Правда, надо отметить, что даже во втором варианте без уточняющего условия все равно можно посоветовать игроку сменить выбор. Вероятность выигрыша для него варьируется от 50% до 100%, и почти наверняка реально выше 50%, так что он ничего не проигрывает, а скорее всего выигрывает, от смены выбора.


Техническое приложение

Это приложение будет понятно только тем, кто знаком с теорией вероятностей.

С помощью условной вероятности можно смоделировать все варианты этой задачи - и тот, когда ведущий открывает всегда дверь с козой, и тот, когда он выбирает наугад, а открытие автомобиля отсеивается, и тот, когда он выбирает наугад только между двумя козами, и то, когда он между ними выбирает _не_ наугад. В некоторых из этий случаев выходит 1/2, в некоторых 2/3, в некоторых 1 - теорема Байеса все говорит и ничего не скрывает.

Поведение ведущего описывается вероятностями вида P31 = P(открывает номер 3 | автомобиль в 1) (для тех, кто незнаком, но все же читает: знак "|" надлежит читать как "при условии, что"). Поскольку мы предполагаем, что игрок выбрал дверь 1, ведущий всегда открывает 2 или 3, поэтому его поведение описывается числами P21, P22, P23, P31, P32, P33. Тот факт, что ведущий всегда открывает какую-то дверь, описан уравнениями P21+P31 = 1, P22+P32 = 1, P23+P33 = 1. Так что на самом деле свободных параметров у него всего три, а не шесть.

Сказать, что ведущий выбирает одну из дверей случайно, не глядя на то, где автомобиль - значит сказать, что P21=P31 = 1/2, P22=P32=1/2, P23=P33=1/2. Чтобы смоделировать глобальное предпочтение одной из дверей, можно просто заменить в каждой из этих формул 1/2 на p и 1-p.

Сказать (как в обычном условии), что ведущий никогда не открывает автомобиль- значить сказать, что P22 = P33 = 0. При этом поведение ведущего при автомобиле за второй или третьей дверью детерминировано: P32 = P23 = 1. Неизвестными остаются лишь числа P21, P31, т.е. выбор между двумя козами. Если этот выбор случаен, то P21 = P31 = 1/2. Если, например, ведущий всегда предпочитает в таком случае третью дверь, то P31 = 1, P21 = 0.

Наконец, само вычисление условной вероятности выглядит так. Пусть мы выбрали дверь номер 1, и ведущий открыл дверь номер 3. Мы выигрываем, если автомобиль находится за дверью номер 2.

P(выигрыш при смене выбора | открыта номер 3) = P (автомобиль в 2 | открыта номер 3) = (согласно теореме Байеса) P(открыта номер 3 | автомобиль в 2) * P (автомобиль в 2) / P(открыта номер 3)

= P32 * 1/3 / (1/3*P31 + 1/3*P32 + 1/3*P33) =

(здесь мы предполагаем, что вероятность автомобиля распределена по дверям равномерно; последний член - всего лишь подсчет вероятности открытия третьей двери по всем трем возможностям; теперь мы можем сократить 1/3 и получить)

= P32 / (P31 + P32 + P33)

Рассмотрим с помощью этой формулы все обсуждавшиеся выше варианты.

Если ведущий выбирает дверь 2 или 3 наугад всегда, не глядя на то, где автомобиль, то все вероятности в формуле равны 1/2 (включая P33! - т.е. он может открыть автомобиль), и ответ выходит 1/2 / 3*1/2 = 1/3. Этот ответ, казалось бы, противоречит 50%, которые мы хотим получить, если ведущий выбирает наугад, не глядя на автомобиль; но надо вспомнить, что только в этом случае мы "отсеиваем" часть результатов, не считая случай, когда открыт автомобиль, за неудачу. Иными словами, если бы проигрышем считался и тот случай, когда мы выбрали 1, ведущий открыл 3 с автомобилем, а мы поменяли на 2, где точно нет автомобиля, то всего наши шансы были бы 1/3; но все такие случаи - а их ровно 1/3, т.к. это ровно те, когда автомобиль за третьей дверью - мы отсеиваем из результатов, и вероятность становится больше в 3/2 раза, т.е. 1/2, как и полагается (вместо того, чтобы делить на общее число попыток x, мы делим на 2/3*x, т.е. умножаем на 3/2).


Если же ведущий всегда выбирает дверь с козой, то P33 = 0, P32 = 1, поэтому формула еще упрощается: 1 / (1+P31). Мы видим, что вероятность тогда меняется в границах от 1/2 до 1.

Если ведущий выбирает между козами наугад, то P31 = 1/2, и ответ выходит 2/3: стандартный правильный ответ.

Если ведущий предпочитает всегда третью дверь, то P31 = 1, и ответ выходит 1/2.
Если ведущий предпочитает всегда вторую дверь, то P31 = 0, и ответ выходит 1.

Date: 2008-10-28 06:18 pm (UTC)
From: [identity profile] kdv2005.livejournal.com
Заинтригован.

Date: 2008-10-28 06:45 pm (UTC)
From: [identity profile] avva.livejournal.com
Дописал. Да ничего особенного.

Date: 2008-10-28 07:05 pm (UTC)
From: [identity profile] kdv2005.livejournal.com
Последний гвоздь в крышку гроба :-)
Нужно сказать, что задача Монти Холла, на мой взгляд, принадлежит к классу тех задач, в которых формулы дают правильный ответ, но совершенно не проясняют сути дела. А формула Байеса, наверное, одна из самых плохо понятых формул теории вероятностей. Авторы учебников любят ее приводить (или давать в качестве задачи), но часто избегают ее содержательного обсуждения.

Хороший анализ получился.

Date: 2008-10-28 08:08 pm (UTC)
From: [identity profile] kondybas.livejournal.com
Как бы, теория вероятности вообще один из самых сложных разделов математики. Вдобавок, очень многие выкладки напрямую опираются на лейбниц-ньютоновский предел, а если брать за базис робинсоновскую малую, то кое-какие теоремы теорвера меняются радикально. Во всяком случае, многие парадоксы теорвера прямо проистекают из оснований анализа. Достаточно условных оснований, которые нынче считаются аксиоматичными.

Date: 2008-10-28 09:46 pm (UTC)
From: [identity profile] kdv2005.livejournal.com
многие парадоксы теорвера прямо проистекают из оснований анализа
Как интересно. Я иногда размышляю про основания, но про "нестандартную" сторону вопроса знаю очень мало. Вы не согласитесь немножко пояснить или хотя бы ссылки дать? Спасибо.

Date: 2008-10-28 10:20 pm (UTC)
From: [identity profile] kondybas.livejournal.com
Ну, лейбниц-ньютоновский анализ опирается на теорему Архимеда о кратных. Звучит она так: всякое, сколь угодно малое число, помноженное на некоторое число, даст любое другое, наперед заданное число. В преобразованном виде звучание ее таково: между натуральным числом Б, лежащим в сколь угодно малой окрестности натурального числа А, и числом А лежит бесконечно большое число других натуральных чисел.

Абрахам Робинсон, вместо постулата о делимости отрезка по Архимеду, предложил постулат о существовании бесконечно малого отрезка, меньше которого указано быть не может. Если, согласно Ньбтону, из теоремы Архимеда следовало, что площадь под кривой может быть сколь угодно близко аппроксимирована суммой прямоугольников, то из постулата Робинсона прямо следовало, что сумма прямоугольников НЕ может быть равна площади под кривой.

Собственно, фишка в принципе предельного перехода, на котором базируется интегрирование и дифференцирование в классическом анализе. В неклассическом анализе по Робинсону предельного перехода просто нет. Есть крайняя вычислимость по эпсилону.

Вот простейший пример, иллюстрирующий разницу между ньютоновским и робинсоновским подходом к делимости отрезка:
Image

Из точки А в точку В можно добраться либо по черной, либо по красной линии. Легко видеть, что при бесконечной делимости лесенки, она вырождается в гипотенузу путем предельного перехода, причем гипотенуза становится равна простой сумме катетов, а не корню из суммы их квадратов.

Предельный переход классического анализа приводит к невозможности деления на ноль и к строго нулевой вероятности извлечения одинокого белого шара из бесконечно большой компании черных шаров.

Вообще, большинство математических парадоксов так или иначе вызваны идеализацией парадигмы предела, хотя она - лишь одна из множества (бесконечного?) допустимых альтернативных парадигм.

Рука бойца сидеть устала.
Edited Date: 2008-10-28 10:29 pm (UTC)

Date: 2008-10-29 01:25 am (UTC)
From: [identity profile] kdv2005.livejournal.com
Спасибо, это и в самом деле очень увлекательный круг вопросов. Хотя мне не вполне понятно, почему Вы сводите сложность теории вероятностей к проблеме предела. Такое сведение, как мне кажется, тривиализует вопрос, поскольку пределы много еще где используются, и тогда просто можно сказать, что математика трудна из-за попытки овладения парадигмой бесконечности. Но в такой общности трудно сказать что-нибудь содержательное.

Я, наверное, не возьмусь защищать тезис, что теория вероятностей является одним из самых сложных разделов математики. Мне кажется, что ее сложность носит не столько технический характер (необходимость использования бесконечностей), сколько психологический, поскольку большая часть парадоксов может быть продемонстрирована на конечном материале (задача Монти Холла тому пример). Вероятностная интуиция человека чрезвычайно слаба по сравнению, например, с геометрической интуицией. Потому, я думаю, мы так часто и удивляемся вероятностным рассуждениям, находя выводы из них неожиданными. Наверное, если бы мы жили в мире, пронизанном не столько причинно-следственными связями, сколько корелляционными, то могло бы быть наоборот и наш повседневный опыт снабдил бы нас мощной вероятностной интуицией.

Date: 2008-10-29 02:55 pm (UTC)
From: [identity profile] ionial.livejournal.com
я думаю, что Вы описались с "натуральными" числам - вы имели ввиду действительные.

December 2025

S M T W T F S
  123 4 56
78 9 10 11 1213
1415 1617181920
21 22 23 24 2526 27
28293031   

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Dec. 29th, 2025 01:54 am
Powered by Dreamwidth Studios