avva: (Default)
[personal profile] avva
Есть одна старая задачка о вероятностях, о которой я думал, что все знаю. Пару дней назад оказалось, что не все. Сначала я расскажу саму задачу и обычное ее решение, а потом - что нового я об этом узнал.

1. Вы встречаете на улице знакомого, которого не видели много лет. Он рассказывает вам, что у него двое детей (о которых вы до сих пор ничего не знали), и решает проверить ваше знание теории вероятностей: "Один из моих детей - девочка. Какова вероятность того, что другой ребенок - мальчик?"

Эта задача довольно хорошо известна. Правильный ответ на нее - вероятность того, что в семье мальчик и девочка равна 2/3, или около 67% (соответственно, вероятность того, что две девочки - 1/3). Обычный неправильный ответ - 1/2.

Вот как можно придти к правильному ответу. Поскольку мы полагаем, что вероятность рождения мальчика или девочки - "50 на 50", и между разными родами нет зависимости, есть четыре возможных варианта детей в семье: ММ, МД, ДМ, ДД, где первая буква обозначает пол первого ребенка, вторая - второго. Вероятность каждого из этих вариантов - 1/4. Нам стало известно, что в семье есть как минимум одна девочка, т.е. вариант ММ отбрасывается, а все остальные остаются возможными. Из этих трех возможных вариантов нас интересуют два (ДМ и МД), поэтому вероятность равна 2/3.

Как люди приходят к неверному решению 1/2? Обычно одним из двух путей. Во-первых, некоторые считают, что МД и ДМ следует считать одним и тем же вариантом, потому что "порядок роли не играет". Порядок детей действительно не играет роли в условии задачи, но то, что упускают эти люди - что если мы распишем всего три варианта, не учитывая порядка - т.е. "М и М", "М и Д", "Д и Д" - то у нас нет никаких оснований считать, что их вероятности равны друг другу и равны 1/3 каждая. Для того, чтобы это как понять, полезно продумать как следует, почему у нас есть такие основания считать вероятности равными в правильном решении. Некоторые знают правильное решение, но не понимают, почему ММ, МД, ДМ и ДД все равны друг другу по вероятности - им это представляется очевидным, например, потому, что ведь это "симметрично". Но из того, что мы симметрично написали четыре буквы, еще ничего не следует. Ключевую роль играет то, что рождение мальчика или девочки мы считаем равновероятным, и разные случаи рождения в одной семье - независящими друг от друга. Поэтому мы словно бы бросаем монету, на которой написано М и Д на разных сторонах, два раза. Эти предположения, на которые мы опираемся, кстати, верны лишь приблизительно, и сильно зависят от культуры (можно представить себе общество, в котором за счет абортов или искусственного оплодотворения поддерживается очень неравное соотношение мальчиков и девочек, или отношение равное, но в каждой семье пол детей чередуют от ребенка к ребенку. В таком обществе у этой задачи будет другой ответ).

Второй путь к неправильному ответу, еще более частый - понять условие так, будто оно говорит о конкретном ребенке. Например, вот всего лишь легкое изменение условий задачи, для которого правильный ответ уже - 1/2:

2. Вы встречаете на улице знакомого, которого не видели много лет. Он рассказывает вам, что у него двое детей (о которых вы до сих пор ничего не знали), и решает проверить ваше знание теории вероятностей: "Мой старший ребенок - девочка. Какова вероятность того, что второй ребенок - мальчик?"

Здесь известно, какой ребенок девочка - старший, поэтому из четырех возможностей ММ, МД, ДМ, ДД отбрасывается не одна, как раньше, а две: ММ и МД невозможны. Из оставшихся двух мы заинтересованы в одной, поэтому ответ - 1/2.

Разница между задачами, которые я обозначил 1. и 2. довольно тонка, но тем не менее важна и полностью меняет ответ. Многие люди не замечают этого, или отказываются согласиться с тем, что эти разные задачи, и настаивают на том, что исходная задача дает ответ 1/2, размышляя примерно так: "Нам сказали про одного ребенка; пол другого ребенка не зависит от пола первого, и поэтому вероятность того, что другой ребенок мальчик, равна 1/2. Какая разница, сказали нам слово "старший" или нет? Главное, что назвали пол одного ребенка, мы можем в уме отставить его в сторону и сосредоточиться на другом".

Это рассуждение звучит довольно логично, но тем не менее, оно неверно. Кстати, объяснить, почему неверно, не так-то и просто; лучше способа, чем просто подробно объяснить правильное решение, и как оно вытекает из принципов теории вероятности, я не знаю.

Ну да ладно. Теперь к новому. К немалому удивлению, я узнал, что есть способ понять условие, довольно логичный притом, который ведет опять-таки к ответу в 50% или 1/2 - на этот раз правильному. В начале этой записи я специально сформулировал задачу так, что ее можно понять и так и этак, так что правильным ответом можно считать и 2/3, и 1/2 (но не по тем, неверным, причинам, что разобраны выше).

Вот как можно объяснить разные подходы к условию задачи. То, что знакомый - которого мы можем считать представителем случайно выбранной семьи с двумя детьми - говорит нам, "среди моих детей есть девочка", можно понять двумя разными способами:

A. У нас просто появилась новая информация, а именно: вариант ММ невозможен. Это все, что мы знаем, не больше и не меньше.

B. Мы можем резонно предположить, что наш знакомый назвал пол одного из своих детей, выбрав его наугад. То, что он сказал "девочка", означает, что у него ДД или МД или ДМ; но он мог бы также сказать и "мальчик", что означало бы, что у него ММ или ДМ или МД.

На первый взгляд может показаться, что A и B - одно и то же. Но это не так. Вариант A. в точности соответствует задаче, которую я обсуждал выше, и ведет к ответу 2/3. Вариант B ведет к ответу 1/2, как я сейчас объясню.

В варианте B мы хотим узнать, какова вероятность "МД или ДМ" при условии, что знакомый сказал "девочка". Если бы у знакомого был случай ММ, он не мог бы сказать "девочка", так что этот случай мы справедливо отметаем. Если бы был ДД, то он точно сказал бы девочка. Но если у нашего знакомого МД или ДМ, то он может сказать и то, и другое, как ему вздумается. На самом деле от того, как он поступает в таких случаях, зависит ответ на наш вопрос. Резонно предположить, что в случае ДМ или МД он выбирает наугад, и в половине случаев говорит "девочка", а в половине "мальчик".

Как тогда расписать возможные случаи? Добавим еще одну букву, например МДм означает "дети - мальчик и девочка, знакомый сказал 'мальчик' ". Возможности есть такие:

ММм - 1/4 (если ММ, то всегда м)
ДДд - 1/4

МДм - 1/8 (если МД, что случается с вероятностью 1/4, то в половине случае м, в половине д)
МДд - 1/8

ДМд - 1/8 (те же соображения)
ДМм - 1/8

Нам известно, что он сказал 'д', то есть остаются только возможности ДДд (1/4), МДд (1/8), ДМд (1/8). Из них нас интересует две последние, но сумма их вероятностей равна 1/4, а сумма всех трех - 1/2, поэтому ответ - 50%.

Что здесь происходит? Из-за того, что мы интерпретируем информацию "один из детей - девочка", не как условие, которое просто задает какую-то информацию, а как некоторое событие, высказывание, которое может случиться, а может не случиться, даже если сама информация верна, вероятности меняются. Ключевым является случай, когда у знакомого есть мальчик и девочка, а он нам говорит "один из детей - мальчик"; хотя также верно то, что один из детей - девочка, этого он не говорит, поэтому такой знакомый не учитывается в подсчете по условию B. Если мы предположим на секунду, что наш знакомый почему-то предпочитает всегда сказать, что у него есть девочка, а не мальчик (если это правда), тогда ответ опять будет 2/3, потому что в случаях МД и ДМ он всегда скажет "девочка", и их условная вероятность возрастет опять до 1/4 у каждого. Но если он выбирает в таких случаях наугад, их вероятность при условии того, что он сказал "девочка", всего 1/8 у каждого, и конечный ответ - 50%.

Можно сформулировать задачу так, чтобы вариант A. и ответ 2/3 был единственно верным. Один способ - сказать просто "известно, что один из детей - девочка", вместо истории про знакомого и его слова. Другой способ, чуть более хитрый - лишить знакомого возможности выбора пола. А именно: знакомый говорит вам, что у него двое детей. Вы его спрашиваете: верно ли, что среди них есть девочка? Он отвечает: да. Какова теперь вероятность того, что это девочка и мальчик? В такой формулировке единственно верным ответом опять-таки будет 2/3.

Ссылки:

1. Я узнал об этом новом решении из блога Paul'а Buchheit'a. Пол сформулировал свое 50%-ное решение на языке "алгоритмов отброса" неверных семей при опросе большого количества случайных семей. Мне это объяснение не очень по душе, по-моему оно больше затемняет, чем объясняет; но по сути он прав.
2. Пол узнал об этом из популярного блога Джефа Этвуда, где за последние дни накопилось уже несколько тысяч комментариев на эту тему. Некоторые из них очень внятно и подробно объясняют то решение, которое я назвал "новым" (мне оно внове по крайней мере). Тем, кто заглянет в ту дискуссию, рекомендую сделак поиск на странице никнейма VoiceOfUnreason - этот комментатор очень ясно все объясняет.
3. Несколько месяцев назад я написал о том, что узнал что-то новое для себе в не менее заезженной и известной задачке - проблеме Монти Холла. Аналогий с данным случаем - сразу несколько. И то, и другое - старые задачи, на которые большинство людей интуитивно отвечают неверно; и там, и там многим очень трудно бывает понять верный ответ (в проблеме Монти Холла, пожалуй, труднее, чем в этой). И в том случае, и в этом я был уверен, что ничего нового об этой заезженной до смерти задаче я не смогу узнать. И там, и здесь оказался неправ, и верный ответ оказался не совсем верным, в зависимости от того, как поставить вопрос. И там, и здесь другой вариант ответа зависит от неизвестной дополнительной информации (здесь это - какой пол ребенка назовет знакомый, если у него МД или ДМ). Разница, пожалуй, в том, что там дополнительные соображения менее существенны и более педантичны, чем здесь.
Page 2 of 2 << [1] [2] >>

Date: 2009-01-13 08:46 am (UTC)
From: [identity profile] gdy.livejournal.com
- У меня двое детей: один мальчик... и второй тоже мальчик.

Date: 2009-01-14 12:02 am (UTC)
From: [identity profile] kobak.livejournal.com
Что-то я плохо соображаю и не могу до конца понять вот какой момент.

Рассмотрим такую формулировку: "Пусть у нас есть знакомый, у которого есть два ребенка. И мы встречаем этого знакомого на прогулке вместе с дочкой. Вопрос: какова вероятность, что другой ребенок, который на прогулку не пошел, -- мальчик?"

Правильный ответ, очевидно, 1/2. Это и так ясно, но можно и подсчитать.

Мой вопрос в том, почему такая формулировка не эквивалентна задаче А ("верно ли, что один из твоих детей девочка? -- верно"). Если расписать варианты или формулы, это видно, но интуитивно я этого как-то не могу почувствовать. А Вы?

Date: 2009-01-14 12:21 am (UTC)
From: [identity profile] avva.livejournal.com
Думаю, что могу. В вашей формулировке мы фиксируем одного из детей. Причем неважно, как именно (некоторые считают, что важно фиксировать именно по возрасту, как в варианте "мой старший ребенок - дочка", но это, очевидно, не так). В задаче А такого фиксирования нет. Известно, что один из детей девочка, но нет такого ребенка, пол которого известен; другой способ сказать то же самое - нет случайного события, исход которого достоверно известен.

Мне кажется, кстати, что у людей, знакомых с математикой, "зависание" на этом пункте может быть еще более продолжительным, чем у других, и вот почему. Мы очень привыкли к следующему логическому приему, который стал практически второй натурой. Известно, что некая формула Ex(phi(x)) верна (E - квантор существования, конечно). Введем новый символ a, который обозначает объект, для которого phi верна. Теперь мы можем продолжать наши рассуждения, используя phi(a) в качестве аксиомы, и все, что мы ни докажем (не содержащее букву a), будет верно и в исходной системе аксиом.

В мат. логике это правило формально обосновывается и доказывается под именем Existential Instantiation (его можно обосновать мета-индукцией по длине док-ва). Но практикующие математики и близкие к мат-ке люди пользуются им совершенно естественным образом абсолютно все время, не задумываюясь.

(прошу прощения, если вы это хорошо знаете)

Так вот, путаницу между двумя версиями, указанными вами, можно считать демонстрацией того, что интуитивное использование EI в пространстве вероятностных исходов - некорректно. Некорректно сказать "мы знаем, что есть ребенок, который девочка" -> "обозначим такого ребенка a, а второго b" -> "рассмотрим пространство исходов двух случайных событий рождение-а и рождение-б" -> "возможны только исходы ДМ и ДД" -> "ответ 1/2". Почему? Потому что мы меняем пространство событий "на ходу", перекраивая его под введенную переменную a. Исходное пространство исходов, как бы мы его не определяли (через какую угодно заранее заданную нумерацию детей) устроено так, что "один из детей - девочка" не фиксирует в нем с определенностью исхода ни одного из двух случайных событий. А мы, подменяя его на ходу, притворяемся, что фиксирует.

Как-то так.

Date: 2009-01-14 11:28 am (UTC)
From: [identity profile] kobak.livejournal.com
Спасибо.

Не могу сказать, что это объяснение очень уж интуитивно (пожалуй, на уровне интуиции у меня всё равно остается какое-то неудовлетворение), но по крайней мере с этой разницей легче примириться как с частью общего принципа (который Вы сформулировали как "интуитивное использование EI в пространстве вероятностных исходов - некорректно").

ещё раз про "боян" :)

Date: 2009-01-25 08:58 pm (UTC)
From: [identity profile] falcao.livejournal.com
Осмелюсь предложить одну ссылку на близкую тему:

http://falcao.livejournal.com/161044.html

Я там затронул очень "избитую" тему, но у меня акцент сделан очень "узконаправленный". Мне очень запомнились вот эти Ваши слова, сказанные немного по другому поводу:

"Это рассуждение звучит довольно логично, но тем не менее, оно неверно. Кстати, объяснить, почему неверно, не так-то и просто; лучше способа, чем просто подробно объяснить правильное решение"

Меня прежде всего интересовал (и интересует) такой вопрос общего характера: "препарировать" внешне правдоподобные рассуждения, отделяя в них "бесспорное" от очень ловко запрятанных ошибок. Тут ставится цель не просто указать на ошибку, а чётко выделить то "позитивное", что имеется в ошибочном решении. Как правило, оно есть всегда, и осознание того, что же именно доказано "на самом деле", помогает осмыслить всё "до косточек".
Page 2 of 2 << [1] [2] >>

January 2026

S M T W T F S
    1 2 3
45678910
11121314151617
18192021222324
25262728293031

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jan. 5th, 2026 04:50 am
Powered by Dreamwidth Studios