avva: (Default)
[personal profile] avva
Есть одна старая задачка о вероятностях, о которой я думал, что все знаю. Пару дней назад оказалось, что не все. Сначала я расскажу саму задачу и обычное ее решение, а потом - что нового я об этом узнал.

1. Вы встречаете на улице знакомого, которого не видели много лет. Он рассказывает вам, что у него двое детей (о которых вы до сих пор ничего не знали), и решает проверить ваше знание теории вероятностей: "Один из моих детей - девочка. Какова вероятность того, что другой ребенок - мальчик?"

Эта задача довольно хорошо известна. Правильный ответ на нее - вероятность того, что в семье мальчик и девочка равна 2/3, или около 67% (соответственно, вероятность того, что две девочки - 1/3). Обычный неправильный ответ - 1/2.

Вот как можно придти к правильному ответу. Поскольку мы полагаем, что вероятность рождения мальчика или девочки - "50 на 50", и между разными родами нет зависимости, есть четыре возможных варианта детей в семье: ММ, МД, ДМ, ДД, где первая буква обозначает пол первого ребенка, вторая - второго. Вероятность каждого из этих вариантов - 1/4. Нам стало известно, что в семье есть как минимум одна девочка, т.е. вариант ММ отбрасывается, а все остальные остаются возможными. Из этих трех возможных вариантов нас интересуют два (ДМ и МД), поэтому вероятность равна 2/3.

Как люди приходят к неверному решению 1/2? Обычно одним из двух путей. Во-первых, некоторые считают, что МД и ДМ следует считать одним и тем же вариантом, потому что "порядок роли не играет". Порядок детей действительно не играет роли в условии задачи, но то, что упускают эти люди - что если мы распишем всего три варианта, не учитывая порядка - т.е. "М и М", "М и Д", "Д и Д" - то у нас нет никаких оснований считать, что их вероятности равны друг другу и равны 1/3 каждая. Для того, чтобы это как понять, полезно продумать как следует, почему у нас есть такие основания считать вероятности равными в правильном решении. Некоторые знают правильное решение, но не понимают, почему ММ, МД, ДМ и ДД все равны друг другу по вероятности - им это представляется очевидным, например, потому, что ведь это "симметрично". Но из того, что мы симметрично написали четыре буквы, еще ничего не следует. Ключевую роль играет то, что рождение мальчика или девочки мы считаем равновероятным, и разные случаи рождения в одной семье - независящими друг от друга. Поэтому мы словно бы бросаем монету, на которой написано М и Д на разных сторонах, два раза. Эти предположения, на которые мы опираемся, кстати, верны лишь приблизительно, и сильно зависят от культуры (можно представить себе общество, в котором за счет абортов или искусственного оплодотворения поддерживается очень неравное соотношение мальчиков и девочек, или отношение равное, но в каждой семье пол детей чередуют от ребенка к ребенку. В таком обществе у этой задачи будет другой ответ).

Второй путь к неправильному ответу, еще более частый - понять условие так, будто оно говорит о конкретном ребенке. Например, вот всего лишь легкое изменение условий задачи, для которого правильный ответ уже - 1/2:

2. Вы встречаете на улице знакомого, которого не видели много лет. Он рассказывает вам, что у него двое детей (о которых вы до сих пор ничего не знали), и решает проверить ваше знание теории вероятностей: "Мой старший ребенок - девочка. Какова вероятность того, что второй ребенок - мальчик?"

Здесь известно, какой ребенок девочка - старший, поэтому из четырех возможностей ММ, МД, ДМ, ДД отбрасывается не одна, как раньше, а две: ММ и МД невозможны. Из оставшихся двух мы заинтересованы в одной, поэтому ответ - 1/2.

Разница между задачами, которые я обозначил 1. и 2. довольно тонка, но тем не менее важна и полностью меняет ответ. Многие люди не замечают этого, или отказываются согласиться с тем, что эти разные задачи, и настаивают на том, что исходная задача дает ответ 1/2, размышляя примерно так: "Нам сказали про одного ребенка; пол другого ребенка не зависит от пола первого, и поэтому вероятность того, что другой ребенок мальчик, равна 1/2. Какая разница, сказали нам слово "старший" или нет? Главное, что назвали пол одного ребенка, мы можем в уме отставить его в сторону и сосредоточиться на другом".

Это рассуждение звучит довольно логично, но тем не менее, оно неверно. Кстати, объяснить, почему неверно, не так-то и просто; лучше способа, чем просто подробно объяснить правильное решение, и как оно вытекает из принципов теории вероятности, я не знаю.

Ну да ладно. Теперь к новому. К немалому удивлению, я узнал, что есть способ понять условие, довольно логичный притом, который ведет опять-таки к ответу в 50% или 1/2 - на этот раз правильному. В начале этой записи я специально сформулировал задачу так, что ее можно понять и так и этак, так что правильным ответом можно считать и 2/3, и 1/2 (но не по тем, неверным, причинам, что разобраны выше).

Вот как можно объяснить разные подходы к условию задачи. То, что знакомый - которого мы можем считать представителем случайно выбранной семьи с двумя детьми - говорит нам, "среди моих детей есть девочка", можно понять двумя разными способами:

A. У нас просто появилась новая информация, а именно: вариант ММ невозможен. Это все, что мы знаем, не больше и не меньше.

B. Мы можем резонно предположить, что наш знакомый назвал пол одного из своих детей, выбрав его наугад. То, что он сказал "девочка", означает, что у него ДД или МД или ДМ; но он мог бы также сказать и "мальчик", что означало бы, что у него ММ или ДМ или МД.

На первый взгляд может показаться, что A и B - одно и то же. Но это не так. Вариант A. в точности соответствует задаче, которую я обсуждал выше, и ведет к ответу 2/3. Вариант B ведет к ответу 1/2, как я сейчас объясню.

В варианте B мы хотим узнать, какова вероятность "МД или ДМ" при условии, что знакомый сказал "девочка". Если бы у знакомого был случай ММ, он не мог бы сказать "девочка", так что этот случай мы справедливо отметаем. Если бы был ДД, то он точно сказал бы девочка. Но если у нашего знакомого МД или ДМ, то он может сказать и то, и другое, как ему вздумается. На самом деле от того, как он поступает в таких случаях, зависит ответ на наш вопрос. Резонно предположить, что в случае ДМ или МД он выбирает наугад, и в половине случаев говорит "девочка", а в половине "мальчик".

Как тогда расписать возможные случаи? Добавим еще одну букву, например МДм означает "дети - мальчик и девочка, знакомый сказал 'мальчик' ". Возможности есть такие:

ММм - 1/4 (если ММ, то всегда м)
ДДд - 1/4

МДм - 1/8 (если МД, что случается с вероятностью 1/4, то в половине случае м, в половине д)
МДд - 1/8

ДМд - 1/8 (те же соображения)
ДМм - 1/8

Нам известно, что он сказал 'д', то есть остаются только возможности ДДд (1/4), МДд (1/8), ДМд (1/8). Из них нас интересует две последние, но сумма их вероятностей равна 1/4, а сумма всех трех - 1/2, поэтому ответ - 50%.

Что здесь происходит? Из-за того, что мы интерпретируем информацию "один из детей - девочка", не как условие, которое просто задает какую-то информацию, а как некоторое событие, высказывание, которое может случиться, а может не случиться, даже если сама информация верна, вероятности меняются. Ключевым является случай, когда у знакомого есть мальчик и девочка, а он нам говорит "один из детей - мальчик"; хотя также верно то, что один из детей - девочка, этого он не говорит, поэтому такой знакомый не учитывается в подсчете по условию B. Если мы предположим на секунду, что наш знакомый почему-то предпочитает всегда сказать, что у него есть девочка, а не мальчик (если это правда), тогда ответ опять будет 2/3, потому что в случаях МД и ДМ он всегда скажет "девочка", и их условная вероятность возрастет опять до 1/4 у каждого. Но если он выбирает в таких случаях наугад, их вероятность при условии того, что он сказал "девочка", всего 1/8 у каждого, и конечный ответ - 50%.

Можно сформулировать задачу так, чтобы вариант A. и ответ 2/3 был единственно верным. Один способ - сказать просто "известно, что один из детей - девочка", вместо истории про знакомого и его слова. Другой способ, чуть более хитрый - лишить знакомого возможности выбора пола. А именно: знакомый говорит вам, что у него двое детей. Вы его спрашиваете: верно ли, что среди них есть девочка? Он отвечает: да. Какова теперь вероятность того, что это девочка и мальчик? В такой формулировке единственно верным ответом опять-таки будет 2/3.

Ссылки:

1. Я узнал об этом новом решении из блога Paul'а Buchheit'a. Пол сформулировал свое 50%-ное решение на языке "алгоритмов отброса" неверных семей при опросе большого количества случайных семей. Мне это объяснение не очень по душе, по-моему оно больше затемняет, чем объясняет; но по сути он прав.
2. Пол узнал об этом из популярного блога Джефа Этвуда, где за последние дни накопилось уже несколько тысяч комментариев на эту тему. Некоторые из них очень внятно и подробно объясняют то решение, которое я назвал "новым" (мне оно внове по крайней мере). Тем, кто заглянет в ту дискуссию, рекомендую сделак поиск на странице никнейма VoiceOfUnreason - этот комментатор очень ясно все объясняет.
3. Несколько месяцев назад я написал о том, что узнал что-то новое для себе в не менее заезженной и известной задачке - проблеме Монти Холла. Аналогий с данным случаем - сразу несколько. И то, и другое - старые задачи, на которые большинство людей интуитивно отвечают неверно; и там, и там многим очень трудно бывает понять верный ответ (в проблеме Монти Холла, пожалуй, труднее, чем в этой). И в том случае, и в этом я был уверен, что ничего нового об этой заезженной до смерти задаче я не смогу узнать. И там, и здесь оказался неправ, и верный ответ оказался не совсем верным, в зависимости от того, как поставить вопрос. И там, и здесь другой вариант ответа зависит от неизвестной дополнительной информации (здесь это - какой пол ребенка назовет знакомый, если у него МД или ДМ). Разница, пожалуй, в том, что там дополнительные соображения менее существенны и более педантичны, чем здесь.
Page 1 of 3 << [1] [2] [3] >>

Date: 2009-01-05 09:57 pm (UTC)
From: [identity profile] new-user-name.livejournal.com
ну это же, по сути, задача "про три двери на викторине"?

Date: 2009-01-05 10:14 pm (UTC)
From: [identity profile] pigmeich.livejournal.com
Сейчас опять холивар начнется. Как с задачей про двери Монти Холла.

офф

Date: 2009-01-05 10:14 pm (UTC)
From: [identity profile] gasterea.livejournal.com
Название поста - шутка? Извините за занудство, но почему-то очень испугало.

Date: 2009-01-05 10:17 pm (UTC)
From: [identity profile] jerom.livejournal.com
Последнее рассуждение ошибочное. ½ -- это ответ на какой-то другой вопрос. Я его сейчас сформулировать не берусь, но что-то типа: "какова вероятность того, что у него мальчик и он скажет нам, что второй ребёнок - девочка".

А нужна условная вероятность: "какова вероятность того, что у него мальчик, при условии, что он уже сказал нам, что второй ребёнок - девочка".

Date: 2009-01-05 10:21 pm (UTC)
From: [identity profile] avva.livejournal.com
Не, не взлетит, думаю.

Date: 2009-01-05 10:21 pm (UTC)
From: [identity profile] 1a1.livejournal.com
А вот если мы знаем, что он просто сказал что у него двое детей и "Один из моих детей - девочка" (не собираясь проверять наше владение основами теор.вероятностей), то можно уверенно сделать вывод, что второй ребенок - мальчик.
:))
Т.к. при ДД он сказал бы "[обе/две] - девочки".

Date: 2009-01-05 10:27 pm (UTC)
From: [identity profile] avva.livejournal.com
Нет, 1/2 - именно ответ на условную вероятность (хотя ваша формулировка с "второй ребенок" может привести к путанице, "один из детей" лучше). Вся суть в том, что в данной формулировке есть разница между событиями "есть девочка" и "он сказал, что есть девочка". Это два разных условия, и мы считаем условную вероятность при условии второго, а не первого.

Re: офф

Date: 2009-01-05 10:28 pm (UTC)
From: [identity profile] avva.livejournal.com
Не шутка - наверное, помутилось что-то в голове, а перечитать запись я еще к тому моменту не успел, дописывал ссылки. Спасибо, исправил.

Date: 2009-01-05 10:28 pm (UTC)
From: [identity profile] avva.livejournal.com
Нет, совсем нет. Это тоже задача, в которой часто люди путаются, но совсем другая задача.

Date: 2009-01-05 10:30 pm (UTC)
From: [identity profile] avva.livejournal.com
Да, это понятно, и даже можно твердо обосновать лингвистическими соображениями :) Но мы все же предполагаем несколько идеализированного знакомого, для которого это не так.

Date: 2009-01-05 10:31 pm (UTC)
From: [identity profile] plotnikovp.livejournal.com
"но он мог бы также сказать и "мальчик", что означало бы, что у него ММ или ДМ или МД."

Мог бы, но не сказал! Он сказал - девочка. Зачем такой вариант (мог сказать "мальчик") вообще рассматривать?

Date: 2009-01-05 10:33 pm (UTC)
From: [identity profile] kdv2005.livejournal.com
Анатолий, очень хороший анализ, но, извините за придирку, ответ к пункту 1 в приведенной Вами формулировке
"Один из моих детей - девочка. Какова вероятность того, что второй ребенок - мальчик?"

именно что 1/2.

Для того, чтобы ответ был 2/3 формулировку нужно изменить:
"Один из моих детей - девочка. Какова вероятность того, что другой ребенок - мальчик?"
Интересно, есть ли языки, в которых слово "второй" не может иметь значения "другой", и создает ли в них эта задача столько же путаницы.

Date: 2009-01-05 10:37 pm (UTC)
From: [identity profile] kcmamu.livejournal.com
"В 1994 году Буш признался, что один из его детей борется с наркотической зависимостью". Какова вероятность того, что второй ребенок борется с наркотической зависимостью?

Date: 2009-01-05 10:38 pm (UTC)
From: [identity profile] avva.livejournal.com
Забавно. Мне кажется, что "второй" в этом контексте как минимум может означать ровно то же, что "другой", но, возможно, я неправ. В любом случае, я вообще не обратил на это внимания; спасибо, сейчас исправлю!

Date: 2009-01-05 10:41 pm (UTC)
From: [identity profile] kdv2005.livejournal.com
Может, конечно. Но именно эта двусмысленность и путает многих.
Согласно современным стандартам формулировку со словом второй, стоит объявить некорректной именно потому, что неясно, что имеется в виду, то ли другой ребенок, то ли младший. А от этого и ответ зависит.

Date: 2009-01-05 10:50 pm (UTC)
From: (Anonymous)
Таки взлетит? ;)

Date: 2009-01-05 10:52 pm (UTC)
From: [identity profile] dtim.livejournal.com
Предположим, что знакомый не хотел проверять знание теорвера, а просто сказал, без подвоха, что один из его детей девочка. Изменится ли ответ? Я могу представить себе даже ответ "вероятность - 1" (если бы оба ребенка были девочками, знакомый так бы и сказал, что оба, а не один, его ребенка - девочки). Какой ответ будет правильным на самом деле?

Вообще, основной проблемой этой задачи, которая и ведет к путанице, мне кажется толкование вероятности как меры неопределенности. По-моему, в этом случае о вероятности вообще говорить некорректно, поскольку речь идет о конкретном ребенке, который имеет определенный пол. Спрашивать, какова вероятность того, что это мальчик, настолько же корректно, как спрашивать, с какой вероятностью Наполеон выигрывал свои сражения. Я бы еще понял, если бы мы рассматривали сразу много семей с двумя детьми, один из которых девочка, и задавались бы вопросом, какова вероятность того, что в наугад выбранной семье второй ребенок - мальчик. Но есть ли смысл говорить о вероятности события, которое случайным не является?

Date: 2009-01-05 11:03 pm (UTC)
From: [identity profile] spamsink.livejournal.com
Если мне память не изменяет, и у Гарднера эта задача приведена в варианте, где рассказчик просто видит пол одного из детей, то и у него ошибка.

Date: 2009-01-05 11:05 pm (UTC)
From: [identity profile] dtim.livejournal.com
толкование вероятности как меры неопределенности

Прошу прощения, неправильно выразился. Имел в виду "вероятности как меры нашего незнания".

Date: 2009-01-05 11:06 pm (UTC)
From: [identity profile] deni-ok.livejournal.com
Мне что-то кажется, что предположение о том, что внутри себя, перед высказыванием сообщения, знакомый ставит случайный эксперимент "выбрав пол одного из детей наугад" негодное.

Представим, что он бросает кубик и говорит "выпало число больше 1". Тогда ответ на вопрос "Какова вероятность, что оно чётное" 3/5, не так ли? Или мы должны дополнительно порассуждать "А почему он сказал 'больше 1'? А если бы 1 выпало, он бы сказал 'не больше одного'? Или, для симметрии, он говорит 'меньше 5' в половине случаев и 'больше 1' в другой?" Подобный анализ может далеко завести, и я не вижу чем он принципиально отличается от предложенного в задаче про детей.

Date: 2009-01-05 11:29 pm (UTC)
From: [identity profile] muchkap.livejournal.com
спасибо, очень интересно!

«есть способ понять условие, довольно логичный притом» -

вот эта тема: понимание обще- и не очень -принятых условностей в формулировках задач, – очень важна.

вспомните другую задачу:

встречаются два друга-математика, между ними происходит такой диалог: «дети есть?», «да, двое», «сколько лет детям?», «дошкольники, произведение годов равно количеству цветов на этой клумбе», «э-э...», «старший весь в меня», «а-а... тогда понятно». вопрос: сколько лет детям?

считается, что эта задача имеет однозначное решение в отличие от, казалось бы, эквивалентной:

у человека двое детей разных возрастов до 6 лет включительно. вопрос: сколько лет детям?

так и в ваших примерах, если строго подходить, должно быть (?) :

А. у человека один из двух детей – девочка. вопрос: какова вероятность, что второй ребенок – мальчик?

В. человек сказал: «один из моих двух детей – девочка». вопрос: какова вероятность, что второй ребенок – мальчик?

Date: 2009-01-05 11:52 pm (UTC)
From: [identity profile] karakal.livejournal.com
МД и ДМ - разные вещи?

Так вот почему статистика часто ошибается!

Date: 2009-01-06 12:05 am (UTC)
From: [identity profile] liveuser.livejournal.com
> Некоторые из них очень внятно и подробно объясняют то решение, которое я назвал "новым" (мне оно внове по крайней мере).

Лет так 15 назад я встречал эту задачу в не помню какой занимательно-математической книге на русском языке. С двумя ответами - 1/2 и 1/3 - (точнее, там сказали, что задача в такой формулировке не имеет решения, поскольку имеет два ответа) и такими же объяснениями.

оффтопик про Израиль

Date: 2009-01-06 12:14 am (UTC)
From: [identity profile] schwetz.livejournal.com
Вот здесь интернет-голосовалка за/против Израиля.
http://www.israel-vs-palestine.com/gz/?stats
Наиболее произраильски настроены постсоветские страны - Россия, Украина, Прибалтика, Грузия. Меньше поддерживают Израиль американцы.
Европа,Канада а также страны ислама (включая "союзника" Турцию) - ненавидят Израиль

Date: 2009-01-06 12:51 am (UTC)
From: [identity profile] 1a1.livejournal.com
2й может быть не зависим; зависим, но не борется; борется но Буш об этом умалчивает.
Да, тут теорвер бессилен :)
А если у него дочери-близнецы, то ситуация еще комичнее.
Page 1 of 3 << [1] [2] [3] >>

December 2025

S M T W T F S
  123 4 56
78 9 10 11 1213
1415 1617181920
21 22 23 24 2526 27
28293031   

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Dec. 29th, 2025 05:36 pm
Powered by Dreamwidth Studios