парадокс симпсона
May. 18th, 2008 12:56 amДве улитки, одну из которых зовут Басё, а другую - Исса, соревнуются в том, кто лучше умеет забираться на гору Фудзи. Каждая из улиток пытается забраться на гору 100 раз. У Басё получается добраться до вершины получается 68 раз из ста, а у Иссы - 75.
Казалось бы, ясно, что Исса - более опытный альпинист, чем Басё, верно?
Но, видите ли, мы упустили из виду, что на гору Фудзи есть два маршрута - пологий и легкий северный склон, и крутой, опасный южный. Оказывается, Басё в основном пытался заползти по сложному южному маршруту, а Исса - всё больше по легкому северному.
По северному, легкому, маршруту Басё пытался проползти 20 раз, и из них он добрался до вершины в 18-ти; а Исса пытался 80 раз, и получилось у него 65. Выходит, что Басё добивался успеха в 90% случаев, а Исса - в 81% случаев, поэтому Басё опытнее Иссы на северном склоне.
По южному, тяжелому маршруту, Басё пытался проползти 80 раз, и получилось у него в 50 - 62.5%. А Исса пытался по нему проползти 20 раз, и вышло у него всего в 10 из них - 50%. Выходит, что Басё опытнее Иссы и на южном склоне.
Но если все сложить, выходит, что Басё забрался на гору 68 раз из ста, а Исса 75 раз из ста, так что же, получается, что Исса опытнее Басё?
Нет. Мы знаем, что Басё - более опытный альпинист, и мы понимаем, как объяснить кажущееся противоречие: итоговый подсчет не учитывает того факта, что Басё намного чаще взбирался по более сложному маршруту, а Исса - наоборот.
Но если бы у нас не было этого факта, если бы мы вообще ничего не знали о двух маршрутах и о том, как улитки между ними выбирали - тогда, на основании одного только сравнения между 68/100 и 75/100, мы могли бы прийти к ложному выводу о том, что Исса опытнее. Действительно, откуда бы нам было знать, что внутри вопроса таится скрытая переменная - выбор маршрута - которая коренным образом меняет то, как надлежит интерпретировать результаты?
Это было наглядное объяснение парадокса Симпсона - настолько наглядное, насколько я смог придумать. В статье в Википедии есть несколько других примеров этого интереснейшего парадокса.
Казалось бы, ясно, что Исса - более опытный альпинист, чем Басё, верно?
Но, видите ли, мы упустили из виду, что на гору Фудзи есть два маршрута - пологий и легкий северный склон, и крутой, опасный южный. Оказывается, Басё в основном пытался заползти по сложному южному маршруту, а Исса - всё больше по легкому северному.
По северному, легкому, маршруту Басё пытался проползти 20 раз, и из них он добрался до вершины в 18-ти; а Исса пытался 80 раз, и получилось у него 65. Выходит, что Басё добивался успеха в 90% случаев, а Исса - в 81% случаев, поэтому Басё опытнее Иссы на северном склоне.
По южному, тяжелому маршруту, Басё пытался проползти 80 раз, и получилось у него в 50 - 62.5%. А Исса пытался по нему проползти 20 раз, и вышло у него всего в 10 из них - 50%. Выходит, что Басё опытнее Иссы и на южном склоне.
Но если все сложить, выходит, что Басё забрался на гору 68 раз из ста, а Исса 75 раз из ста, так что же, получается, что Исса опытнее Басё?
Нет. Мы знаем, что Басё - более опытный альпинист, и мы понимаем, как объяснить кажущееся противоречие: итоговый подсчет не учитывает того факта, что Басё намного чаще взбирался по более сложному маршруту, а Исса - наоборот.
Но если бы у нас не было этого факта, если бы мы вообще ничего не знали о двух маршрутах и о том, как улитки между ними выбирали - тогда, на основании одного только сравнения между 68/100 и 75/100, мы могли бы прийти к ложному выводу о том, что Исса опытнее. Действительно, откуда бы нам было знать, что внутри вопроса таится скрытая переменная - выбор маршрута - которая коренным образом меняет то, как надлежит интерпретировать результаты?
Это было наглядное объяснение парадокса Симпсона - настолько наглядное, насколько я смог придумать. В статье в Википедии есть несколько других примеров этого интереснейшего парадокса.
no subject
Date: 2008-05-18 12:38 am (UTC)Я бы назвал это не парадоксом, а ошибкой неверного подхода - если бы на первом склоне сравнивали не проценты, а абсолютное число удач - Исса был бы лучшим.
в принципе, Исса и на самом деле опытнее - раз чаще выбирал тот склон, на котором у него получается лучше всего %)
no subject
Date: 2008-05-18 12:46 am (UTC)В этой записи у
no subject
Date: 2008-05-18 01:09 am (UTC)У нас такое однажды получилось в суммарном зачёте многоступенчатого чемпионата по ЧГК: мы проиграли некоторой команде по итоговым результатам, хотя на каждом отдельно взятом этапе сыграли лучше неё. :)
no subject
Date: 2008-05-18 01:28 am (UTC)(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2008-05-18 01:47 am (UTC)no subject
Date: 2008-05-18 01:52 am (UTC)+1
Date: 2008-05-18 07:20 am (UTC)"Парадо́кс (от др.-греч. παράδοξος —неожиданный, странный от др.-греч. παρα-δοκέω — кажусь) — истинное высказывание, утверждение, суждение или вывод, характеризующиеся парадоксальностью.
Парадоксальность — неожиданность, непривычность, оригинальность, противоречивость себе, исходным посылкам, общепринятому, традиционному взгляду или здравому смыслу по содержанию и/или по форме."
А тут просто умалчивание или неучитывание всех исходных данных. Это всё равно, как, к примеру, расчитывать скорость движения тела в среде, учитывая все параметры тела, но не учитывая параметры среды.
(no subject)
From:(no subject)
From:no subject
Date: 2008-05-18 02:02 am (UTC)Но обьяснение деиствительно наглядное.
no subject
Date: 2008-05-18 02:40 am (UTC)(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2008-05-18 03:25 am (UTC)no subject
Date: 2008-05-18 05:31 am (UTC)(no subject)
From:no subject
Date: 2008-05-18 03:38 am (UTC)2. умный улит вообще в гору не пойдёт, обойдёт - а опытный определён как ищющий лёгких путей или наоборот :)
3. или как в покере - не число выигранный hands важно, а выручка в конце. Опытные игроки большую часть раскладок как раз проигрывают, а потом отрывают по-крупной. М.б. та, что реже залазит, в самые кайфовые моменты залазит - на закате/рассвете/раздаче пирожков на вершине и т.д.
no subject
Date: 2008-05-18 03:44 am (UTC)Если на южном склоне результаты были 18/20 и 72/80, а на северном 52/80 и 13/20, то несмотря на то, что по каждому склону соотношения равны (18/20 = 72/80 = 90%, 52/80 = 13/20 = 65%), в итоговом расчёте будет разница: 18+52=70 из 100, 72+13=85 из 100.
no subject
Date: 2008-05-18 07:04 am (UTC)на северном все доползли - 20/20 и 80/80
а на южном никто не дополз - 0/80 и 0/20
то в целом - 20/100 против 80/100 :)
Тривиальный какой-то парадокс
(no subject)
From:no subject
Date: 2008-05-18 03:58 am (UTC)Есть 2 магазина, торгующих джинсами: известный в центре города и неизвестный на отшибе. С апреля по май цены в центре увеличиваются с 1000 до 1100 руб., а на отшибе с 800 до 900. При этом в апреле люди знали только про центральный (и покупали по 1000), а в мае сарафанное радио разнесло, что появился более дешевый (и стали покупать там по 900). В каждом магазине цены выросли, а покупать джинсы стали дешевле.
Собственно, проблема в изменении весовых коэффициентов: есть второй фактор "место продажи", и его нельзя не учитывать в постановке.
Правда, на этом сложности не заканчиваются: http://polnolunie.baikal.ru/me/aggregate.doc :)
Оперативно работают
Date: 2008-05-18 04:06 am (UTC)Я таки идиотка, но все-таки мне интересно, что ...
Date: 2008-05-18 04:42 am (UTC)а на нейтральной полосе цветы
Date: 2008-05-18 04:54 am (UTC)по западно-восточному склону Фудзи
(в парадоксальном смысле)
Re: а на нейтральной полосе цветы
Date: 2008-05-18 07:08 am (UTC)По западно-восточному склону Фудзи:
Там наверху диван.
спасибо за понимание
From:no subject
Date: 2008-05-18 06:02 am (UTC)no subject
Date: 2008-05-18 06:48 am (UTC)no subject
Date: 2008-05-18 07:07 am (UTC)no subject
no subject
Date: 2008-05-18 08:04 am (UTC)Очень здорово, когда есть такие занимательные задачи.
Ну и некоторая популяризация статистики :)
no subject
Date: 2008-05-18 08:47 am (UTC)А что там есть спрятанная переменная, "сложность сезона" типа, это уже потом, в процессе объяснения нужно. То есть я вообще не понимаю, зачем вы сразу сказали, что один склон сложный, а второй -- простой. Интуитивное представление о том, каким должен быть ответ, появляется ещё до того, как сформирован парадокс.
no subject
Date: 2008-05-18 09:06 am (UTC)Более опытный альпинист
Date: 2008-05-18 09:39 am (UTC)Re: Более опытный альпинист
Date: 2008-05-18 10:27 am (UTC)no subject
Date: 2008-05-18 10:27 am (UTC)no subject
Date: 2008-05-18 07:50 pm (UTC)no subject
Date: 2008-05-18 10:35 am (UTC)Замучился уже объяснять руководству и своим креативным рекламистам, что точно просчитать эффективность акции нереально, поскольку без опроса участников (считай, в данном случае спросить у каждой улитки, сколько раз где она ползла) структурно отделить фактор естественного прироста от фактора действия акции увы никак...
no subject
Date: 2008-05-18 11:01 am (UTC)2000
Date: 2008-05-18 01:05 pm (UTC)