о возвращении к среднему
Apr. 5th, 2012 11:14 pmВозвращение к среднему значению (по-английски regression to the mean) - феномен в статистике, который очень просто объяснить, но вместе с тем он часто ускользает от нашего внимания.
Представьте, что потоку из сотни студентов дают написать сложный экзамен по математике, и оцени за него выставляют по 100-бальной шкале. Давайте выпишем имена тех, кому выставили 10% худших оценок, и тех, кому достались 10% лучших. На следующий день всему потоку дают еще один экзамен, на ту же самую тему и той же сложности, но задачки другие. Теперь сравним оценки, которые получили студенты в первый день и во второй.
Мы увидим, что почти всегда в среднем наихудшие ученики в первый день повысили свои оценки на второй день, а наилучшие, наоборот, снизили. Не у каждого ученика так будет, но в среднем выйдет так. Почему? На оценку влияют два фактора: знания и случайность (примеры случайных факторов: студент выспался или нет; попалась в точности задача, которую он помнит; мысли заняты чем-то другим; итд. итд.). Когда мы по итогам первого экзамена выделили 10% худших оценок, в них попали студенты, у которых и знаний мало, и к тому же им (в среднем) сильно "не повезло". На следующий день знаний у них не прибавилось, а вот везение, случайные факторы будут примерно средними - они "вернулись к среднему значению". Так что эти студенты напишут второй экзамен несколько лучше. То же самое объяснение, но в другую сторону - для лучших 10% оценок.
(Если вы сомневаетесь в этом примере и хотите увидеть более "чистый" пример, просто удалите фактор знаний. Пусть каждый студент кидает 10 раз шестигранные кости, и оценкой будет сумма того, что он выкинул. В среднем каждый студент выкинет примерно 35, но будет немало оценок хуже и лучше. Возьмем 10% самых худших, и дадим еще один такой же "экзамен" только им. Что же мы увидим? - в среднем у них по второму экзамену опять выпадет 35, т.е. все эти "плохие" студенты улучшились! Конечно, в такой формулировке мы не видим тут ничего странного, потому что полная случайность налицо).
В возвращении к среднему нет ничего мистического или необычного. Проблема состоит в том, что нам свойственно не замечать его, когда есть более "логичные" объяснения того, что оценки изменились. Вернемся к экзамену по математике: представьте, что второй экзамен дают не на следующий день, а через неделю, и в эту неделю 10% худших студентов по результатам первого экзамена получают специальную помощь, с ними интенсивно занимаются
математикой. На втором экзамене "наихудшие" улучшают свои оценки, и все довольны: практика занятий с отстающими студентами доказала себя! Но на самом деле, возможно, весь эффект объясняется возвращением к среднему, о котором не подумали, и специальные занятия ничего не дали. Или дали, но насколько они помогли, трудно судить, потому что возвращение к среднему тоже дает мощный эффект. Надо использовать специальные методы, чтобы этот эффект учесть (у статистиков такие методы есть).
Или представьте, что мы хотим исследовать, насколько психотерапия помогает в лечении сильной депрессии. Мы дадим стандартный опросник клиентам психотерапевтов, когда они впервые приходят на прием, а потом еще раз через полгода - и сравним глубину депрессивного состояния согласно этому опроснику. Если в среднем все улучшается, то мы заключаем, что психотерапия отлично работает. Но, увы, дело в том, что людям свойственно решиться наконец пойти к психотерапевту или психологу, когда им особенно хреново, когда депрессия особенно сильная. А поскольку ее глубина изменяется не по точным законам, а в ней есть много случайности, через полгода согласно возвращению к среднему мы ожидаем увидеть улучшение, опять-таки в среднем, независимо от того, что сделали или не сделали психотерапевты.
Американский психолог Робин Доз пересказывает замечательный пример когнитивного искажения, основанного на непонимании возвращения к среднему. Инструктор летного курса в израильской армии спорил с психологами о том, как лучше мотивировать учеников: кнутом или пряником. "На основании своего личного опыта я знаю, что лучше всего мотивирует наказание, а похвала наоборот вредит", сказал он. "Неоднократно случалось так, что ученик очень хорошо выполнял какой-то маневр в воздухе, я его за это всячески хвалил, а в следующий раз он его делал намного хуже. С другой стороны, когда кто-то выполняет маневр очень плохо, а я за него на это ору и ругаю, в следующий раз у него почти всегда лучше получается!"
(пример взят из его книги House of Cards, о психологии и психотерапии, которую я сейчас читаю; очень интересной)
Представьте, что потоку из сотни студентов дают написать сложный экзамен по математике, и оцени за него выставляют по 100-бальной шкале. Давайте выпишем имена тех, кому выставили 10% худших оценок, и тех, кому достались 10% лучших. На следующий день всему потоку дают еще один экзамен, на ту же самую тему и той же сложности, но задачки другие. Теперь сравним оценки, которые получили студенты в первый день и во второй.
Мы увидим, что почти всегда в среднем наихудшие ученики в первый день повысили свои оценки на второй день, а наилучшие, наоборот, снизили. Не у каждого ученика так будет, но в среднем выйдет так. Почему? На оценку влияют два фактора: знания и случайность (примеры случайных факторов: студент выспался или нет; попалась в точности задача, которую он помнит; мысли заняты чем-то другим; итд. итд.). Когда мы по итогам первого экзамена выделили 10% худших оценок, в них попали студенты, у которых и знаний мало, и к тому же им (в среднем) сильно "не повезло". На следующий день знаний у них не прибавилось, а вот везение, случайные факторы будут примерно средними - они "вернулись к среднему значению". Так что эти студенты напишут второй экзамен несколько лучше. То же самое объяснение, но в другую сторону - для лучших 10% оценок.
(Если вы сомневаетесь в этом примере и хотите увидеть более "чистый" пример, просто удалите фактор знаний. Пусть каждый студент кидает 10 раз шестигранные кости, и оценкой будет сумма того, что он выкинул. В среднем каждый студент выкинет примерно 35, но будет немало оценок хуже и лучше. Возьмем 10% самых худших, и дадим еще один такой же "экзамен" только им. Что же мы увидим? - в среднем у них по второму экзамену опять выпадет 35, т.е. все эти "плохие" студенты улучшились! Конечно, в такой формулировке мы не видим тут ничего странного, потому что полная случайность налицо).
В возвращении к среднему нет ничего мистического или необычного. Проблема состоит в том, что нам свойственно не замечать его, когда есть более "логичные" объяснения того, что оценки изменились. Вернемся к экзамену по математике: представьте, что второй экзамен дают не на следующий день, а через неделю, и в эту неделю 10% худших студентов по результатам первого экзамена получают специальную помощь, с ними интенсивно занимаются
математикой. На втором экзамене "наихудшие" улучшают свои оценки, и все довольны: практика занятий с отстающими студентами доказала себя! Но на самом деле, возможно, весь эффект объясняется возвращением к среднему, о котором не подумали, и специальные занятия ничего не дали. Или дали, но насколько они помогли, трудно судить, потому что возвращение к среднему тоже дает мощный эффект. Надо использовать специальные методы, чтобы этот эффект учесть (у статистиков такие методы есть).
Или представьте, что мы хотим исследовать, насколько психотерапия помогает в лечении сильной депрессии. Мы дадим стандартный опросник клиентам психотерапевтов, когда они впервые приходят на прием, а потом еще раз через полгода - и сравним глубину депрессивного состояния согласно этому опроснику. Если в среднем все улучшается, то мы заключаем, что психотерапия отлично работает. Но, увы, дело в том, что людям свойственно решиться наконец пойти к психотерапевту или психологу, когда им особенно хреново, когда депрессия особенно сильная. А поскольку ее глубина изменяется не по точным законам, а в ней есть много случайности, через полгода согласно возвращению к среднему мы ожидаем увидеть улучшение, опять-таки в среднем, независимо от того, что сделали или не сделали психотерапевты.
Американский психолог Робин Доз пересказывает замечательный пример когнитивного искажения, основанного на непонимании возвращения к среднему. Инструктор летного курса в израильской армии спорил с психологами о том, как лучше мотивировать учеников: кнутом или пряником. "На основании своего личного опыта я знаю, что лучше всего мотивирует наказание, а похвала наоборот вредит", сказал он. "Неоднократно случалось так, что ученик очень хорошо выполнял какой-то маневр в воздухе, я его за это всячески хвалил, а в следующий раз он его делал намного хуже. С другой стороны, когда кто-то выполняет маневр очень плохо, а я за него на это ору и ругаю, в следующий раз у него почти всегда лучше получается!"
(пример взят из его книги House of Cards, о психологии и психотерапии, которую я сейчас читаю; очень интересной)
no subject
Date: 2012-04-05 08:21 pm (UTC)no subject
Date: 2012-04-05 08:43 pm (UTC)(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:Наглядная демонстрация
Date: 2012-04-05 08:34 pm (UTC)Я имел удовольствие недавно присутствовать на практической демонстрации этого принципа, называемой "The Read Bead Experiment". Можно даже посмотреть видеозапись: http://www.agilerigaday.lv/Sessions/the-red-bead-experiment
no subject
Date: 2012-04-05 08:38 pm (UTC)no subject
Date: 2012-04-05 08:42 pm (UTC)(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2012-04-05 08:38 pm (UTC)Помимо спонтанного улучшения может иметь место и спонтанное ухудшение, что при депрессии очень часто случается.
no subject
Date: 2012-04-05 08:41 pm (UTC)обычно нет
в депрессии мы говорим об очень высоком уровне именно спонтанного улучшения
(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2012-04-05 08:41 pm (UTC)no subject
Date: 2012-04-05 08:52 pm (UTC)no subject
Date: 2012-04-05 09:02 pm (UTC)(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2012-04-05 09:06 pm (UTC)no subject
Date: 2012-04-05 09:10 pm (UTC)no subject
Date: 2012-04-06 11:34 am (UTC)no subject
Date: 2012-04-05 09:23 pm (UTC)http://www.amazon.com/Fooled-Randomness-Hidden-Chance-Markets/dp/1587990717
Судя по всему наш мозг вообще не приспособлен к пониманию вероятности и статистики
no subject
Date: 2012-04-05 09:33 pm (UTC)(no subject)
From:(no subject)
From:no subject
Date: 2012-04-05 09:28 pm (UTC)статистика задач на уровне студенческих "истребителей-бомбардировщиков"
нет никакого искажения, ни психологического, ни статистического
все знают, что второй раз тесты на айкью проходят в сто раз лучше
итак, кто хочет возможности мозга сравнить со статистикой?
no subject
Date: 2012-04-05 09:28 pm (UTC)Традиционно процитирую "Социальную психологию" Майерса вдобавок.
"Чтобы имитировать последствия похвалы и наказания, Пол Шаффнер (Paul Schaffner, 1985) попросил студентов Боудонского колледжа приучить выдуманного четвероклассника Гарольда приходить в школу к 8.30. Каждый день в течение трех недель компьютер показывал время прихода «Гарольда», обычно это было между 8.20 и 8.40. Участники эксперимента должны были решить, как реагировать на приход мнимого ученика — изысканной похвалой или строгим выговором. Как вы могли предположить, они обычно хвалили «Гарольда», когда он приходил до 8.30, и делали замечание, если он приходил после 8.30. Так как Шаффнер запрограммировал компьютер на случайную последовательность времени прихода, после замечаний возникала тенденция к улучшению (время приближалось к 8.30). Например, если «Гарольд» приходил в 8.39, он был почти уверен, что его отругают, а вероятность того, что случайное время прихода на следующий день будет меньше 8.39, была очень высока. Таким образом, даже если замечания не имели никакого эффекта, большинство участников эксперимента закончили его, полагая, что их замечания сыграли свою роль.
no subject
Date: 2012-04-06 11:35 am (UTC)no subject
Date: 2012-04-05 09:39 pm (UTC)no subject
Date: 2012-04-06 11:35 am (UTC)no subject
Date: 2012-04-05 11:12 pm (UTC)на парактике же, если написать например вот такую программку:
int c = 0; for (int i = 0; true; i++) { c += Math.random() <= 0.5 ? 1 : -1; if (i % 1000 == 0) {System.out.println(c);} } }то можно увидеть, что значение переменной с (среднее значение которого равно 0) подавляющее количество времени находится очень далеко от среднего значения
no subject
Date: 2012-04-06 02:06 am (UTC)(no subject)
From:no subject
Date: 2012-04-06 01:51 am (UTC)no subject
Date: 2012-04-06 03:13 am (UTC)ДА, верно со студентами
Date: 2012-04-06 05:07 am (UTC)no subject
Date: 2012-04-06 06:20 am (UTC)А не ещё хуже...
no subject
Date: 2012-04-06 07:45 am (UTC)no subject
Date: 2012-04-06 07:37 am (UTC)Эта идея возвращения к среднему в некоторых случаях приводит к совершенно неверным выводам. Например, некоторые считают, что учи-не учи ребёнка, воспитывай-не воспитывай - всё равно толку не будет, поэтому не стоит этим и заниматься.
По этому поводу мне запомнилось такое наблюдение на празднике в детском саду. Зрители (родители) сидели в зале и ждали, под музыку аккуратным строем входили дети. Сначала вывели младшую группу, потом среднюю, старшую и подготовительную. И вот на что я обратила внимание. Все дети существенно разного роста, и в младшей группе есть высокие, и в подготовительной - совсем крохотули, как из младшей группы. Казалось бы, все группы в целом должны выглядеть примерно одинаково. Однако нет, прекрасно видно, где какая группа. То есть этот самый средний рост определяется даже на глаз и даже несмотря на большой разброс.
То есть получается, что маленький от природы ребёнок или крупный, быстро растёт или отстаёт в росте, его возраст всё равно даёт себя знать. Время идёт, и дети растут.
Так же, мне кажется, и с занятиями: умный студент или глупый, трудолюбивый или лентяй - если заниматься с ним интенсивно, то эти занятия неизбежно должны отразиться на результатах.
no subject
Date: 2012-04-06 10:41 pm (UTC)Например, цыплят держали на разных диетах, и они по-разному выросли. Но те, что были на одной диете, тоже по-разному выросли. Какие диеты эффективны?
Например, кормящие матери-подростки: замедляется ли их рост из-за нехватки кальция?
Дать ответы непросто, и этим как раз статистика занимается.
no subject
Date: 2012-04-06 08:18 am (UTC)Я извиняюсь, но афаик дело обстоит ровно наоборот. На пике депрессии у человека нет сил ни на что решиться. Предпринимание каких-либо шагов происходит, когда депрессия начинает немного спадать (в том числе таких, как самоубийство, как это ни парадоксально выглядит). Этот факт тоже подрывает доверие с успехам психотерапии, но по другим причинам (т.е. возможно, что да пациент и так шел на поправку). Другое дело, что окружающие могут заставить человека обратиться к психологу на пике депрессии, это да.
no subject
Date: 2012-04-06 08:41 am (UTC)off. частная иллюстрация
Date: 2012-04-06 12:06 pm (UTC)Система "Кнут + пряник" не может быть мотивирующим фактором для любого обучения. Только стимулирующим.
Мотивирующими могут быть другие предпосылки, например: "научиться управлять большим/маленьким/красивым самолётом", "научиться летать, как птицы" или
"освоить престижную профессию" и т.д.
В лётном обучении добиться стабильно высоких показатели качества пилотирования можно лишь путём многократного повторения элементов мнёвра, с подробным анализом действий обучаемого после каждого полёта. (в т.ч. правильное распределение внимания при мониторинге ПНП, соразмерная работа органами управления, своевременные исправление отклонений от заданной траектории и компенсация ошибок и др.). Результатом такой работы послужит приобретение учеником устойчивых навыков пилотирования (или вывод о профнепригодности). Возврат к средним показателям, а то и к утрате навыков возможен при длительном перерыве в практической работе пилота-профессионала. Летать с любителем - бросать монетку. Очевидно, пилот-любитель всегда нестабилен и редко выходит за пределы среднего в ожидании.
Эмоциональная оценка обучаемого инструктором не только бессмысленна, но и вредна, т.к. выводит обучаемого из состояния "с холодной головой" и делает его неспособным к критическому анализу своих действий. Имеет смысл только количественная оценка по таблице допустимых отклонений. Такой подход справедлив для обучения операторов любых сложных систем с "острой" обратной связью.
В лётном обучении эмоциональная система "хвалить-ругать", на мой взгляд, допустима лишь для оценки работы инструктора, как творца различных методик обучения. Или мастеров искусств, в т. ч. области выполнения показательных полётов.
В принципе, в авиации существуют печатные труды по авиационной психологии, ссылок привести, к сожалению, не могу. Некоторым спорящим с психологами инструкторам лётных курсов было бы полезно с ними ознакомиться.
Многословен, прошу прощения.
no subject
Date: 2012-04-06 01:49 pm (UTC)гомеотерапиигомеопатии, кстати, в дополнение к эффекту плацебо. См. Bad Science, например.no subject
Date: 2012-04-06 02:15 pm (UTC)no subject
Date: 2012-04-06 05:16 pm (UTC)(no subject)
From:no subject
Date: 2012-04-07 03:22 am (UTC)Как-то с этим инструктором уж очень странно. Кто у кого байку перенял?
no subject
Date: 2012-04-07 03:51 am (UTC)(no subject)
From:no subject
Date: 2012-04-09 08:20 pm (UTC)(Сам я взял ее с собой в Израиль и на Балканы в декабре. ИМХО, это одна из самых ценных книг, написанных за последние сколько-то лет.)
no subject
Date: 2012-04-09 08:24 pm (UTC)