Рэндалл Мунро, более известный под именем xkcd, написал выпуск своего комикса, посвященный спору между частотным и байесовским подходами (по-английски frequentist vs Bayesian) к статистике и теории вероятности.
Пожалуй, он все же слишком несправедливо наехал на частотника - но в конце концов это всего лишь шутка; и оказалось, что его комикс уже породил несколько интересных обсуждений в блогосфере. Отозвались корифей байесовской статистики Эндрю Гельман и корифей частотной статистики Ларри Вассерман. В комментариях у Гельмана есть немало интересного (замечательная цитата из самого Мунро оттуда: "The truth is, I genuinely didn’t realize Frequentists and Bayesians were actual camps of people — all of whom are now emailing me."). В обсуждении на HN есть несколько интересных замечаний, а также ссылка на наглядный разбор разницы между частотной и байесовской статистикой, который мне очень понравился. Отложу себе также на почитать-на-потом эссе Гельмана "Induction and Deduction in Bayesian data analysis", выглядит интересно.
Пожалуй, он все же слишком несправедливо наехал на частотника - но в конце концов это всего лишь шутка; и оказалось, что его комикс уже породил несколько интересных обсуждений в блогосфере. Отозвались корифей байесовской статистики Эндрю Гельман и корифей частотной статистики Ларри Вассерман. В комментариях у Гельмана есть немало интересного (замечательная цитата из самого Мунро оттуда: "The truth is, I genuinely didn’t realize Frequentists and Bayesians were actual camps of people — all of whom are now emailing me."). В обсуждении на HN есть несколько интересных замечаний, а также ссылка на наглядный разбор разницы между частотной и байесовской статистикой, который мне очень понравился. Отложу себе также на почитать-на-потом эссе Гельмана "Induction and Deduction in Bayesian data analysis", выглядит интересно.
no subject
Date: 2012-11-13 02:30 am (UTC)Предположим, что угадывание банки с печеньями - задача на программистском конкурсе, в котором последовательности типов банок, в т.ч. неслучайные - тестовые задания. У кого на модели нулевого порядка будет лучший процент угадываний (средний по всем заданиям, где в среднем гарантируется равномерное распределение; минимальный по "maliciously constructed" заданиям; максимальный по всем заданиям)? А то все эти споры выглядят как solutions battling for an ill-defined problem, что совершенно неконструктивно.
no subject
Date: 2012-11-13 09:28 am (UTC)no subject
Date: 2012-11-13 03:48 am (UTC)no subject
Date: 2012-11-13 06:59 pm (UTC)no subject
Date: 2012-11-13 05:38 am (UTC)no subject
Date: 2012-11-13 06:20 am (UTC)no subject
Date: 2012-11-13 06:36 am (UTC)no subject
Date: 2012-11-13 06:46 am (UTC)я там еще углядел (возможно не существующий) намек на санкт петербургский парадокс.
no subject
Date: 2012-11-13 08:23 pm (UTC)no subject
Date: 2012-11-13 08:14 pm (UTC)no subject
Date: 2012-11-13 08:48 pm (UTC)Вот например:
Emo machine learners are the worst: "Blah blah blah, my life has provably unbounded regret, blah blah blah."
no subject
Date: 2012-11-13 09:31 pm (UTC)http://arxiv.org/abs/quant-ph/0402015
http://arxiv.org/abs/quant-ph/0611261
http://arxiv.org/abs/quant-ph/0408058
это про-байесовские статьи одного автора (в контексте квантовой механики, но речь там про вероятности и статистику), они частично пересекаются, и я сейчас уже не помню, какая из них самая полная.
Я согласен с основным тезисом: "Probabilities are single-case, or nothing!". Но при этом в повседневной работе, когда, скажем, есть две выборки каких-то данных и нужно удостовериться, что у них разные медианы, всегда пользуюсь обычной фреквентистской статисткой и не вижу в этом никакой проблемы. Это интересный момент: есть масса аргументов о том, как плохи p-values (см., в частности, статьи по ссылкам выше), но в реальной жизни таких ситуаций не бывает.
no subject
Date: 2012-11-14 10:44 am (UTC)no subject
Date: 2012-11-15 01:33 am (UTC)http://videolectures.net/mlss09uk_jordan_bfway/