выборы, математическое
Dec. 6th, 2011 11:06 pmО том, как статистика легко и занимательно показывает фальсификацию на прошедших позавчера думских выборах в России:
Красивые и наглядные графики!
Отмечу только, что попытка выявить "реальные" результаты голосования, по первой ссылке, кажется мне неизбежно ограниченной. Она может отрезать участки, на которых вбросили очень много бюллетеней или просто полностью сфальсифицировали результаты на этом участке (как в случаях, о которых писали, когда председатель комиссии "убежал вместе с бюллетенями"). Но эффект "карусели", когда каждый участник вбрасывает "всего" десяток голосов, но на многих участках, она отменить бессильна. Процент явки при этом может увеличиться, и заметно, но не переходит 50% и тем более не приближается к 100.
Update: из многочисленных подробных рассказов о фальсификации это один из лучших и наиболее подробных, очень рекомендую прочитать.
Красивые и наглядные графики!
Отмечу только, что попытка выявить "реальные" результаты голосования, по первой ссылке, кажется мне неизбежно ограниченной. Она может отрезать участки, на которых вбросили очень много бюллетеней или просто полностью сфальсифицировали результаты на этом участке (как в случаях, о которых писали, когда председатель комиссии "убежал вместе с бюллетенями"). Но эффект "карусели", когда каждый участник вбрасывает "всего" десяток голосов, но на многих участках, она отменить бессильна. Процент явки при этом может увеличиться, и заметно, но не переходит 50% и тем более не приближается к 100.
Update: из многочисленных подробных рассказов о фальсификации это один из лучших и наиболее подробных, очень рекомендую прочитать.
no subject
Date: 2011-12-06 10:24 pm (UTC)Характер наблюдений роли не играет - он учитывается в функции распределения, этого достаточно.
no subject
Date: 2011-12-07 07:27 am (UTC)Ну вот подкованные политологи - спорят:
"Establishing a causal relationship between turnout and electoral outcomes is difficult because individual decisions to vote, as well as aggregate turnout data, are likely endogenous to dependent variables involving vote choice."
http://faculty.ucmerced.edu/thansford/Articles/Estimating%20the%20Electoral%20Effects%20of%20Voter%20Turnout.pdf
no subject
Date: 2011-12-07 08:08 am (UTC)Наблюдения не могут быть зависимыми, поскольку происходили практически в одно время, возможность общения между избирателями в день выбора ограничена. Ну если кто-то повлияет на своего брата или сестру, это не имеет значения в такой выборке.
Я математик по профессии, у меня первая специализация была в статистике. Мне эти результаты совершенно очевидны. И я с уверенность утверждаю, что из этого можно сделать научное обоснование массовых фальсификации на выборах, достаточное для любого суда. Другое дело, что нужно четко следить, о чем говорить. К примеру большая разница между соседними участками действительно может случиться, само по себе это событие не столь уж маловероятно (особенно если предположить разные социальные слои по разным сторонам улицы). И даже корреляция между процентом голосов, отданных за одну партию, и явкой, ее тоже можно при желании объяснить естественными причинами (правда не при таких графиках, которые мы видим здесь, но там надо обращать внимание на более тонкие вещи; к примеру на невероятный процент участков с 100% явкой)
А вот нарушение закона Больших чисел на выборке в масштабах страны - это все, это никак объяснить невозможно. Это 100% evidence фальсификаций, причем по размеру сопоставимых с масштабом выборки - иначе этот эффект не был бы заметен.
no subject
Date: 2011-12-07 08:32 am (UTC)Очень заметно. Давайте Вы будете судить о тех областях знания, в которых разбираетесь? А то про политику Вы, мне кажется, очень мало знаете.
no subject
Date: 2011-12-07 08:44 am (UTC)Вот если бы он начал рассуждать, например, о том, хорошо или плохо, когда стабильность достигается ценой тотального вранья, тогда ваши слова ещё имели бы какой-то смысл.
no subject
Date: 2011-12-07 08:51 am (UTC)no subject
Date: 2011-12-07 09:03 am (UTC)no subject
Date: 2011-12-07 09:18 am (UTC)no subject
Date: 2011-12-07 09:12 am (UTC)no subject
Date: 2011-12-07 09:27 am (UTC)Нет конечно. Вранья, запугивания и т.п. в ходе избирательной кампании хватает выше крыши в любой, самой демократической стране. Разница с Россией может быть в степени всего этого. В большинстве случаев такое вранье уголовно не наказуемо - в отличие от фальсификаций самих выборов, голосования.
no subject
Date: 2011-12-07 01:03 pm (UTC)(no subject)
From:no subject
Date: 2011-12-07 04:42 pm (UTC)Однако характер самого распределения обязан остаться колоколообразным.
У нас же характер распределения совершенно не такой. А это значит, что основные коррекции вносили именно в момент подсчета, просто тупо переписывая цифры и не имея способностей или желания сделать это хоть сколько-нибудь достоверно; так, чтобы это хотя бы не так бросалось в глаза.
no subject
Date: 2011-12-07 04:52 pm (UTC)А почему не, скажем, "двугорбое" распределение, что соответствовало бы двум социально несопоставимым общностям, слишком далеко друг от друга социально находящимся, но проживающим компактно в своих участках в общих для обеих внешних границах страны? это один вопрос.
Второй - тут по ссылкам была высказана мысль, что если целью фальсификаций было "натянуть выше 50%" для ЕР, то распределение из гауссовского превратилось бы в log-normal. Вы математически можете это обосновать?
no subject
Date: 2011-12-07 05:05 pm (UTC)А при наличие хоть какого-то перемешивания результаты будут очень быстро становиться нормальными (в математическом смысле). В это все и дело, не требуется большого перемешивания или большой выборки, чтобы распределение стало нормальным - достаточно всего лишь нескольких сотен измерений. А здесь речь идет о измерениях на несколько порядков больших, там должна вообще получаться идеальная кривая.
Это как броуновское движение - отдельные частицы вообще могут иметь принципиально разный характер, размеры отличающиеся в тысячи раз и т.п. А мы ощущаем лишь тепло, прекрасно описывающееся стат. законами (и никогда, заметим, не выходящее за его границы).
По поводу 2 - точные формулы приводить трудно. Но, в общем, это примерно соответствует ситуации, где наше измерение это X*c, где X- нормально распределенные честные выборы, а с - величина искусственной коррекции от 1 до 2, скажем, которая тоже будет нормально распределенной (естественно). В результате у нас получится такой колокол с явно выраженным пологим правым склоном, что примерно похоже на log-normal.
Вообще, если бы я был в суде, то я обратил бы в первую очередь на количество участков со 100% явкой. Дело даже не в том, что это невероятно; самое невероятное, что при огромном количестве участков со 100% явкой участков с 98%-99% явкой меньше в 2-3 раза. А вот ЭТО - это четкий сигнал. Ну как Вам объяснить, это значит, что сначала число умножали на коррекцию, а потом просто обрубали то, что вышло за пределы 100%. И нет никакого другого способа это смоделировать. Потому что даже если бы это были солдаты, которых насильно приводили на участки, то все равно - где-то кто-то заболел, где-то не смог, получилось бы что явка 99% и 100% примерно равны (ну или 100% меньше, конечно, должно было бы быть). А здесь - полная лажа.
(no subject)
From:(no subject)
From:no subject
Date: 2011-12-07 08:49 am (UTC)no subject
Date: 2011-12-07 09:01 am (UTC)no subject
Date: 2011-12-07 09:08 am (UTC)Так же предположение о 100% участии в голосовании именно в деревнях неверно.
no subject
Date: 2011-12-07 09:43 am (UTC)страшно далеки они от народа
From:(no subject)
From:(no subject)
From:no subject
Date: 2011-12-07 11:18 am (UTC)В таком случае Вам, наверное, не представит большого труда подсчитать чему равна вероятность того, что среди 200 первых встретившихся Вам на улице людей не попадётся ни одной женщины. А потом объясните, почему несмотря на ничтожность этой вероятности, указанное событие не является так уж и редким, а для некоторых людей - просто повседневным
no subject
Date: 2011-12-07 11:33 am (UTC)что с улицей мелочиться? считать вероятности, так уж на широкую ногу: что проедешь всю страну и не увидеть ни одной женщины за рулем. или никого, распивающего спиртное. можно даже страны перечислить. и что это доказывает? что область применения стастистических методов анализа ограничена границами РФ?
no subject
Date: 2011-12-07 02:40 pm (UTC)no subject
Date: 2011-12-07 04:05 pm (UTC)no subject
Date: 2011-12-07 04:47 pm (UTC)А где уж у него будет среднее - мы, конечно, знать не можем.
И это лишь одно из бесчисленных "вторичных" свойств, о которых, именно в силу их вторичности, большинство не-статистиков не задумываются. Но эти свойства совершенно надежны.
no subject
Date: 2011-12-07 04:59 pm (UTC)no subject
Date: 2011-12-07 05:06 pm (UTC)Просто надо поработать лет 10 с разными статистическими данными (в том числе и совершенно не случайными), чтобы начать сразу видеть такие несоответствия.
Конечно, подробный анализ с учетом всех факторов не привести а одном ЖЖ-сообщении. Но его можно сделать в этой ситуации без проблем, это недели две работы, я думаю.