avva: (Default)
[personal profile] avva
О том, как статистика легко и занимательно показывает фальсификацию на прошедших позавчера думских выборах в России:

Красивые и наглядные графики!

Отмечу только, что попытка выявить "реальные" результаты голосования, по первой ссылке, кажется мне неизбежно ограниченной. Она может отрезать участки, на которых вбросили очень много бюллетеней или просто полностью сфальсифицировали результаты на этом участке (как в случаях, о которых писали, когда председатель комиссии "убежал вместе с бюллетенями"). Но эффект "карусели", когда каждый участник вбрасывает "всего" десяток голосов, но на многих участках, она отменить бессильна. Процент явки при этом может увеличиться, и заметно, но не переходит 50% и тем более не приближается к 100.

Update: из многочисленных подробных рассказов о фальсификации это один из лучших и наиболее подробных, очень рекомендую прочитать.

Date: 2011-12-06 10:24 pm (UTC)
From: [identity profile] lucky--man.livejournal.com
Никто не спорит. Достаточно чтобы наблюдения были независимыми, а с этим кажется никто не спорит.
Характер наблюдений роли не играет - он учитывается в функции распределения, этого достаточно.

Date: 2011-12-07 07:27 am (UTC)
From: [identity profile] saccovanzetti.livejournal.com
Достаточно чтобы наблюдения были независимыми, а с этим кажется никто не спорит

Ну вот подкованные политологи - спорят:

"Establishing a causal relationship between turnout and electoral outcomes is difficult because individual decisions to vote, as well as aggregate turnout data, are likely endogenous to dependent variables involving vote choice."

http://faculty.ucmerced.edu/thansford/Articles/Estimating%20the%20Electoral%20Effects%20of%20Voter%20Turnout.pdf

Date: 2011-12-07 08:08 am (UTC)
From: [identity profile] lucky--man.livejournal.com
Здесь речь идет о связи turnout и electoral outcome, это совсем другие вещи. Вы действительно не понимаете, или просто у Вас работа такая?

Наблюдения не могут быть зависимыми, поскольку происходили практически в одно время, возможность общения между избирателями в день выбора ограничена. Ну если кто-то повлияет на своего брата или сестру, это не имеет значения в такой выборке.

Я математик по профессии, у меня первая специализация была в статистике. Мне эти результаты совершенно очевидны. И я с уверенность утверждаю, что из этого можно сделать научное обоснование массовых фальсификации на выборах, достаточное для любого суда. Другое дело, что нужно четко следить, о чем говорить. К примеру большая разница между соседними участками действительно может случиться, само по себе это событие не столь уж маловероятно (особенно если предположить разные социальные слои по разным сторонам улицы). И даже корреляция между процентом голосов, отданных за одну партию, и явкой, ее тоже можно при желании объяснить естественными причинами (правда не при таких графиках, которые мы видим здесь, но там надо обращать внимание на более тонкие вещи; к примеру на невероятный процент участков с 100% явкой)

А вот нарушение закона Больших чисел на выборке в масштабах страны - это все, это никак объяснить невозможно. Это 100% evidence фальсификаций, причем по размеру сопоставимых с масштабом выборки - иначе этот эффект не был бы заметен.

Date: 2011-12-07 08:32 am (UTC)
From: [identity profile] saccovanzetti.livejournal.com
Я математик по профессии

Очень заметно. Давайте Вы будете судить о тех областях знания, в которых разбираетесь? А то про политику Вы, мне кажется, очень мало знаете.

Date: 2011-12-07 08:44 am (UTC)
From: [identity profile] plakhov.livejournal.com
А человек как раз судит именно о том, в чем разбирается профессионально: о статистической достоверности тех или иных событий.

Вот если бы он начал рассуждать, например, о том, хорошо или плохо, когда стабильность достигается ценой тотального вранья, тогда ваши слова ещё имели бы какой-то смысл.

Date: 2011-12-07 08:51 am (UTC)
From: [identity profile] saccovanzetti.livejournal.com
Ценой тотального вранья, запугивания и/или искусственной безальтернативности вполне возможно достигнуть близкую к 100%-й явку и голосованию за одну партию, без всяких фальсификаций. Товарищ этого, похоже, в упор не понимает. Это простейший пример, в дебри мобилизации избирателей более изысканными способами я даже не углубляюсь.

Date: 2011-12-07 09:03 am (UTC)
From: [identity profile] krakenrus.livejournal.com
Это вы теоретизируете. Можно, но не здесь и не сейчас.

Date: 2011-12-07 09:18 am (UTC)
From: [identity profile] saccovanzetti.livejournal.com
Так и он "теоретизирует". Если бы он привел аргументы, почему "здесь" и "сейчас" это невозможно, тогда к его мнению можно было бы прислушаться. А так - пустой (статистический) звон.

Date: 2011-12-07 09:12 am (UTC)
From: [identity profile] thawing-wind.livejournal.com
Так тотальное враье и запугивание - это ж тоже фальсификация, нет? Если человека принудили явиться и проголосовать определенным образом, то результат его голосования в сущности остался неизвестен.

Date: 2011-12-07 09:27 am (UTC)
From: [identity profile] saccovanzetti.livejournal.com
Так тотальное враье и запугивание - это ж тоже фальсификация, нет?

Нет конечно. Вранья, запугивания и т.п. в ходе избирательной кампании хватает выше крыши в любой, самой демократической стране. Разница с Россией может быть в степени всего этого. В большинстве случаев такое вранье уголовно не наказуемо - в отличие от фальсификаций самих выборов, голосования.

Date: 2011-12-07 01:03 pm (UTC)
From: [identity profile] krakenrus.livejournal.com
Привежите пример что-ли сколько нибудь массового запугивания в "самых демократических странах". Вы же именно этим объясняете статистические искажения (т.е. это не случайные выбросы, а нечно, что существенно влияет на результат).

(no subject)

From: [identity profile] saccovanzetti.livejournal.com - Date: 2011-12-07 02:37 pm (UTC) - Expand

Date: 2011-12-07 04:42 pm (UTC)
From: [identity profile] lucky--man.livejournal.com
Нет, я это как раз понимаю. Но даже в этом случае должно получиться нормальное распределение по теореме Больших чисел. Просто его среднее будет близко к 100%.
Однако характер самого распределения обязан остаться колоколообразным.

У нас же характер распределения совершенно не такой. А это значит, что основные коррекции вносили именно в момент подсчета, просто тупо переписывая цифры и не имея способностей или желания сделать это хоть сколько-нибудь достоверно; так, чтобы это хотя бы не так бросалось в глаза.

Date: 2011-12-07 04:52 pm (UTC)
From: [identity profile] saccovanzetti.livejournal.com
даже в этом случае должно получиться нормальное распределение по теореме Больших чисел. Просто его среднее будет близко к 100%

А почему не, скажем, "двугорбое" распределение, что соответствовало бы двум социально несопоставимым общностям, слишком далеко друг от друга социально находящимся, но проживающим компактно в своих участках в общих для обеих внешних границах страны? это один вопрос.

Второй - тут по ссылкам была высказана мысль, что если целью фальсификаций было "натянуть выше 50%" для ЕР, то распределение из гауссовского превратилось бы в log-normal. Вы математически можете это обосновать?

Date: 2011-12-07 05:05 pm (UTC)
From: [identity profile] lucky--man.livejournal.com
По поводу 1 - Вы правы, но предположить такое абсолютное неперемешивание невозможно. Всегда есть непрерывность - это же общество, дети, смешанные браки, взаимовлияние и т.п.
А при наличие хоть какого-то перемешивания результаты будут очень быстро становиться нормальными (в математическом смысле). В это все и дело, не требуется большого перемешивания или большой выборки, чтобы распределение стало нормальным - достаточно всего лишь нескольких сотен измерений. А здесь речь идет о измерениях на несколько порядков больших, там должна вообще получаться идеальная кривая.
Это как броуновское движение - отдельные частицы вообще могут иметь принципиально разный характер, размеры отличающиеся в тысячи раз и т.п. А мы ощущаем лишь тепло, прекрасно описывающееся стат. законами (и никогда, заметим, не выходящее за его границы).

По поводу 2 - точные формулы приводить трудно. Но, в общем, это примерно соответствует ситуации, где наше измерение это X*c, где X- нормально распределенные честные выборы, а с - величина искусственной коррекции от 1 до 2, скажем, которая тоже будет нормально распределенной (естественно). В результате у нас получится такой колокол с явно выраженным пологим правым склоном, что примерно похоже на log-normal.

Вообще, если бы я был в суде, то я обратил бы в первую очередь на количество участков со 100% явкой. Дело даже не в том, что это невероятно; самое невероятное, что при огромном количестве участков со 100% явкой участков с 98%-99% явкой меньше в 2-3 раза. А вот ЭТО - это четкий сигнал. Ну как Вам объяснить, это значит, что сначала число умножали на коррекцию, а потом просто обрубали то, что вышло за пределы 100%. И нет никакого другого способа это смоделировать. Потому что даже если бы это были солдаты, которых насильно приводили на участки, то все равно - где-то кто-то заболел, где-то не смог, получилось бы что явка 99% и 100% примерно равны (ну или 100% меньше, конечно, должно было бы быть). А здесь - полная лажа.

(no subject)

From: [identity profile] lucky--man.livejournal.com - Date: 2011-12-07 05:18 pm (UTC) - Expand

(no subject)

From: [identity profile] saccovanzetti.livejournal.com - Date: 2011-12-07 05:20 pm (UTC) - Expand

Date: 2011-12-07 08:49 am (UTC)
From: [identity profile] avva.livejournal.com
Потрудитесь вести себя вежливо и уважительно к другим комментаторам.

Date: 2011-12-07 09:01 am (UTC)
From: [identity profile] saccovanzetti.livejournal.com
А в чем конкретно я не вежлив? Похоже, что Вы восприняли мой комментарий слишком лично. И это правильно, образ мыслей (ошибочный) у вас одинаковый. Ну то-есть в городах вроде Москвы, я вполне допускаю, были гигантские приписки. А в деревне-то этого совершенно не требуется, и таких участков, как описано в анонимном комментарии ниже, подавляющее большинство в местах повального голосования за ЕР. Люди таки сами дают ей 100%, изощряться с открепительными бюллетенями, подделкой протоколов и т.п. не приходится. Понять это чисто из статистики совершенно невозможно, надо знать жизнь и российскую политику.

Date: 2011-12-07 09:08 am (UTC)
From: [identity profile] krakenrus.livejournal.com
Большинство населения России живет в городах.
Так же предположение о 100% участии в голосовании именно в деревнях неверно.

Date: 2011-12-07 09:43 am (UTC)
From: [identity profile] saccovanzetti.livejournal.com
Наверное, слово "деревня" надо было взять в кавычки, чтобы было понятнее о чем я: безальтернативность выбора, толкающая процент голосов за ЕР в сторону 90-100. Это легко представить, мне кажется, любому кто жил и в моногороде. Единственная заковыка, действительно, с явкой - возможна ли на самом деле такая высокая явка в "хвосте" распределения гистограммы (> 50-60%, там не большинство участков, ну может треть отсилы по общему составу). У меня нет однозначного ответа на этот вопрос; удивляет, откуда этот ответ, о возможности такой явки в стране военно-мобилизационного типа, как Россия, был бы у витающих в облаках математиков.

(no subject)

From: [identity profile] krakenrus.livejournal.com - Date: 2011-12-07 01:16 pm (UTC) - Expand

(no subject)

From: [identity profile] saccovanzetti.livejournal.com - Date: 2011-12-07 02:26 pm (UTC) - Expand

Date: 2011-12-07 11:18 am (UTC)
From: [identity profile] levrrr.livejournal.com
Я математик по профессии

В таком случае Вам, наверное, не представит большого труда подсчитать чему равна вероятность того, что среди 200 первых встретившихся Вам на улице людей не попадётся ни одной женщины. А потом объясните, почему несмотря на ничтожность этой вероятности, указанное событие не является так уж и редким, а для некоторых людей - просто повседневным

Date: 2011-12-07 11:33 am (UTC)
From: [identity profile] mitiaf.livejournal.com
была такая бородатая шутка: льва и зайца посадили в одну клетку - посмотреть кто от кого чего наберется, заяц от льва храбрости или лев от зайца - трусости. проголодавшись лев зайца съел. мораль - мудрые пословицы на зверей не распространяются.

что с улицей мелочиться? считать вероятности, так уж на широкую ногу: что проедешь всю страну и не увидеть ни одной женщины за рулем. или никого, распивающего спиртное. можно даже страны перечислить. и что это доказывает? что область применения стастистических методов анализа ограничена границами РФ?

Date: 2011-12-07 02:40 pm (UTC)
From: [identity profile] saccovanzetti.livejournal.com
что предположение об определенной форме распределения вероятностей, доказывающей или опровергающей фальсификации на выборах, может быть ошибочным.

Date: 2011-12-07 04:05 pm (UTC)
From: [identity profile] mitiaf.livejournal.com
Блаженны алчущие и жаждущие правды, ибо они насытятся

Date: 2011-12-07 04:47 pm (UTC)
From: [identity profile] lucky--man.livejournal.com
Да не об этом речь. При чем здесь какая вероятность? Я лишь утверждаю, что если повторять эти измерения снова и снова и суммировать результаты, то мы очень быстро придем к нормальному распределению колоколообразного вида.
А где уж у него будет среднее - мы, конечно, знать не можем.
И это лишь одно из бесчисленных "вторичных" свойств, о которых, именно в силу их вторичности, большинство не-статистиков не задумываются. Но эти свойства совершенно надежны.

Date: 2011-12-07 04:59 pm (UTC)
From: [identity profile] saccovanzetti.livejournal.com
Только в предположении случайности аггрегации людей с определенными взглядами по УИКам, нет? А если оно не случайно, то непонятно. В Штатах существует даже целая политическая доктрина и практика, называемая redistricting, где границы УИК намеренно меняют, чтобы сегрегировать избирателей с определенными взглядами и повлиять таким образом на результат выборов.

Date: 2011-12-07 05:06 pm (UTC)
From: [identity profile] lucky--man.livejournal.com
Да, но это очень слабый фактор.
Просто надо поработать лет 10 с разными статистическими данными (в том числе и совершенно не случайными), чтобы начать сразу видеть такие несоответствия.

Конечно, подробный анализ с учетом всех факторов не привести а одном ЖЖ-сообщении. Но его можно сделать в этой ситуации без проблем, это недели две работы, я думаю.

December 2025

S M T W T F S
  123 4 56
78 9 10 11 1213
1415 1617181920
21 22 23 24 2526 27
28293031   

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Dec. 29th, 2025 10:44 am
Powered by Dreamwidth Studios