?

Log in

No account? Create an account
Previous Entry Share Flag Next Entry
Результаты выборов 4 декабря 2011 года, по России.
dmitry424
"Единая Россия" - партия жуликов и воров (мое оценочное мнение).

Скачал и обработал результаты выборов по России с разбивкой по УИКам. На данный момент на сайте ЦИК до сих пор не вывешены результаты по 2 ТИКам Адыгеи (Майкопская городская и Шовгеновская), точнее, результаты-то есть (и я их скачал), но ссылки до них приходится додумывать самому.


Обработка велась как для всей России с разбивкой по УИКам, так и по каждому региону в отдельности. Бин для гистограмм - 1% (т.е. мы смотрим на число УИК, попавших в диапазон, например, между 49.5% и 50.5%). Тут - ссылка на архив обработанных данных (41Мб) См. архив обработанных данных в UPDATE 2, он устроен следующим образом:
  • То, что лежит в папке "data_combined" в подпапках "regionXXX" - относится к региону с номером XXX. То, что лежит в папке "data_combined_Russia_overall" - суммарные результаты для всей России, в "data_combined_Russia_regions" - суммарные результаты только для областей, краев и заграничных УИК, в "data_combined_Russia_republics" - суммарные результаты только для республик. В корне архива лежит файл "regions_names.txt" - это файл соответствий между номером региона и его именем. Из него мы узнаем, что "region002" - это Республика Алтай (строчка номер 2), а "region074" - город Москва (строчка номер 74).
  • Файлы "distribution_party_result.jpg" - распределение результатов партий (OX - результат партии, OY - число УИКов, показавших такой результат).
  • Файлы "distribution_precinct_size.jpg" - распределение УИКов по размеру (OX - размер УИК, OY - число УИК с таким размером).
  • Файлы "distribution_turnout.jpg" - распределение общей явки, а также явок за партии (OX - число голосов за партию, поделить на число приписанных к УИК избирателей, OY - число УИКов, показавших такой результат).
  • Файлы "support_abs_vs_turnout.jpg" - зависимость между явкой за партию (число голосов за партию, поделить на число приписанных к УИК избирателей) и общей явкой. Для нормальных выборов зависимость должна быть в виде прямой пропорциональности с коэффициентом, равным результату партии в этом регионе (см. здесь подробнее). По этим графикам определяются коэффициенты поддержки дополнительных избирателей (ПДИ) (т.е. какая часть голоса от одного дополнительного избирателя идет заданной партии).
  • Файлы "support_rel_vs_turnout.jpg" - зависимость между результатом партии (число голосов за партию поделить на голосов всего) и общей явкой. Для нормальных выборов зависимости быть не должно (т.е. мы должны наблюдать горизонтально-ориентированные массивы данных).
  • Файлы "turnout_vs_precinct_size_YYYY.jpg" - зависимость между результатом партии YYYY (число голосов за партию поделить на голосов всего) и размером УИКов (чтобы потом не говорили, что ПЖиВ под 100%, например, в Москве набирает только на маленьких УИКах). Файлы "turnout_vs_precinct_size_overall.jpg" - зависимость между общей явкой и размером участка. Есть в России несколько УИКов, которые больше чем 3000 чел. - например, УИК N1800 в Москве - 3106. Есть несколько зарубежных УИКов существенно больше 3000 чел. - например, N5064 - 6239.
  • Файлы "result.txt" содержат следующие сведения: 1) Как изменится общероссийский результат ПЖиВ, если считать всю Россию без рассматриваемого региона (например, неучет Бурятии понизит результат ПЖиВ на 0.8%, Дагестана - на 1%, Чечни - на 0.47%); 2) Явка в регионе; 3) Результат партии и коеффициент поддержки дополнительных избирателей, рассчитанные проведением наилучших прямых по графикам "support_abs_vs_turnout.jpg".
  • Файлы "data.mat" - данные по региону в формате MATLAB.
  • Файл "overall_data_full.mat" в корне папки "data_combined" - вся Россия с разбивкой по УИК в формате MATLAB.
  • Файл "overall_data_short.mat" в корне папки "data_combined" - сумма данных по всей России из предыдущего файла.
Соответствие цвета на графиках и партии - как здесь: красный - ПЖиВ, синий - КПРФ, зеленый - ЛДПР, голубой - СР, недействительные бюллетени - фиолетовый, все остальные вместе взятые - черный, общая явка - черный (предпоследнее и последнее все равно легко отличить друг от друга).

Соответствие обозначений в файлах "result.txt": EdRo - ПЖиВ, Comm - КПРФ, LDPR - ЛДПР, SpRo - СР, unac - недействительные бюллетени, othe - все остальные вместе взятые.

Внимание. Есть некоторые расхождения в результатах ЦИКа и моих: общее число зарегистрированных избирателей у ЦИК - 109238480, у меня - 109235335, что на 3145 меньше (разница - 0.0029%); число голосов у ПЖиВ по ЦИКу - 32383711, у меня - 32378730, что на 4981 меньше (разница - 0.015%). Не знаю, в чем тут проблема. Может быть, на сайте ЦИК вывешены не все УИКи, которые они учитывают при голосовании.


Тут - исходные данные (8Мб, в разархивированном виде - более 400Мб), скачанные с ЦИК, а также коды для обработки данных:
  • "downloader.m" - загрузчик данных с сайта ЦИК (не качает 2 ТИКа Адыгеи - Майкопский городской и Шовгеновский). Ему нужно указать ссылку на общую таблицу данных для России с разбивкой по ТИКам.
  • "combiner_region.m" - вытаскивает таблицы данных по УИКам и комбинирует данные из различных ТИКов в регионы (ТИКов - 135, регионов включая {зарубежные участки + г. Байконур} - 84).
  • "regions_numbers.txt" - нужен предыдущему файлу для соответствия между регионами и ТИКами. Номер строчки = номер региона, числа в строчке = номера XXX папок "regionXXX" с данными по ТИКам, относящимся к этому региону. Например, 3-я строчка - это "3 4 5 6", т.е. Республике Башкортостан соответствуют ТИКи Республика Башкортостан - Бирская (3), Республика Башкортостан - Салаватская (4), Республика Башкортостан - Стерлитамакская (5), Республика Башкортостан - Уфимская (6).
  • "regions_names.txt" - это файл соответствий между номером региона и его именем. Из него мы узнаем, что "region002" - это Республика Алтай (строчка номер 2), а "region074" - город Москва (строчка номер 74).
  • "combiner_overall_results.m" - комбинирует данные с регионов в данные по всей России с разбивкой по УИКам, записывает результаты в "overall_data_full.mat" и "overall_data_short.mat".
  • "analyzer_all_regions_jpg.m" - анализ полученных данных, построение графиков, вычисление коэффициентов ПДИ.
  • "function_....m" - различные функции, которые требуются основным кодам.
  • "elections_simulation_jpg.m" - моделирование вброса и переписывания протоколов, см. подробнее тут.
Все коды написаны под MATLAB для себя пяткой левой ноги, поэтому используйте на свой страх и риск, техподдержки не будет :-) Все, кроме "downloader.m" должно работать и под Linux, и под Windows. Для "downloader.m" же необходим Linux и установленный в нем wget.


Теперь немного картинок:


Распределение результатов партий для всей России по УИКам (OX - результат партии, OY - число УИКов, показавших такой результат). Резкий пик на уровне 50% не подтвердился (возможно, они его "замазали" на тот момент еще не обработанными УИКами; о том, что такое возможно - см. здесь) - см. ниже. Число УИКов по оси ординат на графике [info]oude_rus и на моем отличаются, т.к. у него бин - 0.5%, а у меня - 1%, т.е. у меня числа по оси ординат должны быть примерно в 2 раза больше, что и наблюдается.

Но даже без этих дополнительных пиков на кратных 5% результатах для ПЖиВ, график все равно впечатляет: у всех партий кроме ПЖиВ что-то похожее на Гаусса, у ПЖиВ - распределение Чурова (tm).

Обратите внимание на пики для других партий (кроме ПЖиВ) в области совсем малых результатов (меньше 2-3%). Судя по всему, они берутся от переписывания протоколов (см. моделирование махинаций здесь).

Коэффициент ПДИ для ПЖиВ по все России: каждый дополнительный избиратель привносил в копилку ПЖиВ 1.13 голоса :-) Для нормальных выборов было бы 0.493.



Распределение результатов партий для г. Москва. Похоже, некоторые УИКи выполняли "партийное задание" на 50% результат ПЖиВ. ПДИ для ПЖиВ - 0.88 (должно быть 0.47).


Распределение результатов партий для Республика Северная Осетия - Алания. Тут, похоже, тоже было "партийное задание" :-) ПДИ для ПЖиВ - 0.88 (должно быть 0.68).


Распределение результатов партий для республик России (суммарно). ПДИ ПЖиВ 1.42 (должно быть 0.71 - именно 71% набрала ПЖиВ по республикам вместе взятым). Явка по республикам - 76%, число зарегистрированных избирателей - 16945940, т.е. 15.5% от избирателей всего.


Распределение результатов партий для областей и краев России, а также для заграничных УИК (суммарно). ПДИ ПЖиВ 0.94 (должно быть 0.44 - именно 44% набрала ПЖиВ по областям, краям и заграничным УИК вместе взятым). Явка по областям, краям и заграничным УИК - 57%, число зарегистрированных избирателей - 92289395, т.е. 84.5% от избирателей всего.

Распределение общей явки и явок за партии (OX - явка за партию, т.е. число голосов за партию поделить на число приписанных к УИК избирателей, OY - число УИКов, показавших такой результат) для республик России.



Распределение общей явки и явок за партии (OX - явка за партию, т.е. число голосов за партию поделить на число приписанных к УИК избирателей, OY - число УИКов, показавших такой результат) для областей, краев и заграничных УИК России.


Регионы 5, 6, 7, 9, 13, 17, 20 показали результат ПЖиВ выше 80%. Это (соответственно):
  1. Дагестан (явка 91%, результат 91%, добавок к общероссийскому результату ПЖиВ - 1%),
  2. Ингушетия (86% / 91% / 0.1%),
  3. Кабардино-Балкария (98% / 82% / 0.3%),
  4. Карачаево-Черкессия (93% / 90% / 0.2%),
  5. Мордовия (94% / 92% / 0.4%),
  6. Тыва (86% / 85% / 0.1%),
  7. Чечня (99.5% / 99.5% / 0.5%).
Если не учитывать их, то общероссийский результат ПЖиВ уменьшился бы до 46.7% (сейчас - 49.3%).

Ссылки:
    Сергей Шпилькин, выборы в России: [1], [2], [3].
    Андрей Кунов, Михаил Мягков, Алексей Ситников, Дмитрий Шакин, выборы в России и на Украине.
    John Brady Kiesling, армянские выборы.
    Еще доклад по армянским выборам.
    Walter R. Mebane, Kirill Kalinin, выборы в России.
    Misha Myagkov, Peter C. Ordeshook, выборы в России.
    Nils B. Weidmann, афганские выборы.

P.S. Результат партии считается как число голосов за партию поделить на сумму действительных и недействительных бюллетеней.


UPDATE: [info]oude_rus посоветовал выбирать начало бинов не между, например 49.5 и 50.5, как я делал, а между 49% и 50% (для бина в 1%). Кроме того, я уменьшил бин до 0.5%, и сделал такой же масштаб как у него. Получилось, что мой график и график[info]oude_rus совпадают:

По оси OX - результат партии, по OY - число УИК, показавших такой результат. Красная кривая - ПЖиВ. Мы видим, что число участков, показавших результат между 49.5% и 50% - около 600, а между 50% и 50.5% - чуть больше 1000. Пики на кратных 5% результатах для ПЖиВ, таким образом, подтверждаются.

P.S. (15.12.2011) Пики на 50%, 25%, 75%, 2/3 и т.д. могут быть артефактом, связанным с тем, что мы работаем с принципиально целочисленными данными (см. здесь и здесь). От этого можно избавиться зашумлением начальных данных (добавляем случайные числа в диапазоне от 0 до 1). Если проделать это с предыдущим графиком, то получается вот что:


Видно, что пик на 50% сильно поубавился, но пики на 65%, 70%, 80%, 85%, 90%, 95% - все же есть. Про статистическую значимость пиков см. здесь и здесь.


UPDATE 2: Архив с графиками в более удобном виде, картинки в основном тексте решил не переделывать. Бин 1%, начало бинов на целых числах процентов (например, с 49% до 50%). Пики на кратных 5% результатах для ПЖиВ просматриваются.


UPDATE 3: Вот такие были распределения явки в России в 1996 (черная и синяя кривые), 2000 (зеленая кривая) и 2004гг (красная кривая). Сравните с 2-ым и 3-им графиками с конца в этом посту, черная кривая на них как раз соответствует распределению явки. Андрей Кунов, Михаил Мягков, Алексей Ситников, Дмитрий Шакин, выборы в России и на Украине, стр. 34, рис.10 и 11.



Еще коллекция нормальных выборов у [info]podmoskovnik.