Статистика исследовала выборы
Статистический анализ результатов думских выборов-2011 показывает
Статистический анализ результатов думских выборов-2011 показывает
Каждые выборы – это огромный эксперимент по определению мнений и предпочтений избирателей. Федеральные выборы дают 96 с небольшим тысяч
Прежде чем приступать к статистическому анализу такого объема данных, полезно привести его к обозримому виду, и проще всего это сделать в графической форме. Мы рассмотрим два графических подхода, которые удобно применять для анализа выборных данных.
Диаграммы рассеяния
Диаграмма рассеяния – это график, позволяющий выявить взаимосвязь между двумя показателями. Результаты измерений наносятся в виде точек на координатную плоскость с координатами, соответствующими интересующим нас показателям.
Преимущество диаграммы рассеяния состоит в том, что она позволяет исследовать даже совсем небольшие наборы данных.
В качестве примера ниже представлены в виде диаграмм рассеяния результаты думских выборов 2011 года в трех районах Москвы – Южном Тушине, Строгине и Гольянове. Каждая точка соответствует результатам одной из партий на одном избирательном участке. По горизонтальной оси отложена явка на участке, по вертикальной – доля зарегистрированных избирателей, проголосовавших за соответствующую партию на этом участке. Каждому избирательному участку соответствует пять точек – по одной для результата каждой из показанных партий
Все три территории – спальные районы Москвы с обычным составом населения, однако наблюдаемые картины различны. Картина на диаграмме для Южного Тушина
Диапазон явки невелик, что ожидаемо для небольшой территории, соотношение голосов, поданных за разные партии, на всех участках более или менее одинаково.
Единственная выбивающаяся из общей картины точка с явкой 96% – небольшой
На диаграмме для Строгина ситуация другая. Диапазон явки больше, но на участках с большей величиной явки почему-то увеличивается только доля избирателей, проголосовавших за ЕР, а доли остальных партий остаются постоянными.
Такое поведение легко объяснить, если понять, как меняется положение избирательного участка на диаграмме при искусственном добавлении голосов за одну из партий
Во-первых, точки всех партий для этого участка сдвигаются в сторону большей явки на столько процентов, сколько составляют добавленные голоса от численности избирателей на участке. Во-вторых, точка партии, за которую добавляют голоса, поднимается вверх на столько же процентов. В итоге точка партии, за которую происходит
На диаграмме для Гольянова проявляется еще одно явление. Кроме групп точек, укладывающихся в картину добавления голосов за ЕР, как на предыдущей диаграмме, появляются группы, в которых доли голосов за остальные партии резко понижены по сравнению с соседними участками, а доля голосов за ЕР увеличена еще больше.
Это соответствует ситуации, когда ЕР добавляют голоса, а у других партий – отнимают.
На диаграмме для всех московских участков внизу слева выделяется плотная группа синих точек
В пересчете на число проголосовавших избирателей это означает, что на этих участках ЕР получила немного больше 50% голосов.
Судя по тому, что такие участки выделяются в виде отдельной группы, показатель в 50% был для части участков плановым заданием.
Гистограммы
Гистограммы распределения голосов - еще более удобный и показательный способ визуализации результатов выборов. Поясним, что они собой представляют и как работают на классическом примере игры в орлянку – орел или решка.
Вероятность выпадения орла при бросании монетки составляет 50%. Но это не означает, что если бросить монетку сто раз,
Количество выпадений конкретного числа орлов является случайной величиной, поэтому полученное распределение не будет гладким
(тонкая желтая линия). График гауссова распределения имеет вид симметричной колоколообразной кривой.
Гауссово распределение типично для многих величин, которые зависят от множества случайных независимых факторов
К числу таких величин относятся, в том числе и явка избирателей и доля голосов, поданных за конкретную партию, если каждый избиратель принимает решение об участии в выборах и голосовании самостоятельно и независимо.
Из-за разных размеров избирательных участков, разной активности и разных предпочтений избирателей на разных участках и т.п. на практике распределение этих показателей является суммой множества гауссовских распределений с разной шириной и разным положением центральной линии, но разумно ожидать, что его общий характер
Когда речь идет об анализе десятков тысяч измерений, диаграммы рассеяния становятся неудобны. В этой ситуации удобнее применять другой стандартный статистический инструмент – гистограммы распределения данных по различным показателям. При построении гистограммы диапазон значений интересующего нас показателя разбивается на интервалы и для каждого интервала подсчитывается количество измерений, в которых показатель попадает в данный интервал. Например, медицинские статистики строят гистограммы заболеваемости простудными заболеваниями по неделям, демографы – гистограммы распределения численности населения по возрасту и т.п.
При анализе выборов удобно строить гистограммы распределения избирательных участков или голосов избирателей по явке и по процентам голосования за различные партии. Для начала в качестве примера – гистограммы распределения избирательных участков по явке в нескольких зарубежных странах. По горизонтальной оси отложена явка, по вертикальной – количество избирательных участков в интервале явки шириной 1%.
Для всех показанных стран распределения достаточно гладкие и более или менее симметричные, похожие на гауссовы.
Совсем не так обстоит дело в случае российских выборов.
Бросаются в глаза две примечательные особенности.
1. Распределения участков по явке не имеют колоколообразной формы, как на приведенных выше графиках для зарубежных стран. В первую очередь это касается области высоких явок, где распределение не снижается симметрично начальному участку, а остается на высоком уровне вплоть до явок в 100%. Другими словами,
на наших выборах завышено количество участков с высокой явкой.
2. Распределения имеют резкие пики на значениях явки, кратных 5%. Например, на президентских выборах 2008 года участков с явкой 79% было 1429, с явкой 80% - 2069, 81% - 1787.
Как мы уже видели при рассмотрении диаграмм рассеяния, большое количество участков с повышенной явкой образуется при искусственном добавлении голосов в пользу какой-либо партии, хотя можно пытаться объяснить его, например, высокой явкой в республиках Кавказа или в сельской местности.
Но что с трудом поддается объяснению естественными механизмами – это склонность результатов выборов к круглым значениям явки.
Единственное разумное объяснение состоит в том, что такая явка получена в результате ручного вмешательства, то есть фальсификацией результатов выборов в соответствии с заданными сверху показателями.
Кстати, меньше всего пики на красивых явках выражены на распределении для думских выборов 2011 года. Однако это не означает, что с ними все в порядке. На следующем графике показано распределение избирательных участков на выборах 2011 года по проценту голосов, полученных различными партиями. По горизонтальной оси отложена доля голосов, полученных партиями, по вертикальной – количество избирательных участков с такой долей голосов за партии в интервале 0.5%.
Здесь все еще интереснее.
График для
Правая часть распределения по голосам за ЕР неестественно растянута вплоть до 100%, а пики на кратных 5% значениях доли голосов однозначно показывают, что на процент голосования за ЕР, как и на явку, был заказ. Надо отметить, что если довести явку до нужного уровня еще теоретически можно, хватая избирателей за рукав на улице и приводя их на участок, то сделать красивый процент голосования можно только после вскрытия избирательных урн и подсчета бюллетеней – то есть только путем прямой подделки результатов.
С другой стороны, графики для КПРФ,
Итак, мы видим, что единственная партия, распределение голосов за которую радикально отличается от гауссова – это
Более того, есть явные свидетельства, что показатели голосования за эту партию подделывались. Это еще один аргумент в пользу того, что странность российских распределений по явке – результат именно добавления голосов в пользу
Распределения голосов, полученных всеми партиями, очень похожи между собой, и только распределение голосов за
Именно такую картину мы видели на диаграммах рассеяния: при добавлении голосов за ЕР голоса за остальные партии просто размазываются по оси явки, сохраняя неизменное соотношение между собой, а относительная доля ЕР растет.
Предполагая, что различие в распределении голосов за ЕР и за другие партии в зависимости от явки обусловлено именно искусственным завышением голосов за ЕР, можно попробовать оценить вклад этого завышения. Для этого попытаемся выделить из распределения голосов за ЕР часть, пропорциональную сумме голосов за другие партии.
Как видно из графика, из распределения голосов за
Оставшуюся
На момент написания статьи данные голосования на выборах в Госдуму 4 декабря 2011 года еще не были окончательными и охватывали 108,6 млн избирателей
При вычислении на этих данных из 32,1 млн голосов, поданных за ЕР,
Официальные и скорректированные итоги голосования при этом выглядят следующим образом:
Читать полностью: http://www.gazeta.ru/science/2011/12/10_a_3922390.shtml