- Чт, 15:09: 1. Носителем суверенитета и единственным источником власти в Российской Федерации является ее многонациональный народ. 2. Народ осущес...
- Чт, 15:09: 1. Носителем суверенитета и единственным источником власти в Российской Федерации является ее многонациональный... http://t.co/R4ofC57T
- Чт, 15:20: Вот, интересующимся и понимающим http://t.co/ZjMngOll
- Чт, 15:25: http://t.co/SavosATJ
- Чт, 15:25: http://t.co/SavosATJ: http://t.co/pX18sHff
Nov. 2nd, 2012
Оригинал взят у
alexanderbragin в Кластерный анализ результатов голосования в КС
Дисклеймер. Автор не является профессионалом в кластерном анализе, электоральной статистике, политологии и прочих вещах о которых пойдет речь в посте. Любая конструктивная критика приветствуется. Ниже для краткости все кандидаты именуются по фамилиям.
Предмет анализа: Предпочтения избирателей в КС. Поиск кластеров (групп) избирателей с общими предпочтениями.
Входные данные: Расшифрованный протокол из 81691 голосов. На сколько я понимаю, в нем в том числе присутствуют отфильтрованные ЦВК голоса МММщиков. https://github.com/xoposhiy/cvk2012/blob/master/protocols/protocols/decrypted.csv
Метод: самоорганизующиеся карты Кохонена (SOM-карты).
Все что надо знать про SOM-карты для понимания процесса:
Карта представляет из себя двумерную сетку. По сетке распределяются бюллетени с голосами, таким образом, что:
различающиеся на пару голосов в соседних;
совсем непохожие в разных концах карты;
Результат распределения бюллетеней по кучкам.

Здесь цветом ячейки показано насколько кластер отличается от соседних.
Чем темнее ячейка, тем больше она отличается от соседних. Чем светлее, тем меньше различий.
Точка в центре ячейки показывает количество бюллетеней, которые в данную ячейку уложились: чем толще точка, тем больше бюллетеней.
( Read more... )
Предмет анализа: Предпочтения избирателей в КС. Поиск кластеров (групп) избирателей с общими предпочтениями.
Входные данные: Расшифрованный протокол из 81691 голосов. На сколько я понимаю, в нем в том числе присутствуют отфильтрованные ЦВК голоса МММщиков. https://github.com/xoposhiy/cvk2012/blob/master/protocols/protocols/decrypted.csv
Метод: самоорганизующиеся карты Кохонена (SOM-карты).
Все что надо знать про SOM-карты для понимания процесса:
Карта представляет из себя двумерную сетку. По сетке распределяются бюллетени с голосами, таким образом, что:
- В каждой ячейке сетки находятся максимально похожие бюллетени.
- Чем ближе ячейка A к ячейке B, тем больше схожи бюллетени ячейки A c бюллетенями из ячейки B
различающиеся на пару голосов в соседних;
совсем непохожие в разных концах карты;
- Другого физического смысла координаты в данной карте не имеют.
Результат распределения бюллетеней по кучкам.

Здесь цветом ячейки показано насколько кластер отличается от соседних.
Чем темнее ячейка, тем больше она отличается от соседних. Чем светлее, тем меньше различий.
Точка в центре ячейки показывает количество бюллетеней, которые в данную ячейку уложились: чем толще точка, тем больше бюллетеней.
( Read more... )