Nov. 2nd, 2012

catok: (Default)
catok: (Default)
Оригинал взят у [livejournal.com profile] alexanderbragin в Кластерный анализ результатов голосования в КС
Дисклеймер. Автор не является профессионалом в кластерном анализе, электоральной статистике, политологии и прочих вещах о которых пойдет речь в посте. Любая конструктивная критика приветствуется. Ниже для краткости все кандидаты именуются по фамилиям.

Предмет анализа: Предпочтения избирателей в КС. Поиск кластеров (групп) избирателей с общими предпочтениями.
Входные данные: Расшифрованный протокол из 81691 голосов. На сколько я понимаю, в нем в том числе присутствуют отфильтрованные ЦВК голоса МММщиков. https://github.com/xoposhiy/cvk2012/blob/master/protocols/protocols/decrypted.csv
Метод: самоорганизующиеся карты Кохонена (SOM-карты).

Все что надо знать про SOM-карты для понимания процесса:

Карта представляет из себя двумерную сетку. По сетке распределяются бюллетени с голосами, таким образом, что:
  • В каждой ячейке сетки находятся максимально похожие бюллетени.
  • Чем ближе ячейка A к ячейке B, тем больше схожи бюллетени ячейки A c бюллетенями из ячейки B       
           Условно говоря: абсолютно одинаковые бюллетени окажутся в одной ячейке;
                                    различающиеся на пару голосов в соседних;
                                    совсем непохожие в разных концах карты;
  • Другого физического смысла координаты в данной карте не имеют.
Подробней о SOM-картах http://mathcs.emory.edu/~kthayer/ifcsoft/som.html 

Результат распределения бюллетеней по кучкам. 
distance

Здесь цветом ячейки показано насколько кластер отличается от соседних. 
Чем темнее ячейка, тем больше она отличается от соседних. Чем светлее, тем меньше различий.
Точка в  центре ячейки показывает количество бюллетеней, которые в данную ячейку уложились: чем толще точка, тем больше бюллетеней.
 

Read more... )

Profile

catok: (Default)
Сергей Большаков

April 2017

S M T W T F S
       1
2 345678
9101112131415
16171819202122
23242526272829
30      

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Feb. 13th, 2026 05:41 pm
Powered by Dreamwidth Studios