Wybory samorządowe 2014 w poszukiwaniu anomalii statystycznych

Podobne dokumenty
Sympozjum. Streszczenia referatów

Czy sondaże przedwyborcze mówią prawdę? O technikach manipulacyjnych w badaniach społecznych i marketingowych

Warszawa, październik 2011 BS/124/2011 PREFERENCJE PARTYJNE PRZED WYBORAMI

WYBORY SAMORZĄDOWE 2014 W POSZUKIWANIU ANOMALII STATYSTYCZNYCH

Preferencje partyjne w listopadzie

Badanie opinii i postaw mieszkańców Wrocławia. Kwiecień 2018

STATYSTYKA MATEMATYCZNA

Preferencje partyjne we wrześniu

Porównanie wyników wyborów do sejmików z lat 2010 i 2014 wraz z oceną wpływu zbroszurowania kart

Preferencje partyjne w maju

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego

Preferencje partyjne Polaków w czerwcu 2010 r.

KOMUNIKATzBADAŃ. Preferencje partyjne w sierpniu NR 106/2017 ISSN

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA

Temat: BADANIE NIEZALEśNOŚCI DWÓCH CECH JAKOŚCIOWYCH TEST CHI KWADRAT. Anna Rajfura 1

Protokół obrad Kapituły II Edycji Konkursu o Puchar Pytii. Wybory Parlamentarne, październik 2015

Analiza współzależności zjawisk. dr Marta Kuc-Czarnecka

Raport z badania ilościowego Jedynki

KOMUNIKATzBADAŃ. Preferencje partyjne w czerwcu NR 73/2017 ISSN

Warszawa, marzec 2015 ISSN NR 33/2015 PREFERENCJE PARTYJNE W MARCU

P: Czy studiujący i niestudiujący preferują inne sklepy internetowe?

Warszawa, listopad 2014 ISSN NR 154/2014 PREFERENCJE PARTYJNE W LISTOPADZIE

Preferencje partyjne Polaków w pierwszy weekend stycznia 2007 r.

Preferencje partyjne w marcu

Warszawa, październik 2013 BS/140/2013 PREFERENCJE PARTYJNE W PAŹDZIERNIKU

SYMULACJA ROZKŁADU MANDATÓW W WYBORACH DO PARLAMENTU EUROPEJSKIEGO

haeq-h6ak-]4eu-vhts-[cik

WYBORY DO RADY POWIATU ZESTAWIENIE

KOMUNIKATzBADAŃ. Preferencje partyjne w marcu NR 28/2017 ISSN

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Statystyczna analiza danych w programie STATISTICA 7.1 PL (wykład 3) Dariusz Gozdowski

Wykład 12 Testowanie hipotez dla współczynnika korelacji

Warszawa, październik 2014 ISSN NR 136/2014 WYBORY SAMORZĄDOWE

Preferencje partyjne Polaków na początku czerwca 2009 r.

Badanie zależności pomiędzy zmiennymi

Politikon IV ʼ10. Sondaż: Preferencje polityczne w kwietniu Wyniki sondażu dla PRÓBA REALIZACJA TERENOWA ANALIZA. Wykonawca:

Korelacja krzywoliniowa i współzależność cech niemierzalnych

Warszawa, wrzesień 2011 BS/104/2011 PREFERENCJE PARTYJNE WE WRZEŚNIU

20 lecie samorządu 20 lecie wyborów lokalnych w Chojnicach

Nazwa przedmiotu: Informatyczne systemy statystycznej obróbki danych. Informatics systems for the statistical treatment of data Kierunek:

Analiza autokorelacji

Preferencje partyjne Polaków w marcu 2010 r.

Preferencje partyjne Polaków w maju 2010 r.

Temat: Badanie niezależności dwóch cech jakościowych test chi-kwadrat

Analiza wyników prawyborów z dnia r. w Zespole Szkół Ekonomicznych w Nowym Sączu

Spis tabel. Tabela 5.6. Indeks rywalizacyjności oraz efektywna liczba partii w wyborach

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7

Preferencje partyjne Polaków w marcu 2009 r.

Analiza korelacji

, , WYBORY PARLAMENTARNE 97 - PREFERENCJE NA TRZY TYGODNIE PRZED DNIEM GŁOSOWANIA WARSZAWA, WRZESIEŃ 97

WYBORY DO RADY POWIATU ZESTAWIENIE

Preferencje partyjne Polaków w połowie listopada 2005 r.

KOMUNIKATzBADAŃ. Preferencje partyjne w kwietniu NR 40/2017 ISSN

Preferencje partyjne w czerwcu

KOMUNIKAT PAŃSTWOWEJ KOMISJI WYBORCZEJ. z dnia 13 czerwca 2011 r.

Preferencje partyjne Polaków w lutym 2009 r.

Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI. Zmienna losowa dwuwymiarowa i korelacja

R-PEARSONA Zależność liniowa

Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia związku pomiędzy dwiema zmiennymi nominalnymi (lub porządkowymi)

Preferencje partyjne Polaków we wrześniu 2006 r.

WYBORY DO RADY POWIATU PROTOKÓŁ Z WYBORÓW. do Rady Powiatu w Sławnie sporządzony dnia 18 listopada 2014r. przez Powiatową Komisję Wyborczą w Sławnie

Preferencje partyjne w listopadzie

Statystyka matematyczna dla leśników

Preferencje partyjne Polaków na początku sierpnia 2009 r.

Warszawa, czerwiec 2014 ISSN NR 85/2014 PREFERENCJE PARTYJNE PO WYBORACH DO PARLAMENTU EUROPEJSKIEGO

WYBORY DO RADY POWIATU ZESTAWIENIE WYNIKÓW GŁOSOWANIA I PODZIAŁU MANDATÓW W OKRĘGU WYBORCZYM

MODELE LINIOWE. Dr Wioleta Drobik

Warszawa, kwiecień 2013 BS/47/2013 PREFERENCJE PARTYJNE W KWIETNIU

Warszawa, maj 2011 BS/54/2011 PREFERENCJE PARTYJNE W MAJU

Preferencje partyjne Polaków w listopadzie 2007 r.

CENTRUM BADANIA OPINII SPOŁECZNEJ

PREFERENCJE POLAKÓW W WYBORACH SAMORZĄDOWYCH 2002 R.

WIELKOŚĆ NIEWAŻNYCH GŁOSÓW W WYBORACH SAMORZĄDOWYCH W ODNIESIENIU DO RODZAJÓW JST - USYTUOWANIE W POLSCE

WYBORY DO RADY POWIATU

GRUPY NIEZALEŻNE Chi kwadrat Pearsona GRUPY ZALEŻNE (zmienne dwuwartościowe) McNemara Q Cochrana

Preferencje partyjne Polaków. Grudzień Preferencje partyjne Polaków. TNS Grudzień 2015 K.079/15

KOMUNIKATzBADAŃ. Preferencje partyjne przed wyborami NR 142/2015 ISSN

WYBORY DO RADY POWIATU ZESTAWIENIE WYNIKÓW GŁOSOWANIA I PODZIAŁU MANDATÓW W OKRĘGU WYBORCZYM

Trwałość geograficzna wyników wyborów w Polsce

WYBORY DO RADY POWIATU ZESTAWIENIE

Spis treści 3 SPIS TREŚCI

SYMULACJE WYNIKÓW WYBORÓW W UKŁADZIE JOW

809C-hWh0-99K3-z3Rr-9ab3

WYBORY DO RADY POWIATU ZESTAWIENIE WYNIKÓW GŁOSOWANIA I PODZIAŁU MANDATÓW W OKRĘGU WYBORCZYM

Preferencje partyjne Polaków w styczniu 2006 r.

KOMUNIKATzBADAŃ. Preferencje partyjne w lutym NR 15/2017 ISSN

Wprowadzenie do analizy korelacji i regresji

Uchwała Nr 4/2014 Gminnej Komisji Wyborczej w Oleśnicy z dnia 23 października 2014r.

Preferencje partyjne Polaków w grudniu 2009 r.

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Warszawa, wrzesień 2012 BS/123/2012 PREFERENCJE PARTYJNE WE WRZEŚNIU

Warszawa, styczeń 2015 ISSN NR 5/2015 PREFERENCJE PARTYJNE W STYCZNIU

Warszawa, sierpień 2011 BS/96/2011 PREFERENCJE PARTYJNE W SIERPNIU

EDUKACJA a WYBORY XLIII Konferencja Zastosowań Matematyki Instytutu Matematycznego PAN Zakopane-Kościelisko, 6 września 2014 r.

Warszawa, grudzień 2014 ISSN NR 174/2014 ZAUFANIE DO PROCEDUR WYBORCZYCH

Warszawa, grudzień 2010 BS/165/2010 PREFERENCJE PARTYJNE W GRUDNIU

WYBORY DO RADY POWIATU ZESTAWIENIE WYNIKÓW GŁOSOWANIA I PODZIAŁU MANDATÓW W OKRĘGU WYBORCZYM

Badanie zależności skala nominalna

Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407

Transkrypt:

Wybory samorządowe 2014 w poszukiwaniu anomalii statystycznych Na podstawie pracy o tym samym tytule autorstwa: Piotr Gawron, Łukasz Pawela, Zbigniew Puchała, Jacek Szklarski, Karol Życzkowski, która ukazała się w czasopiśmie Studia Wyborcze, tom 19, 2015. Piotr Gawron Instytut Informatyki Teoretycznej i Stosowanej PAN Sympozjum Wiarygodność wyborów samorządowych 2014: Analiza ilościowa Kraków, 16 czerwca 2015

Motywacja Perspektywa informatyka: są dane do przetworzenia, to trzeba je przetworzyć. Perspektywa obywatelska: analiza danych wyborczych, które są powszechnie dostępne jest obowiązkiem obywatelskim osoby, która jest w stanie to zrobić.

Pozyskanie danych Pozyskanie danych wyborczych, w postaci wygodnej do przetworzenia, nie zawsze jest łatwe. Szczególnie w omawianych wyborach, w których doszło do afery informatycznej. Wniosek o udostępnienie informacji publicznej złożyłem 23.11.2014, dane uzyskałem 05.03.2015.

Wybory samorządowe 2014 podstawowe statystyki Do analizy wyników wyborów posłużyliśmy się wynikami z poszczególnych obwodowych komisji wyborczych. W wyborach do sejmików wojewódzkich w roku 2014 głosowanie odbyło się w 27 435 obwodowych komisjach wyborczych. Uprawnionych do głosowania było 30 613 691 osób, komisje wydały 14 466 824 kart do głosowania, oddano 11 928 736 głosów ważnych oraz 2 525 210 głosów nieważnych. Frekwencja wyborcza, liczona jako stosunek liczby wydanych kart do głosowania do liczby wyborców, wynosiła ok. 47,3%. Odsetek głosów nieważnych, liczony jako stosunek liczby głosów nieważnych do głosów wyjętych z urn, wynosił 17,5%.

Korelacje Ze względu na dużą liczbę głosów nieważnych, interesuje nas związek pomiędzy frekwencją wyborczą a odsetkiem głosów nieważnych lub poparcia dla danego komitetu wyborczego w poszczególnych komisjach wyborczych. W tym celu wykonaliśmy test istotności współczynnika korelacji r-pearsona oraz test istotności współczynnika korelacji rang Spearmana. Oba testy badają istotność zależności monotonicznej, jednakże pierwszy mierzy zależność liniową i wymaga spełnienia założeń o normalności, które w przypadku naszych danych nie zawsze są spełnione. Biorąc pod uwagę powyższy fakt, przy badaniu istotności korelacji większą wagę przywiązujemy do wyniku testu drugiego.

Frekwencja vs. odsetek głosów nieważnych G osów niewa nych 40% 35% 30% 25% 20% 15% 10% 5% 0% 0% 20% 40% 60% 80% 100% Frekwencja 64 56 48 40 32 24 16 8 Rysunek : Istnieje słaba dodatnia istotna statystycznie korelacja pomiędzy frekwencją wyborczą a procentem głosów nieważnych.

Analiza wyborów do Dumy Federacji Rosyjskiej z roku 2011 Figure 1: Summary of results by United Russia and Vladimir Putin. (A showing a certain turnout and result of United Russia (in 1% 1% bin the cluster in the upper right corner is heavily saturated to enable othe depicts an overall result for each turnout bin. White lines show linear fi 2 Źródło: Kobak, Dmitry, Sergey Shpilkin, and Maxim S. Pshenichnikov. Statistical anomalies in 2011-2012 Russian elections revealed by 2D correlation analysis. arxiv:1205.0741 (2012).

Analiza wyborów do Prezydenckich w Federacji Rosyjskiej z roku 2012 ssia and Vladimir Putin. (A) Ballots obtained at polling stations ed Russia (in 1% 1% bins). Number of ballots is colour-coded; Źródło: Kobak, Dmitry, Sergey Shpilkin, and Maxim S. Pshenichnikov. Statistical anomalies in 2011-2012 Russian elections revealed by 2D correlation analysis. arxiv:1205.0741 (2012).

Frekwnecja vs. poparcie 100% PSL PiS 80% 60 45 Poparcie 60% 40% 45 30 30 20% 15 15 0% 100% PO 40 SLD LR 80% 100 Poparcie 60% 40% 30 20 75 50 20% 10 25 0% 0% 20% 40% 60% 80% 100% Frekwencja 0% 20% 40% 60% 80% 100% Frekwencja Rysunek : Korelacje są istotne statystycznie z wyjątkiem PiS.

Histogram poparcia 1200 1000 Komitet Wyborczy Polskie Stronnictwo Ludowe Komitet Wyborczy Prawo i Sprawiedliwo Komitet Wyborczy Platforma Obywatelska RP Koalicyjny Komitet Wyborczy SLD Lewica Razem 800 Liczba komisji 600 400 200 0 0% 20% 40% 60% 80% 100% Procent poparcia Rysunek : Nie obserwujemy tzw. rezonansów Putina. Rozkład dla PSL jest nietypowy.

Procent głosów nieważnych vs. poparcie 100% PSL PiS 80% 120 45 Poparcie 60% 40% 90 60 30 20% 30 15 0% 100% PO SLD LR 80% 45 120 Poparcie 60% 40% 30 80 20% 15 40 0% 0% 20% 40% 60% 80% 100% 0% 20% 40% 60% 80% 100% G osów niewa nych G osów niewa nych Rysunek : Wszytkie korelacje są istotne statystycznie.

Prawo Benforda Prawo Benforda opisuje rozkład częstości występowania cyfr na poszczególnych miejscach w liczbie w danych empirycznych. Przykładowo, w tym rozkładzie cyfra 1 występuje około 30% na pierwszym miejscu w liczbie. Dokładniej prawdopodobieństwo wystąpienia cyfry d na pierwszym miejscu dane jest wzorem: ( P(d) = log 10 1 + 1 ) (1) d Prawdopodobieństwo, że cyfra d znajduje się na miejscu dane jest wzorem: 10 n 1 1 ( ) 1 P(d; n) = log 10 1 +. (2) 10k + d k=10 n 2 Prawo Benforda jest spełnione przez dane służące opisaniu wielu rodzajów zjawisk empirycznych, jak na przykład kwoty na rachunkach za energię, numery domów, ceny akcji, populacje krajów, długości rzek.

Rozkłady pierwszych cyfr Rozk ad Benforda (pierwsza cyfra) w skali kraju 0.40 0.35 SLD LR PO G osy wa ne 0.30 Procent wyst pie 0.25 0.20 0.15 0.10 0.05 0.00 0.40 0.35 1 2 3 4 5 6 7 8 9 PSL 1 2 3 4 5 6 7 8 9 PiS 1 2 3 4 5 6 7 8 9 G osy niewa ne 0.30 Procent wyst pie 0.25 0.20 0.15 0.10 0.05 0.00 1 2 3 4 5 6 7 8 9 1 2 3 4 5 6 7 8 9 1 2 3 4 5 6 7 8 9 Rozk ad teoretyczny Rozk ad empiryczny Rysunek : Test χ 2 na poziomie istotności α = 0.01 rozkładu pierwszej cyfry wykazuje, że dane nie pochodzą z rozkładu Benforda.

Rozkłady drugich cyfr Rozk ad Benforda (druga cyfra) w skali kraju 0.14 SLD LR PO G osy wa ne 0.13 Procent wyst pie 0.12 0.11 0.10 0.09 0.08 0.07 0.14 0 1 2 3 4 5 6 7 8 9 PSL 0 1 2 3 4 5 6 7 8 9 PiS 0 1 2 3 4 5 6 7 8 9 G osy niewa ne 0.13 Procent wyst pie 0.12 0.11 0.10 0.09 0.08 0.07 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 Rozk ad teoretyczny Rozk ad empiryczny Rysunek : Test χ 2 na poziomie istotności α = 0.01 rozkładu drugiej cyfry wykazuje, że liczby głosów oddanych na PO, PSL oraz SLD LR pochodzą z rozkładu Benforda. Pozostałe natomiast nie pochodzą z tego rozkładu.

Podsumowanie Na podstawie analiz statystycznych nie można stwierdzić, że podczas wyborów do sejmików samorządowych w roku 2014 doszło do nieprawidłowości. Dane wyborcze powinny się pojawiać na portalu https://danepubliczne.gov.pl/ prowadzonym przez Ministerstwo Administracji i Cyfryzacji. Tego rodzaju analizy powinny być prowadzone na bieżąco przy każdych wyborach. Zatem trzeba zastanowić się nad stworzeniem repozytorium danych, algorytmów oraz wyników i omówień analiz.

Dziękuję za uwagę!