Vaalitulosten vertailua vuorovaikutteisena visualisaationa

Vaalihumu alkaa onneksi jo laantua, mutta innokkaimmille tarjotaan tässä vielä osana Datavaalit2012-projektia mahdollisuus vertailla äänestystuloksia ensimmäisen ja toisen kierroksen välillä. Vertailu onnistuu kuntatasolla sekä pääkaupunkiseudun sisällä äänestysalueiden kesken.

VISUALISOINTI: VAALITULOSTEN VERTAILU KUNNITTAIN. Tässä voi esimerkiksi tarkastella kuinka aktiivisesti Soinia ja Väyrystä ensimmäisellä kierroksella äänestäneet äänestivät toisella kierroksella, ja toisaalta äänestivätkö he Niinistöä vai Haavistoa.

VISUALISOINTI: VAALITULOSTEN VERTAILU PÄÄKAUPUNKISEUDULLA. Tässä voi tarkastella äänestyskäyttäytymistä yksityiskohtaisesti pääkaupunkiseudun sisällä äänestysalueittain. PÄIVITYS 8.2. kaupungit korjattu, kiitos Martille kommentista.

Tässä esimerkkinä ruutukaappaus interaktiivisesta visualisoinnista.

Esimerkkivertailu. Väyrysen ensimmäisen kierroksen kannatuksen ja toisen kierroksen äänestysprosentin välillä näyttää olevan yhteys.

Aiemmat Louhoksessa julkaisut visualisaatiot ovat kaikki olleet staattisia, sillä R:ssä on toistaiseksi melko huonosti tarjolla työkaluja interaktiivisten visualisointien tekoon. Tähän tuli kuitenkin hiljattain muutos googleVis R-paketin myötä. Paketti tarjoaa helppokäyttöisen rajapinnan Google Chart Tools:iin, joilla kuka tahansa voi tuottaa esimerkiksi Hans Rosling -tyyppisen Motion Chartin hetkessä.

Vaalien ensimmäisen kierroksen tuloksista julkaistiinkin jo hieno Motion Chart -visualisointi, jossa oli lisäksi yhdistetty muuta Tilastokeskukselta löytyvää kuntadataa. Näytämme nyt kuinka sama tehdään R:llä yhdistäen ensimmäisen ja toisen kierroksen vaalidatat, koodi löytyy alta.

HS Next tarjoaa ensimmäisen ja toisen kierroksen äänestystulokset, ja lisäksi Tilastokeskukselta löytyi lista kunnista vaalipiireittäin, mikä helpottaa datan työstämistä yhteensopivaan muotoon. Tulokset löytyvät aluksi linkitettyinä Dropboxin kautta, kunnes keksin kuinka ne saa sisällytettyä WordPressiin. PÄIVITYS: Tämä ei taidakaan onnistua eli noilla Dropbox-linkeillä mennään.

PÄIVITYS 6.1.2013: Blogin R-skriptejä ylläpidetään jatkossa Githubissa. Tämän artikkelin koodit löytyvät täältä.

This entry was posted in paikkatieto, R, sorvi, tiedonlouhinta, visualisointi and tagged , , , , . Bookmark the permalink.

8 vastausta artikkeliin: Vaalitulosten vertailua vuorovaikutteisena visualisaationa

  1. MV sanoo:

    Hieno homma…

    Ärsyttäviä nuo Hesarin datan virheet. Vaikkei pitäisi katsoa lahjahevosen suuhun…

    Katselin itse sitä dataa aikani, ja totesin että paras tehdä jonkinlaista regressiota. Periaatteessa toisen kierroksen tuloksia voisi selittää ensimmäisen kierroksen tuloksilla. Tämä kannattaa selvästikin tehdä lukumäärillä ja pitää antamatta jääneitä ääniä ääninä pseudoehdokkaalle. Näin aineiston rakenne pääsee parhaiten oikeuksiinsa.

    Seuraava askel on löytää R:stä funktio, jolle voi antaa sekä laatikkorajoitteita (äänisiirtymän täytyy olla nollan ja yhden välillä), sekä summarajoitteita (Arhinmäen äänet jakautuvat toisella kierroksella tasan, kertoimien summa pitää olla yksi).

    • ouzo sanoo:

      Kiitos kommentista!
      Joo ei voi liikaa vaatia datan avaajilta, varsinkin kun data tuli tarjolle hyvin nopeasti. Toki erot datan formaatissa vaalikierrosten välillä aiheutti pientä lisävaivaa.

      Regressio kierrosten välillä kuulostaa mielenkiintoiselta, kerro jos saat jotain tuloksia! Enpä osaa äkkiseltään sanoa miten noi summarajoitteet saisi toteutettua R:ssä.

  2. Martti sanoo:

    Ainakin kaupunkien värit näyttäisivät olevan hiukan sekaisin tuossa linkin visualisaatiossa. Tapiola tuskin lienee vantaata, vaikka se on kuvattu keltaisella..

    • ouzo sanoo:

      Jahas, pitää tarkistaa kun pääsen himaan. Samoin koodista on mystisesti hävinnyt isoja osia…

      PÄIVITYS 8.2.2012: Nyt on kaupungit kunnossa, en ollut tajunnut että merge()-funktio järjestää data framen rivit uudestaan joten kaupungit meni aivan päin honkia. Ja nyt näkyy koko koodi taas.

  3. Olli Laasanen sanoo:

    Aivan loistavaa analyysiä ja visualisointia!

    Näistä voi sitten johtaa uusia kysymyksiä, kuten: ”Ensimmäisen kierroksen ennakkoäänestysprosentti oli Ahvenanmaalla ja Pohjanmaan ruotsinkielisssä kunnissa alhainen, ja varsinainen äänestysprosentti jäi alhaiseksi Ahvenanmaalla, mutta kohosi poikkeuksellisen korkeaksi Pohjanmaalla – miksi?”

    Olen asentanut R:n, mutta en vielä osaa käyttää sitä. Oppimista odotellessa tein yksinkertaisen mutta hauskan excel- ja powerpoint-harjoituksen: http://ollilaasanen.wordpress.com/2012/02/01/suomen-kunnat-presidenttiehdokkaiden-epapoliittisten-ominaisuuksien-valossa/.

    • ouzo sanoo:

      Mielenkiintoista analyysiä sinullakin. Leo teki aiemmin samantapaista ryhmittelyä Hesarin vaalikonevastausten perusteella, tosin niissä taustatiedoissa maantieteellinen sijainti oli annettu hyvin epätarkasti, joten suoraa vertailu ei taida onnistua.

  4. Hienot ja informatiiviset saippuakupla-animaatiot! Aikaulottuvuus vielä uupuu datasta, mahtaako kuntavaalidataa olla puolueittain kunnittain olemassa yli ajan? Varsinainen kommentti liittyi kuplakaavioin liittämiseen WordPressiin, eli ainakin palvelimelle tehtyyn wordpress asennukseen on mahdollista ladata myös html-tiedostoja ja linkittää niihin. Tein syksyllä simppelin demon tähän tyyliin: http://research.muuankarski.org/visual/?p=44 . Gistin alla linkki visualisointiin.

    • ouzo sanoo:

      Selvitin tuota mahdollisuutta ja totesin ettei se onnistu kun käytössä on wordpress.com-palvelu. Jos wordpressin blogia hostaisi jossain muualla siihen voisi lisätä plugineja, joilla saisi muun muassa html-tiedostot näkymään.

Vastaa

Täytä tietosi alle tai klikkaa kuvaketta kirjautuaksesi sisään:

WordPress.com-logo

Olet kommentoimassa WordPress.com -tilin nimissä. Log Out / Muuta )

Twitter-kuva

Olet kommentoimassa Twitter -tilin nimissä. Log Out / Muuta )

Facebook-kuva

Olet kommentoimassa Facebook -tilin nimissä. Log Out / Muuta )

Google+ photo

Olet kommentoimassa Google+ -tilin nimissä. Log Out / Muuta )

Muodostetaan yhteyttä palveluun %s