-
Viimeisimmät artikkelit
Viimeisimmät kommentit
Arkistot
Kategoriat
Meta
Aihearkisto: tiedonlouhinta
Stan ja Kilpisjärven kesät
Johtopäätöksiä tai edes käyttökelpoista visualisaatiota ei useinkaan pysty tekemään datasta suoraan, vaan tarvitaan mallintamista. Mallintaminen erottaa kiinnostavan ja ei-kiinnostavan variaation, ja auttaa johtopäätösten luotettavuuden arvioinnissa. Pienehköissä projekteissa mallintaminen perustuu valmiisiin mallikohtaisiin ohjelmistopaketteihin. Esim. jos työskennellään R:ssä, regressiomalli syntyy lm()-funktiolla. Jos … Lue loppuun
Alueellinen hyvinvointi – vuorovaikutteinen visualisointi Sotkanetin datasta
EDIT: Päivitetty uudet linkit visualisointiin ja lähdekoodiin (10.10.2014). Louhoksen ja Demos Helsingin yhteistyönä tehty vuorovaikutteinen visualisointi alueellisesta hyvinvoinnista sijoittui Apps4Finland 2013 -kilpailun Hahmota-sarjassa hienosti kolmanneksi. Visualisointi mahdollistaa Sotkanetin hyvinvointi-indikaattoreiden havainnollisen tarkastelun ja mielenkiintoisten ilmiöiden löytämisen. Demos blogasi aiheesta aiemmin tällä viikolla, … Lue loppuun
Kategoria(t): R, sorvi, tiedonlouhinta, uutinen, visualisointi
Avainsanat: Apps4Finland, Demos Helsinki
Kommentoi
Eduskunnan äänestysten hakurutiinit R-kielelle
Eduskunnan äänestysdatan sujuva saatavuus mahdollistaa eduskunnassa tehtävien päätösten automaattisen seurannan ja edistää läpinäkyvyyttä. Mikko Heikkisen aiemmin julkaisema biomi.orgin eduskunta-APIn kautta on saatavilla osa eduskunnan äänestysdatoista. Lisäsimme nyt R-kieliset hakurutiinit eduskunnan äänestysdatalle sorviin osana Datavaalit-hanketta. Näiden avulla löytyvät kaikki biomi.org-rajapinnan kautta … Lue loppuun
Louhoksen Datawiki avattu
Tieteelliset analyysiympäristöt tarjoavat joustavia ja tehokkaita välineitä avoimen datan käsittelyyn. R-kielen ja Pythonin kaltaisten analyysiympäristöjen kautta on saatavilla kaikkein monipuolisimmat tutkimusvälineet datan vuorovaikutteiseen pöyhimiseen, ja lähdekoodin myötä analyysit ovat läpinäkyviä, toistettavissa alusta loppuun ja edelleen muokattavissa. Tarkoitukseen luotujen kirjastojen myötä … Lue loppuun
Kategoria(t): koneoppiminen, R, sorvi, tiedonlouhinta
Avainsanat: Apps4Finland, datawiki, Suomi
Kommentoi
Kunnallisvaaliehdokkaiden aktiivisuus sosiaalisessa mediassa: puolueiden vertailua
Datavaalit-hanke on kerännyt runsaasti aineistoa kunnallisvaaliehdokkaista ja puolueista. Sivustolla ylläpidetään esimerkiksi sosiaalisen median aggregaattia, johon kerätään tietoja ehdokkaiden aktiivisuudesta mm. Facebookissa ja Twitterissä. Teimme muutamia esimerkkejä ehdokasaineistojen käsittelystä R-kielellä. Esimerkit hakevat dataa Oikeusministeriön, Tilastokeskuksen, Maanmittauslaitoksen ja Datavaalit-sivuston palvelimilta ja vertailevat … Lue loppuun
Kategoria(t): R, sorvi, tiedonlouhinta, uutinen, visualisointi
Avainsanat: Datavaalit, facebook, kunnallisvaalit, twitter
2 kommenttia
Suomen CO2-päästöt 1990-2008
Louhos osallistui Open Knowledge Festivalin yhteydessä järjestettyyn HSOpen-hackathoniin, jonka teemana oli pöyhiä Maailmanpankin avoimia datoja. Maailmanpankin aineistot sisältävät huomattavan määrän tilastotietoa eri maiden sosioekonomisesta tilanteesta. Hans Roslingin esitelmän kannustamana visualisoimme Suomen hiilidioksidipäästöt vuosilta 1990-2008. Esimerkkikoodi tämän analyysin toistamiseksi R-laskentakielellä löytyy … Lue loppuun
YLE/MOT yritystukidatan R-hakurutiinit
YLE:n MOT-ohjelman yhteydessä julkaistiin eilen (maanantaina 10.9.2012) avoimesti lisensoituna kattava kooste suomessa toimivien yritysten saamista tukirahoista pisimmillään yli 15 vuoden ajalta. Aineisto kattaa Tekes-tukien osalta vuodet 1997 – 2012 ja listaa yritystukia yhteensä yli 5 miljardin euron edestä. Tärkeimpien yritystukien … Lue loppuun
Louhos-hack syyskuun Open Knowledge-Festivaalilla – tervetuloa mukaan
Syyskuussa Helsingissä järjestettävä kansainvälinen Open Knowledge Festival kokoaa yhteen avoimen tiedon aktiiveja ympäri maailmaa. Tapahtumassa on 170 erilaista luentoa ja työpajaa liittyen avoimen tiedon hankkeisiin tieteessä, koulutuksessa, kulttuurissa, demokratiassa, journalismissa ja monilla muilla alueilla. Louhos on mukana järjestämässä tiedehackathonia Open … Lue loppuun
Kategoria(t): R, sorvi, tiedonlouhinta, uutinen
Avainsanat: Open Knowledge Festival, seminaari
Kommentoi
Aihepiirianalyysi kansanedustajien puheista
Hesari ja Kansan muisti julkaisivat keväällä mielenkiintoisen kansanedustajien puheista koostetun datasetin. Datan perusteella syntyikin useita mielenkiintoisia visualisointeja osana HS Open 4 -tapahtumaa. Näin laaja aineisto tarjoaa myös mainion mahdollisuuden kokeilla aihepiirianalyysiä (engl. topic model). Se on tilastollinen koneoppimismenetelmä, jolla laajoista tekstidokumenttikokoelmista voidaan etsiä toistuvia aihepiirejä … Lue loppuun
Kategoria(t): koneoppiminen, R, tiedonlouhinta, visualisointi
Avainsanat: Eduskunta, Processing, topicmodels
Yksi kommentti
Datavaalit osa 1 – vaali- ja kuntadatan kokoaminen ja paketointi
Datavaalit Syksyn kunnallisvaalien yhteydessä on mahdollisuus kokeilla vaaleihin ja päätöksentekoon liittyvän tiedonlouhinnan mahdollisuuksia ja tuoda esiin kehityskohteita päätöksentekoon kytkeytyvien tietoaineistojen saatavuuden ja yhteiskunnan läpinäkyvyyden lisäämiseksi. Aiheen tiimoilta on käynnistynyt ruohonjuuritason Datavaalit-tempaus, jossa eri toimijat keräävät, pöyhivät, ja julkaisevat vaaleihin liittyvää … Lue loppuun
Kategoria(t): paikkatieto, R, tiedonlouhinta, uutinen
Avainsanat: Datavaalit, github, kunnat, PC Axis
6 kommenttia