Aihearkisto: tiedonlouhinta

Stan ja Kilpisjärven kesät

Johtopäätöksiä tai edes käyttökelpoista visualisaatiota ei useinkaan pysty tekemään datasta suoraan, vaan tarvitaan mallintamista. Mallintaminen erottaa kiinnostavan ja ei-kiinnostavan variaation, ja auttaa johtopäätösten luotettavuuden arvioinnissa. Pienehköissä projekteissa mallintaminen perustuu valmiisiin mallikohtaisiin ohjelmistopaketteihin. Esim. jos työskennellään R:ssä, regressiomalli syntyy lm()-funktiolla. Jos … Lue loppuun

Kategoria(t): koneoppiminen, R, tiedonlouhinta, visualisointi | Avainsanat: | Kommentoi

Alueellinen hyvinvointi – vuorovaikutteinen visualisointi Sotkanetin datasta

EDIT: Päivitetty uudet linkit visualisointiin ja lähdekoodiin (10.10.2014). Louhoksen ja Demos Helsingin yhteistyönä tehty vuorovaikutteinen visualisointi alueellisesta hyvinvoinnista sijoittui Apps4Finland 2013 -kilpailun Hahmota-sarjassa hienosti kolmanneksi. Visualisointi mahdollistaa Sotkanetin hyvinvointi-indikaattoreiden havainnollisen tarkastelun ja mielenkiintoisten ilmiöiden löytämisen. Demos blogasi aiheesta aiemmin tällä viikolla, … Lue loppuun

Kategoria(t): R, sorvi, tiedonlouhinta, uutinen, visualisointi | Avainsanat: , | Kommentoi

Eduskunnan äänestysten hakurutiinit R-kielelle

Eduskunnan äänestysdatan sujuva saatavuus mahdollistaa eduskunnassa tehtävien päätösten automaattisen seurannan ja edistää läpinäkyvyyttä. Mikko Heikkisen aiemmin julkaisema biomi.orgin eduskunta-APIn kautta on saatavilla osa eduskunnan äänestysdatoista. Lisäsimme nyt R-kieliset hakurutiinit eduskunnan äänestysdatalle sorviin osana Datavaalit-hanketta. Näiden avulla löytyvät kaikki biomi.org-rajapinnan kautta … Lue loppuun

Kategoria(t): R, sorvi, tiedonlouhinta | Avainsanat: , , | 7 kommenttia

Louhoksen Datawiki avattu

Tieteelliset analyysiympäristöt tarjoavat joustavia ja tehokkaita välineitä avoimen datan käsittelyyn. R-kielen ja Pythonin kaltaisten analyysiympäristöjen kautta on saatavilla kaikkein monipuolisimmat tutkimusvälineet datan vuorovaikutteiseen pöyhimiseen, ja lähdekoodin myötä analyysit ovat läpinäkyviä, toistettavissa alusta loppuun ja edelleen muokattavissa. Tarkoitukseen luotujen kirjastojen myötä … Lue loppuun

Kategoria(t): koneoppiminen, R, sorvi, tiedonlouhinta | Avainsanat: , , | Kommentoi

Kunnallisvaaliehdokkaiden aktiivisuus sosiaalisessa mediassa: puolueiden vertailua

Datavaalit-hanke on kerännyt runsaasti aineistoa kunnallisvaaliehdokkaista ja puolueista. Sivustolla ylläpidetään esimerkiksi sosiaalisen median aggregaattia, johon kerätään tietoja ehdokkaiden aktiivisuudesta mm. Facebookissa ja Twitterissä. Teimme muutamia esimerkkejä ehdokasaineistojen käsittelystä R-kielellä. Esimerkit hakevat dataa Oikeusministeriön, Tilastokeskuksen, Maanmittauslaitoksen ja Datavaalit-sivuston palvelimilta ja vertailevat … Lue loppuun

Kategoria(t): R, sorvi, tiedonlouhinta, uutinen, visualisointi | Avainsanat: , , , | 2 kommenttia

Suomen CO2-päästöt 1990-2008

Louhos osallistui Open Knowledge Festivalin yhteydessä järjestettyyn HSOpen-hackathoniin, jonka teemana oli pöyhiä Maailmanpankin avoimia datoja. Maailmanpankin aineistot sisältävät huomattavan määrän tilastotietoa eri maiden sosioekonomisesta tilanteesta. Hans Roslingin esitelmän kannustamana visualisoimme Suomen hiilidioksidipäästöt vuosilta 1990-2008. Esimerkkikoodi tämän analyysin toistamiseksi R-laskentakielellä löytyy … Lue loppuun

Kategoria(t): R, tiedonlouhinta, visualisointi | Avainsanat: , | Kommentoi

YLE/MOT yritystukidatan R-hakurutiinit

YLE:n MOT-ohjelman yhteydessä julkaistiin eilen (maanantaina 10.9.2012) avoimesti lisensoituna kattava kooste suomessa toimivien yritysten saamista tukirahoista pisimmillään yli 15 vuoden ajalta. Aineisto kattaa Tekes-tukien osalta vuodet 1997 – 2012 ja listaa yritystukia yhteensä yli 5 miljardin euron edestä. Tärkeimpien yritystukien … Lue loppuun

Kategoria(t): R, sorvi, tiedonlouhinta, visualisointi | Avainsanat: , | Kommentoi

Louhos-hack syyskuun Open Knowledge-Festivaalilla – tervetuloa mukaan

Syyskuussa Helsingissä järjestettävä kansainvälinen Open Knowledge Festival kokoaa yhteen avoimen tiedon aktiiveja ympäri maailmaa. Tapahtumassa on 170 erilaista luentoa ja työpajaa liittyen avoimen tiedon hankkeisiin tieteessä, koulutuksessa, kulttuurissa, demokratiassa, journalismissa ja monilla muilla alueilla. Louhos on mukana järjestämässä tiedehackathonia Open … Lue loppuun

Kategoria(t): R, sorvi, tiedonlouhinta, uutinen | Avainsanat: , | Kommentoi

Aihepiirianalyysi kansanedustajien puheista

Hesari ja Kansan muisti julkaisivat keväällä mielenkiintoisen kansanedustajien puheista koostetun datasetin. Datan perusteella syntyikin useita mielenkiintoisia visualisointeja osana HS Open 4  -tapahtumaa.  Näin laaja aineisto tarjoaa myös mainion mahdollisuuden kokeilla aihepiirianalyysiä (engl. topic model). Se on tilastollinen koneoppimismenetelmä, jolla laajoista tekstidokumenttikokoelmista voidaan etsiä toistuvia aihepiirejä … Lue loppuun

Kategoria(t): koneoppiminen, R, tiedonlouhinta, visualisointi | Avainsanat: , , | Yksi kommentti

Datavaalit osa 1 – vaali- ja kuntadatan kokoaminen ja paketointi

Datavaalit Syksyn kunnallisvaalien yhteydessä on mahdollisuus kokeilla vaaleihin ja päätöksentekoon liittyvän tiedonlouhinnan mahdollisuuksia ja tuoda esiin kehityskohteita päätöksentekoon kytkeytyvien tietoaineistojen saatavuuden ja yhteiskunnan läpinäkyvyyden lisäämiseksi. Aiheen tiimoilta on käynnistynyt ruohonjuuritason Datavaalit-tempaus, jossa eri toimijat keräävät, pöyhivät, ja julkaisevat vaaleihin liittyvää … Lue loppuun

Kategoria(t): paikkatieto, R, tiedonlouhinta, uutinen | Avainsanat: , , , | 6 kommenttia