big data

Tutkijat saivat selville mikä erottaa nopeat ja hitaat kirjoittajat toisistaan

Ma, 04/09/2018 - 12:02 Toimitus
Kirjoittamista. Kuva: flickr / Chris Blakeley

168 000 koehenkilöä testasi kirjoitusvauhtinsa tutkijoiden kehittämällä verkkotestillä. Nopeimpia näppäilijöitä yhdisti mm. pianon soittamista muistuttava painallustekniikka. Voit tehdä myös itse testin!

Aalto-yliopiston ja Cambridgen yliopiston tutkimukseen osallistui vapaaehtoisia yli 200 eri maasta. Selvästi suurin osa, 68 prosenttia, oli Yhdysvalloista.

Enemmistö osallistujista oli nuoria ja rutinoituneita näppäimistön käyttäjiä, ja noin 70 prosenttia oli osallistunut kirjoitustekniikan kursseille.

Keskimäärin osallistujat kirjoittivat 52 englanninkielistä sanaa minuutissa. Hajonta oli kuitenkin erittäin suurta.

”Nopeimmat koehenkilöt ylsivät 120 sanaan minuutissa. Se on mahtava tulos, kun ottaa huomioon, että koe tehtiin kontrolloidusti ja satunnaislauseilla”, sanoo professori Antti Oulasvirta.

Nopeimmat kirjoittajat tekivät vähiten virheitä, mutta tutkijat havaitsivat datan perusteella myös toisen yhdistävän tekijän: pianon soittamista muistuttavan painallustekniikan, jossa kirjoittaja painaa seuraavaa näppäintä jo ennen, kuin nostaa sormen ylös edelliseltä.

Tekniikka on suosittu peliharrastajien keskuudessa, mutta tämä on ensimmäinen kerta, kun tutkimuksessa on havaittu sitä hyödynnettävän myös kirjoittamisessa.

”Nopeista kirjoittajista 40–70 prosenttia hyödynsi rolloveriksi kutsumaamme tekniikkaa riippumatta siitä, kirjoittivatko he kosketusnäytöllä vai fyysisellä näppäimistöllä. Rollover toimii vain tiheään toistuvilla kirjainyhdistelmillä ja edellyttää, että käyttäjä osaa kirjoittaa katsomatta sormiaan”, tohtorikoulutettava Anna Feit sanoo.

Nopeuteen ei tarvita kymmentä sormea – tai edes kirjoituskursseja

Suurin osa koneella kirjoittamista koskevasta tutkimuksesta on peräisin kirjoituskoneiden aikakaudelta. 70- ja 80-luvuilla ammattikirjoittajat ylsivät 60–90 sanaan minuutissa. Kirjoituskoneella tehdyt virheet olivat yleensä tuplalyöntejä tai kirjainten väliin jäämisiä, kun taas näppäimistöllä tai kosketusnäytöllä kirjoittaessa tyypillinen virhe on väärän kirjaimen painaminen. Nykyisin kirjoittajien tekniikoissa on myös enemmän vaihtelua.

“Nykyisillä näppäimistöillä painallukseen vaaditaan paljon vähemmän fyysistä voimaa kuin kirjoituskoneella kirjoittaessa. Siksi itseoppineet kirjoittajat voivat olla todella nopeita, vaikkeivat hyödyntäisi perinteistä kymmensormitekniikkaa”, Feit selittää.

Tutkijat havaitsivat myös, ettei kursseilla käyneiden ja itseoppineiden välillä ollut juurikaan eroja nopeudessa tai virheiden määrässä. Tulos vahvistaa aiemmat tutkimukset, joiden mukaan itseoppineet löytävät itselleen sopivimmat kirjoitustavat ja kursseja käyneet taas unohtavat osan oppimastaan.

Tutkimukseen osallistuneet vapaaehtoiset antoivat ennen testin tekemistä luvan anonyymiksi muutetun datan hyödyntämiseen.

”Tällaiset joukkoistamista hyödyntävät kokeet antavat meille tietoa ihmisen ja koneen vuorovaikutuksesta todella suuressa mittakaavassa ja ovat siksi välttämättömiä, kun mietitään tulevaisuuden käyttöliittymien suunnitteluperiaatteita”, sanoo professori Per Ola Kristensson Cambridgen yliopistosta.

Vaaka-akseli kuvaa minuutissa kirjoitettujen sanojen määrää, pystyakseli koehenkilöiden määrää. Kokeeseen osallistuneiden keskimääräinen kirjoitusnopeus oli 52 sanaa minuutissa. Suomen kielessä sanojen keskipituus on selvästi pidempi kuin englannissa, joten tulosta ei voida suoraan verrata suomen kielellä tehtyihin testeihin.

 

Näin kirjoitat nopeammin

Tohtorikoulutettava Anna Feit kertoo, miten kirjoittaminen onnistuu nopeammin:

  • Virheiden korjaaminen on hidasta, eli vältä niitä. Kirjoita heti oikein ja vähän – hitaammin  se on lopulta nopeampaa.
  • Opettele kirjoittamaan niin, ettei sinun tarvitse katsoa sormiisi. Motorinen järjestelmäsi oppii pian muodostamaan yleisimmistä kirjainyhdistelmistä nopeita ”trillejä”, mikä vauhdittaa kirjoittamista. Katseen pitäminen näytössä tekee myös virheiden korjaamisesta nopeampaa.
  • Harjoittele rolloveria. Käytä eri sormia kahdelle eri kirjaimelle sen sijaan, että liikuttaisit samaa sormea näppäinten välillä, ja paina seuraavan kirjaimen näppäintä jo ennen kuin nostat edellisen ylös.
  • Tee välillä kirjoittamistesti verkossa, se auttaa sinua seuraamaan edistymistäsi ja huomaamaan, missä sinulla on parantamisen varaa. Varmista, että testissä käytetään aina uusia lauseita – näin et harjoittele turhaan samoilla teksteillä.

Tutkimus tehtiin yhteistyössä TypingMaster.com:n kanssa.

Data on saatavissa tutkimuskäyttöön osoitteesta userinterfaces.aalto.fi/136Mkeystrokes/

Kirjoitusnopeutensa voi testata osoitteessa typingmaster.research.netlab.hut.fi/

*

Juttu on Aalto-yliopiston tiedote. Otsikkuva: flickr / Chris Blakeley.

Big data auttoi selvittämään rauduskoivun historiaa

La, 05/13/2017 - 19:47 Toimitus
Rauduskoivu. Kuva: Wikipedia / jordgubbe

Helsingin yliopiston tutkijat ovat selvittäneet koivun lajiutumishistoriaa perimästä kerätyllä big datalla tutkimusprojektissa, jossa määritettiin kaikkiaan 150 koivun perimät.

Big data on tuttu ilmaisu esimerkiksi yritysten asiakaskäyttäytymisanalyyseistä tai internetin sosiaalisten verkkojen mallinnuksesta, mutta suuria datamääriä syntyy myös biologian alalla genomien emäsparien lukemisessa eli sekvensoinnissa.

Genomisekvensoinnin halventuminen on mahdollistanut kokonaisten yksilöryhmien eli populaatioiden genomien määrittämisen. Tästä aineistosta voidaan populaatiogenomiikan menetelmiä käyttäen tutkia jälkiä, jotka lajin historia ja luonnonvalinta on evoluution aikana genomikokoelmaan jättänyt.

Suomalaistutkimus tästä julkaistiin 8. toukokuuta Nature Genetics-lehdessä.

Vastaavanlaista tutkimusta on aiemmin tehty lähinnä ihmisillä, joista on vuosien ajan kerätty laajaa genomikokoelmaa, mutta viimeaikainen teknologian kehitys on mahdollistanut tutkimuksen myös aivan uusille lajeille. 

Tutkijat keräsivät koivunäytteitä Irlannista, Norjasta ja neljästä eri paikasta Siperiasta sekä Suomesta kuudelta eri paikkakunnalta Lopen ja Kittilän väliltä. Kaikkiaan genomeja luettiin yli 700 gigaemäsparia, mikä tuotti yli 20 teratavua tiedostoja.

Perimien laskennallinen analyysi osoitti hyvin alhaisia yksilömääriä eli populaation pullonkauloja ajanjaksoina, jolloin maapallolla tapahtui suuria ilmastollisia muutoksia. Ensimmäinen ja voimakkain pullonkaula tapahtui aikana jolloin dinosaurukset kuolivat sukupuuttoon noin 66 miljoonaa vuotta sitten.

Tämän jälkeen pullonkauloja oli 34 miljoonaa, 14,5 miljoonaa ja noin 1 miljoona vuotta sitten. Viimeisimmän pullonkaulan jälkeen koivupopulaatio on kasvanut tasaisesti, eikä viime jääkausikaan ole siihen suuremmin vaikuttanut.

Jääkauden vaikutuksesta koivut jakautuivat Siperiassa kasvavaan Aasian kantaan ja Länsi-Euroopan kantaan, jotka myöhemmin mannerjään sulaessa ovat sekoittuneet Suomessa.

Rauduskoivun lisäksi projektissa sekvensoitiin kuusi muuta koivulajia, mukaan lukien hieskoivu ja vaivaiskoivu, sekä koivun lähisukulaiset harmaa- ja tervaleppä. Rauduskoivun ja hieskoivun erottaminen toisistaan osoittautui yllättävän vaikeaksi, sillä osa rauduskoivuksi luokitelluista puista osoittautuikin genomianalyyseissä hieskoivuiksi.

"Tämä vahvistaa kaksinkertaisen kromosomiston omaavan rauduskoivun ja nelinkertaisen kromosomiston omaavan hieskoivun välillä tapahtuneen ja todennäköisesti edelleenkin tapahtuvan geenien vaihtoa", kertoo tutkija Jarkko Salojärvi Helsingin yliopiston biotieteiden laitokselta bio- ja ympäristötieteellisestä tiedekunnasta

Luonnonvalinta on auttanut koivua pärjäämään kovissa oloissa

Populaatiohistorian lisäksi projektissa koostettiin referenssigenomi ja ennustettiin koivun geenit. Perimän analyysit paljastivat yli 900 lajiutumisen aikana luonnonvalinnan alla ollutta geeniä, jotka ovat muokanneet kansallispuustamme kylmänkestävän ja nopeakasvuisen pioneerilajin. Valinnan alla olevat geenit ovat avainasemassa koivun ilmiasun muodostamisessa, minkä takia näihin geeneihin kohdistuvan jalostustyön kautta voidaan kehittää koivulinjoja erilaisiin biotalouden sovelluksiin.

"Kun kandidaattigeenit on löydetty, on jalostaminen nopeata, sillä koivu on ainoa puulaji, jonka voi kasvuolosuhteita muokkaamalla saada kukkimaan alle yhden vuoden ikäisenä, mahdollistaen yhden risteytyssukupolven kasvattamisen vuoden aikana", kertoo professori Jaakko Kangasjärvi.

"Koivulinjalle tyypillinen ominaisuus voi olla jo yhdenkin geenin takana, sillä esimerkiksi kyynelkoivun genomin sekvensointi paljasti tynkäproteiinin LAZY-geenissä", sanoo puolestaan professori Yrjö Helariutta.

Kyynelkoivu, jota käytetään puutarhakasvina, on tunnettu riippuvista oksistaan. Mutaatio vastaavassa geenissä tuottaa maata pitkin kasvavan velton ilmiasun muun muassa maississa ja lituruohossa.

Tutkimuksen tekivät Helsingin yliopistosta tekniikan tohtori Jarkko Salojärvi, tekniikan tohtori Olli-Pekka Smolander, professori Jaakko Kangasjärvi, professori Yrjö Helariutta, tutkimusjohtaja Petri Auvinen sekä Buffalon yliopistosta Yhdysvalloista professori Victor Albert. Geeniennusteiden tarkistamiseen osallistui tutkijoita Helsingin yliopiston lisäksi Turun, Itä-Suomen, Oulun, Tarton ja Uumajan yliopistoista, sekä Luonnonvarakeskuksesta.

Artikkeli perustuu Helsingin yliopiston tiedotteeseen.

 

Mitä kuvassa näkyy? Matematiikka kertoo ja sinä nautit tuloksista.

Pe, 12/11/2015 - 11:25 Jari Mäkinen

Astun ulos hissistä Tampereen teknillisessä yliopistossa ja edessäni on tyypillinen tutkimuslaitoksen käytävä: se on pitkä ja sen kummallakin puolella on ovia, joiden vieressä on nimikylttejä sekä erilaisia papereita seinälle kiinnitettyinä. On ilmoitustaulu, ikkuna käytävän päässä, porraskuilu vieressä sekä muutamia ihmisiä.

Pystyn hahmottamaan nopeasti ympärilläni olevat kohteet ja erottamaan niistä aiemmin näkemäni kuvan perusteella akatemiaprofessori Moncef Gabbouj’n, mutta kameran kautta maailmaa kuvaava tietokone olisi hyvin hämillään. Konenäöllä olisi vaikeuksia erottaa toimistojen ovia muista neliskanttisista kohteista ja ihmisiä toisistaan – saati  yhdistää näkemänsä kuva muistissaan olevaan kuvaan tietystä henkilöstä.

Tämän vuoden lopussa akatemiaprofessorikautensa päättävä Gabbouj on erikoistunut epälineaarisiin digitaalisiin suotimiin, erityisesti haluttujen kohteiden löytämiseen videokuvasta sekä älykkäisiin hakupalveluihin.

Jo nyt kameroissa käytetään kasvontunnistusta ja hakukoneet voivat etsiä tietynlaisia kuvia, mutta Gabbouj haluaa tehdä tästä tarkempaa, nopeampaa ja arkisempaa, minkä lisäksi hän laajentaa hahmontunnistusta kaikkialle tiedonlouhintaan. Siihen tarvitaan matematiikkaa, joka yleistäen on sitä monimutkaisempaa, mitä helpommalta työn halutaan vaikuttavan.

Parvella tiedon kimppuun

“Kyse on yksinkertaisesti signaalinkäsittelystä ja algoritmeista, joilla tätä käsittelyä tehdään”, aloittaa Gabbouj työnsä selittämisen.

“Kehitimme aluksi tällä alalla erilaisia tekniikoita hahmontunnistukseen ja koneoppimiseen, joita olemme soveltaneet nyttemmin laajoihin tietomääriin ja niin sanottuun big dataan.”

Tällaisia tietokantoja ovat yhtäältä esimerkiksi kuva-arkistot kuten netissä olevat kuvat, toisaalta vaikkapa lääketieteelliset kuvat tai tutkahavainnot. Usein näissä on yksittäisiä tietoja, kuvia ja havaintoja niin paljon, että niiden valikoiminen yksittäin tietyn hakukriteerin mukaan ei ole käytännössä mahdollista. Äreimmätkään tietokoneet eivät onnistu siinä.

Siksi tietojen hakua voi auttaa älykkäillä algoritmeilla, jotka seulovat tietoja ja muodostavat löytämistään tiedoista kolmiulotteisen mallin, mistä matemaattisesti voidaan löytää kaikkein osuvimmat vaihtoehdot.

Siinä missä aiemmin hakua tehtiin avainsanojen avulla, pystyy tamperelaisten niin sanottu parvioptimointialgoritmi hahmottamaan tietoa ja löytämään siitä erilaisia määreitä. Näin esimerkiksi kuvahakua Pisan kaltevasta tornista tehtäessä tuloksena ei ole kaikenlaista kaltevaa, vaan vaikuttava määrä erilaisia kuvia juuri Pisan tornista.

Samaa menetelmää voi käyttää esimerkiksi syöpäkasvaimien tai pinnanmuotojen tunnistamiseen. Tuoreimmassa tutkimusohjelmassa menetelmää käytetään taloustietojen tunnistamiseen ja louhimiseen.

“Siinä missä aiemmin puhuimme vain kuvista, on nyt kaikki tieto kiinnostavaa. Pystymme käsittelemään raakadataa, kuvia, videota ja ääntä, joista oppiva algoritmimme pystyy etsimään haluttuja asioita. Lopulta voimme jopa ennustaa tietojen perusteella tulevaisuuteen.”

Tällainen ennustava systeemi on esimerkiksi sydänkäyrää tutkiva algoritmi, joka kykenee havaitsemaan sydänkohtauksesta varoittavat merkit jo ennalta, jolloin esimerkiksi älykelloon asennettuna se voi antaa hälytyksen ja pyytää kantajaansa lepäämään. Näin kohtaus ei tulekaan tai apu voi olla matkalla jo itse kohtauksen alkaessa.

Gabbouj’n tutkimusryhmä on kehittänyt myös oppivia algoritmeja, jotka esimerkiksi sydänkäyrän tapauksessa pystyvät sopeutumaan käyttäjän omaan sydämen lyöntityyliin – jokaisella se on omanlaisensa.

Lisää sovelluksia tällaisilla älykkäillä signaalikäsittelyä, hahmontunnistusta ja koneoppimista käyttävillä systeemeillä on vaikka kuinka:  autonomisesti liikkuvien autojen ohjauslaitteiden kameroiden reaaliajassa ottamista kuvista pitää löytää nopeasti ja luotettavasti näkökentässä olevat kohteet ja valokuvia nettiin lataavia auttaisi huomattavasti älykäs ohjelmisto, joka löytäisi automaattisesti kuvassa olevat avainsanat.

Puolustus- ja turvallisuusviranomaiset ovat luonnollisesti myös hyvin kiinnostuneita järjestelmistä, jotka pystyvät seulomaan tehokkaasti suuria tietomääriä ja löytämään niistä haluttuja asioita.

Ei ihme, että tutkimusta tällä alalla tehdään nykyisin muuallakin kuin vain Tampereella.

Apua hiukkasfysiikasta

Gabbouj kertoo, että aluksi hänen ryhmänsä lähinnä sovelsi muiden tekemiä algoritmeja ja kehitti niitä eteenpäin, kunnes ryhmä halusi ottaa hyppäyksen eteenpäin ja tehdä jotain aivan uutta.

Niinpä ryhmäläiset alkoivat katsoa rohkeasti muilla aloilla olevia matemaattisia sovelluksia. Erityisen kiinnostavaksi paljastui hiukkasfysiikka, ja etenkin Schrödingerin yhtälö. Se on kvanttimekaniikassa käytetty aaltoyhtälö, joka kuvaa hiukkasta ja sen olotilaa niin sanotun aaltofunktion avulla. Samaa menetelmää voi käyttää yksittäisten tietojen ja sen ominaisuuksien kuvaamiseen. Myös silloin, kun ei tiedetä ihan täsmälleen mitä ollaan etsimässä.

Myös fysiikassa käytetty menetelmä ison ongelman ratkaisemisesta osissa oli toimiva: tuloksena oli skaalattava algoritmi, joka luokittelee tietoa semanttisiin luokkiin.

Tamperelaisten keinoin onnistuttiin ratkaisemaan myös eräs neuroverkkojen – hermosolujen toimintatapaan perustuvien keinoälysysteemien – kompastuskivi: kahden spiraalin ongelma. Siinä on sisäkkäin kaksi pisteinä piirrettyä spiraalia, ja hahmontunnistuksen pitäisi erottaa ne toisistaan. Tehtävä ei ole helppo.

Sisäkkäisten spiraalien kanssa painiminen on tyypillinen tapaus ongelmasta, joka äkkiseltään kuulostaa kaiken maailman dosenttien harrastamalta teoreettiselta pohdiskelulta, mutta jolla onkin hyvin konkreettisia ja merkittäviä sovelluksia.

“Sovelluksia ei ole ilman perustutkimusta”, toteaakin Gabbouj ja jatkaa: “Perustutkimus on kuin uutta verta, mitä ilman emme voi tulla toimeen. Voimme kehittää sovelluksia ja parantaa menetelmiämme jonkin aikaa aiemman tiedon perusteella, mutta todella uusien asioiden löytäminen ja harppausten ottaminen eteenpäin tarvitsevat perustutkimusta. Sen merkitystä ei voi aliarvioida.”

Moncef Gabbouj (keskellä) perjantai-iltana paikalla olleita tutkimusryhmän jäseniä.

Kuva: Moncef Gabbouj (keskellä) perjantai-iltana paikalla olleita tutkimusryhmän jäseniä.

 

Haasteita pitää olla!

Kun juttelemme Gabbouj’n kanssa, paiskoo ikkunan takana räntää marraskuiselta taivaalta. On jo pimennyt perjantaisen iltapäivän loppu.

Siitä huolimatta Signaalinkäsittelyn laitoksen huoneissa on vielä väkeä. Kun muualta tutkijat ja opiskelijat vetäytyvät viikonlopun viettoon, on Gabbouj’n ryhmästä vielä moni paikalla. Syynä ei ole suinkaan se, että professori olisi orjapiiskuri, vaan se, että ratkottavana on niin kiinnostavia ongelmia.

“Tämä ryhmä on eräs yliopiston kansainvälisimmistä, sillä meillä on 14:stä eri kansallisuudesta”, selittää itse Yhdysvalloista Tampereelle jo 25 vuotta sitten tullut Gabbouj.

“Professorina tuolloin ollut Yrjö Neuvo halusi kansainvälistää yliopistoa, ja palkkasi minut tänne perustamaan ohjelmaa ulkomaisia opiskelijoita varten. Sen jälkeen aloitimme koulutuksen englanniksi ensin peruskursseilla ja nykyisin kaikki opinnot voi suorittaa englanniksi.”

Nyt ryhmässä olevat eivät kuitenkaan ole tulleet Hervantaan vain englanninkielisen opetuksen vuoksi, vaan siksi, että signaalinkäsittelyssä se on eräs huipuista maailmassa.

“Tutkijat tulevat tänne etsimään haasteita ja tekemään tiedettä, ja annammekin heille mahdollisuuden rakentaa aivan uudenlaista tekniikkaa. He ovat motivoituneita ja tekevät kaikki työtä yhdessä erilaisista taustoista ja kulttuureista huolimatta.”

“Mutta aina välillä kyllä täytyy mennä ulos”, toteaa akatemiaprofessori ja katsoo kohti ikkunaa ja tämän talvikauden ensimmäistä räntää.

Kenties yksi syy työintoon on myös se, että sisällä labrassa on mukavaa, valoisaa ja lämmintä.

Juttu on julkaistu myös Suomen akatemian nettisivuilla.

Tämä on Suomen tieteen koko kuva

Ke, 12/02/2015 - 15:33 Jari Mäkinen


Teknologian tutkimuskeskus VTT on analysoinut Suomen tutkimusjärjestelmän muutoksia 1995 - 2011 ja julkaisi tänään kiinnostavan kartan Suomen tieteestä. Kyseessä on ensimmäinen koskaan tehty ns. ohjaamattomaan oppimiseen perustuva suomalaisesta tutkimusmaailmasta.


"Ohjaamaton oppiminen" kuulostaa varsin omituiselta,  mutta kyseessä on uudenlainen Suomessa tehdyn tieteellisen tuotannon luonnollisen kielen analyysiin ja koneoppimiseen perustuva lähestymistapa, joka sopii hyvin kuvaamaan aineistoa, jonka luokittelua ei tunneta ennalta tarkasti. 

Yleistäen menetelmässä laitetaan tietokoneeseen kaikki vuosien 1995 ja 2011välisenä aikana Suomessa tehdyt tutkimukset ja katsotaan paljonko niitä on ja mitkä on niiden väliset yhteydet.  Näistä muodostetaan kartta. Mitä isompi pallura on, sitä "suurempi" ala on kyseessä, ja mitä enemmän viivoja siitä on jonnekin, sitä enemmän sillä on yhteyksiä toisiin aiheisiin. Tällaisella menetelmällä saadaan selville helposti yhteyksiä ja kokoluokkia, joita ei ole aiemmin huomattu.

Menetelmä on omiaan suomalaisen tieteen hahmottamiseen, koska Suomen tiedejärjestelmä on voimakkaiden muutosten keskellä. Samalla on kuitenkin tärkeää ymmärtää, mistä Suomen tiede koostuu. Viime aikoina vilkasta keskustelua synnyttäneet suunnitellut rahoitusleikkaukset, vaatimukset yliopistojen roolien selkeyttämisestä, strategisten painopistealueiden valinnat sekä yliopistojen tulosten laadun mittaaminen tekee tämän kokonaiskuvan saamisen entistäkin tärkeämmäksi.

Arho Suomisen ja Hannes Toivasen Journal of the Association for Information Science and Technology -julkaisussa ilmestynyt tutkimus osoitti, että Suomen tiede on monimuotoistunut. Suomen tiede on perinteisesti nojannut kahdelle tukijalalle: lääke- ja luonnontieteen tutkimukseen. Näiden rinnalle on kehittymässä uusi, kansainvälisesti merkittävä tukijalka, joka koostuu laajasti informaatioteknologian, yhteiskunta- ja kauppatieteen tutkimuksesta. Tämä yhdistelmä on ollut Suomen tieteen merkittävin kasvukomponentti, kun tuloksia mitataan kansainvälisillä tiedejulkaisuilla. Vielä on kuitenkin epäselvää, mitkä yksittäiset kasvavat tutkimusaiheet näyttelevät merkittävää roolia Suomen tutkimuskartalla tulevaisuudessa.  

Kartoitus nostaa esille myös mielenkiintoisia aiemmin varjoon jääneitä kasvualoja kuten lääketieteen tuki- ja liikuntaelin sairauksiin liittyvä tutkimus, kauppa- ja taloustiede, koulutukseen liittyvä tutkimus sekä materiaalitiede, erityisesti ohutkalvojen kasvatustekniikka.

Kokonaisuudessaan tutkimuksessa koostettu (myös otsikkokuvana oleva) kartta on katsottavissa VTT:n sivuilla.

VTT toteaa tiedotteessaan, että ​tiede- ja innovaatiopoliittisen päätöksenteon tulisi kuitenkin pohjautua tutkittuun ja luotettavaan tietoon. Kaavaillut merkittävät muutokset tutkimusrahoitukseen, tutkimusorganisaatioiden toimintaan ja painotukset perustutkimuksen sekä soveltavan tutkimuksen välillä tarvitsevat rinnalleen mittareita, joilla voidaan luotettavasti arvioida muuttuvaa tutkimuskenttää sekä tiedepoliittisten päätösten vaikutuksia. 

Artikkeli perustuu yllä mainittuun VTT:n tiedotteeseen.

Taide muokkaa Big Dataa

To, 10/22/2015 - 19:03 Helena Sederholm

 

Data on nykyisin myös taiteen materiaalia. Taiteilijat keräävät ja järjestelevät suuria datavirtoja – Big Dataa – niin, että niistä strukturoituu uutta tietoa. Datataideteoksissa asiat saavat usein kokonaan uusia merkityksiä, estetiikkaa unohtamatta.

Raakamateriaalina on isoja datamassoja, joita muokataan. Suuria datajoukkoja käsitellään tieteessäkin: esimerkiksi tilastollinen päättely on sitä, että laajan aineiston perusteella johdetaan malli ja sen pohjalta laaditaan esimerkiksi ennusteita. 

Taiteessa ei kuitenkaan ole kyse tieteellisestä tutkimuksesta tai tieteen ennusteiden visualisoinnista, vaan taiteilijat päättävät omista lähtökohdistaan, mitä tietoaineistoja ja miten he käyttävät. 

Useimmin kuvataan nykymaailmaa, mutta taiteilijat voivat käsitellä dataa siten, että asiat saadaan näyttämään oudoilta ja epätavanomaisilta, mikä onkin taiteen tarkoitus: näyttää asioita uudessa valossa ja sellaisista näkövinkkeleistä, joita ei aina tule ajatelleeksi.

 

 

Teoksessaan Cinemetrics Frederic Brodbeck on kerännyt ja visualisoinut dataa elokuvista. Taiteilija on luonut elokuville visuaalisen "sormenjäljen" poimimalla ja analysoimalla otteita editointistruktuuria, väriä ja liikettä käsittelevästä informaatiosta ja muuntamalla sen animoiduksi graafiseksi esitykseksi siten, että elokuvat voidaan nähdä kokonaisina vierekkäin samalla näytöllä. 

Teos mahdollistaa sen, että useampia elokuvia voi katsoa samanaikaisesti rinnakkain ja verrata niiden eroja ja yhtäläisyyksiä, esimerkiksi alkuperäisiä verrattuna uusintaversioihin, saman genren elokuvia, eri aikakausien elokuvia tai tietyn ohjaajan eri elokuvia.

Mikä sitten tekee datamuokkauksista taidetta? Paitsi että ne esitetään visuaalisesti kiinnostavassa muodossa ja usein taidegallerioissa, Lev Manovich, newyorkilainen tietotekniikan ja mediateorian professori, kiteytti Renewable Futures -konferenssissa Riiassa lokakuussa: "Taide kuvaa maailmaa jostakin yksittäisestä näkökulmasta, yhden ihmisen kokemuksesta". 

Kommentti on sikäli paradoksaalinen, että taiteilijoiden käyttämä iso data sisältää usein satojen tai tuhansien ihmisten elämää ja kokemuksia. Esimerkiksi Daniel GoddemeyerinMoritz StefanerinDominikus Baurin ja Lev Manovichin installaatioon ja nettisovellukseen On Broadway on koottu 40 miljoonaa datakohdetta ja sosiaalisen median kuvaa. 

Tämä nykyajan maisemataulu on kaupunkinäkymä, joka on luotu lukuisien ihmisten jakamista instagramkuvista, twiiteistä, taksitilausdatasta, foursquare-kirjoittautumisista ja muusta mediaelämästä. 

Sen sijaan, että tämä "datakaupunki" olisi kuvattu tavanomaiseen tapaan graafeina, numeroina tai karttana, se on kuvallinen interaktiivinen moniperspektiivinen kaupunkimaisema. Teoksella on myös taiteellinen esikuvansa Edward Ruschan 8,33 m pitkässä valokuvateoksessa Every Building on the Sunset Strip vuodelta 1966. 

 

 

Cinemetrics-teoksen tuottama tieto tai On Broadway -teokseen koottu data ei ehkä ole yhteiskunnan kehityksen kannalta hyödyllistä tai käyttökelpoista. Mutta taiteilijoiden innovatiivinen työ tuottaa uusia kokemuksia monille ja – mikä parasta – näyttää oivaltavasti, että asioita voi tarkastella monesta näkökulmasta: kaikki ei ole sitä miltä ensivilkaisulla näyttää. 

Nykytaiteessa on jo pitkään ollut pelkän visuaalisuuden lisäksi paljon muutakin. Pelkästään teoksia tuijottamalla niistä ei välttämättä irtoa mitään, vaan tarvitaan myös (taiteilijan antamaa) taustatietoa tai erilaisten yhteyksien ja tilanteiden tajua. 

Datateoksienkin sisältö on paljon muuta kuin visuaalista, mutta silti niissä tuntuu olevan enemmän katsottavaa ja niiden ääressä viihtyy pidempään kuin monien perinteisten taideteosten. 

Riiassa, Latviassa parhaillaan (10.10.–22.11.2015) esillä olevassa Data Drift -näyttelyssä on kauniisti installoituina kiinnostavia töitä kuten elokuvia katsovia tietokoneita (otsikkokuvassa Matrix-elokuvaa), länsimaiden kulttuurihistoria merkkihenkilöiden synnyin- ja kuolinpaikkojen datana vuodesta 600 BC nykyaikaan viidessä minuutissa ja monta muuta post-digiajan datateosta.

 

Tässä on metsän jokainen puu

Ma, 04/20/2015 - 14:10 Toimitus

Kun metsäntutkijat ja kartoittajat kiertelevät maastossa, he saavat raittiin ulkoilman lisäksi paljon tarkkaa tietoa metsistä, niiden puista ja koko kasvustosta. 

Mutta hekään eivät pääse yhtä tarkkaan tietoon kuin Tampereen teknillisen yliopiston 3D-kartoittajat. Heidän tekniikallaan pystytään luomaan kolmiulotteinen malli metsän jokaisesta yksittäisestä puusta. Entistä tarkempi tieto siitä, millaisia puita Suomen metsissä kasvaa, helpottaa metsänhoidon suunnittelua ja parantaa metsäteollisuuden kustannustehokkuutta.


Suomessa metsät ovat merkittävä luonnonvara, ja ne kasvavat yli 100 miljoonaa kuutiota vuodessa. Jos me tiedämme tarkasti millaista puuta metsissämme kasvaa, voimme tehostaa metsänhoitoa ja tehdä tarkempaan tietoon perustuvia päätöksiä puuvarojen käytöstä.

TTY:n matematiikan laitoksella on kehitetty uusi metsien 3D-mallinnusmenetelmä. Sen avulla pystytään nopeasti tuottamaan valtava määrä yksityiskohtaista, metsänomistajille ja metsäteollisuudelle rahan arvoista tietoa metsän jokaisesta yksittäisestä puusta. 

Tarkka, kolmiulotteinen malli jokaisesta puusta

Puiden mallinnuksessa käytetään hyväksi laserskannauksella kerättyä dataa. Metsässä tuhannet puut laserkeilataan kymmenistä eri paikoista kameran kaltaisella laitteella, jonka pyörivä peili heijastaa lasersäteitä. Jokaisesta puusta kertyy miljoonia pikseleitä mittauspistedataa, joista muodostuva pistepilvi käsitellään digitaalisesti. Ensimmäistä kertaa pistepilvestä voidaan nyt tehdä kolmiulotteinen rakennemalli jokaiselle puulle. Se kertoo tarkasti millaista puumateriaalia metsässä on, ja mihin tarkoitukseen sitä voi käyttää.

"Kyseessä on ensimmäinen operatiivisesti tehokas, teollisessa mittakaavassa toimiva 3D-mallinnus", kertoo professori Mikko Kaasalainen matematiikan laitoksen inversio-ongelmien tutkimusryhmästä

"Kukaan muu maailmassa ei pysty tekemään mallinnusta kokonaisesta metsästä tässä mittakaavassa. Parista hehtaarista metsää voidaan tuottaa mallinnus saman päivän aikana."

"Datan analyysi ja siitä saatu informaatio on tässä menetelmässä viety aivan uudelle tasolle. Metsän omistajat, viranomaiset ja kansalaisjärjestöt voivat jatkossa hyödyntää puiden mittaustuloksia myös hiilijalanjäljen laskemisessa."

"Tämä on ainoa tapa, jolla hiilijalanjälki voidaan laskea tarkasti", Kaasalainen sanoo.

Vaahtera, joka on mallinnettu TTY:n matematiikan laitoksen inversio-ongelmien tutkimusryhmässä kehitetyllä uudella 3D-mallinnusmenetelmällä. Menetelmän on kehittänyt yliopistotutkija Pasi Raumonen.Uusi 3D-mallinnusmenetelmä on herättänyt paljon kiinnostusta suomalaisten metsäalan toimijoiden ja yritysten keskuudessa.

Kaasalaisen tutkimusryhmä on kehittämässä myös 4D-mallia, jonka avulla voi ennustaa miten metsä kasvaa. Sen avulla voisi katsoa mitä tapahtuu, jos metsästä hakattaisiin pois tietty määrä puita.

Big dataa kerätään metsistä

TTY on mukana kehittämässä kansallista metsäalan infrastruktuuria Forest Big Data -hankkeessa. Siinä tehostetaan menetelmiä, joilla hankitaan ja käsitellään tietoa Suomen metsien puustosta ja niiden kasvuolosuhteista.

Professori Risto Ritala TTY:n systeemitekniikan laitokselta on mukana Forest Big Data -hankkeessa. Siinä kehitetään menetelmiä, joilla saadaan tarkempaa tietoa Suomen metsien puista ja niiden kasvuolosuhteista. 

"Hankkeessa luodaan perustaa uudelle ja kattavalle metsävarojen tietojärjestelmälle, jolla saataisiin entistä tarkempaa ja ajantasaisempaa tietoa metsäomaisuuden hallintaa, puukauppaa, puun korjausta ja kuljetusta, metsänhoitotyötä ja metsäntutkimusta varten", toteaa Ritala.

"Tietoa Suomen metsistä kerätään jo nyt sekä satelliittikuvauksella että lentokoneilla, jotka mittaavat puustoa skannaamalla sitä laserkeilauksella ilmasta käsin. Metsävaratietoa voisi myös kerätä älykkäillä metsätyökoneilla istutetun metsän ensiharvennuksen yhteydessä. Näin saataisiin tietoa puustosta 16 x 16 metrin kokoisen ruudukon tarkkuudella."

TTY:n tehtävänä Forest Big Data -hankkeessa on kehittää menetelmiä, joilla yhdistetään ja ajantasaistetaan metsien laserkuvausdataa, metsäkoneiden tuottamaa dataa sekä Metsäntutkimuslaitoksen laajoissa alueellisissa tietokannoissa olevaa dataa.

Tämä TTY:n tiedotuksessa Leena Koskenlaakson kirjoitama juttu on julkaistu TTY:n Rajapinta-lehdessä 1/2015.