Koneoppimisesta työkalut tulevaisuuteen

Samuel Kaski työskentelee tietojenkäsittelytieteen professorina tietotekniikan laitoksella.

KaskiSamuel_01.jpgMitä työsi sisältää juuri nyt?

– Olen syksyn 2015 sapattivapaalla ja vietän kolme kuukautta vierailevana tutkijana Kioton yliopistossa. Jatkan silti väitöskirjojen ohjaamista ja tutkimusta Aallon ryhmäni kanssa, joten Skypelle on käyttöä.

– Vuodenvaihteessa aloitan Suomen Akatemian akatemiaprofessorina Aalto-yliopistossa, ja pohdimme parhaillaan tutkimusryhmäni kanssa akatemiaprofessuuriin liittyviä tutkimussuunnitelmia. Lisäksi johdan Suomen Akatemian laskennallisen päättelyn huippuyksikköä COINia.

– Tutkimustyössäni kehitän koneoppimismenetelmiä data-analyysiä varten. Tällä hetkellä pyrin ratkaisemaan niin sanottua small n, large p -ongelmaa, eli miten tehdä päättelyä, kun näytteiden määrä n on pieni ja muuttujien määrä p on iso. Tuloksia hyödynnetään esimerkiksi yksilöllistetyssä lääketieteessä ennustamaan hoitojen tehoa yhdelle potilaalle, kun muuttujina on kaikki mahdollinen tieto, joka potilaasta saadaan. Neurotieteessä samoja menetelmiä puolestaan voidaan käyttää erottamaan ulkoisiin tapahtumiin liittyviä aivotoimintoja.

Missä työskentelit ennen nykyistä tehtävääsi?

– Olen työskennellyt Aallossa vuodesta 2005, ja siitä ajasta viisi vuotta myös Aallon ja Helsingin yliopiston yhteisen Tietotekniikan tutkimuslaitos HIITin johtajana. Ennen Aaltoa työskentelin pari vuotta Helsingin yliopistolla ja sitä ennen akatemiatutkijana ja Suomen Akatemian postdoc-tutkijana.

Kerro aiemmasta tutkijanurastasi.

– Tutkimustyöni on koko ajan keskittynyt koneoppimiseen. Se on toisaalta tietojenkäsittelytiedettä, jossa tavoitteet määritellään tilastotieteellisesti, ja toisaalta tilastotiedettä, jossa laskenta on keskeisessä osassa.

– Olen ollut myös lyhyempiä aikoja vierailevana tutkijana skotlantilaisissa ja englantilaisissa yliopistoissa, muun muassa UCL:ssä (University College London), sekä Pariisin yliopistossa.

Pitää uskaltaa yrittää vaikeita asioita. Sitten kun epäonnistuu, on vain noustava jaloilleen ja jatkettava työtä. Jos koskaan ei epäonnistuisi, eivät tavoitteet olisi tarpeeksi korkealla.

Miksi valitsit oman tutkimusalasi? Mikä sytytti sinussa kipinän?

– Kiinnostuin opiskeluaikana toisaalta matematiikasta ja algoritmeista, toisaalta psykologiasta ja kognitiotieteestä. Varsinainen kipinä kuitenkin syttyi koneoppimiseen, joka oli kaikkien näiden kiinnostuksenkohteitteni ytimessä. Siihen aikaan neuroverkkotutkimus oli suosittua, ja muistan vieläkin alan suomalaisen pioneerin Teuvo Kohosen esitelmän ja sen synnyttämän ahaa-elämyksen, että sellaistakin tutkimusta voisi olla mahdollista tehdä. Asian keskiössä on tilastollinen oppiminen datasta, ja perusteet kun kiinnostavat, niin siihen olen keskittynyt.

Mainitse kolme asiaa, joista olet ylpeä urallasi.

– Olen ylpeä omasta tutkimusryhmästäni. Koneoppiminen on kiinnostava yhdistelmä teoreettisen ymmärryksen hankkimista ja käytännön testaamista. Tähän palapeliin tarvitaan tutkimusryhmässä erilaisia taitoja. Kun mukaan tulee koko ajan uusia ihmisiä ja vanhoja opiskelijoita lähtee ja jokaisen on tärkeää päästä näyttämään taitonsa seuraavia uravaiheita varten, ei ole aivan triviaalia, miten yksilösuoritusten yhdistelmä saadaan toimimaan. Meillä se on toiminut hämmästyttävän hyvin.

– Tutkimusaiheista taidan olla aina ylpein siitä, mitä olen juuri saanut tehdyksi. Kesken olevissa töissä pelottaa, että oliko tämä hyvä idea sittenkään, ja vanhojen muistelu olisi ajanhukkaa. Tällä hetkellä olen ylpeä esimerkiksi yhteistyökumppanien kanssa tehdyistä näppäristä faktorianalyysin yleistyksistä useiden datajoukkojen yhteyksien analysointiin, ja toisaalta uudenlaisesta tiedonhausta ihmisen tavoitteen interaktiivisen mallintamisen avulla.

– Olen myös vähän ylpeä siitä, että jaksan innostua uusista asioista. Se on todennäköisesti opittu taito. Kun muistaa pohtia, mikä uusissa ajatuksissa on hienoa, ne imaisevat mukaansa.

Kuinka työsi Aallossa linkittyy oman tutkimusalasi kansainväliseen verkostoon?

– Kaikki työmme on kansainvälistä, jopa siinä määrin, että minusta tämä on vähän hassu kysymys. Tutkimusryhmämme jäsenistä lähes puolet on muualta kuin Suomesta, ja työkielemme on se, millä kommunikaatio parhaiten sujuu, eli englanti. Rekrytointimme on täysin kansainvälistä, ja parhaat valitaan. Itsestään selvää on, että tutkimustulokset pyritään julkaisemaan parhailla mahdollisilla kansainvälisillä foorumeilla. Rahoitus haetaan sieltä, mistä sitä saadaan, ja jos se rahoittajalle sopii, niin mukaan otetaan parhaat yhteistyökumppanit Suomen rajoista riippumatta.

Näkyvätkö tutkimuksesi tulokset tavallisen ihmisen arjessa nyt tai tulevaisuudessa?

– Hyvän perustutkimuksenkin tulokset näkyvät ennemmin tai myöhemmin arjessa, mutta on vaikeaa ennakoida, kuinka nopeasti ja millaisia käytännön sovelluksia ne poikivat. Tutkimustulokset ja koodit julkaistaan avoimina, jolloin kuka tahansa voi niitä käyttää.

– Lääketieteen perustutkimus on nykyään suureksi osaksi data-analyysia, joten siellä meidän työmme tulokset kyllä näkyvät. Koneoppiminen voi tulevaisuudessa auttaa lääkäreitä tekemään parempia hoito- ja lääkemääräyksiä.

– Pilottitutkimusten tulokset saattavat näkyä arjessa nopeastikin, ja koneoppimisessa pyrimme niitä tekemään, jotta saamme tietoa teorioidemme toimivuudesta. Yhdestä pilottitutkimuksesta on hiljattain syntynyt tiedonhakuun keskittyvä spin-off-yritys, ja meillä on käynnissä pilottiprojekteja myös sairaaloiden kanssa. Näistä voi kummuta tuloksia hyvinkin pian.

Olen myös vähän ylpeä siitä, että jaksan innostua uusista asioista.

Mainitse kolme tärkeää ominaisuutta, jotka akateemisen uran valinneella professorilla tulisi olla.

– Paljon hyviä julkaisuja, viittauksia ja projektirahaa. No, varmaan tällä tarkoitetaan, että millaisia ominaisuuksia kannattaa kehittää, jos haluaa professoriksi. Ensiksikin intohimoa omaa alaa kohtaan, sillä se mahdollistaa innostumisen, muiden innostamisen ja pitkäjänteisyyden.

– Kannattaa opetella työskentelemään määrätietoisesti ja pitkään, yhdessä muiden kanssa. Tämä ei ole pelkästään yksilölaji, vaan työtä tehdään osana tiedeyhteisöä ja opiskelijoiden kanssa.

– Pitää uskaltaa yrittää vaikeita asioita. Sitten kun epäonnistuu, on vain noustava jaloilleen ja jatkettava työtä. Jos koskaan ei epäonnistuisi, eivät tavoitteet olisi tarpeeksi korkealla.

Millaisia opiskelijoita toivot laitoksesi koulutusohjelmaan ja tohtorikoulutettaviksi?

– Toivon aidosti innostuneita opiskelijoita, jotka haluavat oppia ja saada asioita aikaan. Onneksi meillä onkin paljon tällaisia opiskelijoita. He ovat valmiita tarttumaan toimeen ja työskentelemään pitkäjänteisesti.

– Koneoppimista voi opiskella kahdesta syystä: koska se on kiinnostavaa tai koska sillä on vahva välinearvo, eli sille on tarvetta yhteiskunnassa ja se avaa oven hyviin työpaikkoihin. Molemmat ovat ihan hyviä syitä, mutta koneoppimisesta kyllä kannattaa kiinnostua myös sen itsensä takia, sillä silloin pääsee syvemmälle.

Miltä oman tutkimusalasi tulevaisuus näyttää? Kuinka tulevaisuudennäkymät vaikuttavat Aaltoon?

– Digitalisaatio ja datatiede ovat tämän hetken isoja trendejä, ja niiden taustalla on koneoppiminen sekä uudet data-analyysimenetelmät. Koneoppimista tarvitaan jatkuvasti uusilla aloilla, ja siksi siihen on syytä satsata vahvasti. Se on myös yksi Aallon vahvimpia aloja. Siitä kannattaa pitää kiinni.

Teksti: Anu Jussila

 

Tietotekniikan laitoksen sivut: cs.aalto.fi.

Sivusta vastaa: | Viimeksi päivitetty: 26.10.2015.