Big Data muutti maailman

Kasvaneiden muistien myötä luomme ja tallennamme uutta dataa ennätysmääriä ja sovellamme big dataa yhä moninaisempiin kohteisiin. Big Data tarkoittaa valtavien järjestämättömien tietomassojen keräämistä, säilyttämistä ja analysointia tietoteknisten ratkaisujen avulla.

Viime vuosina tiedon tallentaminen ja jakaminen verkossa on muuttunut vallankumouksellisesti, kun muistien tallennuskapasiteetti on kasvanut tuhatkertaisesti. Yksi tämän kehityksen vauhdittajista on brittiläinen fyysikko, spintroniikan uranuurtaja Stuart Parkin, joka palkittiin kehitystyöstään Millennium-teknologiapalkinnolla vuonna 2014.

Spintroniikassa bittien tallennus ei perustu sähkövaraukseen, vaan elektronin magneettiseen momenttiin, spiniin. Parkinin keksinnöt pohjautuvat gmr-ilmiötä eli suurta magnetovastusta hyödyntävään spin valve -lukupäähän. Ilmiö löydettiin vuonna 1988. Parkin kehitti siitä tallennustekniikan.

Arkielämässä Parkinin keksintö näkyy esimerkiksi siinä, miten tallennamme ja katsomme videoita, lähetämme toisillemme valtavia tiedostoja ja miten annamme kännyköiden ja erilaisten antureiden taltioida lähes kaiken elämästämme liikkumisesta ja tunnetiloistamme alkaen.

Yksi spintroniikan parantamia tallennusmahdollisuuksia voimakkaasti hyödyntävä tieteenala on lääketiede. Esimerkiksi Turun, Helsingin ja Aalto-yliopiston yhteinen tutkimushanke tähtää sellaisten ennustavien mallien kehittämiseen, joilla voidaan ennustaa lääkkeiden ja proteiinien keskinäistä vuorovaikutusta ja vastustuskyvyn kasvua lääkkeillä.

Apulaisprofessori Tapio Pahikkalan johtamassa hankkeessa ennustaminen perustuu koneoppimiseen eli tekoälyn osa-alueeseen, jossa ohjelmistoa yritetään saada toimimaan paremmin yhdessä sekä pohjatiedon että tapahtuvan toiminnan perusteella. Koneoppimisessa ohjelmiston tekijä ei ole määrittänyt algoritmia eli toimintamenetelmää jokaista tilannetta varten, vaan ohjelmisto oppii myös itsenäisesti päätymään haluttuun lopputulokseen.

 

CSC – Tieteen tietotekniikan keskus tarjoaa tutkijoille käyttöön Sisu-supertietokonetta, joka kuuluu Euroopan nopeimpien joukkoon. Sen teoreettinen huipputeho on 1,7 petaflopsia eli 1,7 x 10 potenssiin 15 liukulukulaskutoimitusta sekunnissa. Sitä käytetään nyt muun muassa ilmaston, astrofysiikan, nanoteknologian, materiaalitieteen, biotieteen, fuusioenergian ja uusiutuvien energiamuotojen tutkimuksessa. Kuva: Samuli Saarinen /CSC.

 

Tuloksia voidaan hyödyntää uusien syöpähoitojen kehittämisessä

”Monet biolääketieteelliset koneoppimisongelmat sisältävät dataa, jota voidaan esittää tensoreina, tietynlaisina geometrisina kokonaisuuksina. Tensoriperusteisessa koneoppimisessa käsitellään monimutkaisia aineistoja. Taudit ja lääkeaineet voivat muodostaa kaksiulotteisen tensorin. Kolmiulotteinen tensori saadaan lisäämällä potilaat,” mainitsee Pahikkala esimerkkinä.

”Parannamme menetelmien monimutkaisuutta uusilla optimointialgoritmeilla, jotka hyödyntävät datan tensorirakennetta. Yhdistämme näihin menetelmiä puuttuvien arvojen paikkaamiseksi tensoreilla, liitämme niihin aktiivista koneoppimista sekä biofyysisiä atomitason simulaatioita yhdistäviä hybridimalleja”, kertoo Pahikkala.

”Käytössämme on suuri määrä dataa, supertietokoneiden laskentavoima ja merkittävä määrä tallennuskapasiteettia. Tämän ansiosta syntyy tuloksia.”

Pahikkalan mukaan onnistuneilla tuloksilla on valtava merkitys esimerkiksi uusien syöpähoitojen kehitykselle.

Lääkkeen ja proteiinien vuorovaikutus on lääkkeen vaikutuksen ydinkysymyksiä. Lääkeaineen sitoutuminen proteiineihin vaikuttaa erittäin keskeisesti kehossa lääkeaineen imeytymiseen, leviämiseen, solun aineenvaihduntaan eli metaboliaan ja eliminaatioon eli siihen, miten solut pyrkivät eroon lääkeaineesta.

 

Antibioottien huolimaton käyttö edistää mikrobien vastustuskykyä

Mikrobien vastustuskyvyn parantuminen lääkkeiden huolimattoman käytön seurauksena on kasvava uhka. Esimerkiksi keuhkotuberkuloosi tappoi viime vuosisadan alussa joka vuosi jopa 10 000 suomalaista. Joka tunti keuhkotauti tappoi siis yhden suomalaisen. Antibioottien avulla ongelma saatiin Suomessa lähes kokonaan poistettua. Nyt lääkeresistentit kannat ovat kuitenkin jo yleistyneet lähellämme. Esimerkiksi Venäjällä ja Baltiassa esiintyy lääkkeille vastustuskykyistä tuberkuloosia. Ongelman ratkaisemiseksi tarvitaan muun ohella lisää tutkimusta, joka hyödyntää big dataa.

Suomen Akatemian merkitys tutkimushankkeelle on erittäin keskeinen.

”Suomen Akatemian rahoitus mahdollistaa konsortion kuuden osapuolen saumattoman yhteistyön hankkeen tavoitteiden saavuttamiseksi. Tutkimustyötä vievät eteenpäin rahoituksella palkatut tohtoriopiskelijat ja postdoc-tutkijat, jotka työskentelevät samanaikaisesti useille konsortioon kuuluville ryhmille”, Pahikkala kertoo.

 

Teksti: Visa Noronen
Pääkuva: Esko Keski-Oja

 

Artikkeli on alunperin julkaistu Suomen Akatemian tietysti.fi-sivustolla osana artikkelisarjaa ”Millennium-innovaatioista elämänlaatua”.

Millennium-teknologiapalkinto on suomalainen, miljoonan euron arvoinen kunnianosoitus maailman huippuinnovaatioille, jotka parantavat ihmisten elämänlaatua ja edistävät kestävää kehitystä. Palkittavat teknologian innovaatiot ovat yhteiskunnallisesti erittäin vaikuttavia ja edistävät hyvinvointia jopa koko ihmiskunnan tasolla. Kansainvälinen Millennium-teknologiapalkinto jaetaan seuraavaksi 22. toukokuuta 2018.