SAS ja yhteiskunta
 
Data Mining -tekniikalla yritetään ennustaa synnytyskomplikaatioita Olavi Kauhasen (vas.) ja Seppo Heinosen mukaan hoitohenkilöstön työ helpottuisi huomattavasti, jos synnytyskomplikaatioita voitaisiin ennustaa Data Mining -tekniikan avulla.
Olavi Kauhasen (vas.) ja Seppo Heinosen mukaan hoitohenkilöstön työ helpottuisi huomattavasti, jos synnytyskomplikaatioita voitaisiin ennustaa Data Mining -tekniikan avulla.

Kuopion yliopistollisen sairaalan synnytysklinikalla tutkitaan mahdollisuutta ennustaa Data Mining -tekniikan avulla, keillä synnyttäjillä saattaa ilmetä komplikaatioita synnytyksen aikana.

Idea tutkimuksesta sai alkunsa umpisuolentulehdusten diagnostointia koskeneesta väitöskirjasta, jonka mukaan neuroverkkomenetelmä pystyy arvioimaan tulehduksen esiintymisen yhtä hyvin kuin kokenut lääkäri.

"Neuroverkko edellyttää yleensä melko paljon opetusdataa, ja meillä on paljon dataa synnytysrekisterissä. Neuroverkkoon syötetään dataa ja sille kerrotaan, mikä on komplikaatiotapaus ja mikä ei. Näin se oppii tunnistamaan komplikaatiotapaukset pohjatietojen perusteella", naistentautien ja synnytysklinikan atk-suunnittelija Olavi Kauhanen kertoo.

Kuopion yliopistollisessa sairaalassa on tallennettu huomattavasti normaalia laajempia tietoja synnyttäjistä jo kymmenen vuoden ajan. Siellä on sähköisessä muodossa tallessa tiedot 26 000 synnyttäjästä.

Synnytysrekisteri sisältää myös äitiysneuvoloista saadut esitiedot, jotka ovat jo järjestelmässä, kun synnyttäjä ilmoittautuu sairaalaan synnyttämään.

SAS/Enterprise Miner™ -ohjelmiston avulla tehtävässä tutkimuksessa selvitetään, voidaanko esitietojen perusteella ennustaa mahdolliset ongelmasynnyttäjät ja varautua valvomaan heitä erityisellä huolella.

"Ajatus on, että saisimme hälytyksen heti, kun meille ilmoittautuu synnyttämään äiti, jolla on suuri todennäköisyys saada vaikkapa hapenpuutteessa syntynyt lapsi tai muu synnytysajan komplikaatio", professori Seppo Heinonen kertoo.

Ennustuskyky datasta kiinni
Vielä toistaiseksi Data Mining -tekniikalla ei ole Heinosen mukaan saavutettu kliiniseen käyttöön riittävän tarkkaa ennustuskykyä. Enterprise Miner on kuitenkin luokittellut muuttujia samalla tavalla kuin klinikalla on aikaisemmin tehty oman kokemuksen perusteella.

"Monet biologiset ilmiöt ovat sellaisia, että niitä ei voida johtaa mistään kaavasta. Niihin vaikuttavat niin monet sellaiset tekijät, joita me emme hallitse tai joita me emme tiedä", Heinonen selittää.

Riittämätön ennustuskyky voi johtua siitä, että käytetyssä datassa ei ole tietoa kaikista tekijöistä, jotka komplikaatioita saattavat aiheuttaa. Ensi vuonna tutkimusta jatketaan lisäämällä dataan uusia tietoja synnyttäjistä.

"Liitämme mukaan kaikututkimusten antamat tiedot sikiöstä, istukasta, lapsivedestä, napasuonesta ja muista seikoista. Lisäksi saamme digitaaliseen muotoon tiedot sikiön sydänäänianalyyseista eli CTG-nauhoista, jolloin pääsemme kenties analysoimaan myös niitä."

Riittävän ennustuskyvyn saavuttaminen Data Mining -menetelmällä olisi Heinosen mukaan kansainvälisestikin merkittävää. Menetelmä todennäköisesti leviäisi nopeasti yleiseen käyttöön maailmalla.

"Tällainen ennustava lääketiede helpottaisi huomattavasti meidän työtämme synnytysklinikalla. Voisimme keskittää päähuomion sellaisiin äiteihin, joilla on odotettavissa ongelmia", hän sanoo.

Aika ei kulu epäolennaiseen
Enterprise Minerin neuroverkkoa on Kauhasen mukaan käytetty tähän asti pitkälti oletusarvojen pohjalta. Tulokset saattaisivat hänen mukaan parantua, jos neuroverkko viritettäisiin juuri kyseistä dataa varten.

"Se edellyttää aika paljon työtä, emmekä ole ehtineet sitä tehdä vielä. Eräässä röntgenkuvien tulkintaa koskeneessa tutkimuksessa päästiin varsin hyviin tuloksiin neuroverkkoa räätälöimällä", hän kertoo.

Välineenä Enterprise Miner on Kauhasen mukaan osoittautunut hyväksi, koska siinä on integroitu yhteen erilaiset menetelmät, kuten neuroverkot, logistinen regressio, klusterianalyysit ja tree-analyysit.

"Kaikki tulokset voi helposti vetää yhteen ja tarkastella niitä toisiaan vasten, jotta nähdään, mikä analyysi antoi parhaan tuloksen", hän sanoo.

Tilastoanalyysit usein edellyttävät normaalijakaumaa tietylle muuttujalle. Jos jakauma ei ole normaali, jakaumaa joudutaan muuttamaan.

"Enterprise Minerissa on väline, jolla muunnoksen voi tehdä ihan ohimennen ennenkuin dataa ryhdytään analysoimaan. Se on erittäin hyvä ominaisuus, ja mekin olemme sitä käyttäneet", Heinonen sanoo.

Heinonen kiittää myös Enterprise Minerin helppokäyttöisyyttä, selkeyttä ja käyttäjäystävällisyyttä. Sitä käytettäessä ei hänen mukaansa tarvitse kuluttaa aikaa eläolennaisiin asioihin, vaan voi keskittyä siihen, mitä menetelmää ja mitä muuttujia haluaa käyttää.

"Se muodostaa yhdellä klikkauksella automaattisesti koodin, jonka se ajaa. Tulostukset ja kaikki muu toimivat nykyaikaisella graafisella käyttöliittymällä", hän toteaa.

Artikkeli julkaistu SAS Uutisissa (nro 4/2000).

Takaisin