Koneoppiminen ja tekoäly ovat olleet yksi viime vuosikymmenen puhutuimmista teknologiatrendeistä. Kuten aina, hypekäyrän lakipisteessä odotukset olivat kuin hopealuodilla. Koneoppimisen sekä pelättiin että toivottiin muuttavan likipitäen kaiken. Kun sitten niin suuret kuin pienemmätkin yritykset käynnistivät ja veivät koneoppimisprojekteja läpi, huomattiin, että koneoppimisen soveltamiselle on kuin onkin omat paikkansa ja hetkensä. Mutta mitä se koneoppiminen oikein on?
Karkeasti koneoppimismenetelmien käyttäminen on kokonaisuus, jossa on kolme merkittävää osatekijää:
- koodin muodossa toteutetut matemaattiset algoritmit
- digitaalisesti käsiteltävissä oleva data
- mallin koulutuksen ja tulosten käytön mahdollistava IT-infra sovelluksineen ja palveluineen
Koneoppimisalgoritmeja, sekä perinteisempiä että viimeaikaisen tutkimuksen kautta tulleita uudempia menetelmiä, löytyy valmiina eri ohjelmointikirjastoihin ja -kehyksiin toteutettuina. Menetelmien hyödyntäminen vaatii ymmärrystä, jotta menetelmien soveltuvuutta voidaan arvioida.
Koneoppimisalgoritmeja ei tarvitse kuitenkaan alkaa kehittää itse. Tärkeintä on ymmärrys siitä, mikä algoritmi auttaa parhaiten minkäkinlaisen ongelman ratkaisussa.
Data on osoittautunut koneoppimisprojektien alkuvaiheessa eniten työtä vaativaksi osa-alueeksi, ja se on koneoppimismenetelmien näkökulmasta myös kaiken keskiössä. Dataa on ensinnäkin oltava riittävästi, mikä hihavakiona tarkoittaa vähintäänkin tuhansia havaintoja mallinnettavasta asiasta.
Toiseksi: Datan on oltava riittävän laadukasta. Laatu varmistetaan datan huolellisella jälkikäsittelyllä valittu koneoppimismenetelmä huomioden. Datan, eli esimerkiksi ennustamiseen käytettävien muuttujien sekä itse ennustettavan asian, määrittäminen vaatii usein myös merkittävää yrityksen osa-alueet läpäisevää yhteistyötä.
Kokonaisuutena koneoppimismenetelmien hyödyntäminen osana päivittäistä palveluliiketoimintaa on loppujen lopuksi vain datakeskeistä sovelluskehitystä, johon pätevät sovelluskehitysprojektien lainalaisuudet. Lisävaatimukset tulevat datan laadun, käytön ja keruun kautta.
Datan hyödyntäminen koneoppimismenetelmien avulla lähtee liikkeelle menetelmien mahdollisuuksien ymmärtämisestä. Hyväksi havaitsemamme keino on matalan kynnyksen puolen päivän koneoppimistyöpaja, yhdenlainen digityöpaja, jossa sekä esitellään aihetta että keskitytään omassa toiminnassa olevien koneoppimisella ratkaistavien ongelmien löytämiseen.
Kiinnostuitko? Lue blogistamme myös liiketoimintalähtöisestä koneoppimisesta ja koneoppimisen käyttökohteista!