Miten löydän hyvän mätsin?

02.09.2016 / Miska Natunen

Blogisarjamme edellisessä osassa Jouni Mäkeläinen kävi läpi netin suosittelumenetelmien koko kirjon. Tällä kertaa pureudumme tarkemmin niistä yhteen: miten vaalikoneista tuttu, profiilien mätsäykseen perustuva suosittelu toimii, ja mikä tällaisen suosittelun rakentamisessa on tärkeää?

Vaalikoneen toiminta ei ole suuri salaisuus. Itse asiassa sen käyttämä algoritmi on hyvin yksinkertainen. Lainaus suoraan toteuttamamme Ylen eduskuntavaalikoneen FAQ:sta:

Miten vaalikone laskee tuloksen?

Vaalikone vertaa ehdokkaan ja käyttäjän vastausta jokaisen kysymyksen kohdalla. Mitä lähempänä vastaukset ovat toisiaan, sitä enemmän kysymyskohtaisia pisteitä ehdokas saa. Lopuksi kaikkien kysymysten pisteet lasketaan yhteen ja muunnetaan prosenttiarvoksi.

Yleistettynä tässä on kysymys profiilien vertailusta: käyttäjän vastaukset muodostavat vastausprofiilin, ehdokkaan vastaukset muodostavat tulosprofiilin, ja sitten katsotaan, kuinka yhteneväiset ne ovat.


Mihin muuhun vaalikonealustaa voi käyttää?

Samanlaista profiilimätsäystä voi hyödyntää monissa muissakin palveluissa, kuten tuotesuositteluissa, työpaikkahauissa tai seuranhakupalveluissa. Olennaista on kysymysten laatiminen siten, että käyttäjän lisäksi niihin voi vastata myös tulosprofiilien näkökulmasta.

Otetaan esimerkiksi toteuttamamme Lääkäriliiton Erikoisalani­-palvelu, jossa nuoret lääkärit voivat hakea itselleen sopivinta lääketieteen erikoisalaa. Siinä kysymykset ovat erikoisalan ominaisuuksiin liittyviä väittämiä, kuten:

Alalla työskennellään paljon lasten ja nuorten parissa.

Käyttäjä vastaa niihin sen mukaan, kuinka hyvin kyseinen ominaisuus sopisi hänelle. Alojen asiantuntijat taas ovat vastanneet samoihin kysymyksiin sen mukaan, kuinka hyvin kyseinen väittämä sopii erikoisalaan. Näin alan vastauksista muodostuu tulosprofiili, joka on vertailukelpoinen käyttäjän vastausprofiilin kanssa.

Toisenlainen esimerkki on Terveyden ja hyvinvoinnin laitoksen Sokra-projektille toteuttamamme Osallisuustesti. Sen voi tehdä puhtaana viihteenä - tuloskandidaatit ovat kauniisti kuvitettuja mytologisia hahmoja - mutta samalla pinnan alla testi kerää tutkimustietoa ihmisten osallisuuden kokemuksista.


Onko vaalikone hakukone?

Kyllä, mutta ei samassa merkityksessä kuin esimerkiksi verkkokaupan tuotehaku.

Esimerkkinä auton ostaminen: perinteisessä mallissa hakuehdot on helppo poimia autojen teknisistä ominaisuuksista, mutta ostajan täytyy tietää, millaisen korimallin, moottorin, vaihteiston jne. hän haluaa. Mutta mitä jos ominaisuuksien sijaan haku kysyisikin:

Kuinka suuri perhe sinulla on?
tai
Ajatko yleensä kaupungissa vai maanteillä?

Tällaisilla kysymyksillä päästään kiinni ostajan todellisiin tarpeisiin, ja parhaimmillaan saadaan tulokseksi myös sellaisia suosituksia, joita ostaja ei olisi osannut muuten edes harkita.

Menetelmällä on etuja myös verrattuna blogin edellisessä osassa esiteltyihin suosittelualgoritmeihin, jotka perustuvat käyttäjän toiminnan automaattiselle seuraamiselle ja siitä tehdyille johtopäätöksille. Niiden lopputulos on useissa tapauksissa hyvä arvaus, mutta aina se ei riitä. Vastausprofiilin rakentaminen vaatii käyttäjältä vastaamisen verran enemmän vaivaa, mutta samalla arvailun tarve vähenee, kun käyttäjä kertoo itse mitä tarvitsee.

Merkittävää on myös käyttäjän oma aktiivinen tahto. Omien valintojen seurauksena tuleva suositus on mieluisampi kuin silmille hyppäävä, algoritmisesti valittu mainos.

Eri suosittelumenetelmät eivät ole toisiaan poissulkevia, vaan automaattisia algoritmeja, profiilien vertailua ja suoria hakutoimintoja käytetään toisiaan täydentäen. Jo vaalikoneissa yhdistetään näistä kahta, kun kysymyksiin vastaamisen jälkeen käytetään hakuehtoja tulosjoukon rajaamiseen ehdokkaan puolueen tai asuinpaikan perusteella.

Palvelusuunnittelu on olennaisessa roolissa menetelmien valinnassa. Kun suosittelua tarvitaan, hyvä suunnittelija osaa valita sopivimman menetelmän tai niiden yhdistelmän kuhunkin käyttötapaukseen.


Ei ole huonoja vastauksia, on vain huonoja kysymyksiä

Tämä on siis yksinkertaista.  Miksi siis vaalikoneet tuntuvat välillä tarjoavan täysin vääriä ehdokkaita? Miksi jotkut näkevät vaalikoneet enemmän viihteenä kuin aidosti ehdokkaan löytämisessä auttavana työkaluna?

Edellä on tullut jo esille kysymyspohjaisen lähestymistavan vahvuudet profiilien vertailuun perustuvassa suosittelussa. Kysymyksissä piilee kuitenkin myös menetelmän suurin heikkous.

Kysymysten laatu on kriittinen tekijä palvelun toimivuudessa. Jos kysymykset ovat epäolennaisia tai epäselvästi muotoiltuja, koneen antama tulos voi olla hyödytön. Jos eduskuntavaaliehdokkailta kysytään, ”mikä on lempiruokasi” tai ”uskotko ufoihin”, vaalikoneen uskottavuus murenee nopeasti.

Suosittelun rakentaminen vaatii aihealueen laajaa asiantuntemusta: mitkä ovat käyttäjien todelliset tarpeet, mitkä ovat tuloskandidaattien olennaiset ominaisuudet tarpeisiin liittyen, ja miten tämä kaikki saadaan muotoiltua oikeita asioita mittaaviksi kysymyksiksi? Siinä missä muita suosittelumenetelmiä parannetaan virittämällä algoritmia, vaalikoneessa parempia tuloksia saadaan viilaamalla sisältöä.

Esimerkiksi Erikoisalani­-palvelun tapauksessa kysymysten sisältö tuli Lääkäriliitolta, jossa oli jo olemassa kattava näkemys erikoisalan valintaan vaikuttavista tekijöistä aiempien tutkimusten perusteella. Lääkäriliitto otti myös palvelun kohderyhmän - nuoret lääkärit - mukaan ideoimaan kysymyksiä. Me huolehdimme kysymysten muotoilusta valintakoneeseen sopiviksi.


Millä muulla on väliä?

Vastauksillakin on merkitystä. Jos tuloskandidaatit ovat tuotteita, eivätkä siis pysty vastaamaan itse, vastausten jakaminen kysymyksiin määritellylle skaalalle vaatii samaa asiantuntemusta kuin itse kysymysten laatiminen. Myös vastausten kerääminen esimerkiksi poliittisten vaalien ehdokkailta asettaa omat haasteensa keräyksen prosesseille ja työkaluille.  

Vastaaminen vaatii myös käyttäjältä pelisilmää: ei kannata vastata kysymyksiin, joilla ei ole itselle merkitystä, sillä ne vääristävät tulosta itselle epäolennaiseen suuntaan.

Suosittelu on lähes aina osa isompaa palvelukokonaisuutta. Lopullinen päätös tehdään harvoin pelkän suosittelutuloksen perusteella. Esimerkiksi vaalikoneissa ehdokkaiden kommentit tai videot voivat olla äänestyspäätöksen kannalta ratkaisevampia kuin sijoitus tuloslistalla. Suosittelu on kuitenkin aivan olennainen työkalu tässä kokonaisuudessa – sen avulla valtava vaihtoehtomäärä saadaan ensin rajattua edes hiukan inhimillisempään kokoluokkaan, jonka jälkeen tarkempi karsinta voi alkaa.

Kirjoittaja ja Sangre Oy ovat rakentaneet vaalikoneita ja muita samaan teknologiaan pohjautuvia palveluja yli vuosikymmenen ajan. Ylen vaalikoneita he ovat olleet tekemässä yhtä kauan. Niihin on vuosien varrella muodostunut syvällinen suhde niin projektinhallinnan, suunnittelun kuin teknisen kehityksenkin näkökulmasta.