torstai 22. helmikuuta 2018

MATEMATIIKAN VÄÄRINKÄYTTÖ


Suomessakin toukokuisia iltapäivälehtiä myydään lukiovertailuilla, joissa on laskettu miten eri lukioiden opiskelijat keskimäärin menestyvät ylioppilaskirjoituksissa. Aika yleisesti sentään tiedetään, että moinen on epäreilu mittari lukioiden opetuksen laadulle: koulu voi tarjota tasokasta opetusta, mutta jos tulijoiden lähtötaso on heikko, he tuskin kirjoittavat erityisen loistokkaasti. Astetta reilummassa vertailussa otetaankin huomioon opiskelijoiden lähtötaso. Jos lukioon tullaan keskimäärin varsin heikoilla todistuksilla, mutta ylioppilaskirjoituksissa menestytään keskitasoisesti, opetus on ollut erinomaista – sehän näyttäisi nostaneen opiskelijoita lähtötasoltaan. Nopeasti ajatellen kuulostaa ihan pätevältä. Mutta kannattaa malttaa mielensä ja ajatella hitaammin. 

Cathy O´Neil (2016) kertoo kirjassaan Matikkatuhoaseet, miten Washington D.C:n uusi pormestari halusi vuonna 2007 eroon kaikista huonoista opettajista. Niinpä yläasteen opettajat saivat arvosanan sen mukaan nousivatko heidän opiskelijoidensa numerot lähtötasosta vai tuliko laskua. Idea ei ole aivan niin pöhkö miltä kuulostaa, sillä varsinkin matematiikassa ja kielissä oli käytössä aika hyviä valmiita kokeita - opettajan lempeys tai ankaruus kokeiden tarkastajana ei siis päässyt olennaisesti vaikuttamaan tulokseen. Jos opiskelijoiden taso oli lukuvuoden aikana suhteellisesti heikentynyt, opettaja sai potkut ja parempia palkattiin tilalle. Lopputulemana pitäisi loogisesti olla pelkästään erinomaisia opettajia ja lasten oppimistulokset olisivat muutaman vuoden päästä huikeita. Näin ei tietenkään käynyt.

Aluksi paljastui erikoisia yksittäistapauksia: huonon arvion takia annettiin potkuja joillekin opettajille, joiden opiskelijat olivat ennen menestyneet aivan hyvin ja joita yleisesti pidettiin hyvinä opettajina – ja jotka varsin nopeasti saivat uuden työpaikan yksityisistä kouluista. Osa potkut saaneista opettajista yritti saada tarkempaa tietoa, miten heidän surkea tuloksensa oli laskettu. Paljastui, etteivät edes irtisanomisia tehneet rehtorit tunteneet mallia yksityiskohtaisesti. Vastaus oli – se on konsulttiyhtiön kehittelemää korkeaa matematiikkaa, et ymmärtäisi sitä. Onneksi matemaatikotkin kiinnostuivat asiasta ja alkoivat tutkia sitä. Paljastui, että mallin ongelmat eivät rajoittuneet vain joihinkin epäonnekkaisiin yksityistapauksiin. Oli erittäin tyypillistä, että samalle opettajalle saatiin hyvin erilaisia lukuja eri vuosina. Sama opettaja saattoi saada 7. luokkalaisten numeroiden perusteella surkeat arvosanat ja 8. luokkalaisten kohdalla erinomaiset. Data oli siis erittäin kohinaista. Eikä ihme! Kuten kuka tahansa opettaja tai opiskelija voi kertoa – opiskelijoiden tulokset johtuvat kovin monista seikoista, opettajan ammattitaito on niistä vain yksi.

Neil näkee tarinassa muutaman tyypillisen tavan väärinkäyttää matematiikkaa: 1) Arveluttavat päätökset naamioidaan mukamas neutraalin algoritmin ja liikesalaisuuden taakse, eikä päätöksen uhri saa tietää päätöksen perusteluja. 2) Malli otetaan käyttöön aivan liian aikaisin, eikä mallia hiota. Neil vertaa kouluarviointeja baseball seurojen tapaan kerätä tietoja arvokkaista pelaajista – siellä tietoa kerätään jatkuvasti, ja algoritmia parannellaan koko ajan, kun sen huomataan tekevän virheitä. Tällöin lopputulemana on - vuosien päästä -  aika hyvä, tehokas ja reiluhko malli.  3) Mittaustavat voivat luoda vääristäviä kierteitä: Amerikassa paljastui, että potkuja pelänneet ala-asteen opettajat olivat huijanneet – he olivat parannelleet oppilaidensa vastauksia, jolloin nämä saivat ala-asteelta lähtiessään liian hyvän tuloksen. Tämä johti taas siihen, että yläasteen opettajista parhaallakaan ei ollut mahdollisuuksia pitää tuloksia edes samalla tasolla (paitsi ehkä turvautumalla samaan huijaustrategiaan). 

Erityistä huomiota kannattaakin kiinnittää siihen, millaisia ohjausvaikutuksia mittauksilla ja malleilla on. Pitää tunnistaa myrkyllisiä palautekierteitä. Sellainen syntyi Yhdysvalloissa esimerkiksi, kun U.S.News alkoi laittaa eri collageja paremmuusjärjestykseen. Iso osa mittaria oli se, paljonko opinahjosta valmistuneet olivat valmiita lahjoittamaan rahaa koululleen ja kuinka korkealle he sitä arvostivat. Listan laatijat korostavat ylpeinä, että mittari on pakottanut collaget parantamaan palvelujaan ja ottamaan opiskelijat vakavasti. Tämä onkin totta, mutta samalla oppilaitokset ovat myös alkaneet pelata listalla: tehdä paljon asioita vain, jotta asema suhteessa muihin opinahjoihin paranisi. Voidaan tietenkin satsata fiksusti opetukseen ja opintojen-ohjaukseen, mutta myös hulppeisiin tiloihin, jalkapalloseuroihin tms. Voidaan myös temppuilla valintakoejärjetelyillä. Suurin ongelma on, ettei lista huomioi lainkaan koulutuksen hintaa. Menestyäkseen listalla collagen kannattaa  kerätä ja kuluttaa hulluna rahaa, se nostaa arvostuspisteitä ja tuo hyviä opiskelijoita. Samalla opintojen hinta on noussut taivaisiin.

Vaan entä köyhät? He ovat erityisen haavoittuvia matematiikan väärinkäytölle ja netin saalistaja-algoritmeille. He paljastavat haavoittuvuutensa ja epätoivonsa esim. klikkaamalla auki sivustoja, jotka on suunniteltu houkuttamaan talousahdingossa kärvisteleviä ihmisiä. Saalistaja-algoritmi "haistaa verta" ja lähettää lisää syöttejä näiden ihmisten facebook syötteeseen. Eräs paljon käytetty ansa on valheellinen työpaikkailmoitus, jossa luvataan apua ruokakorttien saamisessa - ilmoitus houkuttaa kaikkein haavoittuvampia ja epätoivoisempia. Jos he laittavat hakemukseen puhelinumeronsa, he saavat jonkin ajan päästä puhelisoiton, joka tarjoaa pikalainaa tai lainarahoitteisen opiskelupaikan ns. voittoa tuottavassa yliopistossa. Kyseisissä opinahjoissa suoritettu tutkinto ei yleensä ole juuri minkään arvoinen työmarkkinoilla, ja se jättää opiskelijalle lähinnä kirvelevän opintovelan. Kuvaavaa on, että eräs tällainen opinahjo käytti 2225 dollaria per opiskelija markkinointiin ja 892 dollaria opetukseen. Oikeissa opinahjoissa luvut ovat sentään toisin päin.

Neil kertoo lukuisia esimerkkejä matematiikan väärinkäytöstä: pörssikeinottelusta, sairausvakuutusten tai autovakuutusten epäreilusta hinnottelusta (varallisuus vähentää vakuutusmaksua enemmän kuin rikkeetön ajohistoria), oikeuslaitoksen toiminnasta jne. Kirjaa lukiessa huomaa, että yhdysvaltalainen järjestelmä on monin tavoin erilainen kuin pohjoismainen hyvinvointivaltio. Neilin kuvaamat suuraineistoalgortimit ovat silti tulossa meillekin, ja hyvä niin. Monet matemaatikkojen keksinnöistä tuottavat hyvinvointia, terveyttä ja reiluutta. Ehkä jopa pelastavat maailman ilmastonmuutokselta. Neil on matemaatikko ja rakastaa matematiikkaa. Hän haluaa kuitenkin herätellä ihmisiä huomaamaan, milloin matematiikkaa käytetään väärin. 

Nykyhetken ennakkoluulot ja vääryydet kirjautuvat helposti algoritmeihin ja jos algoritmejä ei saa avata (koska ovat liikesalaisuus), vääryydet muuttuvat pysyviksi. Kuvitellaan esimerkiksi, että hyperkonservatiivinen Fox yhtiö päättäisi luoda matemaattisen mallin rekrytoinnin tueksi. Pohjaksi katsottaisiin, millaiset ihmiset ovat parhaiten menestyneet Fox –yhtiössä. Malli havaitsisi, että juuri kukaan nainen tai värillinen ei ole yhtiössä menestynyt, joten se keskittyisi etsimään kykyjä valkoihoisista miehistä. Malli olisi ”evidence based”… se perustuisi suureen määrään havaintoja siitä, millaiset ihmiset ovat yhtiössä menestyneet. Samalla se olisi tietenkin myös epäreilu ja valheellinen – se sementoisi yhtiön syrjivät asenteet liikesalaisuudeksi nimetyn algoritmin taakse.

Maailmassa kerätään valtavasti tietoa ja sen hyödyntäminen on viisasta. Matematiikan ja koneälyn avulla suuret tietomassat saadaan ehkä hallintaan ja tietomme maailmasta kasvaa. Kansalaisten on kuitenkin syytä pysyä hereillä ja vaatia avoimuutta. Ei ole syytä uskoa, jos päätösten perusteluksi tarjotaan, ”tämä on matematiikkaa, et ymmärtäisi.” Palaneen käryä on ilmassa myös silloin, jos kansalaisia koskevia päätöksiä ei voida avata, koska taustalla on liikesalaisuus.


Ei kommentteja:

Lähetä kommentti