Annons

Annons

Annons

Annons

krönikaVetenskapskrönikor

Amy Loutfi
Inkorrekt data – då fattar AI förvrängda beslut

En man och hans son är båda svårt skadade i en bilolycka och körs till sjukhuset. Läkaren som undersöker pojken utbrister ”Jag kan inte operera den här pojken, det är min son!”

Hur kan detta vara möjligt? Oavsett om du vet svaret eller inte, så ska jag berätta om hur det som kallas bias är en del av svaret på frågan om doktorn och pojken – och en del i forskningen inom AI (artificiell intelligens) och maskininlärning.

Text: 

Det här är en krönika.Analys och värderingar är skribentens egna.

Att data är korrekt är en förutsättning för att AI ska ta rätt beslut. Konstverket till höger är skapat av AI. Bild: TT/Privat

Annons

Fakta

NA:s vetenskapssatsning

►Idag fortsätter NA:s satsning på vetenskapsjournalistik. Tio olika forskare, alla verksamma på Örebro universitet, skriver krönikor på fredagar, inom en rad varierande områden. Idag är det AI-forskaren Amy Loutfis tur. Hon forskar på samspelet mellan artificiell intelligens och människan. Nästa vecka är det kriminologen Susanne Strands tur att publicera krönika.

Det finns skevheter i en del data som används av AI-system. Och när data inte ger en korrekt bild av verkligheten så kommer AI också att fatta förvrängda beslut.

Den senaste tiden har en rad exempel på dessa skeva beslut fattats av AI och en del har uppmärksammats av media. Ett exempel är en app för rekrytering där män prioriterades. En annan är algoritmer för ansiktsigenkänning som inte kände igen människor med olika hudfärger.

Annons

Annons

Orsaken är ”bias”, ett begrepp som används i många vetenskaper och definieras som felaktigheter på grund av något systematiskt, till exempel insamling av data, bearbetning eller analys av resultat.

I rekryteringsappen och fallet med ansiktsigenkänning fanns felet i den data man samlat in. I rekryterinsappen använde man till exempel till stor del enbart CV:n från manliga vd:ar.

I vår forskning vill vi alltid säkerställa att den data som används är representativ och ”balanserad”. För oss betyder balanserad att data ska fånga upp alla möjliga utfall. Som ett exempel, för ansiktsigenkänning gäller alltså att AI ska matas med olika typer av ansikten, hudfärger, näsor, ögon, munnar, hakor med mera.

I vår forskning vill vi alltid säkerställa att den data som används är representativ och 'balanserad'.

Men – det är inte alltid lätt att ta fram balanserade data. Ibland är problemet att det blir väldigt dyrt eller att det handlar om sällsynta händelser. Sällsynta händelser är just sällsynta - det finns så få möjligheter i verkligheten att ta fram bra data.

Just nu har vi ett projekt där vi tittar på data från självkörande bilar. Datan måste spegla hur det ska gå till att köra bil korrekt. Men för att den självkörande bilen ska klara av trafiken bör den också kunna ha data om hur det går till att bryta mot trafikregler – och till och med ha data om förödande trafikolyckor.

Annons

Här är problemet att vi har mycket mer data om god och normal bilkörning än om motsatsen. Ett ytterligare problem är att orsaken till olyckor är så olika.

Annons

Dessutom inträffar två olyckor sällan på exakt samma sätt och det är just dessa sällsynta händelser som vi så gärna vill ha som underlag till AI-systemen, men som vi inte har tillgång till.

Det är därför vi nu inom vår forskning tittar vi på hur vi kan utveckla maskininlärningsmetoder för att hantera de sällsynta händelserna och därmed balansera data. Lösningen är så kallad dataaugmentation. Det handlar i korthet om att AI-algoritmer skapar konstgjorda data, syntetiska data. Denna process leder till nya uppsättningar av syntetiska data som kan balansera data som kommer från verkligheten.

Låt säga att jag till exempel vill ha data som visar hur en njursten kan se ut men enbart har tillgång till ett fåtal röntgenbilder med njurstenar. Med dataaugmentation kan jag lära en AI att skapa nya exempel. Dessa nya exempel kommer att vara lika de riktiga men kommer också att innehålla tillräcklig med variation för att berika den totala mängden data.

Det handlar i korthet om att AI-algoritmer skapar konstgjorda data, syntetiska data.

Jag kan ge ett annat konkret exempel. Den infällda bilden här ovan, är ett konstverk som enbart är skapat av AI. Denna AI har lärt sig att skapa konst genom att titta på hundratals bilder av konstverk - i detta fall har jag tränat min AI-algoritm på ungefär 480 tavlor av landskapsmålningar. Detta konstverk är långt ifrån tydligt - det är tyvärr en lågupplöst bild - men vid närmare påseende kan man ana konturerna av ett berg, lite växtlighet och något som kan tolkas som ett vattendrag. Denna AI-genererade konst är helt unik.

Annons

Idag lever vi i en tid där data är en råvara. Utmaningen är att se till att den också blir värdefull genom att vara representativ och balanserad. Här har jag försökt att beskriva vår forskning där AI också kan användas till att skapa bättre data. För det är viktig att inse att AI inte har en bias per definition. Men om den bakomliggande datan inte är balanserad finns risken att AI inte kan fatta rätt beslut.

Annons

Med andra ord, AI är som en blank yta på en sjö. Utan rätt förutsättningar speglar ytan den bias som finns hos oss människor – och kan i värsta fall till och med vara en förstärkning.

Tillbaka till frågan i början – doktorn var pojkens mamma.

Fakta

Amy Loutfi

►Ålder: 43 år.

►Född: I New Brunswick, Kanada.

►Forskningsområde: Artificiell intelligens.

►Kuriosa: Amy älskar historia, musik, film – och har vid ett tillfälle paddlat kajak från Örebro till Stockholm på åtta dagar.

Annons

Annons

Till toppen av sidan