Mens vi har vært opptatt med å diskutere om kunstig intelligens kommer til å stjele jobbene våre eller bare har blitt usedvanlig god til å rime, har en gruppe forskere i all stillhet avdekket hva som egentlig foregår under den digitale motorvognen. Svaret er ikke bare relevant for maskiner, det kan også avsløre noe om hvordan kreativitet oppstår i oss alle.
Det siste året har det vært nesten umulig å åpne en nettavis uten å bli møtt av nok et bilde skapt av en kunstig intelligens. En astronaut på en hest i fotorealistisk stil. En katt malt som en van Gogh. Fantasien, eller i det minste maskinens evne til å kombinere konsepter, ser ut til å være grenseløs.
Men hvor kommer denne «kreativiteten» fra? Er maskinen virkelig kreativ, eller er den bare det noen kritiske forskere har kalt en stokastisk papegøye – en avansert mimiker som bare blander og matcher de milliarder av bilder den har blitt matet med, uten noen reell innovasjon?
En ny studie, publisert i det anerkjente tidsskriftet Quanta Magazine, tyder på at sannheten er langt mer subtil. Kreativitet er ikke noe du spesifikt programmerer inn i disse bildegeneratorene. I stedet ser det ut til å være et uunngåelig biprodukt av selve arkitekturen. Et slags lykkelig uhell som er bygget inn i systemets DNA… unnskyld: kode!
Makulerte malerier
For å forstå oppdagelsen må vi se på hvordan en moderne bildegenerator, en såkalt diffusjonsmodell, faktisk fungerer. En diffusjonsmodell starter med å forvandle et hvilket som helst bilde til ren digital støy – som et maleri som kjøres gjennom en makuleringsmaskin til det bare er fint støv igjen.

Så begynner KI-en å samle støv igjen. Den jobber ikke i blinde, men får en «monteringsveiledning» i form av tekstbeskrivelsen man gir den, for eksempel «en astronaut på en hest». For hvert lille, nitidige trinn der modellen fjerner noe av støyen, rådfører den seg med guiden sin og vurderer hvilken justering som mest sannsynlig vil bringe den nærmere et resultat som både ligner et gjenkjennelig bilde og stemmer overens med den ønskede scenen. Det er i denne guidede gjenskapingsprosessen at magien skjer.
Frem til nå har visse deler av denne prosessen blitt betraktet som tekniske begrensninger. For eksempel er systemet bygget for å fokusere på små deler av bildet om gangen, nesten som en kunstner som bare kan se en liten del av lerretet sitt. Samtidig er det en innebygd regel om at hvis du flytter inndataene litt – for eksempel ved å flytte et ansikt noen piksler til venstre – vil systemet automatisk gjøre den samme forskyvningen i det endelige bildet.
Disse reglene ble sett på som tekniske finurligheter som hindret maskinen i å lage perfekte kopier. De ble ikke forbundet med kreativitet, som ble ansett for å være en mer opphøyet, nesten mystisk egenskap. Men her tok de feil.
Den uunngåelige kreativiteten
Den nye forskningen viser at nettopp de mekanismene som begrenser modellens syn og tvinger den til å arbeide lokalt, er selve kilden til dens kreativitet. Fordi systemet tvinges til å gjenskape bildet ut fra bruddstykker og generelle regler – i stedet for å ha et perfekt minne om originalen – må det generalisere og improvisere.
Det er som å be en musiker om å gjenskape en symfoni etter å ha hørt bare små, usammenhengende bruddstykker. Musikeren ville bli tvunget til å fylle ut hullene basert på sin forståelse av musikalske regler og harmonier. Resultatet ville ikke bli en perfekt kopi, men en nytolkning – en kreativ handling.
Forskerne har for første gang formulert dette matematisk. De har vist hvordan den tilsynelatende kreativiteten er en deterministisk prosess – en direkte og forutsigbar konsekvens av måten systemet er bygget opp på. Det er ikke tilfeldig magi, men en logisk konsekvens av arkitekturen.
Det er ikke noe monster under sengen, men hvis vi kikker lenge nok inn i det skimrende mørket, vil vi få øye på det likevel.
Dette utfordrer direkte ideen om den «stokastiske papegøyen». Papegøyen kan bare gjenta det den har hørt. Men disse systemene er, på grunn av sin iboende «glemsomhet» og fokus på lokale mønstre snarere enn helheter, tvunget til å skape noe som er i samsvar med opplæringen, men ikke nødvendigvis en direkte kopi. De lager nye sanger basert på tonene de kjenner.
Så hva betyr det for oss? Kanskje puslespillet i vår egen kreativitet ikke er så annerledes. Hjernene våre er heller ikke perfekte harddisker som lagrer alle erfaringer med perfekt nøyaktighet. Vi glemmer, vi generaliserer, og vi kombinerer fragmenter av minner og kunnskap for å skape nye ideer. Kanskje er menneskelig kreativitet, i likhet med maskinkreativitet, et uunngåelig resultat av et system som er bygget for å finne mønstre i en kaotisk verden, selv når det ikke har alle brikkene i puslespillet. Det finnes ikke noe monster under sengen, men hvis vi kikker lenge nok inn i det skimrende mørket, vil vi få øye på det likevel.
Så neste gang du ser et KI-generert bilde av en ridende astronaut, kan det være verdt å tenke over. Det er ikke bare en smart papegøye; det er et glimt inn i en grunnleggende mekanisme som tvinger orden og innovasjon ut av støy. Og det er kanskje den mest presise definisjonen av kreativitet vi hittil har fått.
Kilder: Quanta Magazine, ACM Digtial Library
Les videre med LB+
Full tilgang 1 uke uten bindingstid!
Tilgang til ALT innhold i 1 UKE!
LB+ Total tilbud - Første mnd KUN 79,-
Tilgang til ALT LB+ innhold
LB+ total 12 måneder
Tilgang til ALT innhold i 12 måneder
- Tilgang til mer enn 7800 produkttester!
- Store rabatter hos våre samarbeidspartnere i LB+ Fordelsklubb
- Ukentlige nyhetsbrev med siste nytt
- L&B TechCast – en podcast av L&B
- Magsinet digitalt – ny utgave hver måned
- Deaktiver annonser
- L&B+ Video – bli med L&B redaksjonen behind the scenes, på de store tech-messene og mye mer!