Mens vi har vært opptatt med å diskutere om kunstig intelligens kommer til å stjele jobbene våre eller bare har blitt usedvanlig god til å rime, har en gruppe forskere i all stillhet avdekket hva som egentlig foregår under den digitale motorvognen. Svaret er ikke bare relevant for maskiner, det kan også avsløre noe om hvordan kreativitet oppstår i oss alle.

Det siste året har det vært nesten umulig å åpne en nettavis uten å bli møtt av nok et bilde skapt av en kunstig intelligens. En astronaut på en hest i fotorealistisk stil. En katt malt som en van Gogh. Fantasien, eller i det minste maskinens evne til å kombinere konsepter, ser ut til å være grenseløs.

Men hvor kommer denne «kreativiteten» fra? Er maskinen virkelig kreativ, eller er den bare det noen kritiske forskere har kalt en stokastisk papegøye – en avansert mimiker som bare blander og matcher de milliarder av bilder den har blitt matet med, uten noen reell innovasjon?

Les også Nyhet: Disney og Universal kaller Midjourney «et bunnløst hull av plagiat» Filmbransjen krever at KI-selskapet setter en stopper for bruken av opphavsrettsbeskyttet materiale.

En ny studie, publisert i det anerkjente tidsskriftet Quanta Magazine, tyder på at sannheten er langt mer subtil. Kreativitet er ikke noe du spesifikt programmerer inn i disse bildegeneratorene. I stedet ser det ut til å være et uunngåelig biprodukt av selve arkitekturen. Et slags lykkelig uhell som er bygget inn i systemets DNA… unnskyld: kode!

Makulerte malerier

For å forstå oppdagelsen må vi se på hvordan en moderne bildegenerator, en såkalt diffusjonsmodell, faktisk fungerer. En diffusjonsmodell starter med å forvandle et hvilket som helst bilde til ren digital støy – som et maleri som kjøres gjennom en makuleringsmaskin til det bare er fint støv igjen.

Annonse

Innebygde begrensninger gjør generativ KI mer kreativ 1 — Når den generative KI-en skaper bilder, gjør den det ved å sette sammen bildet bit for bit etter en guide (Illustrasjon: Midjourney AI)

Så begynner KI-en å samle støv igjen. Den jobber ikke i blinde, men får en «monteringsveiledning» i form av tekstbeskrivelsen man gir den, for eksempel «en astronaut på en hest». For hvert lille, nitidige trinn der modellen fjerner noe av støyen, rådfører den seg med guiden sin og vurderer hvilken justering som mest sannsynlig vil bringe den nærmere et resultat som både ligner et gjenkjennelig bilde og stemmer overens med den ønskede scenen. Det er i denne guidede gjenskapingsprosessen at magien skjer.

Frem til nå har visse deler av denne prosessen blitt betraktet som tekniske begrensninger. For eksempel er systemet bygget for å fokusere på små deler av bildet om gangen, nesten som en kunstner som bare kan se en liten del av lerretet sitt. Samtidig er det en innebygd regel om at hvis du flytter inndataene litt – for eksempel ved å flytte et ansikt noen piksler til venstre – vil systemet automatisk gjøre den samme forskyvningen i det endelige bildet.

Les også Nyhet: KI-bot slettet bedriftens database Jeg gjorde en katastrofal feilvurdering, sa Botten etter å ha blitt pågrepet.

Disse reglene ble sett på som tekniske finurligheter som hindret maskinen i å lage perfekte kopier. De ble ikke forbundet med kreativitet, som ble ansett for å være en mer opphøyet, nesten mystisk egenskap. Men her tok de feil.

Den uunngåelige kreativiteten

Den nye forskningen viser at nettopp de mekanismene som begrenser modellens syn og tvinger den til å arbeide lokalt, er selve kilden til dens kreativitet. Fordi systemet tvinges til å gjenskape bildet ut fra bruddstykker og generelle regler – i stedet for å ha et perfekt minne om originalen – må det generalisere og improvisere.

Det er som å be en musiker om å gjenskape en symfoni etter å ha hørt bare små, usammenhengende bruddstykker. Musikeren ville bli tvunget til å fylle ut hullene basert på sin forståelse av musikalske regler og harmonier. Resultatet ville ikke bli en perfekt kopi, men en nytolkning – en kreativ handling.

Forskerne har for første gang formulert dette matematisk. De har vist hvordan den tilsynelatende kreativiteten er en deterministisk prosess – en direkte og forutsigbar konsekvens av måten systemet er bygget opp på. Det er ikke tilfeldig magi, men en logisk konsekvens av arkitekturen.

Det er ikke noe monster under sengen, men hvis vi kikker lenge nok inn i det skimrende mørket, vil vi få øye på det likevel.

Dette utfordrer direkte ideen om den «stokastiske papegøyen». Papegøyen kan bare gjenta det den har hørt. Men disse systemene er, på grunn av sin iboende «glemsomhet» og fokus på lokale mønstre snarere enn helheter, tvunget til å skape noe som er i samsvar med opplæringen, men ikke nødvendigvis en direkte kopi. De lager nye sanger basert på tonene de kjenner.

Les også Nyhet: Mørke mystiske ritualer var bare spilleregler Da kunstig intelligens begynte å lese opp blodige besvergelser, var det en mer jordnær og nerdete forklaring.

Så hva betyr det for oss? Kanskje puslespillet i vår egen kreativitet ikke er så annerledes. Hjernene våre er heller ikke perfekte harddisker som lagrer alle erfaringer med perfekt nøyaktighet. Vi glemmer, vi generaliserer, og vi kombinerer fragmenter av minner og kunnskap for å skape nye ideer. Kanskje er menneskelig kreativitet, i likhet med maskinkreativitet, et uunngåelig resultat av et system som er bygget for å finne mønstre i en kaotisk verden, selv når det ikke har alle brikkene i puslespillet. Det finnes ikke noe monster under sengen, men hvis vi kikker lenge nok inn i det skimrende mørket, vil vi få øye på det likevel.

Så neste gang du ser et KI-generert bilde av en ridende astronaut, kan det være verdt å tenke over. Det er ikke bare en smart papegøye; det er et glimt inn i en grunnleggende mekanisme som tvinger orden og innovasjon ut av støy. Og det er kanskje den mest presise definisjonen av kreativitet vi hittil har fått.

Kilder: Quanta Magazine, ACM Digtial Library

John Hvidlykke

(f. 1964): Journalist og tester. John har arbeidet for Lyd & Bilde siden 2013, hvor han skriver om hi-fi, høyttalere, computere, gaming og teknologihistorie. John har beskjeftiget seg med teknologijournalistikk siden 1982(!), og har arbeidet for tallrike magasiner i forskjellige roller; blant annet GEAR, High Fidelity, Komputer for alle, Illustreret Videnskab, Ny Elektronik, PC World og Privat Computer. Han har dessuten skrevet tallrike bøker og undervisningsprogrammer om IT.

Nyhet

Innebygde begrensninger gjør generativ KI mer kreativ

Makulerte malerier

Den uunngåelige kreativiteten

Legg igjen en kommentar Avbryt svar

Les videre med LB+

Full tilgang 1 uke uten bindingstid!

Tilbud - 4 uker 4,-

LB+ total 12 måneder

Googles nye KI kan lese håndskrevne oppskrifter og planlegge reisen din

OpenAIs strømregning blir større enn Indias

Den eksistensielle frykten av å være en støvsuger

Barbie Girl saksøker Suno

Kina kaster servere i havet

Kan husholdningsroboten forbedre hverdagen?

OpenAI prøver seg på musikkskaping

Nike lager robotsneakers

Tre som er sterkere enn stål

OpenAI utfordrer Chrome med ny KI-nettleser

"Halve internett" er nede - slik rammes du av Amazon-feil

Isende favoritt i jakten på liv i verdensrommet

Hold deg oppdatert!