Å la KI-modeller trene seg opp på eksisterende musikk og deretter skrive helt nye sanger er ikke noe nytt. Eller å kopiere og etterligne artisters musikk. Men Nvidias KI Fugatto skaper i stedet lyder som aldri har eksistert før.
Selv om den ikke er offentlig tilgjengelig ennå, har de lagt ut en nettside full av eksempler. Hva med for eksempel å høre lyden av saksofoner som bjeffer som hunder, folk som faktisk snakker under vann, eller ambulansesirener som synger i kor?
Fugatto ble skapt for å prøve å skape «et meningsfullt forhold mellom språk og lyd». Å snakke med en chatbot er én ting, men hvordan beskriver man egentlig lyder med ord?
Forskerne har latt en stor språkmodell lage Python-skript som beskriver ulike lydkilders natur, for eksempel «en ung arbeidende mann» eller «generer en glad stemme». Og så har du mulighet til å påvirke resultatet ved å «gjøre stemmen gladere».
Ved å skape en stor database med nøyaktig beskrevne lyder kan de nå la Fugatto bruke den til å finne opp helt nye, fiktive lyder. Kanskje er dette veien videre for KI til å skape noe helt nytt i stedet for å etterligne noe eksisterende.
Les mer på Nvidias blogg
Les videre med LB+
Juletilbud - 50% Rabatt!
50% På LB+ Total i 1 år! (Spar 925,-)
Prøv LB+Total i 1 måned
Tilgang til ALT innhold i 1 måned for kun 79,-
LB+ Total 12 mnd / 156,-
Tilgang til ALT innhold i 12 måneder
- Tilgang til mer enn 7500 produkttester!
- Store rabatter hos våre samarbeidspartnere i LB+ Fordelsklubb
- Ukentlige nyhetsbrev med siste nytt
- L&B TechCast – en podcast av L&B
- Deaktiver annonser