annonse
annonse
annonse

Fra studiolyd til MP3

Slik ødelegges lyden

Visste du at lydkvaliteten på musikk som i utgangspunktet er fantastisk, i dag ødelegges på vei til forbrukeren? MP3 har skylda!

annonse

Når en musiker spiller inn musikken sin i studio, så er det med ett mål for øyet: at musikken skal formidles så godt som overhode mulig. Å formidle gnisten man har der og da, gjennom musikk. Når selve spillejobben er gjort, settes hodene sammen med produsent og teknikere for å skape det ønskelige lydbildet. Og enten lyden er skrudd på den ene eller andre måten; skitten og rå eller oppløst og luftig, så er det nettopp det lydbildet musikkforbrukerne fortjener å få servert. Til tross for at teknologien i dag er langt foran hva den var for bare få år siden, later det til at lydkvaliteten forbrukerne opplever har blitt dramatisk dårligere siden 70-, 80- og spesielt 90-tallet. Og det til tross for at tilgjengelig utstyr for både innspilling og avspilling både er bedre og billigere.

Fra innspilling til avspilling
Selv når opptaks- og lydteknikerne har gjort sitt beste med en innspilling, og innspillingen har Drømmelyden med stor D, så er ikke ferden over med dette. Innspillingen, som nå er redusert fra 24 til 2 spor, skal til mastering. Dette er den siste finslipingen, som gjør at musikken låter mindre rå og mer glatt. Den dynamiske kontrasten i musikken reduseres, for at musikken skal kunne spilles på et mindre lydanlegg.

Populære lydformater og bitstrøm

  • MP3 – 192-320 kbps
  • CD – 1411 kbps
  • 24-bit/96kHz – 4608 kbps
  • 24-bit/192kHz  – 9216 kbps

Til konsumentformat
Hvis vi nå går ut fra at nevnte masteringprosess går skikkelig for seg og faktisk gagner musikken i stedet for å ødelegge den med overkompresjon og ”brickwall limiting” (les om lydnivåkrigen her), skal lyden enda videre i signalkjeden. Fremdeles er musikken lagret med høy oppløsning, gjerne høyere enn CD-kvalitet. Men herfra skal den skaleres ned til konsumentvennlige formater. På 1970- og 1980-tallet var det snakk om LP-er og musikkassetter. På 1990-tallet og det påfølgende tiåret var CD-ene mest utbredt.

MP3
I dag er MP3 sammen med sine mange slektninger det mest brukte musikkformatet for konsumenter. Et format utviklet på 1990-tallet for å gjøre deling av musikk på internett praktisk. Det dreier seg om å komprimere ned musikken til å ta rundt en tiendedel av plassen, slik at den opptar mindre plass på harddisken og ikke mer båndbredde enn at det på den tiden faktisk var mulig å sende den rundt omkring. Internett var ikke raskt på den tiden, og lagringsplass var dyrt. Både hva internettservere og PC-harddisker gjaldt. Derfor var det rett og slett ikke praktisk å lagre i full oppløsning, uten kompresjon.

Selv om vi i dag har store nok harddisker og god nok båndbredde til å håndtere musikken i full CD-kvalitet, blir dette lite gjort.

Hva mister du?
Så hva mister du når musikken komprimeres fra studiokvalitet til MP3? Vel, dersom det tas hensyn i alle ledd, og maksimal datastrøm brukes, som er 320 kilobit pr. sekund (kbps), kan den subjektive opplevelsen av lydkvaliteten faktisk være riktig så god, og i noen tilfeller vanskelig å skille fra CD-kvalitet. Men noe er nødvendigvis forsvunnet på veien. Til sammenligning dreier ekte CD-kvalitet seg om en datastrøm på 1411 kilobit pr. sekund, eller nesten 5 ganger høyere. Du kan ikke uten videre fjerne 80 prosent av lyddataene og sitte igjen med full kvalitet. Men du kan komme så nært at mange ikke reagerer. Men det slurves mye.

Oppløsning
Den vanligste måten å ødelegge lyden på, er ved å ikke bruke høy nok datastrøm. MP3 med datastrøm på 192 kbps eller lavere er rett og slett for dårlig, og spesielt i overtoneområdet hører man artefakter. En ting er toner som er borte, men noe helt annet er uønskede toner som sniker seg med – og som ikke harmonerer med de andre. MP3-filer med lav datastrøm har for mye forvrengning til at det kan godkjennes som et skikkelig musikkformat. God lydkvalitet starter først ved 256 kbps, og helst bør man opp i det maksimalt tillatte for MP3-kodeken, nemlig 320 kbps. Da kan musikken i praksis låte ganske så bra, og det blir viktigere hvordan selve innspillingen er gjort, og at den ikke er knust i mastering som følge av lydnivåkrigen.

Transkoding
Det største sviket som blir gjort, er at musikken ofte kan lagres i ett komprimert format, for så å bli kodet om til et nytt. Fordi platebransjen og butikkene ikke har blitt enige om rammer og standarder, har plateselskapene gjerne funnet på å sende komprimerte MP3-filer av sine utgivelser til strømmetjenester og online-butikker. Dette er tjenester og butikker som allerede har valgt seg et format og en oppløsning å tilby musikken i. For eksempel bruker Wimp AAC-formatet, mens Spotify bruker Ogg Vorbis. Om de mottar musikken i MP3 i en gitt oppløsning, må disse filene så pakkes opp, for så å kodes på nytt i det nye formatet. Dette kalles transkoding. Og det er da moroa starter. I en MP3-fil er nemlig alt fjernet som er mulig å fjerne, uten at det skal høres. Det tas hensyn til psykoakustikk, slik at man kan fjerne toner som hjernen så vil gjenskape ut ifra andre harmoniske toner. Men siden ulike kodeker velger litt ulike variabler på det samme problemet, vil artefakter bli hørbare ved at det fjernes for mye og ødelegger den psykoakustiske rekonstruksjonen.

MP3 for PC og bærbart
Selv er jeg av den klare oppfatningen at MP3 og andre musikkformater med datatap, egner seg best til å spilles av gjennom PC-høyttalere og på farten med en bærbar musikkspiller. Gjort skikkelig kan den likevel fint spilles på stereoanlegget, men spesielt dersom du lytter lenge over tid, vil du kunne merke at lyttetrettheten melder seg tidligere med MP3 enn om du spiller med CD. Det har å gjøre med at det både trekkes fra og legges til noe i lydbildet som gjør at det endelige resultatet ikke er like ørevennlig over tid. For lengre tids lytting til et godt stereoanlegg, vil jeg klart anbefale høyere oppløsning.

Wimp tar grep
Strømmetjenesten Wimp er den første til å adressere problemet med redusert lydkvalitet. De har til nå hatt AAC i 256 kbps som høyeste oppløsning. Denne har nå økt til 320 kbps. Men enda viktigere er at de nå har ryddet opp i transkodet musikk i katalogen.

– Hele backkatalogen er i ferd med å leveres inn til oss på nytt, i tapsfritt format, hvorpå vi lagrer det tapsfritt i FLAC-lydformatet, sa Pål Bråtelund i en samtale vi hadde med ham i februar.

Med andre ord finnes det ikke lenger musikk i Wimp-tjenesten som i utgangspunktet var lagret som MP3 og som så har blitt kodet på nytt til AAC.

I tillegg til å øke datastrømmen og rydde opp i biblioteket, vil Wimp på sikt lansere et abonnement for puristene, med ren FLAC-kvalitet. FLAC er et lydformat som komprimerer dataene, men på en slik måte at det ikke går utover lydkvaliteten. Når dataene pakkes ut igjen, er de helt intakt, det kan sammenlignes med musikkens svar på ZIP-filer.

Apple viser vei
Apple har også vist at de bryr seg om lydkvalitet. For en tid tilbake lanserte de konseptet Mastered For iTunes. Lydformatet her er det samme som annen musikk man kjøper på iTunes, nemlig AAC i 256 kbps. Men forskjellen ligger i at musikkselskapene og artistene har fått helt konkrete retningslinjer å holde seg til, både når det gjelder et minimum av dynamikkområde på innspillingen, i tillegg til at den må leveres til iTunes i 24-bit/96kHz oppløsning. Garantert ingen transkoding her, og man kan regne med det bare er et tidsspørsmål før Apple trykker på en knapp og tilbyr musikken til nedlasting i full 24-bit/96kHz oppløsning.

Høyoppløste musikktjenester
Utvalget av høyoppløst musikk er også i ferd med å bli større. Tjenester som gubemusic.com og hdtracks.com tilbyr stadig bredere utvalg av musikk i CD-kvalitet eller enda bedre. Mange utgivelser er tilgjengelige helt opp i 24-bit/192kHz oppløsning, som ukomprimert har 6,5 ganger høyere datastrøm enn CD (16-bit/44,1kHz). Man kan likevel ikke si at det er 6,5 ganger bedre lyd, da de subjektive forskjellene er marginale. Faktisk er det to leirer her: de som mener det ikke er forskjell på CD og enda høyere oppløsning, og de som mener det er. Selv tilhører jeg den siste gruppen (klikk her for å lese mer om disputten på Wikipedia, på engelsk).

Høyere oppløsning gir ingen wow-opplevelse med én gang, selve klangstrukturen i lydbildet er veldig lik. Men det oppleves som mer organisk, man får mer ro over seg, kanskje fordi hjernen ikke jobber like mye med å rekonstruere delene av lydbildet som er borte. Og man trenger ikke et dyrt high-end-anlegg for å høre det. Selv ganske billige stereoanlegg kan låte overraskende bra om de fôres med god lyd. Inntil videre er høyoppløst musikk upraktisk til strømming, selv komprimert til tapsfrie formater (FLAC eller ALAC) snakker vi rundt 4 ganger større datastrøm enn CD. Men den som liker å ha musikken lagret på harddisk, bør vite å benytte seg av denne muligheten.

Bransjen endrer seg
Det ser ut til at ting er i ferd med å endre seg til det positive, etter at lydkvaliteten har lidd under hummer-og-kanari-politikk siden MP3-formatet ble allemannseie på slutten av 90-tallet.

I takt med at strømmetjenestene er i ferd med å tilby høyere oppløsning på musikken sin, innarbeides det også normer for å få bukt med lydnivåkrigen, også kjent som The Loudness War. Blant annet ved at musikktjenestene implementerer såkalt Normalized Level Control. Det betyr at både gjennomsnittslydnivå og maksimalt lydnivå i hver fil leses av, hvorpå hver sang deretter går gjennom en enkel volumkontroll, slik at Abba og Rihanna låter like kraftig til tross for at Rihanna er mye kraftigere analogt komprimert og derfor burde låte høyere. Dette gjør at fordelene med å overkomprimere musikken sin bortfaller, slik at man igjen kan konsentrere seg om å lage så bra lyd så mulig i stedet for så høy lyd som mulig. Det blir med andre ord en spennende tid i møte for lydkvalitet!

Illustrasjon av en musikkfil  

Sang: ”Baby Loves that Way” av David Bowie

WAV (David Bowie - Babie Loves that Way)

Ukomprimert WAV-fil
Hele musikkens frekvensområde opp
til 20 kHz er med.

MP3 – 320 kbpsFrekvenser mellom 16 kHz og 20 kHz er for det meste kuttet bort. Bare tidvis dukker de opp, vi kan anta at komprimeringen prioriterer dette området kun ved høyfrekvente transienter, som anslag på cymbal, hi-hat, etc. De fleste voksne mennesker sliter med å høre stort over 16 kHz, så i praksis er ikke dette et stort problem.

MP3 – 320 kbps
Frekvenser mellom 16 kHz og 20 kHz er for det meste kuttet bort. Bare tidvis dukker de opp, vi kan anta at komprimeringen prioriterer dette området kun ved høyfrekvente transienter, som anslag på cymbal, hi-hat, etc. De fleste voksne mennesker sliter med å høre stort over 16 kHz, så i praksis er ikke dette et stort problem.

10 sekunder i 320 KBPS Et 10 sekunders utdrag av sangen ”Baby Loves that Way” av David Bowie viser at informasjonen under 16 kHz er godt bevart.

10 sekunder i 320 KBPS
Et 10 sekunders utdrag av sangen ”Baby Loves that Way” av David Bowie viser at informasjonen under 16 kHz er godt bevart.

MP3 – 192 kbps Enda mindre informasjon over 16 kHz enn med 320 kbps. Et annet problem som ikke synes i dette bildet, er drop-outs i lavere frekvenser.

MP3 – 192 kbps
Enda mindre informasjon over 16 kHz enn med 320 kbps. Et annet problem som ikke synes i dette bildet, er drop-outs i lavere frekvenser.

10 sekunder i 192 KBPS Samme 10 sekunders utdrag viser at musikkfilen har ”svarte hull” i det hørbare frekvensområdet.

10 sekunder i 192 KBPS
Samme 10 sekunders utdrag viser at musikkfilen har ”svarte hull” i det hørbare frekvensområdet.

 

Uformell blindtest

I forsøk på å konstatere forskjeller mellom tapskomprimert musikk og ekte, har vi i redaksjonen lyttet til Wimp, Spotify, CD-kvalitet og høyoppløst.

Kilden var MacBook Pro, optisk koblet til Hegel HD11, deretter Hegel P30 forforsterker og to H30 monoforsterkere. Høyttalerne var Elac FS 407. Pris rundt 230.000 kroner uten kabler. For anledningen noen helt greie fra Monster Cable. Lasse Svendsen og Audun Hage satt i lyttepanelet, mens undertegnede styrte musikken: Tori Amos’ ”Gold Dust” fra Wimp (320 kbps AAC), Spotify (320 kbps Ogg) og fra 24-bit/96kHz ukomprimert. Ane Bruns ”It All Starts With One” fra Wimp, Spotify og 16-bit/44,1kHz ukomprimert. Trondheimsolistenes ”In Folk Style” fra Wimp, Spotify og 24-bit/96kHz ukomprimert.

Forskjellene var små. Tori Amos ble best likt fra Spotify, mens all annen musikk ble foretrukket fra Wimp og ukomprimert. Klassisk musikk av Trondheimsolistene låt klart best høyoppløst. Med Ane Brun kunne man ikke sikkert skille Wimp fra ukomprimert. Gjennomgående ble Spotify oppfattet som litt mer punchy, men med mindre dybde i lydbildet. Derimot var det svært vanskelig å skille mellom Wimp og ukomprimert.

Blindtesten påpeker kun at det er vanskelig å høre forskjell når man skifter frem og tilbake over kortere perioder, og sier ingenting om forskjeller som avdukes over lengre tid med lytting.

Les hele blindtesten her

 

annonse
annonse
annonse
annonse