Audiotechniek

De hedendaagse scene:

II. Datareductie

Als we MP3 en soortgelijke gimmicks vaarwel zeggen, missen we niets wezenlijks.
Sterker nog, we krijgen iets belangrijkers weer terug: CD-kwaliteit.

 

© Aart van der Wal, juni 2006

 

MP3, ofwel voluit MPEG1 layer III - heeft zich zonder enige twijfel inmiddels ontwikkeld tot de meest gebruikte en kwalitatief minst veelbelovende muziekdrager sinds de CD, en dan ook nog op wereldwijde schaal. Daarbij gaat het slechts om een ogenschijnlijk simpele gimmick: zoveel mogelijk muziek op zo weinig mogelijk (opslag)ruimte; en in het verlengde daarvan zo weinig mogelijk transmissietijd (voor downloading en uploading). Daarmee slaat MP3 twee grote vliegen in een klap en die combinatie werd een money maker van je welste.

Het draait om datareductie, niets meer en niets minder, wat een andere technische benadering vroeg dan de conventionele methode, die uitgaat van het bemonsteren van amplitudes, waarbij de precisie ervan wordt bepaald door het aantal bits om die amplitude vast te leggen. De bandbreedte (het 'geheugen') die het audiosignaal opsoupeert wordt door drie factoren bepaald: 1. het aantal genomen monsters per seconde (frequentie); 2. het aantal bits om de amplitude vast te leggen (de zogenaamde bit depth) en tenslotte de signaallengte (tijd). Op basis van deze drie gegevens komt de volgende rekenformule tot stand:

Geheugen = Frequentie x Bit Depth x Tijd (per kanaal)

Voor de 16 bit audio-CD - we lazen het al in deel I - is de bemonsteringsfrequentie 44.1 kHz. Als we nu bovenstaande formule hierop loslaten, dan is de uitkomst:

Geheugen (CD ) = 44.100 x 16 x 60 x 2 (kanalen, stereo) = 84.672.000 bits

ofwel iets meer dan 10 mb per minuut. Bij een symfonie met een speelduur van ongeveer een uur levert dat per saldo ruim 600 mb op. Als we dan naar de transmissiesnelheid van een standaardmodem (56 kb/s) kijken, neemt het zo'n klein halfuur in beslag om ca. 1 minuut muziek te downloaden. Voor de Eroica zou dit dus 25 uur vergen. Daar heeft niemand zin in, nog afgezien van het toenemende risico van signaalonderbrekingen gedurende die absurd lange periode. Met een goede adsl-verbinding moet minimaal met zo'n 2 uur worden gerekend, met de nadruk op minimaal, want de transmissiesnelheid is afhankelijk van de drukte op de lijnen en kan een fractie bedragen van hetgeen is gespecificeerd. In ieder geval mag bij zeer gunstige omstandigheden voor Wagners Götterdämmerung toch maar liefst een werkdag worden uitgetrokken. Kortom, er moest naar een andere oplossing worden gezocht en die kwam er in de vorm van MP3.

Een kwestie van algoritme

MP3 werd eind jaren tachtig in Duitsland ontwikkeld door het Fraunhofer Institut, dat ook de patenten van dat systeem in handen heeft. De oorspronkelijke opdracht was om een audiosysteem van hoge kwaliteit te ontwikkelen dat geschikt was om door het bestaande telefoonnetwerk te geleiden. Goed geluid door de telefoon dus. Met zijn bandbreedte van 2 x 64 kb/s in de duplex-modus leek ISDN bij uitstek geschikt te zijn als uitgangspunt voor een dergelijk audioconcept. Fraunhofer slaagde daarin met vlag en wimpel, maar de opdracht was dus niet om MP3 te ontwikkelen zoals dit nu wereldwijd op het gebied van de muziekweergave nu wordt toegepast!

MP3 ofwel MPEG-1 Layer III, maakt onderdeel uit van MPEG, ofwel voluit Moving Picture Coding Experts Group, die in het leven was geroepen om een standaard te ontwikkelen voor de gecodeerde uitgifte van speelfilms, documentaires en audio. Audio hoorde daar vanzelfsprekend bij, al was het alleen maar omdat een gecodeerde speelfilm zonder geluid natuurlijk niet kon. Bescheiden begonnen, groeide de MPEG-groep uit tot 350 deskundigen die niet minder dan 250 bedrijven en organisaties in 20 landen vertegenwoordigen. Daaruit volgt ook dat de partijen het al snel eens waren over een uniforme benadering en werkwijze en dus over de te hanteren wereldwijde standaard. Maar om te voorkomen dat eenieder in de ontwikkeling van MP3 zijns weegs ging op basis van eigen uitgangspunten, werd al snel een ISO-norm in het leven geroepen op basis van gemeenschappelijk geformuleerde directieven. Daarbij heeft het internet sterk bijgedragen aan de efficiënte werkwijze van de verschillende groepen binnen het MPEG-model: de technici worden in de gelegenheid gesteld hun bevindingen en voorstellen middels de ftp-site van MPEG eenvoudig uit te wisselen. Als er dan een bijeenkomst plaatstvindt, zijn de deelnemers (voornamelijk academici met een technische achtergrond) tevoren al goed geïnformeerd.

Wereldwijde normering

MP3 is onderdeel van MPEG, ofwel voluit Moving Picture Coding Experts Group, die in het leven werd geroepen om een standaard te ontwikkelen voor de gecodeerde uitgifte van speelfilms, documentaires en audio. Audio hoorde daar vanzelfsprekend bij, al was het alleen maar omdat een gecodeerde speelfilm zonder geluid natuurlijk niet kon. Bescheiden begonnen, groeide de MPEG-groep uit tot 350 deskundigen die niet minder dan 250 bedrijven en organisaties in 20 landen vertegenwoordigen. Daaruit volgt ook dat de partijen het al snel eens waren over een uniforme benadering en werkwijze en dus over de te hanteren wereldwijde standaard. Maar om te voorkomen dat eenieder in de ontwikkeling van MP3 zijns weegs ging op basis van eigen uitgangspunten, werd al snel een ISO-norm in het leven geroepen op basis van gemeenschappelijk geformuleerde directieven. Daarbij heeft het internet sterk bijgedragen aan de efficiënte werkwijze van de verschillende groepen binnen het MPEG-model: de technici worden in de gelegenheid gesteld hun bevindingen en voorstellen middels de ftp-site van MPEG eenvoudig uit te wisselen. Als er dan een bijeenkomst plaatstvindt, zijn de deelnemers (voornamelijk academici met een technische achtergrond) tevoren al goed geïnformeerd.

De MPEG-technologie heeft zich wereldwijd doorgezet en zich in vele media genesteld, zoals in de computer, CD-ROM, CD-I, Video-CD, DVD, DSS (Digital Satellite System), DAB (Digital Audio Broadcasting), DVB (Digital Video Broadcasting), ADR (Astra Digital Radio) en in vele kabelnetwerken. Omarmd door de industrie en de consumenten kon de MPEG-systemen een wereldwijde vlucht nemen, maar werd het ook een bron van auteursrechtschendingen en nieuwe vormen van illegaliteit.

Wie meer wil weten over onder andere de verschillende MPEG-coderingen (MPEG-1 t/m 4, 7) kan terecht op http://www2.sims.berkeley.edu/courses/is224/s99/GroupG/report1.html

Datacompressie of reductie kennen we natuurlijk al van Sony's ATRAC (speciaal ontwikkeld voor MiniDisc en waarvan de laatste versies geen hoorbaar verschil meer opleveren met de CD) en Philips' DCC (in schoonheid gestorven). Het doel is steeds om met behoud van de kwaliteit het datapakket te verkleinen. Ook de ontwikkeling ervan kent geen einde want binnen de gekozen standaard blijft er ruimte voor verbetering van het coderingsalgoritme (de encoder of ripper is, in tegenstelling tot de decoder [afspeler], niet gestandaardiseerd en laat ruimte voor verdere ontwikkeling).

Voor het Frauenhofer Institut liep het uiteindelijk niet zo fortuinlijk af. Men had daar weliswaar baanbrekend werk verricht en wetenschappelijk een prestatie van formaat geleverd, maar uiteindelijk besloten de snelle radio- en tv-jongens toch voor de MPEG Layer 2 standaard omdat die beter was en even gemakkelijk door de ISDN-lijnen kon worden gepompt, maar ook nog eens gemakkelijker bewerkt (editing) kon worden. Voor Frauenhofer was dit dermate een teleurstelling dat het bedrijf besloot om hun (niet versleutelde) encoder dan maar gratis op het internet te zetten. Wie ervan gebruik wilde maken kon zonder enige beperking zijn gang gaan. En dát gebeurde ook, eigenlijk tot ieders verrassing...

MP3 versus Ogg Vorbis

Daar was die dan de gratis encoder waarmee audiobestanden konden worden gecomprimeerd. En daarmee ging vooral de jeugd, met de industrie in zijn kielzog, bliksemsnel aan de slag, werden de tracks van de CD 's gecomprimeerd en via het internet naar vrienden en bekenden verzonden, om door hen vervolgens weer te worden gedecodeerd. Er ontstond een levendige 'ruilhandel', muziektracks vlogen door de datalijnen. MP3 werd aldus bijna spontaan de nieuwe standaard, waarbij de geluidskwaliteit het er niet zo toe deed. Want het kernbezwaar van MP3 was niet opgelost: de standaard was immers niet ontwikkeld voor hoogwaardige muziekweergave.

Er zijn aanmerkelijk betere coderingssystemen dan MP3 en die leveren dus ook een aanmerkelijk betere kwaliteit op, maar ze zijn in tegenstelling tot MP3 niet gratis, met voorop WMA (Microsoft, audio) en WMV (Microsoft, video), direct gevolgd door de vergelijkbare kwaliteit van MP2 (waarvan de broncode niet openbaar is gemaakt).

Ogg Vorbis is het veel betere antwoord en lijkt qua uitgangspunt op Linux, het gratis softwaresysteem dat de pendant is van de niet-gratis Microsoft Windows applicaties. Linux is - in tegenstelling tot Windows - gestoeld op een open broncode (dus voor iedereen vrij toegankelijk), en kan dus ook vrij worden gebruikt, gekopieerd, verspreid en desnoods ook individueel aangepast. Ogg is het formaat, Vorbis een component ervan (in dit geval de audiocomponent). Ook voor dit systeem geldt als uitgangspunt dat 'niet relevante' informatie wordt weggefilterd, maar de uitwerking ervan is fijnmaziger dan bij MP3. Bij een bitrate van 192 kb/s in samenhang met de variable bitrate kunt u zich verbazen over de goede kwaliteit van dit systeem, dat in kwalitatief opzicht MP3 achter zich laat en althans gehoormatig nog beter presteert dan WMA en MP2.

Op het internet zijn vele sites te vinden met diepgaande informatie over Ogg Vorbis. en laat u zich eens goed voorlichten over de mogelijkheden (met inbegrip van luistertests). Bedenk daarbij wel dat de afspeler het Ogg Vobis formaat moet ondersteunen!

De cd als referentiestandaard

Alvorens de CD en de daarvan afgeleide apparatuur konden worden geïntroduceerd moesten de partijen in het industriële complex het eens worden over de standaard. Die werd 16 bit. Iedere CD wordt aan de hand van die standaard geproduceerd en afgespeeld. Eenvoudig gezegd, voor het Compact Disc Digital Audio System (CDDA) geldt het Rode Boek als referentiestandaard, niets meer en niets minder (en dat is al met al toch al ingewikkeld genoeg). Die referentie komt in zijn meest eenvoudige vorm neer op de eerder al gegeven formule:

Bit rate = 44.100 (monsters) x 16 (bits) x 60 (seconden) x 2 (kanalen, stereo) = 84.672.000 bits, ofwel iets meer dan 10 mb per minuut.

De opslag van de data op de CD is verdeeld in sectoren van ieder 2352 bytes, 75 sectoren/s.

In de loop der tijd werden allerlei technische foefjes bedacht en geïntroduceerd om de audiokwaliteit van de CD op te vijzelen (denkt u maar aan Sony's Super Bit Mapping), maar aan de essentie van de standaard = 16 bit viel natuurlijk niet te tornen. Het komt er dus voor u en voor mij op neer dat de CD de hoogste referentiestandaard is voor muziekweergave in de huiskamer.

Allerlei publicaties door de audioindustrie, maar ook door individuele technici en audiojournalisten waren erop gericht om enerzijds het systeem zo goed mogelijk te verklaren en anderzijds verbeteringen in dat systeem toe te lichten, te motiveren. Na de introductie in het begin van de jaren tachtig kwamen er steeds betere CD-spelers op de markt en kwam ook de opnameindustrie met verbeteringen. De essentie van de CD als 16 bit fenomeen is evenwel - noodgedwongen - gebleven. Het bleek praktisch onmogelijk om naar een hoger aantal bits over te stappen, want dan zouden de consumenten hun speler aan de kant moeten doen en zouden ook in de muziekindustrie zelf nieuwe investeringen moeten worden gedaan. Dus: eens gekozen blijft gekozen. Dat het inmiddels vanuit natuurkundig perspectief zoveel beter kan heeft alleen theoretische betekenis. U kunt van mij aannemen dat een goed ontworpen 20 bit speler niet meer uit een CD kan halen dan 16 bits (maar dat zijn dan wèl 16 bits!).

In de derde aflevering: Roeien met de riemen...


index

Home  -  Actueel  -  Audio  -  Muziek  -  Video  -  Boeken  -  Links