Audiocompressie


Algemeen
2BGM: TVstudiotechnieken / 2007_2008 / Laatste aanpassing op 2008-05-24.
Door ziekte was dit de enige les die ik heb gemist. Net als bij
videocompressie zou ik even een bevestiging wensen of ik het algemeen
principe snap:

We delen bij audiocompressie het frequentiespectrum op in meerdere banden
waarna er wordt berekend wat het maximale niveau is waar ruis mag komen te
liggen en toch nog gemaskeerd wordt. Daarna wordt de resolutie verlaagd
tot op het niveau dat de ruis nog steeds gemaskeerd wordt. Na toepassing
van dit 'perceptual model' kan er nog een extra Huffmancoding, toevoeging
van metadata, etc. worden toegepast.

Inderdaad.

Ik had graag ook beter geweten wat 'resolutie' bij audio betekent?

Resolutie: De quantiserinsstappen bij het digitaliseren, maw het aantal bits
dat gebruikt wordt om een audiosample weer te geven.


Dolby E
2BGM: TVstudiotechnieken / 2007_2008 / Laatste aanpassing op 2008-05-24.
Dolby digital (AC3) ondervindt een zeker aantal problemen: sterke
compressie met sterke ruis bij verdere bewerking, lange encoding en
probleem in montage door een verschillende packet size dan video. Met dit
in het achterhoofd is dolby E ontstaan. Maar waar wordt Dolby E dan écht
concreet voor gebruikt? Is dat in post-productie omgevingen, tussenstap
naar broadcast?

Dolby E wordt gebruikt om 5.1 audio op te slaan op tape, harde schijf en servers,
maar niet tijdens de post-productie. Het is het 5.1 audioformaat zoals de TVstations
het krijgen bij de aankoop van fims, ...


DTS
2BGM: TVstudiotechnieken / 2005_2006 / Laatste aanpassing op 2006-06-25.
en dan nog een laatste vraagje op p 253) DTS encodering. Een belangrijk onderdeel hieruit is de subband adaptive differential encoding. het is de stap die het tweede niveau aan decorellatie doet . Hier haak ik af. Een gecorreleerd signaal moeten we toch niet decorelleren? Ik zal wel gewoon fout zitten wat 'decorellatie' betreft op zich'
Een willekeurig signaal bevat een eenvoudig te coderen gedeelte (het gecorreleerd gedeelte) en 'de overschot'.† Om deze 'overschot' te vinden moet het gecorreleerd gedeelte van het originele signaal worden afgetrokken.


Generaties
2BGM: TVstudiotechnieken / 2005_2006 / Laatste aanpassing op 2006-09-23.
blz. 238, Dolby E: wat bedoelt u met 10 encoding/decoding cycles? Zijn dit
10 generaties van compressie, decompressie en opnieuw compressie?
Ja


look-ahead delay
2BGM: TVstudiotechnieken / 2005_2006 / Laatste aanpassing op 2006-09-23.
blz. 238: bedoelt u met 'look-ahead delay voor dynamic block switching' de
vertraging die ontstaat door het vooraf analyseren van het signaal om
transiŽnten te vinden, waar men dan de frequentieresolutie (met dynamische
filters) verlaagt om zo een preciezere tijdsresolutie te krijgen (en o.a.
pre-echo te vermijden)?
Ja, look-ahead wil dus zeggen bekijken wat er gaat komen.† Omdat†het niet mogelijk is te voorspellen wat er gaat gebeuren, kan je dat wel simuleren door nu te zien wat er nu is, en pas iets later de echte codering te doen.


MP3 - bitrate uncompressed audio
2BGM: TVstudiotechnieken / 2005_2006 / Laatste aanpassing op 2006-06-25.
> In het blokschema van de mp3 encoder staat een input van 168 kbps. Moet 
> dat geen gewone PCM zijn ŗ 1,4 Gbps?
Inderdaad, dat is gewone PCM, maar aan ongeveer 1,4 tot 1,92 Mb /sec voor een stereosignaal, afhankelijk van de samplefrequentie (44.1, 48 kHz) en het aantal bits (16, 20)

Psycho-akoestisch model
2BGM: TVstudiotechnieken / 2005_2006 / Laatste aanpassing op 2006-09-23.

-)Bij audiocompressie hebben we ook het psycho-akoestisch model. Wat doet dit eigenlijk want de dit word niet echt vermeld in de uitleg hierover op pagina 234.

Met het psycho-akoestisch model wordt bedoeld dat er rekening wordt gehouden met hoe de hersenen ( de menselijke interpretatie, psycho) de klanken (akoestich) waarnemen, interpreteren.



temporal spread
2BGM: TVstudiotechnieken / 2005_2006 / Laatste aanpassing op 2006-09-23.
blz. 237 bij temporal noise shaping (AAC): wat is 'temporal spread'?
Dat is de verspreiding in de tijd van de geluidssampels.  Na de codering kan het immers zijn dat de audiosampels iets naar voor achter geplaatst worden.