Perceptuellt baserad komprimering för ljuddata utnyttjar begränsningarna för mänsklig hörsel för att minska storleken på ljudfiler utan att påverka upplevd kvalitet. Istället för att helt enkelt kassera data enhetligt, tar den på ett intelligent sätt bort eller minskar information som troligtvis inte kommer att märkas av lyssnaren. Detta uppnås genom flera viktiga strategier:
* maskering: Detta är kärnprincipen. Det förlitar sig på det faktum att våra öron är mindre känsliga för tystare ljud när högre ljud finns samtidigt. Högre ljud "mask" tystare. Perceptuellt baserade codecs identifierar frekvenser maskerade av högre och antingen reducerar deras bitrate eller eliminerar dem helt. Detta är särskilt effektivt för att minska de data som behövs för högfrekventa komponenter, som ofta maskeras av lägre frekvenser.
* kvantisering: Detta innebär att minska ljuddataens precision. Istället för att representera varje prov med ett mycket stort antal bitar, använder perceptuellt baserade codecs färre bitar, särskilt för mindre perceptuellt viktiga delar av signalen. Kvantiseringsbruset som introduceras maskeras ofta av högre ljud.
* psykoakustiska modeller: Det här är matematiska modeller som simulerar det mänskliga hörsystemet. De förutspår vilka delar av ljudsignalen som troligtvis är maskerade och kan därför komprimeras mer aggressivt. Olika modeller finns med olika nivåer av komplexitet och noggrannhet.
* Frekvensdomänbehandling: Många perceptuellt baserade codecs fungerar i frekvensdomänen (med hjälp av transformer som den diskreta kosinustransform eller modifierad diskret kosinus transform), vilket gör identifierande och manipulering av maskerade frekvenser mycket enklare.
Exempel på codecs med perceptuellt baserad komprimering:
* mp3: Ett allmänt använt exempel. Det är relativt effektivt men kan införa märkbara artefakter med mycket höga kompressionsförhållanden.
* AAC (avancerad ljudkodning): Allmänt anses ge bättre kvalitet än MP3 på samma bitrate.
* opus: En mer modern codec utformad för både ljud och tal som erbjuder hög kvalitet på låga bitrater.
* vorbis: En annan öppen källkodek som är känd för sin goda kvalitet och effektiva komprimering.
Begränsningar:
Även om det är mycket effektivt, är det inte perfekt, perceptuellt baserad komprimering. Vid mycket höga kompressionsförhållanden kan artefakter bli märkbara, särskilt som väsande, surrande eller lerighet i ljudet. Kvaliteten på kompressionen beror också starkt på komplexiteten i den psykoakustiska modellen som används och implementeringen av Codec.
Sammanfattningsvis minskar perceptuellt baserade ljudkomprimering dramatiskt filstorlekar genom att utnyttja begränsningarna av mänsklig hörsel, vilket ger en god balans mellan datareduktion och upplevd ljudkvalitet. Framgången ligger i dess förmåga att på ett intelligent sätt kassera eller minska information som är mindre benägna att uppfattas av lyssnaren.