Vid talbehandling är en kodbok en strukturerad samling av representativa talenheter eller funktioner. Dessa enheter kan variera beroende på den specifika applikationen och vilken typ av talbehandling som utförs. De är i huvudsak en ordbok över "byggstenar" som används för att representera och manipulera talsignaler.
Här är en uppdelning av hur kodböcker används i olika sammanhang:
* vektorkvantisering (VQ): Detta är den vanligaste tillämpningen. I VQ innehåller en kodbok en uppsättning vektorer (som ofta representerar spektrala funktioner som mel-frekvens cepstral-koefficienter-MFCC). Dessa vektorer representerar olika "prototyper" av talljud. Under kodning jämförs en inkommande talfunktionsvektor med vektorerna i kodboken, och den närmaste matchande vektorns index används som en komprimerad representation av det ursprungliga talet. Under avkodning används detta index för att hämta motsvarande vektor från kodboken och rekonstruera en tillnärmning av det ursprungliga talet. Målet är att uppnå effektiv komprimering samtidigt som man upprätthåller acceptabel talkvalitet.
* dolda Markov -modeller (HMMS): Kodböcker används ibland inom HMMS för taligenkänning. Varje tillstånd i en HMM kan ha en tillhörande kodbok som representerar de akustiska funktionerna som sannolikt kommer att observeras i det tillståndet. Sannolikheterna för att observera specifika kodbokvektorer används sedan under avkodningsprocessen för att bestämma den mest troliga sekvensen av HMM -tillstånd (och därmed de erkända orden).
* Högtalarigenkänning/verifiering: Kodböcker kan lagra högtalarespecifika funktioner. Till exempel kan en kodbok representera de typiska spektrala egenskaperna hos en viss högtalares röst. Denna kodbok kan sedan användas för att jämföra med en okänd talares röst för att avgöra om det är en match.
I huvudsak ger en kodbok en kvantiserad, kompakt representation av det potentiellt stora utrymmet för möjliga talljud eller högtalaregenskaper, vilket möjliggör effektiv lagring, överföring och bearbetning av taldata. Kvaliteten på talbehandling beror starkt på kvaliteten och designen på kodboken, som ofta involverar träningsalgoritmer för att skapa effektiva representationer.