Filkomprimering påverkar TXT -filer (vanlig textfiler) genom att minska deras storlek. Detta uppnås genom att utnyttja uppsägningar och mönster inom textdata. Olika kompressionsalgoritmer uppnår detta på olika sätt, men den allmänna principen förblir densamma:
* Förlustfri komprimering: Detta är den vanligaste typen som används för TXT -filer. Förlustfria kompressionsalgoritmer garanterar att den ursprungliga texten kommer att rekonstrueras perfekt efter dekomprimering. De fungerar genom att identifiera upprepande mönster, sekvenser av tecken eller annan förutsägbar data och ersätta dem med kortare koder. Exempel inkluderar:
* lz77/lz78 och deras derivat (t.ex. zip, gzip, 7z): Dessa algoritmer hittar upprepande sekvenser och ersätter dem med pekare till tidigare händelser, vilket effektivt minskar redundansen.
* huffman kodning: Denna algoritm tilldelar kortare koder till mer frekventa tecken och längre koder till mindre frekventa sådana, vilket minskar den totala storleken.
* bzip2: Denna algoritm använder en hålhjulingstransformation för att ordna om data innan man applicerar Huffman-kodning, vilket resulterar i högre kompressionsförhållanden.
* Lossy Compression: Denna typ av komprimering används * inte * vanligtvis för TXT -filer. Förlust av kompressionstekniker kastar viss information för att uppnå minskning av större storlek. Eftersom kassering av information i en textfil skulle förändra dess betydelse är detta inte praktiskt. Exempel på förlustkompression (som är olämpliga för TXT) inkluderar JPEG för bilder och MP3 för ljud.
Hur mycket kompression uppnås?
Mängden komprimering som uppnås på en TXT -fil beror på flera faktorer:
* Storleken på den ursprungliga filen: Större filer har i allmänhet fler möjligheter till redundans, vilket möjliggör högre kompressionsförhållanden.
* Innehållet i filen: Mycket repetitiv text, till exempel kod med upprepade block eller ett dokument med många upprepade fraser, kommer att komprimera bättre än mycket slumpmässig text (som en verkligt slumpmässig sträng av tecken).
* Komprimeringsalgoritmen: Olika algoritmer har olika effektivitet. BZIP2 uppnår i allmänhet högre komprimering än GZIP, men till kostnaden för långsammare kompression och dekomprimeringshastigheter.
Kort sagt, filkomprimering för TXT -filer gör dem mindre för lagring och överföring utan att förlora data. Omfattningen av storleksminskning beror på textens inneboende struktur och den valda kompressionsalgoritmen.