Antalet tecken du kan lagra på en hårddisk på 80 GB beror på flera faktorer, viktigast av allt karaktären som kodar.
* byte per karaktär: Olika teckenkodningar använder olika antal byte per karaktär. ASCII använder 1 byte per tecken, medan UTF-8 (vanligt använt) använder ett variabelt antal byte (1-4, beroende på karaktär). UTF-16 använder 2 byte per tecken, och UTF-32 använder 4 byte per tecken.
* Filsystem över huvudet: Filsystemet själv använder lite utrymme för metadata (information om filer, som namn och platser). Denna overhead varierar beroende på det använda filsystemet (t.ex. NTFS, ext4).
* diskformatering: Hur hårddisken formateras påverkar också användbart utrymme.
Låt oss göra några uppskattningar:
* Best-Case Scenario (ASCII): 80 GB är ungefär 80 * 1024 * 1024 * 1024 byte ≈ 85 899,345 920 byte. Om vi antar 1 byte per karaktär kan du teoretiskt lagra cirka 85,9 miljarder tecken.
* mer realistiskt scenario (UTF-8): Med UTF-8 beräknas det genomsnittliga antalet byte per tecken ofta vara cirka 3 byte (även om det kan variera beroende på texten). I detta fall skulle antalet tecken vara cirka 85 899 345 920 byte / 3 byte / karaktär ≈ 28,6 miljarder tecken.
* Worst-Case-scenario (UTF-32): Med UTF-32 skulle du få cirka 85 899 345 920 byte / 4 byte / karaktär ≈ 21,5 miljarder tecken.
Sammanfattningsvis: Du kan lagra tiotals miljarder tecken, men det exakta antalet beror starkt på den karaktär som kodar och filsystemet över huvudet. Siffrorna ovan är grova uppskattningar; Det faktiska antalet skulle vara något lägre på grund av filsystemets omkostnader.