Här är några exempel på textbaserade dokument, kategoriserade för tydlighet:
Allmän text:
* E -post: Personlig, företag, marknadsföring, nyhetsbrev
* Bokstäver: Formella, informella, affärer, personliga
* Rapporter: Affärsrapporter, vetenskapliga rapporter, utredningsrapporter
* Artiklar: Nyhetsartiklar, blogginlägg, tidskriftsartiklar
* uppsatser: Personliga uppsatser, akademiska uppsatser, övertygande uppsatser
* romaner och noveller: Fiktion, facklitteratur, poesi
* skript: Filmskript, spela manus, videospelskript
* CV och täckningsbrev: Arbetsansökningar
* kontrakt och juridiska dokument: Juridiska avtal, kontrakt, testament, hyresavtal
* textmeddelanden: Personlig kommunikation, företagskommunikation
Tekniska dokument:
* Programvarudokumentation: Användarmanualer, API -dokumentation
* Tekniska specifikationer: Produktspecifikationer, tekniska ritningar
* vitböcker: Tekniska rapporter som förklarar koncept eller produkter
* Instruktionshandböcker: Instruktioner för montering eller driftsanordningar
* kod: Programmeringskod på olika språk
Akademiska dokument:
* Forskningspapper: Akademiska studier, vetenskapliga artiklar
* avhandling/avhandling: Akademiska avhandlingar för examen
* term papper: Forskningspapper skrivna för universitetskurser
* Föreläsningsanteckningar: Anteckningar tagna i klassen eller online
* Studieguider: Material för att förbereda för tentor
Datacentrisk text:
* kalkylblad: Data organiserade i rader och kolumner
* databasfiler: Strukturerade data lagrade elektroniskt
* loggar: Systemloggar, felloggar, händelseloggar
* Konfigurationsfiler: Inställningar för programvara och system
* Vanliga textfiler: Enkla textfiler utan formatering
Andra exempel:
* Webbplatsinnehåll: Webbsidor, blogginlägg, forumdiskussioner
* Inlägg sociala medier: Tweets, Facebook -inlägg, Instagram -bildtexter
* chattloggar: Samtal från chattapplikationer
* Undersökningar och frågeformulär: Data som samlas in från undersökningar
Obs: Många dokument kan kombinera text med andra element som bilder, tabeller och formatering. Fokus här är på dokument där det primära innehållet är textuellt.