Fitxer de text
Aquesta entrada o secció sobre el tema dels formats de fitxer no menciona les fonts necessàries o les persones que hi són presents són insuficients . |

Un fitxer de text és un fitxer informàtic que només conté text pur , és a dir, la codificació binària de caràcters entenedors per a un lector humà, com ara lletres, números, signes de puntuació, etc.
El terme es pot utilitzar a diferència de fitxer binari , que és un fitxer que conté seqüències binàries que no es poden rastrejar fins a una codificació de caràcters llegible, com ara representacions binàries de píxels o les instruccions d’una aplicació executable per la CPU . En realitat, des del punt de vista de les màquines, no hi ha distinció entre els dos tipus, ja que tots els fitxers no són res més que seqüències de bytes . La diferència només es troba en què representen els bytes i com s’utilitzen. És el format del fitxer que indica com s’han d’interpretar les seqüències de bytes que el formen.
Per tant, els bytes dels fitxers de text representen lletres, números, puntuació, espais i altres símbols imprimibles normals, però també poden contenir alguns caràcters de control com ara el tabulador , l’ inici de la línia i el retorn del carro .
Codificació
Per codificació en fitxers de text entenem la correspondència entre el valor de byte, que sempre és un nombre enter de 0 a 255, i el caràcter representat. La correspondència no sempre és de 1 a 1: en moltes codificacions modernes, un sol caràcter està representat per molts bytes, per tal de superar el límit de 256 caràcters possibles i també admeten llenguatges rics en símbols com els orientals. Exemples de codificacions 1 a 1 són els ASCII molt comuns, els de la norma ISO 8859 i l’ EBCDIC . Exemples de codificacions multibytes són els diversos tipus d’ Unicode i l’ EU .
Ús
Purposebviament, el propòsit per al qual van néixer els fitxers de text i que encara és un ús molt freqüent és la lectura / escriptura directa dels usuaris. La manca de format els fa pobres des del punt de vista estètic, però d’altra banda, gràcies a aquesta senzillesa, no calen programes especials per llegir-los i sovint es poden transferir directament d’un sistema operatiu a un altre (sempre que teniu el mateix conjunt de caràcters disponible).
Per aquest motiu, gairebé tot el programari s’acompanya d’un simple fitxer de text que proporciona una breu descripció, sovint anomenada readme (o readme en anglès). Fins i tot el codi font dels programes s’escriu normalment en text pla. Si una font s’escrivís per exemple en format .doc (amb Microsoft Word o OpenOffice.org ), el fitxer produït també contindria informació de format binari que posaria els compiladors en crisi.
Hi ha algunes limitacions a la universalitat dels fitxers de text:
- la codificació no sempre és òbvia, i quan el sistema no la reconeix o no la suporta, el fitxer pot esdevenir il·legible;
- els sistemes principals utilitzen notacions diferents per a la nova línia: MacOS utilitza CR , Unix utilitza LF , Windows utilitza CR / LF. Alguns programes, com Gedit , poden obrir fitxers de text correctament, almenys amb les codificacions més populars, independentment del sistema en què es van crear; en altres casos, la pantalla serà imperfecta.
L’ extensió de fitxers de text destinats a la lectura, quan s’utilitza, sol ser .txt . En el cas dels fitxers font, l'extensió depèn del llenguatge de programació utilitzat, per exemple .c per a C i .htm o .html per a HTML .
Ús del programari
Els fitxers de text no estan necessàriament relacionats amb el processament humà. Molt sovint s’utilitzen exclusivament pel programari, tant en lectura com en escriptura, per a l’emmagatzematge de dades. Són menys compactes que els fitxers binaris , cosa que pot significar una pèrdua d’espai al disc: per exemple, un nombre de 32 bits , que pot valer milers de milions, sempre ocupa 4 bytes en binari, però en format de text n’ocupa fins a 11 (com a cas de -1222333444) més qualsevol caràcter delimitant. Tot i això, si l’ocupació del disc no és crítica, el format de text té avantatges:
- La informació es pot utilitzar fàcilment per altres programes i sistemes, amb un mínim coneixement de la seva estructura: la mida dels camps i l'ordre de bytes us limiten. Per exemple, tot i que cada full de càlcul té el seu propi format d'emmagatzematge binari, tothom pot treballar amb fitxers de text on la matriu de dades és simplement una llista de valors separats per caràcters estàndard ( CSV , TSV ...)
- Qualsevol corrupció de dades sol causar menys danys i només a nivell local. Perdre un byte en un fitxer de text normalment significa perdre una part de dades; perdre'l en un fitxer binari pot resultar en una fase desfasada i desordenar tot el fitxer
- Si és necessari o en cas d'errors ( depuració ), l'usuari el pot comprovar fàcilment. Per exemple, examinar i editar un fitxer INI és molt intuïtiu
Articles relacionats
- Art ASCII
- Codificació de caràcters
- Editor de text
- Fitxer binari
- Format de text
- Text pur
- Processament de vídeo
Altres projectes
-
Wikimedia Commons conté imatges o altres fitxers en fitxers de text