Format del document
En informàtica , un format de document és un format de fitxer utilitzat per representar un document digital (tant fitxers de text com fitxers binaris ). Hi ha nombrosos formats de documents, la majoria dels quals són incompatibles entre si.
Els components d’un format de document
Segons laciència de la informació , la paraula document fa referència a la combinació d’un mitjà físic i informació (que són rellevants per a l’usuari). Si examinem un document digital genèric, podem trobar quatre tipus d'informació o components: el contingut, l'estructura, l'estil de presentació i les metadades . Normalment, aquesta informació es confon en un sol fitxer: per exemple, intenteu obrir un fitxer .doc amb un editor de text. XML és una solució a aquest problema: us permet mantenir aquests components separats. Fins i tot el fitxer XSV representa una altra solució excel·lent, ja que és perfectament llegible.
Contingut
El contingut es compon generalment de les paraules que componen el document; un document electrònic pot contenir dades de diferent naturalesa: text, imatge, àudio i vídeo.
Estructura
L’estructura d’un document és el seu component lògic: és la informació que indica com dividir el contingut en elements, possiblement subdividits en subelements, etc. en una mena de jerarquia d’ arbres . Per exemple, aquest document té un títol i una successió de seccions obertes al seu torn per un títol. A més, podem fer que el contingut de les seccions estigui dividit en paràgrafs, paràgrafs, llistes, etc.
Estil
L’estil és la informació relacionada amb la manera de representar el document en un dispositiu concret. Els documents generalment s'han dissenyat principalment per "renderitzar-los" en paper, o "imprimir-los" o en un monitor. En aquest cas es diu que es mostren. Però també podem pensar en altres maneres de representar un document: per exemple, en un dispositiu per a persones amb discapacitat visual. En aquest cas, el document es llegeix. Per tant, necessitarem més informació d’estil per instruir un sintetitzador de veu per convertir contingut i estructura en un senyal d’àudio.
Metadades
Si observem detingudament la informació continguda en un fitxer electrònic, trobem bàsicament els tres tipus d’informació esmentats anteriorment. En realitat, també hi ha un quart tipus d'informació que sovint ignorem que existeix. Es tracta d'informació "bibliogràfica" (com ara el nom de la persona que va compondre el document o l'autor, les dates de creació i darrera modificació, el nom del programa utilitzat per compondre el document) o informació per descriure i facilitar-lo la cerca del document en si. Aquest tipus d'informació es denomina genèricament "metainformació" o informació sobre informació. Per evitar malentesos, cal assenyalar que la divisió entre la informació (contingut, estructura i estil) i la metainformació no és ni molt menys clara i precisa: el que per a alguns és informació, per a altres es considera com a metainformació. Per exemple, un títol de llibre es pot classificar de qualsevol manera.
Els formats electrònics més populars
- .doc per a Microsoft Word
- .rtf
- .tex
- . Troff
- .txt (text pla)
- WordPerfect (.doc)
- .xls Excel
- . mp3 Arxius de música comprimida
- .xsv Fitxer per emmagatzemar dades
- Formats SGML / XML
- TEI (àmpliament utilitzat en publicacions)
- DocBook (apte per a documentació tècnica)
- Office Open XML (estàndard ECMA per a documents d'Office)
- OpenDocument (un altre estàndard per als documents ofimàtics)
- HTML | XHTML (format estàndard per representar documents hipermèdia al web)