La nòrma TEI es un ensemble de preconizacions (TEI Guidelines[1]) qu'especifican de metòdes d'encodatge pels tèxtes que las maquinas pòdon legir, mai que mai en lingüistica e en sciéncias umanas e socialas.

Aquelas preconizacions son redigidas per la TEI (Text encoding initiative[2]), un consòrci que desvolopa e manten d'un biais collectiu de nòrmas per la representacion de tèxtes jos la forma numerica. Es una organizacion a tòca pas lucrativa compausada d'institucions academicas, de còlas de recèrca e d'especialistas individuals del monde tot[3].

Structura del format TEI modificar

Dempuèi la version P4, la TEI es un jos-format del lengatge XML[4]. Aquel utiliza de balisas qu'enquadran un tròç de tèxte e lo qualifican. Aquelas balisas pòdon aver d'atributs, obligatòris o facultatius, que precisan la qualificacion.

Ex. : <pron notation="IPA">trænskrɪpʃən</pron>

La balisa <pron> enquadra lo mot "trænskrɪpʃən", indicant qu'es una prononciacion. L'atribut "notacion", qu'a coma valor "IPA", indica qu'aquela prononciacion es transcriuta en Alfabet Fonetic Internacional.

Las preconizacions modificar

Las TEI Guidelines an agut mantuna version :

  • TEI P1 (publicada en 1990)
  • TEI P2 (publicada en 1992-1993)
  • TEI P3 (publicada en 1994)
  • TEI P4 (publicada en 2002)
  • TEI P5[5] (publicada en 2007)

La version utilizada uèi es la TEI P5 v2.0.1, publicada en 2011.

Definís un cèrt nombre de balisas adaptadas a l'etiquetatge de tèxtes numerics. Per cada balisa, prepausa d'unes atributs e balha d'exemples de valors que pòdon préner.

Aquelas balisas son amassadas dins de moduls que correspondan a las diferentas utilizacions que se pòdon far de la TEI (poesia, transcripcions de discorses, diccionaris, manuscrits...).

Libertat d'utilizacion modificar

Aquelas Guidelines son publicadas en open source. I podèm accedir en linha[6], ne telecargar una version pdf[7] o ebook[8], ne far una còpia locala... D'efièit, la TEI vòl èstre un format obèrt que cadun pòt adaptar a sos projèctes[9]

Projèctes qu'utilizan la TEI modificar

Numeroses projèctes dins lo monde an causit la TEI per encodar los lors tèxtes. Podèm citar :

Nòtas e referéncias modificar

  1. http://www.tei-c.org/Guidelines/
  2. https://web.archive.org/web/20150612040042/http://www.tei-c.org/index.xml
  3. https://web.archive.org/web/20150612040042/http://www.tei-c.org/index.xml
  4. http://www.tei-c.org/Vault/P4/
  5. http://www.tei-c.org/Guidelines/P5/
  6. http://www.tei-c.org/release/doc/tei-p5-doc/en/html/
  7. http://www.tei-c.org/release/doc/tei-p5-doc/en/Guidelines.pdf
  8. http://www.tei-c.org/release/doc/tei-p5-doc/en/Guidelines.epub
  9. http://www.tei-c.org/Guidelines/
  10. http://www.natcorp.ox.ac.uk/
  11. http://ota.ox.ac.uk/
  12. http://freedict.org/
  13. https://web.archive.org/web/20161201094506/http://www.locongres.org/oc/lo-congres/tribalhs-deu-congres/formatatge-en-tei
  14. http://dictionnaire1905.u-cergy.fr/
  15. http://txm.bfm-corpus.org/bfm
  16. http://www.perseus.tufts.edu/