• Du 13 décembre 2022 au 14 décembre 2022
    > Lieu à déterminer selon disponibilités des participants
    false false
  • + 2nd semestre (à déterminer avec les participants) pour l'atelier

Formation Huma-Num Loire


xml-TEI - Encoder des données textuelles pour le traitement et l’édition

La TEI (Text Encoding initiative) est une méthode d’encodage des textes : sources historiques, manuscrits, textes littéraires… mais aussi d’autres données (images, sons) pour différents usages : exploration, annotation, édition… Ces ateliers ont pour but de vous faire découvrir ses possibilités et de débuter en pratique.
Quelques exemples d’applications ici : https://tei-c.org/Activities/Projects/
 


Public concerné
Chercheu.r.se.s, doctorant.e.s, ingénieur.e.s, étudiant.e.s de master ayant un projet d’édition de corpus


Contenu

13/12/22 - TEI/1 : initiation
Cette séance vous permettra de comprendre les possibilités de la TEI et de pratiquer le balisage sur un corpus littéraire.

  • Qu’est-ce que la Text Encoding Initiative ? Implications et usages pour la recherche en LSHS
  • Le langage xml : principes généraux, fonctionnement
  • Structuration d’un document en TEI
  • Prendre en main le logiciel Oxygen
  • Pratique sur un corpus d’exemple


14/12/22 - TEI/2 : approfondissement
Dans cette séance, nous verrons comment élaborer un schéma d’encodage approprié aux besoins de différents types de projet de recherche.

  • Modules, éléments, attributs
  • Utiliser les « guidelines »
  • Construire son propre schéma d’encodage
  • Trouver des ressources
  • Lier des données


2nd semestre - TEI/3 : atelier
Cette séance s’adaptera aux besoins de participants déjà engagés dans un projet ; il leur sera donc demandé de transmettre à la formatrice, en amont de l’atelier, un extrait de leur corpus, une ébauche de leur projet et leurs questions éventuelles.