Se rendre au contenu

Comité International de la Croix-Rouge

Suisse ✧ 2023-2024

Description du projet


Indexation nominatives automatique des listes de prisonniers français de la seconde guerre mondiale.


Corpus


700 000 pages de registres 

Traitement 


-> Reconnaissance automatique de texte

-> Extraction de données

Campagnes d’annotation collaboratives


Chaîne de traitement 


  • Annotation de 500 pages par les archivistes sur l'extension d'Arkindex Callico

  • Extraction d’informations nominatives grâce à un modèle hybride combinant la reconnaissance d’écriture manuscrite (HTR) et l’extraction d’entitées-nomées (NER)