Se rendre au contenu

Bibliothèque interuniversitaire de la Sorbonne

Projet PRET 19

France ✧ 2023-2024

Corpus



42 708 images
82 registres

Technologies d’intelligence artificielle utilisées


PRET 19- TEKLIA
PRET 19- TEKLIA

Objectifs

Numérisation et valorisation scientifique des registres de prêt des bibliothèques de la Sorbonne

Extraction des informations sur les registres de prêt des bibliothèques de la Sorbonne, de l'École normale supérieure et de Sainte-Geneviève au XIXe siècle


  • Extraction autonome des emprunteurs et des titres empruntés
  • Association automatique d’information complémentaires provenant de bases de données en ligne





Chaîne de traitement


- Exclusion des pages non intéressantes pour le projet

- Entraînement de deux modèles de segmentation des zones emprunteurs (annotations fournies par le client) un pour la BIS et l'ENS et l'autre pour la BSG

- Entraînement de deux modèles d'extraction des informations sur les emprunteurs (nom, prénom, adresses, qualités principalement) ; un pour la BIS et l'ENS et l'autre pour la BSG

- Matching avec des référentiels de noms tirés de référentiels

- Export de fichiers CSV qui alimenteront la base de données du projet

Image : Salle Romilly, BIS | © Lise Hébuterne, BIS