Bibliothèque interuniversitaire de la Sorbonne
Projet PRET 19
France ✧ 2023-2024
Corpus
82 registres
Technologies d’intelligence artificielle utilisées
- OCR/HTR pour documents historiques
- Analyse de mise en page et segmentation
- Extraction d’entités
- Matching avec des référentiels externes
Objectifs
Numérisation et valorisation scientifique des registres de prêt des bibliothèques de la Sorbonne
Extraction des informations sur les registres de prêt des bibliothèques de la Sorbonne, de l'École normale supérieure et de Sainte-Geneviève au XIXe siècle
- Extraction autonome des emprunteurs et des titres empruntés
- Association automatique d’information complémentaires provenant de bases de données en ligne
Chaîne de traitement
- Exclusion des pages non intéressantes pour le projet
- Entraînement de deux modèles de segmentation des zones emprunteurs (annotations fournies par le client) un pour la BIS et l'ENS et l'autre pour la BSG
- Entraînement de deux modèles d'extraction des informations sur les emprunteurs (nom, prénom, adresses, qualités principalement) ; un pour la BIS et l'ENS et l'autre pour la BSG
- Matching avec des référentiels de noms tirés de référentiels
- Export de fichiers CSV qui alimenteront la base de données du projet
Lien vers la page web du projet : -> PRET19, Projet de Répertoire des Emprunteurs et Titres empruntés au XIXe siècle à l’université

Image : Salle Romilly, BIS | © Lise Hébuterne, BIS