Avant de lancer un traitement d'intelligence artificielle, il est
important de réfléchir à la manière dont les données seront structurées. La réussite d'un projet dépend souvent davantage
de la qualité de la structure de données que du choix d'un modèle particulier.
La clé pour comprendre Arkindex est de retenir
que tout repose sur la structuration des données autour des éléments,
puis sur leur enrichissement progressif par des classes, métadonnées,
transcriptions et résultats de modèles IA.
Arkindex a été développé avec une ambition particulière : pouvoir traiter n'importe quel type de
document numérique. Cette généralité explique certains choix de
vocabulaire dans l'interface. Là où d'autres logiciels parlent uniquement de
documents et de pages, Arkindex utilise des termes plus neutres afin de pouvoir
décrire des réalités très différentes : les éléments.

Eléments
Un élément représente n'importe quel objet que
l'on souhaite décrire dans un projet. Ils constituent les briques de base du modèle de données. Les éléments sont hiérarchiques au niveau du corpus mais aussi en dessous du niveau de la page, pour la description et la segmentation des parties d'une image.
Dans un projet de manuscrits, un élément pourra
être un volume, une page ou une ligne de texte. Dans une collection
photographique, il pourra s'agir d'un carton d'archive, d'un album, d'une photographie, d'une personne ou d'un visage. Dans un projet consacré à des œuvres d'art, il pourra représenter une exposition, une sculpture, un motif décoratif ou un détail iconographique.
Gestion des élements : Project → Project information → Types
Classes
Une fois les éléments créés, ils peuvent être
qualifiés à l'aide de classes.
Une classe permet d'ajouter une information
descriptive à un élément existant. Une illustration pourra par exemple être
qualifiée comme photographie, dessin ou gravure.
Le choix entre créer plusieurs types d'éléments
ou utiliser des classes dépend du projet, cette décision est souvent guidée par les besoins d'analyse et par les
capacités des modèles utilisés.
Dans la pratique, les classes sont souvent
utilisées pour représenter des catégories ou des résultats de classification
produits automatiquement par des modèles d'intelligence artificielle.
Gestion des classes : Project → Project information → Classes
Métadonnées
Les métadonnées constituent un autre niveau
d'enrichissement.
Elles permettent d'associer à chaque élément des
informations complémentaires comme une date, un auteur, une cote, un lieu ou
une référence externe.
Ces informations sont le plus souvent importées avec les documents, bien qu'elles puissent aussi être ajoutées
manuellement ou générées automatiquement à partir de traitements.
L'un des avantages d'Arkindex est de pouvoir
centraliser dans un même environnement des données provenant de plusieurs
systèmes avant de les réexporter dans un format unique.
Gestion des metadonnées : Project → Project information → Metadata