Importation de documents
Arkindex vous permet de créer facilement des dossiers à partir de vos images dans une structure personnalisable. Vous pouvez ainsi importer vos images depuis votre ordinateur ou depuis un serveur IIIF.
Importez et organisez des images de documents à partir de fichiers (jpeg, tiff, png), PDF, manifestes IIIF .
Annotation
Arkindex vous permet de produire les annotation nécessaires au traitement de vos documents. Il est nécessaire d'enregistrer manuellement en amont du projet quelques exemples du traitement attendu pour mieux cibler l’analyse automatique.
Annotez vos images avec :
- des zones d'éléments sur l'image, avec leur type et leur position
- des transcriptions de texte à n'importe quel niveau (page, paragraphe, ligne, mot)
- des classifications
- des métadonnées
TEKLIA peut également mettre à votre disposition sur demande l'interface Callico, qui s'intègre à Arkindex pour des campagnes d'annotation collaborative avancées.
Traitement
Arkindex est une plateforme permettant d'exécuter tout algorithme de traitement de documents : OCR, HTR, extraction de caractéristiques, sous-titrage, traduction, etc. Son architecture a été conçue pour être générique, ce qui lui permet de stocker tout type de résultat grâce à des éléments configurables.
Les types de traitement suivants sont possibles avec Arkindex :
Type de traitement |
Description |
Classification d'images |
Associer une catégorie à une image ou à une partie d'une image. |
Détection d'objets |
Détecter un objet dans une image à l'aide d'un cadre de sélection et identifier son type. |
Segmentation d'objets |
Détecter le contour précis d'un objet dans une image et identifier son type. |
Légende d'images |
Générer une légende ou des balises pour une image. |
| Transcription | Transcrire du texte imprimé ou manuscrit à partir d'une image. |
Classification de texte |
Associer une catégorie à un texte. |
Extraction de valeurs clés |
Extraire des informations d'une image ou d'un texte sous la forme d'une association clé-valeur. |
Reconnaissance de tableaux |
Détecter et transcrire les informations présentées sous forme de tableau tout en préservant sa structure. |
Reconnaissance d'entités nommées |
Détecter et saisir les entités nommées dans un texte. |
Liaison d'entités |
Lier une entité nommée à un système de référence existant. |
Traduction |
Traduire un texte d'une langue source vers une langue cible |
Géolocalisation |
Associer des coordonnées GPS à une image ou à un texte |
Regroupement d'objets |
Regrouper des éléments dans une même structure |
Méthodologie
Arkindex offre une flexibilité inégalée pour s'adapter à vos méthodologies de travail :
- Gestion de projet personnalisable : Arkindex vous offre la liberté de définir des flux de travail complexes adaptés à vos besoins de traitement. De l'analyse de la mise en page et la classification à la reconnaissance de texte (OCR/HTR), en passant par la reconnaissance d'entités nommées et la génération de métadonnées, vous pouvez organiser chaque étape pour obtenir le résultat souhaité.
- Contrôle en temps réel : avec Arkindex, vous pouvez surveiller en temps réel la progression de chaque tâche au sein de votre flux de travail. Cette fonctionnalité puissante vous fournit une estimation du temps nécessaire pour chaque étape et le détail des tâches exécutées à chaque instant.
- Analyse des erreurs et relance : tous les processus ne se déroulent pas toujours parfaitement. Arkindex fournit des outils pour repérer et analyser les erreurs qui peuvent survenir dans votre traitement. Une fois identifiées, vous pouvez facilement relancer les processus pour des éléments spécifiques.
- Nœuds de traitement flexibles: pour s'adapter à différentes exigences en matière d'infrastructure, Arkindex offre la possibilité de répartir vos tâches de traitement sur plusieurs nœuds. Que ce soit sur site, dans un environnement cloud ou même sur des clusters haute performance utilisant SLURM, nous avons ce qu'il vous faut.
- Intégration de composants personnalisés et open source : Arkindex ne se limite pas à ses fonctionnalités intégrées. Vous pouvez facilement définir vos étapes de traitement à l'aide de votre propre code ou tirer parti de la multitude de composants open source disponibles. L'intégration Docker facilite l'intégration de ces composants.

