Offre de stage en développement Machine Learning/Deep Learning

Dans le cadre de projets de recherche français et européens soutenus par l’agence nationale de la recherche (ANR), nous proposons une offre de stage de fin d’étude en développement  python machine learning/deep learning.

L’objectif est de participer à la mise en place d’un système d’analyse textuelle de manuscrits médiévaux par des techniques de machine learning et deep learning. Cet outil sera développé en collaboration avec des historiens paléographes du CNRS-IRHT (https://www.irht.cnrs.fr/), des informaticiens linguistes du LS2N (https://ls2n.fr/equipe/taln/) et des partenaires européens en Espagne (PRHLT) et en République tchèque  (Národní archiv).

Le projet se base sur des technologies open-sources et les services développés seront librement accessibles. Les méthodes de travail reposent sur les principes du développement agile et impliquent dès le début une  forte interaction avec des utilisateurs finaux.

Machine Learning

  • classification de documents par réseaux de neurones profonds (CNN)
  • reconnaissance d’écriture (CNN/LSTM, HMM hybrides)
  • extraction d’entités (spacy.io, CNN/LSTM)
  • indexation profonde

Stack technique

  • python3
  • django
  • librairies de machine learning (scikit-learn)  et deep learning  (keras/tensorflow)
  • posgresql
  • elastic search
  • IIIF (http://iiif.io/)

Environnement DevOps

  • linux (ubuntu)
  • serveurs dédiés CPU+GPU (ovh)
  • docker
  • intégration/déploiement continu par gitlab CI

Equipe

  • 2 développeurs à Grenoble, 2 Data scientists à Paris

Environnement de travail

  • poste à
  • A/R à Paris/Grenoble  pour réunion de travail

Contacts :

  • Christopher Kermorvant :  kermorvant@teklia.com (Directeur Scientifique)
  • Bastien Abadie : abadie@teklia.com (Directeur technique)