Ingénieur Python NLP pour une application de fact-checking

Type de contrat : CDD

Niveau de diplôme exigé : Bac + 5 ou équivalent

Fonction : Ingénieur scientifique contractuel

A propos du centre ou de la direction fonctionnelle

Le centre de recherche Inria de Saclay a été créé en 2008. Sa dynamique s’inscrit dans le développement du plateau de Saclay, en partenariat étroit d’une part avec le pôle de l’Université Paris-Saclay et d’autre part avec le pôle de l’Institut Polytechnique de Paris. Afin de construire une politique de site ambitieuse, le centre Inria de Saclay a signé en 2021 des accords stratégiques avec ces deux partenaires territoriaux privilégiés.

Le centre compte , dont 27 sont communes avec l’Université Paris-Saclay ou l’Institut Polytechnique de Paris. Son action mobilise plus de 600 personnes , scientifiques et personnels d’appui à la recherche et à l’innovation, issues de 54 nationalités.

 

 

Contexte et atouts du poste

Inria est une institution publique qui promeuve la contribution de la science à la société : il forme des scientifiques et produit des connaissances. Radio France, grande institution du service public, premier groupe radiophonique de France, est structuré autour de 4 missions : informer, éduquer, cultiver, divertir.

L’importance croissante de la désinformation et la nécessité de disposer rapidement de vérifications d’informations qui circulent sur les médias ont fait émerger un projet de collaboration autour de la détection automatique des infox.

Depuis 2022, nous développons StatCheck, un système de vérification des faits spécialisé dans les médias français. Nous avons développé StatCheck dans le cadre d'une collaboration entre des chercheurs en informatique et des journalistes de Radio France.
StatCheck se compose de 3 composants principaux :
1. Un pipeline pour l'exploration, le nettoyage et l'indexation de données statistiques de haute qualité, notamment de l'INSEE et d'Eurostat.
2. Un moteur de recherche sur les données récupérées.
3. Un pipeline pour détecter à partir du texte les affirmations et les entités statistiques dignes d'être vérifiées, affirmations qui peuvent ensuite être vérifiées à l'aide du moteur de recherche.

Plus d'informations sur StatCheck: https://team.inria.fr/cedar/projects/statcheck/

Mission confiée

L'ingénieur sera chargé de :

- améliorer notre moteur de recherche sur les données statistiques en ajoutant un chatbot qui pourrait traiter des requêtes plus complexes ;
- aider nos collaborateurs de RadioFrance sur les demandes liées à la base de code ;
- maintenir la base de code existante.

Principales activités

Principales activés (5 maximum) : maintenir la base de code existante; améliorer les modules existants ; implémenter de nouvelles fonctionnalités

Activités complémentaires (3 maximum) : aider à la publication d'un article de recherche si les résultats le permettent

 

Compétences

Compétences techniques et niveau requis : bonnes compétences en programmation

Langues : Français, Anglais

 

Avantages

  • Restauration subventionnée
  • Transports publics remboursés partiellement
  • Congés: 7 semaines de congés annuels + 10 jours de RTT (base temps plein) + possibilité d'autorisations d'absence exceptionnelle (ex : enfants malades, déménagement)
  • Possibilité de télétravail et aménagement du temps de travail
  • Prestations sociales, culturelles et sportives (Association de gestion des œuvres sociales d'Inria)
  • Accès à la formation professionnelle

Rémunération

Selon expérience