Ingénieur Python NLP pour une application de fact-checking

The offer description be low is in French

Contract type : Fixed-term contract

Level of qualifications required : Graduate degree or equivalent

Fonction : Temporary scientific engineer

About the research centre or Inria department

Le centre de recherche Inria de Saclay a été créé en 2008. Sa dynamique s’inscrit dans le développement du plateau de Saclay, en partenariat étroit d’une part avec le pôle de l’Université Paris-Saclay et d’autre part avec le pôle de l’Institut Polytechnique de Paris. Afin de construire une politique de site ambitieuse, le centre Inria de Saclay a signé en 2021 des accords stratégiques avec ces deux partenaires territoriaux privilégiés.

Le centre compte , dont 27 sont communes avec l’Université Paris-Saclay ou l’Institut Polytechnique de Paris. Son action mobilise plus de 600 personnes , scientifiques et personnels d’appui à la recherche et à l’innovation, issues de 54 nationalités.

 

 

Context

Inria est une institution publique qui promeuve la contribution de la science à la société : il forme des scientifiques et produit des connaissances. Radio France, grande institution du service public, premier groupe radiophonique de France, est structuré autour de 4 missions : informer, éduquer, cultiver, divertir.

L’importance croissante de la désinformation et la nécessité de disposer rapidement de vérifications d’informations qui circulent sur les médias ont fait émerger un projet de collaboration autour de la détection automatique des infox.

Depuis 2022, nous développons StatCheck, un système de vérification des faits spécialisé dans les médias français. Nous avons développé StatCheck dans le cadre d'une collaboration entre des chercheurs en informatique et des journalistes de Radio France.
StatCheck se compose de 3 composants principaux :
1. Un pipeline pour l'exploration, le nettoyage et l'indexation de données statistiques de haute qualité, notamment de l'INSEE et d'Eurostat.
2. Un moteur de recherche sur les données récupérées.
3. Un pipeline pour détecter à partir du texte les affirmations et les entités statistiques dignes d'être vérifiées, affirmations qui peuvent ensuite être vérifiées à l'aide du moteur de recherche.

Plus d'informations sur StatCheck: https://team.inria.fr/cedar/projects/statcheck/

Assignment

L'ingénieur sera chargé de :

- améliorer notre moteur de recherche sur les données statistiques en ajoutant un chatbot qui pourrait traiter des requêtes plus complexes ;
- aider nos collaborateurs de RadioFrance sur les demandes liées à la base de code ;
- maintenir la base de code existante.

Main activities

Principales activés (5 maximum) : maintenir la base de code existante; améliorer les modules existants ; implémenter de nouvelles fonctionnalités

Activités complémentaires (3 maximum) : aider à la publication d'un article de recherche si les résultats le permettent

 

Skills

Compétences techniques et niveau requis : bonnes compétences en programmation

Langues : Français, Anglais

 

Benefits package

  • Restauration subventionnée
  • Transports publics remboursés partiellement
  • Congés: 7 semaines de congés annuels + 10 jours de RTT (base temps plein) + possibilité d'autorisations d'absence exceptionnelle (ex : enfants malades, déménagement)
  • Possibilité de télétravail et aménagement du temps de travail
  • Prestations sociales, culturelles et sportives (Association de gestion des œuvres sociales d'Inria)
  • Accès à la formation professionnelle

Remuneration

Selon expérience