Optimisation des interactions avec les LLMs dans un environnement Python et expérimentation avec les approches symboliques
Contract type : Internship agreement
Level of qualifications required : Graduate degree or equivalent
Fonction : Internship Support functions
About the research centre or Inria department
Depuis 2018, Inria joue un rôle crucial en tant que support à l’action de l’Etat dans le domaine de l’intelligence artificielle, en collaboration étroite avec la Stratégie Nationale pour l’IA. Pour piloter cette mission, Inria a créé le Programme IA, qui s’inscrit dans le dispositif de l’Agence de Programme confié par l’État à Inria, et qui coordonne des dispositifs innovants transverses en IA : recherche, transfert et appui aux politiques publiques.
Dans le cadre de la stratégie d’accélération IA et en particulier dans l’axe « développer des infrastructures numériques de pointe et stimuler les partenariats public-privé et accroître l'impact de la recherche en IA », Inria a proposé la mise en œuvre d’un projet d’accélération visant à soutenir la mise en place et le développement d’une plateforme souveraine ouverte et interopérable de librairies logicielles de l’IA pour les entreprises françaises, et son passage à l’échelle européenne.
Cette initiative est une des priorités d’Inria dans le cadre de l’élaboration de la stratégie d’accélération IA et dans l’objectif de contribuer à la souveraineté technologique française et à l’impact économique sur le tissu industriel français.
L'impact attendu de ces mesures sur l’industrie française est notamment de permettre à l’ensemble des entreprises françaises mais également aux acteurs publics et institutionnels d’accélérer leur transformation numérique à l’aide de l’IA, sans être dans une relation captive avec les acteurs dominants, de par la disponibilité d’un socle technologique générique et d’un ensemble de dispositifs de transfert associés.
Dans le cadre de cette ambition, la mise en œuvre de la mesure repose sur le développement et la diffusion d’une suite cohérente de plateformes de logiciels pour l’IA et les données reposant sur trois actions :
- L’action 1 se concentre sur l'interopérabilité des données, proposant une architecture basée sur les standards du Web (Corese).
- L'action 2, le "Data Wrangling," aborde la préparation des données, visant à réduire le temps manuel nécessaire dans les projets de science des données (skrub).
- L'action 3 se focalise sur l'apprentissage et l'exécution de modèles, en optimisant la bibliothèque scikit-learn pour faciliter l'analyse des données.
Context
Dans le cadre du projet P16, nous explorons les interactions entre les grands modèles de langage (LLMs) et les environnements de développement Python, avec un accent particulier sur les enjeux d'interprétabilité et d'interfaçage avec les graphes de connaissances. L'objectif est d'identifier des cas d'usage concrets et d'expérimenter des approches pertinentes pour renforcer la robustesse, la précision et la fiabilité des outils exploitant les LLMs à des fins de prototypage
Assignment
Le projet vise à optimiser la génération et la validation des réponses des LLMs en développant des mécanismes de vérification d'incohérences, de gestion d'erreurs et d'ajustement contextuel automatique. Il s'agira également d'expérimenter des modèles hybrides combinant LLMs et algorithmes explicites pour améliorer l'interprétabilité et la robustesse des réponses.
Par ailleurs, un pipeline d'interfaçage entre les environnements de développement Python et les LLMs devra être conçu, garantissant la compatibilité des formats d'entrée/sortie et permettant de chaîner de manière modulaire les opérations de pré-traitement, de post-traitement et d'optimisation.
Enfin, le projet prévoit l'intégration de graphes de connaissances pour enrichir les interactions, en explorant l'alignement entre représentations vectorielles et structures symboliques, et en testant des scénarios combinant raisonnement logique et génération de texte afin d'améliorer la pertinence et la fiabilité des réponses produites.
Main activities
Le ou la stagiaire aura pour mission de :
- Optimiser la génération et la validation des réponses des LLMs :
- Développer des mécanismes de vérification des réponses des LLMs, de détection d'incohérences et d'ajustement automatique en fonction du contexte et des contraintes.
- Intégrer des stratégies de gestion d'erreurs.
- Expérimenter des modèles hybrides combinant LLMs et algorithmes plus explicites pour améliorer l'interprétabilité et la robustesse.
- Concevoir un pipeline d'interfaçage entre environnements de développement Python et LLMs
- Assurer une compatibilité fluide entre les formats d'entrée/sortie des LLMs et les outils de traitement des données.
- Mettre en place des pipelines modulaires permettant de chaîner différentes opérations de pré-traitement, de post-traitement et d'optimisation des interactions avec les LLMs.
- Intégrer les graphes de connaissances pour enrichir les interactions avec les LLMs :
- Expérimenter des approches d'alignement entre représentations vectorielles des LLMs et structures symboliques des graphes (embedding de graphes, requêtage hybride SPARQL/LLM).
- Tester des scénarios d'usage combinant raisonnements logiques et génération de texte pour renforcer la pertinence et la fiabilité des réponses.
Skills
- Formation en informatique, intelligence artificielle, science des données ou domaine connexe.
- Solides compétences en Python et expérience avec les APIs des LLMs.
- Connaissance des graphes de connaissances et du web sémantique (RDF, SPARQL, OWL).
- Intérêt pour les approches hybrides combinant apprentissage machine et représentation symbolique.
Benefits package
- Restauration subventionnée
- Transports publics remboursés partiellement
- Congés: 7 semaines de congés annuels + possibilité d'autorisations d'absence exceptionnelle (ex : enfants malades, déménagement)
- Possibilité de télétravail (après 6 mois d'ancienneté) et aménagement du temps de travail
- Équipements professionnels à disposition (visioconférence, prêts de matériels informatiques, etc.)
- Prestations sociales, culturelles et sportives (Association de gestion des œuvres sociales d'Inria)
- Accès à la formation professionnelle
- Sécurité sociale
Remuneration
Gratification de 4.35€ par heure
General Information
- Town/city : Le Chesnay
- Inria Center : Siège
- Starting date : 2025-06-01
- Duration of contract : 6 months
- Deadline to apply : 2025-05-31
Warning : you must enter your e-mail address in order to save your application to Inria. Applications must be submitted online on the Inria website. Processing of applications sent from other channels is not guaranteed.
Instruction to apply
Defence Security :
This position is likely to be situated in a restricted area (ZRR), as defined in Decree No. 2011-1425 relating to the protection of national scientific and technical potential (PPST).Authorisation to enter an area is granted by the director of the unit, following a favourable Ministerial decision, as defined in the decree of 3 July 2012 relating to the PPST. An unfavourable Ministerial decision in respect of a position situated in a ZRR would result in the cancellation of the appointment.
Recruitment Policy :
As part of its diversity policy, all Inria positions are accessible to people with disabilities.
Contacts
- Inria Team : Prog-IA (DG)
-
Recruiter :
Arunraja Emilie / emilie.arunraja@inria.fr
About Inria
Inria is the French national research institute dedicated to digital science and technology. It employs 2,600 people. Its 200 agile project teams, generally run jointly with academic partners, include more than 3,500 scientists and engineers working to meet the challenges of digital technology, often at the interface with other disciplines. The Institute also employs numerous talents in over forty different professions. 900 research support staff contribute to the preparation and development of scientific and entrepreneurial projects that have a worldwide impact.