Doctorant F/H [Allocation Région 2025] Théorie des Jeux pour la Décarbonation du Système Électrique (F/H)

Type de contrat : CDD

Niveau de diplôme exigé : Bac + 5 ou équivalent

Autre diplôme apprécié : Master 2 degree

Fonction : Doctorant

A propos du centre ou de la direction fonctionnelle

Le centre Inria de l'Université de Lille, créé en 2008, emploie 360 personnes dont 305 scientifiques répartis dans 15 équipes de recherche. Reconnu pour sa forte implication dans le développement socio-économique de la région des Hauts-De-France, le centre Inria de l'Université de Lille entretient des relations étroites avec les grandes entreprises et les PME. En favorisant les synergies entre chercheurs et industriels, Inria participe au transfert de compétences et d'expertise dans le domaine des technologies numériques et donne accès au meilleur de la recherche européenne et internationale au bénéfice de l'innovation et des entreprises, notamment dans la région.

Depuis plus de 10 ans, le centre Inria de l'Université de Lille est situé au cœur de l'écosystème universitaire et scientifique lillois, ainsi qu'au cœur de la Frenchtech, avec un showroom technologique basé avenue de Bretagne à Lille, sur le site d'excellence économique EuraTechnologies dédié aux technologies de l'information et de la communication (TIC).

Contexte et atouts du poste

Le développement de la production des énergeies renouvelables (solaire, éolien) définit de nouveaux défis dans la gestion des systèmes de production et de transport d'énergie, ainsi que sur le fonctionnement des marchés de l'électricité. 

Acutellement, ces marchés sont opérés de façon centralisée par un opérateur de marché, dont l'objectif est de maximiser le bien-être socail (ou de façon équivalente, minimiser le coût social) des participants, tout en garantissant l'équilibrage de l'offre et de la demande. La mise en relation des producteurs et des consommateurs se fait via un système d'enchères.

Le but de cette thèse est de définir et mettre en oeuvre un outil d’intelligence artificielle ou plus précisément un outil d’aide à la décision pour la gestion des marchés d’électricité. Au niveau scientifique, l’intégration de contraintes de pollution et de modèles d’apprentissage dans les modèles d’optimisation « multi-leader single follower » représente un important défi. Au niveau applicatif, cet outil pourrait être utilisé comme prototype pour accélérer la décarbonation du système électrique.

Mission confiée

Nous considérons un marché d’électricité faisant intervenir des producteurs d’électricité ayant des technologies différentes. Nous supposons que les producteurs sont stratégiques (leurs parts de marché pouvant varier) et que leurs décisions sont susceptibles d’influencer le prix du marché. En outre, un même producteur peut avoir à sa disposition plusieurs technologies et certains producteurs peuvent également être consommateurs (dans ce cas ils sont appelés “prosumers”). Ces producteurs et prosumers seront appelés “agents” ou “joueurs” dans le contexte de la théorie des jeux.  Notons qu’ils ont en outre à leur disposition de la flexibilité induite par exemple, par les batteries déployées pour le stockage du surplus de production, ou via des technologies d’effacement de la demande. Ces agents doivent définir, un jour à l’avance (en “day ahead”), des enchères en prix et en quantité. Ces enchères sont soumises à l’opérateur de marché qui définit le prix du marché de façon à minimiser le coût social du système électrique. De façon générale, deux stratégies sont considérées : “pay as clear ” ou “pay as bid”. Ce problème peut être modélisé comme un jeu de Stackelberg (multi-leader single-follower) impliquant plusieurs meneurs (les producteurs) et un suiveur (l’opérateur de marché). Plus précisément, les agents interagissent selon un équilibre de Nash au premier niveau.  Chacun d’entre eux a pour but de déterminer la stratégie (prix, quantité) lui permettant de maximiser son profit. Chaque agent cherche alors à résoudre un problème d’optimisation bi-niveaux. Autrement dit, les agents sont en compétition les uns avec les autres mais chaque agent, séparément, intègre le comportement de l’opérateur de marché lors de sa prise de décision. 

Principales activités

Les aspects novateurs de cette thèse sont : i) intégrer des mesures de pollution dans le modèle de prise de décision de l’opérateur de marché. Plus précisément, la forme de ces contraintes complexifie la reformulation des problèmes d’optimisation bi-niveaux de chaque agent sous forme d’un problème d’optimisation à un seul niveau avec contraintes de complémentarité ; ii) intégrer des notions de flexibilité lors de la définition des enchères ;  iii) intégrer de l’incertitude par rapport à la production d’énergie renouvelable. De plus, nous considérerons iv) différentes stratégies pour représenter l’incertitude liée aux stratégies des agents concurrents lors de la prise de décision d’un agent. Une première approche inspirée de la littérature des jeux Bayésiens, consiste à considérer une formulation stochastique où les stratégies des concurrents sont représentées via des distributions de probabilité. Une autre approche repose sur l’utilisation de méthodes d’apprentissage multiagents par renforcement du type  acteur-critique. Nous chercherons en particulier à établir des garanties de convergence pour des jeux continus à somme non nulle. Il s’agit donc d’un vrai défi au niveau scientifique et applicatif. Le fait que les enchères se répètent chaque jour produit un modèle dynamique de théorie des jeux, où une nouvelle instance de jeu est définie chaque jour et dans lequel un processus d'apprentissage par les producteurs peut être introduit dont les équilibres sont complexes à calculer. Cela nous amènera à déplacer le problème du concept d’équilibre vers la façon dont les joueurs pourraient atteindre cet équilibre par le biais d’un processus d’apprentissage en ligne ou adaptatif et à réaliser de la poursuite (“tracking”) d’équilibre. Sur le plan algorithmique, nous serons confrontés à des problèmes non linéaires de grande taille. 

Compétences

Le candidat sera diplômé (ou en cours) d'un Master 2, et avoir suivi des enseignements en optimisation et théorie des jeux. Un intérêt pour les problématiques (non-exhaustif) en lien avec les systèmes complexes, l'intelligence artificielle, et la restructuration des marchés de l'électricité est un plus.

 

Avantages

  • Restauration subventionnée
  • Transports publics remboursés partiellement
  • Congés: 7 semaines de congés annuels + 10 jours de RTT (base temps plein) + possibilité d'autorisations d'absence exceptionnelle (ex : enfants malades, déménagement)
  • Possibilité de télétravail et aménagement du temps de travail
  • Équipements professionnels à disposition (visioconférence, prêts de matériels informatiques, etc.)
  • Prestations sociales, culturelles et sportives (Association de gestion des œuvres sociales d'Inria)
  • Accès à la formation professionnelle
  • Sécurité sociale

Rémunération

2200 € bruts mensuels entre octobre et décembre 2025

2300 € bruts mensuels à partir du 1er janvier 2026