Doctorant F/H Analyse automatique de la capacité humaine à collaborer lors de conversations dyadiques et de groupe, en vue d’applications éducatives.

The offer description be low is in French

Contract type : Fixed-term contract

Renewable contract : Yes

Level of qualifications required : Graduate degree or equivalent

Fonction : PhD Position

Context

Dans le cadre de l'ANR PRME SINNet,

L'objectif de cette thèse est d'étudier les approches qui hybrident les modèles neuronaux et symboliques. Ces méthodes seront dédiées à l'analyse du niveau de collaboration entre les participants dans les conversations (par exemple, l'analyse et la gestion des malentendus) à travers leurs expressions verbales. Nous nous concentrerons sur des applications éducatives telles que l'analyse de la dynamique de la classe et de l'engagement des étudiantes et étudiants, ainsi que sur des systèmes conversationnels destinés à aider les étudiantes et étudiants en difficulté, ou les aider à acquérir des compétences sociales, conformément aux lignes directrices éthiques définies en (1).

Assignment

Les travaux sur le dialogue utilisant des approches de traitement automatique des langues (TAL) et d'apprentissage profond pour la prédiction d’actes de dialogue ou l'analyse de sentiments intègrent les aspects conversationnels en capturant les dépendances contextuelles entre les énoncés à l'aide de réseaux de neurones récurrents (RNN) ou de réseaux de neurones convolutifs (CNN) pour l'apprentissage supervisé (Bapna et al., 2017). Les travaux plus récents intègrent la dynamique des échanges entre locuteurs et locutrices ; dans (Hazarika et al., 2018), la dynamique intra-locuteurs et intra-locutrices est modélisée à l'aide d'une GRU (Gated Recurrent Unit). D’autres manières de modéliser les conversations à travers des structures plus complexes que des enchaînements plats de séquences d’énoncés sont également explorées, en tirant parti d'architectures neuronales hiérarchiques (Chapuis et al., 2020) ou en utilisant des graphes dans les architectures neuronales (Ghosal et al., 2019). Les aspects conversationnels et les dépendances contextuelles entre les étiquettes peuvent aussi être modélisées en utilisant des décodeurs séquentiels et des mécanismes d’attention pour la classification d’actes de dialogue pour le TAL (Colombo et al., 2020). En ce qui concerne les architectures neuronales pour la génération de comportement des agents, plusieurs études ont essayé d’intégrer des processus collaboratifs. Ces études portent sur la génération de comportements non-verbaux d'agents liés à des positionnement interpersonnels (Dermouche & Pelachaud, 2016) et les architectures LSTM (Long-Short-Term-Memory) y sont utilisées comme des boîtes noires, afin de modéliser les dynamiques interactionnelles entre locuteurs et locutrices.

Bien que les architectures neuronales existantes (CNN, RNN, Transformers) soient extrêmement prometteuses pour la modélisation de la dynamique entre locuteurs et locutrices et de la structure séquentielle de la conversation, leur suivi de l'état d'un locuteur ou d’une locutrice dans la conversation se limite à la détection d’opinions, des émotions et des actes de dialogue au niveau du tour de parole. Les approches neuronales susmentionnées sont très efficaces, mais elles nécessitent beaucoup de données. Il existe de nombreux cas d'utilisation où la quantité de données disponibles n'est pas suffisante pour pouvoir utiliser ces méthodes, en particulier lorsqu'il s'agit d'apprentissage profond ; c'est notamment le cas dans les contextes éducatifs, où les données en jeu sont assez confidentielles, en particulier lorsque des enfants sont impliqués, car les données sont considérées comme des données personnelles et sont donc soumises à la RGPD (https://gdpr-info.eu/).

La linguistique computationnelle nous fournit d'autres approches symboliques et logiques pour l'analyse automatique de conversations. Ces approches s'appuient sur de petites quantités de données et se concentrent sur des phénomènes spécifiques, tels que la gestion des implications/des informations implicites dans les dialogues (Breitholtz, 2020) ainsi que de divers contextes (Rebuschi, 2017). La Segmented Discourse Representation Theory (SDRT, Asher et Lascarides, 2003) est l'un des cadres les plus utilisés pour l'analyse du dialogue parmi les approches formelles et hybrides du dialogue. Une autre méthode consiste à proposer une hybridation des graphes de connaissances pour modéliser les normes sociales et les grands modèles de langues (Kim et al., 2023).

Supervision :

Directrice de thèse : Chloé Clavel, directrice de recherche équipe ALMAnaCH

Co-encadrante : Maria Boritchev, maitresse de conférences, équipe S2a, Telecom-Paris

Références

(1) https://web-archive.oecd.org/2020-07-23/559610-trustworthy-artificial-intelligence-in-education.pdf

(Breitholtz, 2020) Breitholtz, E. (2020). Enthymemes in Dialogue. Brill.

(Asher and Lascarides, 2003) Asher, N. and Lascarides, A. (2003). Logics of conversation. Cambridge University Press.

(Rebuschi, 2017) Rebuschi, M. (2017). Schizophrenic conversations and context shifting. In International and Interdisciplinary Conference on Modeling and Using Context, pages 708–721. Springer

(Kim et al., 2023) Hyunwoo Kim, Jack Hessel, Liwei Jiang, Peter West, Ximing Lu, Youngjae Yu, Pei Zhou, Ronan Bras, Malihe Alikhani, Gunhee Kim, Maarten Sap, and Yejin Choi. 2023. SODA: Million-scale Dialogue Distillation with Social Commonsense Contextualization. In Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing, pages 12930–12949, Singapore. Association for Computational Linguistics.

Main activities

Benefits package

Restauration subventionnée
Transports publics remboursés partiellement
Congés: 7 semaines de congés annuels + 10 jours de RTT (base temps plein) + possibilité d'autorisations d'absence exceptionnelle (ex : enfants malades, déménagement)
Possibilité de télétravail (après 6 mois d'ancienneté) et aménagement du temps de travail
Équipements professionnels à disposition (visioconférence, prêts de matériels informatiques, etc.)
Prestations sociales, culturelles et sportives (Association de gestion des œuvres sociales d'Inria)
Accès à la formation professionnelle
Sécurité sociale

Apply for this position

General Information

Theme/Domain : Language, Speech and Audio
Statistics (Big data) (BAP E)
Town/city : Paris
Inria Center : Centre Inria de Paris
Starting date : 2024-06-01
Duration of contract : 3 years
Deadline to apply : 2024-05-31

Warning : you must enter your e-mail address in order to save your application to Inria. Applications must be submitted online on the Inria website. Processing of applications sent from other channels is not guaranteed.

Instruction to apply

Defence Security :
This position is likely to be situated in a restricted area (ZRR), as defined in Decree No. 2011-1425 relating to the protection of national scientific and technical potential (PPST).Authorisation to enter an area is granted by the director of the unit, following a favourable Ministerial decision, as defined in the decree of 3 July 2012 relating to the PPST. An unfavourable Ministerial decision in respect of a position situated in a ZRR would result in the cancellation of the appointment.

Recruitment Policy :
As part of its diversity policy, all Inria positions are accessible to people with disabilities.

Contacts

Inria Team : ALMANACH
PhD Supervisor :
Clavel Chloe / chloe.clavel@inria.fr

The keys to success

Vous pouvez donner là, un portrait à "gros traits" du (de la) collaborateur(trice) attendu(e) : ce que vous voyez comme nécessaire et suffisant et qui peut associer :

goûts et appétences,
domaine d'excellence,
éléments de personnalité ou de caractère,
savoir et savoir faire transversaux...

Cette rubrique permet de compléter et alléger (réduire) la liste plus formelle des compétences :

"Se sentir à l'aise dans un environnement de dynamique scientifique, aimer apprendre et écouter sont des qualités essentielles pour réussir cette mission."
" Passionné(e) par l'innovation, avec une expertise dans le développement Ruby on Rail et une grande capacité de conviction. Une thèse dans le domaine *** constitue un réel atout."

About Inria

Inria is the French national research institute dedicated to digital science and technology. It employs 2,600 people. Its 200 agile project teams, generally run jointly with academic partners, include more than 3,500 scientists and engineers working to meet the challenges of digital technology, often at the interface with other disciplines. The Institute also employs numerous talents in over forty different professions. 900 research support staff contribute to the preparation and development of scientific and entrepreneurial projects that have a worldwide impact.