2022-05400 - Post-Doctorant F/H Découverte de sous-groupes de répondeurs aux combinaisons de chimiothérapies

Type de contrat : CDD

Contrat renouvelable : Oui

Niveau de diplôme exigé : Thèse ou équivalent

Fonction : Post-Doctorant

Contexte et atouts du poste

Dans le cadre du projet CombO en lien avec le Health Data Hub et le Centre Léon Bérard (CLB) de Lyon, nous cherchons une postdoc pour un contrat de 2 ans. 

 

Lea postdoc fera partie au sein de l’équipe HeKA (Inria, Inserm, Univ. Paris Cité, https://team.inria.fr/heka/fr/), localisée à Paris (PariSanté Campus, https://goo.gl/maps/eW55zuHd2ggt2Q4Z9).

 

Le postdoc sera employé par Inria Paris et suivra la grille de salaire Inria.

 

Mots clés : 

*representation learning with knowledge graphs

*unsupervised learning for sub group discovery 

*applications to biomedicine

 

Mission confiée

Le projet de recherche associé concerne l’extraction de connaissances à partir de données de santé, et plus particulièrement la recherche de sous-groupes de patients qui répondent de façon homogène aux combinaisons de chimiothérapie.

Il s’agit de :

a-représenter des données cliniques sous forme de graphe de connaissances [1,2] ;

b-lier ces données à des ontologies et d’autres graphes de connaissances pertinents en cancérologie ;

c-proposer des méthodes non supervisées pour la découverte de sous-groupes dont l’effet au traitement est bien distinct [3].

d-mettre en oeuvre ces méthodes sur des données réelles.

Pour les méthodes nous souhaiterions approfondir l’apprentissage de représentation à partir de graphes de connaissances et d’ontologies, 

avec des GCN par exemple qui permettent d’apprendre des embeddings de graphes. Ces représentations peuvent par exemple être utilisée pour définir une tache de clustering dans l’espace de représentation des embeddings [4]. A partir de ces représentations nous visons l’identification de groupes au sein desquels le niveau de réponse au traitement est homogène au sein d’un groupe, mais éventuellement hétérogène entre les groupes.

 

Références : 

[1] Xiao, G., Pfaff, E., Prud'hommeaux, E., Booth, D., Sharma, D.K., Huo, N., Yu, Y., Zong, N., Ruddy, K.J., Chute, C.G. and Jiang, G., 2022. FHIR-Ontop-OMOP: Building clinical knowledge graphs in FHIR RDF with the OMOP Common data Model. Journal of Biomedical Informatics, 134, p.104201.

https://www.sciencedirect.com/science/article/pii/S1532046422002064

[2] Jacobsen, J.O., Baudis, M., Baynam, G.S., Beckmann, J.S., Beltran, S., Buske, O.J., Callahan, T.J., Chute, C.G., Courtot, M., Danis, D. and Elemento, O., 2022. The GA4GH Phenopacket schema defines a computable representation of clinical data. Nature biotechnology, 40(6), pp.817-820. https://www.nature.com/articles/s41587-022-01357-4

[3] Vernerey, C., Loudni, S., Aribi, N. and Lebbah, Y., 2022, July. Threshold-free Pattern Mining Meets Multi-Objective Optimization: Application to Association Rules. In IJCAI-ECAI 2022. https://www.ijcai.org/proceedings/2022/0261

[4] Monnin, P., Raïssi, C., Napoli, A. and Coulet, A., 2022. Discovering alignment relations with Graph Convolutional Networks: A biomedical case study. Semantic Web, 13(3): 379-398. https://content.iospress.com/articles/semantic-web/sw210452

 

[5] Gong, X., Hu, M., Basu, M. and Zhao, L., 2021. Heterogeneous treatment effect analysis based on machine‐learning methodology. CPT: pharmacometrics & systems pharmacology, 10(11), pp.1433-1443. https://ascpt.onlinelibrary.wiley.com/doi/full/10.1002/psp4.12715

Principales activités

 

La mission du postdoc débutera par une phase de préparation de données, 

incluant la liaison de données cliniques et génétiques des patients avec les graphes de connaissances et ontologies de domaines. 

Il s’agit ensuite d’explorer les méthodes de découverte de sous-groupes afin de mettre en évidence des ensembles de patients répondant différemment 

aux différentes combinaisons de molécules chimiothérapiques.

Compétences

Compétences appréciées : 

Extraction de connaissances, graphes de connaissances, representation learning, données de santé, approches non-supervisées, découverte de sous-groupes, causalité

Python, RDF, Sparql

Communication, écriture scientifique

 

Indispensable : 

Passion pour la recherche en informatique 

Intérêt pour les applications en santé de l’informatique

Avantages

  • Restauration subventionnée
  • Transports publics remboursés partiellement
  • Congés: 7 semaines de congés annuels + 10 jours de RTT (base temps plein) + possibilité d'autorisations d'absence exceptionnelle (ex : enfants malades, déménagement)
  • Possibilité de télétravail et aménagement du temps de travail
  • Équipements professionnels à disposition (visioconférence, prêts de matériels informatiques, etc.)
  • Prestations sociales, culturelles et sportives (Association de gestion des œuvres sociales d'Inria)
  • Accès à la formation professionnelle