2022-05143 - Recherche et le requêtage de données distribuées dans un écosystème SoLiD

Type de contrat : CDD

Niveau de diplôme exigé : Bac + 5 ou équivalent

Fonction : Ingénieur scientifique contractuel

A propos du centre ou de la direction fonctionnelle

Le centre Inria Sophia Antipolis - Méditerranée compte 34 équipes de recherche, ainsi que 7 services d’appui à la recherche. Le personnel du centre (500 personnes environ dont 320 salariés Inria) est composé de scientifiques de différentes nationalités (250 personnes étrangères sur 50 nationalités), d’ingénieurs, de techniciens et d’administratifs. 1/3 du personnel est fonctionnaire, les autres sont contractuels. La majorité des équipes de recherche du centre est localisée à Sophia Antipolis et Nice dans les Alpes-Maritimes. Quatre équipes sont implantées à Montpellier et deux équipes sont hébergées l'une à Bologne et l'autre à Athènes. Inria est membre fondateur d’Université Côte d'Azur et partenaire de l’I-site MUSE porté par l’Université de Montpellier.

Contexte et atouts du poste

Cette offre est dans le cadre d'une collaboration entre l'équipe de recherche WIMMICS et l’entreprise Startin'blox.

WIMMICS est une équipe de recherche jointe ente Inria, l’Université Côte d’Azur et le CNRS (I3S). Ses chercheurs s’intéressent à la représentation et au traitement des graphes de connaissances notamment sur le Web. https://team.inria.fr/wimmics/

Startin'blox développe une technologie innovante et éthique se basant sur des standards ouverts du pour créer des applications fédérées basées sur les données liées et les web components. https://startinblox.com/

L’objectif de cette collaboration est la conception et l’évaluation de méthodes de recherche, indexation et découverte de services et de jeux de données au sein de l’écosystème SoLiD.

Le projet SoLiD, pour “SOcial Linked Data”, lancé en 2015 par Tim Berners-Lee et incubé au W3C, propose la spécification d’une nouvelle architecture d’applications web permettant un découplage complet entre stockage de données et applications métiers. Ainsi, le déploiement massif d’applications respectant les standards SoLiD permettrait de rétablir de la décentralisation sur le web et redonnerait aux utilisateurs la possibilité de garder le contrôle de leurs données, dans des “serveurs personnels” appelés PODs.

A l’heure actuelle, le projet est constitué d’un ensemble d'une dizaine de spécifications plus ou moins avancées et il existe une communauté très active travaillant à plusieurs implémentations. Certains champs ne sont toutefois pas encore couverts comme le requêtage de ces données distribuées.

Mission confiée

Il s’agit de concevoir et évaluer des méthodes permettant la recherche et le requêtage de données distribuées dans un écosystème SoLiD.

La capacité à exécuter des recherches avancées sur de gros volumes de données avec des performances acceptables est un des fondements de la circulation de l’information et de la construction d’applications sociales.

Le candidat devra donc investiguer les solutions possibles permettant de construire par-dessus l’architecture SoLiD des capacités de découverte de services et de parcours et d’accès à des jeux de données distribués, en standardisant les capacités de recherche et de filtrage des PODs . Pour cela on pourra s’appuyer sur des approches de types requêtes SPARQL traversantes ou décentralisées pour aboutir à la conception d’une architecture pilote répondant également aux enjeux de performances par exemple via des systèmes de cache ou d’index. Ceci permettrait d’entrevoir la diffusion de l’écosystème SoLiD à l’échelle du web.

Principales activités

  • Etudier et évaluer l’état de l’art en termes d’accès et requêtage de données liées distribuées en considérant leur compatibilité avec une architecture SoLiD.
  • Evaluer le nécessité ou non d’une indexation ainsi que les options possibles (globale, partielle, distribuée, hybride, etc.) et leur adéquation à un écosystème SoLiD potentiellement à grande échelle.
  • Etudier et évaluer des approches telles que les requêtes traversantes ou de routage de requêtes, la combinaison de méthodes de requêtage partiel (ex. Linked Data Fragments) ou de mise en cache, et la découverte des possibilités de requêtage auprès d’un serveur ou POD donné afin de proposer une méthode de requêtage décentralisée à l’échelle d’un écosystème SoLiD

Compétences

  RDF, SPARQL, Données liées, Architecture Web, SoLiD, Python, JavaScript

Avantages

  • Restauration subventionnée
  • Transports publics remboursés partiellement
  • Congés: 7 semaines de congés annuels + 10 jours de RTT (base temps plein) + possibilité d'autorisations d'absence exceptionnelle (ex : enfants malades, déménagement)
  • Possibilité de télétravail (après 6 mois d'ancienneté) et aménagement du temps de travail
  • Équipements professionnels à disposition (visioconférence, prêts de matériels informatiques, etc.)
  • Prestations sociales, culturelles et sportives (Association de gestion des œuvres sociales d'Inria)
  • Accès à la formation professionnelle
  • Sécurité sociale

Rémunération

A partir de 2632 euros brut mensuel (selon diplôme et expérience)