Ingénieur de données H/F

Type de contrat : CDD

Contrat renouvelable : Oui

Niveau de diplôme exigé : Thèse ou équivalent

Fonction : Ingénieur scientifique contractuel

Corps d'accueil : Ingénieur de Recherche (IR)

Niveau d'expérience souhaité : De 5 à 12 ans

Contexte et atouts du poste

Software Heritage est un projet d’archive universelle du code source logiciel, dont l’objectif est de récupérer, préserver dans le très long terme et partager la totalité du code source qui est publiquement disponible, avec l’historique de son développement (p.ex., comme stocké dans des systèmes de gestion de version). L’archive de Software Heritage contient déjà plus de 19 milliards des fichiers source uniques et 4,2 milliards de commits, récupérés à partir de plus de 300 millions de projets de développement logiciel. L’initiative Software Heritage, hébergée par la Fondation Inria est un projet entièrement logiciel libre (FOSS) et à but non lucratif.

Mission confiée

Nous recherchons un·e ingénieur·e expérimenté·e logiciel orienté·e Big Data. Le·a candidat·e idéal·e sera une personne ayant un un intérêt et une expérience significatifs pour les architectures de traitement et d’exploitation de données à grande échelle, incluant le stockage, l’indexation et l’extraction.

Vous pouvez consulter une liste détaillée de nos projets en cours sur la Roadmap 2024 de Software Heritage (https://docs.softwareheritage.org/devel/roadmap/roadmap-2024.html)

Principales activités

– Mise en place d’une architecture de traitement de données (à la Spark)
– Conception et modélisation d’architectures Big Data
– Implémentation de solutions sur la base des architectures définies
– Mise en place de pipelines big data

Compétences

Le candidat idéal doit avoir de l’expérience dans le développement et l’architecture Big Data, de préférence dans le contexte du logiciel libre. Nous attendons des compétences d’auto-organisation et d’autonomie proportionnelles à l’expérience du candidat. La participation à des projets FOSS existants, à quelque titre que ce soit (développeur·se, organisateur communautaire, rédacteur technique, etc.) constitue un atout supplémentaire.

Les compétences suivantes sont attendues:

– Maîtrise d’un système de traitement de données à grande échelle (par exemple Apache Spark, Flink, ou Hadoop)
– Pratique courante du développement logiciel (Bases en Rust et Python)
– Bon niveau d’anglais (écrit et oral)
– Utilisation de Git
– Utilisation d’outils d’intégration continue (par exemple Gitlab et/ou Jenkins)

Avantages

  • Restauration subventionnée
  • Transports publics remboursés partiellement
  • Congés: 7 semaines de congés annuels + 10 jours de RTT (base temps plein) + possibilité d'autorisations d'absence exceptionnelle (ex : enfants malades, déménagement)
  • Possibilité de télétravail (après 6 mois d'ancienneté) et aménagement du temps de travail
  • Équipements professionnels à disposition (visioconférence, prêts de matériels informatiques, etc.)
  • Prestations sociales, culturelles et sportives (Association de gestion des œuvres sociales d'Inria)
  • Accès à la formation professionnelle

Rémunération

En fonction du diplôme et de l'expérience professionnelle