Doctorat en “Algorithmes de consensus pour les systèmes de stockage distribués” – Programme MSCA Cofund SEED

France
Posted 11 months ago

Informations sur l’emploi

Organisation/Entreprise
IMT Atlantique
Département
Division doctorale
Domaine de recherche
Ingénierie
Profil de chercheur
Chercheur de première étape (R1)
Pays
France
Date limite d’inscription
Type de contrat
Temporaire
Statut du travail
À temps plein
Heures par semaine
37
Date de début de l’offre
Le poste est-il financé par le programme-cadre de recherche de l’UE ?
HE/MSCA COFUND
Numéro de convention de subvention Marie Curie
101126640
L’emploi est-il lié au poste du personnel au sein d’une infrastructure de recherche ?
Non

Description de l’offre

Description de l’offre

Le poste de doctorat est proposé dans le cadre d’un parcours standard (30 mois à IMT Atlantique + 3 mois à l’institut SCI de l’Université de l’Utah + 3 mois à Deuxfleurs, France.)

1.1. Domaine et contexte scientifique/technique

Les connexions à faible latence et les serveurs décentralisés présentent actuellement un nouveau potentiel pour l’informatique distribuée. En particulier, la mobilité et la connectivité intermittente des ressources informatiques créent un besoin en mécanismes de stockage distribué résilients à l’isolement du réseau.

Cependant, le développement de systèmes intégrés capables d’exploiter des ressources hautement distribuées nécessite que les développeurs et les fournisseurs de services fassent face au manque de fiabilité des nœuds de calcul et de l’infrastructure réseau, et doit être pris en compte dès la phase de conception des systèmes. De plus, des contraintes plus pressantes en matière de consommation d’énergie et de ressources favoriseront le besoin d’un calcul distribué avec des capacités restreintes, s’appuyant par exemple sur de petits nœuds de serveur éteints ou déconnectés la plupart du temps.

1.2. Défis scientifiques/techniques

Les problèmes de coordination et de consensus sont au cœur des algorithmes distribués. Dans le contexte des infrastructures côté serveur et notamment des systèmes de stockage hautement distribués, nous identifions deux contributions principales dans le cadre de cette proposition de sujet :

  1. Consensus sans leader pour les logiciels côté serveur : de nombreux algorithmes distribués déployés aujourd’hui reposent sur une forte coordination et sur l’élection des leaders : il s’agit d’une approche coûteuse qui n’est pas compatible avec des nœuds de calcul et un réseau peu fiables. En revanche, des approches de coordination faibles et un consensus sans leader sont attrayants dans cette situation. Cependant, ils ont principalement été appliqués dans le contexte d’applications locales côté client. Nous prévoyons d’étendre ce travail pour développer de meilleurs logiciels distribués côté serveur légers avec un temps d’accès plus rapide et une consommation de ressources légère, même dans des situations qui rendent la coordination difficile.
  2. CRDT pour les systèmes de stockage et de cluster : lorsqu’une forme de coordination encore plus faible est tolérable, les types de données répliquées sans conflit (CRDT) [3] fournissent un bon support système pour la connectivité intermittente. Les CRDT sont utilisés dans les schémas de synchronisation, car les répliques peuvent être mises à jour indépendamment et simultanément sans coordination directe [4,5]. Nous prévoyons d’étudier et de formaliser l’utilisation des CRDT dans les systèmes de stockage et les clusters virtuels.

1.3. Méthodes réfléchies, résultats et impacts visés

Le principal cas d’utilisation motivant pour ce travail est le logiciel Garage, un service de stockage d’objets distribué open source adapté aux infrastructures hautement distribuées [6]. Le garage est développé par Deuxfleurs.

Garage utilise déjà les CRDT pour tolérer les déconnexions du réseau, mais nécessiterait parfois un modèle de coordination plus fort. Par exemple, Garage permet actuellement à deux utilisateurs de créer des espaces de stockage en conflit sur deux nœuds différents, et le conflit n’est découvert que lorsque les modifications sont propagées. Une approche légère de « consensus sans leader » offrirait plus de garanties, tout en étant moins sensible à la latence et aux déconnexions du réseau par rapport à Paxos ou Raft.

Un autre problème intéressant dans Garage est : comment maintenir la cohérence des réplicas de données lorsque des nœuds de stockage sont ajoutés ou supprimés ? Tout changement d’adhésion peut entraîner une mise à jour de l’emplacement des réplicas, mais le déplacement réel des données prendra du temps. Pendant ce temps, tous les nœuds doivent maintenir le niveau de cohérence souhaité tout en tenant compte de l’ancien et du nouvel emplacement. Ce problème n’a pas été étudié en profondeur pour le modèle de cohérence lecture après écriture utilisé dans Garage.

Le sujet proposé devrait contribuer à l’état de l’art algorithmique autour des systèmes de stockage distribués, ce qui bénéficierait indirectement à tous ces systèmes. Un autre objectif de la thèse est d’implémenter les solutions proposées dans le logiciel Garage lui-même.

Ce travail peut également être appliqué aux clusters virtuels (Namespaces) dans des piles logicielles de type Kubernetes. Les espaces de noms présentent les services et les déploiements que les utilisateurs utilisent pour créer et exécuter leurs applications. La capacité de déployer efficacement un cluster virtuel sur des ressources géographiquement distribuées pourrait permettre la collaboration entre conteneurs en exposant une ressource créée sur un site à un autre avec un minimum de modifications de code.

2. Partenaires et périodes d’études

2.1. Encadrants et périodes d’études

  • IMT Atlantique :  Dr Daniel Balouek , chercheur Inria, IMT Atlantique, Nantes, France

    Le doctorant restera 30 mois au laboratoire du Dr Balouek.

  • Partenaire international : Le doctorant sera probablement hébergé trois mois à l’institut SCI de l’Université de l’Utah. Cependant, ce partenaire peut encore changer.
  • Partenaire(s) industriel(s) :  Dr Alex Auvolat , ingénieur de recherche, DeuxFleurs

    Le doctorant sera hébergé trois mois à Deuxfleurs.

2.2. Organisations d’hébergement

2.2.1. IMT Atlantique

IMT Atlantique , reconnue internationalement pour la qualité de sa recherche, est une grande université technologique française placée sous la tutelle du ministère de l’Industrie et du Numérique. IMT Atlantique entretient des relations privilégiées avec de grands partenaires industriels nationaux et internationaux, ainsi qu’avec un réseau dense de PME, start-up et réseaux d’innovation. Avec 290 permanents, 2 200 étudiants dont 300 doctorants, IMT Atlantique produit 1 000 publications chaque année et lève 18 millions d’euros de fonds de recherche.

2.2.2. Deuxfleurs

Deuxfleurs  est une association française qui œuvre pour faire évoluer l’expérience Internet vers un Internet convivial.

Exigences

Domaine de recherche
Ingénierie
niveau d’éducation
Master ou équivalent
Compétences/qualifications

Le sujet implique plusieurs domaines : l’algorithmique distribuée, l’implémentation de ces algorithmes dans un logiciel existant (Garage), et les applications aux systèmes distribués réels à grande échelle. Cela impliquera également des expérimentations à grande échelle utilisant des plateformes de recherche telles que SLICES-RI.

Langues
ANGLAIS
Niveau
Excellent
Domaine de recherche
Ingénierie

Informations Complémentaires

Avantages

Un programme doctoral de formation de qualité : 4 raisons de postuler

  • SEED est un  programme d’excellence  conscient de ses responsabilités : fournir un programme de formation de haute qualité pour développer des chercheurs consciencieux, y compris une formation à la recherche responsable et à l’éthique. 
  • L’approche unique de SEED consistant à offrir une expérience interdisciplinaire, internationale et intersectorielle est adaptée pour travailler de manière axée sur la carrière afin d’améliorer l’employabilité et l’intégration du marché.
  • SEED propose un  dispositif de financement compétitif , visant un salaire mensuel moyen de 2 000 euros net par ESR, complété par des allocations de mobilité complémentaires ainsi que des allocations familiales facultatives.
  • SEED est un programme tourné vers l’avenir qui s’engage activement dans les problèmes et défis actuels, offrant  des opportunités de recherche  abordant  des thèmes industriels et académiques pertinents .
Critère d’éligibilité

Critère d’éligibilité . Conformément aux règles du MSCA, SEED sera ouvert aux candidats sans aucune condition de nationalité ni critère d’âge. SEED applique les normes de mobilité MSCA et les connaissances nécessaires. Les candidats éligibles doivent remplir les critères suivants

  • Règle de mobilité : Les candidats doivent faire preuve d’  une mobilité transnationale  en n’ayant pas résidé ni exercé leur activité principale (travail, études, etc.) en France pendant plus de 12 mois au cours des trois années précédant immédiatement la date limite de l’appel du programme cofinancé (janvier 31 2024 pour l’appel n° 1). Ne sont pas pris en compte le service national obligatoire, les courts séjours tels que les vacances et le temps passé dans le cadre d’une procédure d’obtention du statut de réfugié au sens de la Convention de Genève.
  • Chercheurs débutants (ESR) : Les candidats doivent être titulaires  d’un master ou d’un diplôme équivalent  au moment de leur inscription et  doivent être dans les quatre premières années  (expérience de recherche équivalente temps plein) de leur carrière de chercheur. De plus, ils ne doivent  pas avoir obtenu un doctorat .
    Des prolongations peuvent être accordées (sous certaines conditions) pour le congé de maternité, le congé de paternité, ainsi que pour les maladies de longue durée ou le service national.
Processus de sélection

Le processus de sélection est décrit dans le guide du candidat disponible ici :  https://www.imt-atlantique.fr/en/research-innovation/phd/seed/documents

Commentaires supplémentaires

Les candidatures ne peuvent être soumises que via le système de candidature disponible sur le site SEED :  https://www.imt-atlantique.fr/seed

Site Web pour plus de détails sur le travail

Job Features

Job CategoryDoctorat

Apply For This Job

Check Also

The Third Thumb: A Promising Robotic Thumb Enhancing Manual Abilities

Have you ever imagined having an extra thumb to boost your manual abilities? What once …