Informations sur l’emploi
- Organisation/Entreprise
-
IMT Atlantique
- Département
-
Division doctorale
- Domaine de recherche
-
Ingénierie
- Profil de chercheur
-
Chercheur de première étape (R1)
- Pays
-
France
- Date limite d’inscription
- Type de contrat
-
Temporaire
- Statut du travail
-
À temps plein
- Heures par semaine
-
37
- Date de début de l’offre
- Le poste est-il financé par le programme-cadre de recherche de l’UE ?
-
HE/MSCA COFUND
- Numéro de convention de subvention Marie Curie
-
101126640
- L’emploi est-il lié au poste du personnel au sein d’une infrastructure de recherche ?
-
Non
Description de l’offre
Description de l’offre
Le poste de doctorat est proposé dans le cadre d’un parcours standard (30 mois à IMT Atlantique + 3 mois à l’institut SCI de l’Université de l’Utah + 3 mois à Deuxfleurs, France.)
1.1. Domaine et contexte scientifique/technique
Les connexions à faible latence et les serveurs décentralisés présentent actuellement un nouveau potentiel pour l’informatique distribuée. En particulier, la mobilité et la connectivité intermittente des ressources informatiques créent un besoin en mécanismes de stockage distribué résilients à l’isolement du réseau.
Cependant, le développement de systèmes intégrés capables d’exploiter des ressources hautement distribuées nécessite que les développeurs et les fournisseurs de services fassent face au manque de fiabilité des nœuds de calcul et de l’infrastructure réseau, et doit être pris en compte dès la phase de conception des systèmes. De plus, des contraintes plus pressantes en matière de consommation d’énergie et de ressources favoriseront le besoin d’un calcul distribué avec des capacités restreintes, s’appuyant par exemple sur de petits nœuds de serveur éteints ou déconnectés la plupart du temps.
1.2. Défis scientifiques/techniques
Les problèmes de coordination et de consensus sont au cœur des algorithmes distribués. Dans le contexte des infrastructures côté serveur et notamment des systèmes de stockage hautement distribués, nous identifions deux contributions principales dans le cadre de cette proposition de sujet :
- Consensus sans leader pour les logiciels côté serveur : de nombreux algorithmes distribués déployés aujourd’hui reposent sur une forte coordination et sur l’élection des leaders : il s’agit d’une approche coûteuse qui n’est pas compatible avec des nœuds de calcul et un réseau peu fiables. En revanche, des approches de coordination faibles et un consensus sans leader sont attrayants dans cette situation. Cependant, ils ont principalement été appliqués dans le contexte d’applications locales côté client. Nous prévoyons d’étendre ce travail pour développer de meilleurs logiciels distribués côté serveur légers avec un temps d’accès plus rapide et une consommation de ressources légère, même dans des situations qui rendent la coordination difficile.
- CRDT pour les systèmes de stockage et de cluster : lorsqu’une forme de coordination encore plus faible est tolérable, les types de données répliquées sans conflit (CRDT) [3] fournissent un bon support système pour la connectivité intermittente. Les CRDT sont utilisés dans les schémas de synchronisation, car les répliques peuvent être mises à jour indépendamment et simultanément sans coordination directe [4,5]. Nous prévoyons d’étudier et de formaliser l’utilisation des CRDT dans les systèmes de stockage et les clusters virtuels.
1.3. Méthodes réfléchies, résultats et impacts visés
Le principal cas d’utilisation motivant pour ce travail est le logiciel Garage, un service de stockage d’objets distribué open source adapté aux infrastructures hautement distribuées [6]. Le garage est développé par Deuxfleurs.
Garage utilise déjà les CRDT pour tolérer les déconnexions du réseau, mais nécessiterait parfois un modèle de coordination plus fort. Par exemple, Garage permet actuellement à deux utilisateurs de créer des espaces de stockage en conflit sur deux nœuds différents, et le conflit n’est découvert que lorsque les modifications sont propagées. Une approche légère de « consensus sans leader » offrirait plus de garanties, tout en étant moins sensible à la latence et aux déconnexions du réseau par rapport à Paxos ou Raft.
Un autre problème intéressant dans Garage est : comment maintenir la cohérence des réplicas de données lorsque des nœuds de stockage sont ajoutés ou supprimés ? Tout changement d’adhésion peut entraîner une mise à jour de l’emplacement des réplicas, mais le déplacement réel des données prendra du temps. Pendant ce temps, tous les nœuds doivent maintenir le niveau de cohérence souhaité tout en tenant compte de l’ancien et du nouvel emplacement. Ce problème n’a pas été étudié en profondeur pour le modèle de cohérence lecture après écriture utilisé dans Garage.
Le sujet proposé devrait contribuer à l’état de l’art algorithmique autour des systèmes de stockage distribués, ce qui bénéficierait indirectement à tous ces systèmes. Un autre objectif de la thèse est d’implémenter les solutions proposées dans le logiciel Garage lui-même.
Ce travail peut également être appliqué aux clusters virtuels (Namespaces) dans des piles logicielles de type Kubernetes. Les espaces de noms présentent les services et les déploiements que les utilisateurs utilisent pour créer et exécuter leurs applications. La capacité de déployer efficacement un cluster virtuel sur des ressources géographiquement distribuées pourrait permettre la collaboration entre conteneurs en exposant une ressource créée sur un site à un autre avec un minimum de modifications de code.
2. Partenaires et périodes d’études
2.1. Encadrants et périodes d’études
- IMT Atlantique : Dr Daniel Balouek , chercheur Inria, IMT Atlantique, Nantes, France
Le doctorant restera 30 mois au laboratoire du Dr Balouek.
- Partenaire international : Le doctorant sera probablement hébergé trois mois à l’institut SCI de l’Université de l’Utah. Cependant, ce partenaire peut encore changer.
- Partenaire(s) industriel(s) : Dr Alex Auvolat , ingénieur de recherche, DeuxFleurs
Le doctorant sera hébergé trois mois à Deuxfleurs.
2.2. Organisations d’hébergement
2.2.1. IMT Atlantique
IMT Atlantique , reconnue internationalement pour la qualité de sa recherche, est une grande université technologique française placée sous la tutelle du ministère de l’Industrie et du Numérique. IMT Atlantique entretient des relations privilégiées avec de grands partenaires industriels nationaux et internationaux, ainsi qu’avec un réseau dense de PME, start-up et réseaux d’innovation. Avec 290 permanents, 2 200 étudiants dont 300 doctorants, IMT Atlantique produit 1 000 publications chaque année et lève 18 millions d’euros de fonds de recherche.
2.2.2. Deuxfleurs
Deuxfleurs est une association française qui œuvre pour faire évoluer l’expérience Internet vers un Internet convivial.
Exigences
- Domaine de recherche
- Ingénierie
- niveau d’éducation
- Master ou équivalent
Le sujet implique plusieurs domaines : l’algorithmique distribuée, l’implémentation de ces algorithmes dans un logiciel existant (Garage), et les applications aux systèmes distribués réels à grande échelle. Cela impliquera également des expérimentations à grande échelle utilisant des plateformes de recherche telles que SLICES-RI.
- Langues
- ANGLAIS
- Niveau
- Excellent
- Domaine de recherche
- Ingénierie
Informations Complémentaires
Un programme doctoral de formation de qualité : 4 raisons de postuler
- SEED est un programme d’excellence conscient de ses responsabilités : fournir un programme de formation de haute qualité pour développer des chercheurs consciencieux, y compris une formation à la recherche responsable et à l’éthique.
- L’approche unique de SEED consistant à offrir une expérience interdisciplinaire, internationale et intersectorielle est adaptée pour travailler de manière axée sur la carrière afin d’améliorer l’employabilité et l’intégration du marché.
- SEED propose un dispositif de financement compétitif , visant un salaire mensuel moyen de 2 000 euros net par ESR, complété par des allocations de mobilité complémentaires ainsi que des allocations familiales facultatives.
- SEED est un programme tourné vers l’avenir qui s’engage activement dans les problèmes et défis actuels, offrant des opportunités de recherche abordant des thèmes industriels et académiques pertinents .
Critère d’éligibilité . Conformément aux règles du MSCA, SEED sera ouvert aux candidats sans aucune condition de nationalité ni critère d’âge. SEED applique les normes de mobilité MSCA et les connaissances nécessaires. Les candidats éligibles doivent remplir les critères suivants
- Règle de mobilité : Les candidats doivent faire preuve d’ une mobilité transnationale en n’ayant pas résidé ni exercé leur activité principale (travail, études, etc.) en France pendant plus de 12 mois au cours des trois années précédant immédiatement la date limite de l’appel du programme cofinancé (janvier 31 2024 pour l’appel n° 1). Ne sont pas pris en compte le service national obligatoire, les courts séjours tels que les vacances et le temps passé dans le cadre d’une procédure d’obtention du statut de réfugié au sens de la Convention de Genève.
- Chercheurs débutants (ESR) : Les candidats doivent être titulaires d’un master ou d’un diplôme équivalent au moment de leur inscription et doivent être dans les quatre premières années (expérience de recherche équivalente temps plein) de leur carrière de chercheur. De plus, ils ne doivent pas avoir obtenu un doctorat .
Des prolongations peuvent être accordées (sous certaines conditions) pour le congé de maternité, le congé de paternité, ainsi que pour les maladies de longue durée ou le service national.
Le processus de sélection est décrit dans le guide du candidat disponible ici : https://www.imt-atlantique.fr/en/research-innovation/phd/seed/documents
Les candidatures ne peuvent être soumises que via le système de candidature disponible sur le site SEED : https://www.imt-atlantique.fr/seed
- Site Web pour plus de détails sur le travail
Job Features
Job Category | Doctorat |