Avant l’apparition de l’imprimerie, le seul moyen de reproduire et de diffuser un texte sous forme écrite était la copie manuelle. Au cours de ce processus, des accidents, des erreurs et des modifications intentionnelles se sont produits, modifiant progressivement le texte de chaque témoin. Le texte révisé, modifié délibérément ou accidentellement, servait alors de modèle à d’autres copistes et les modifications seraient ainsi propagées. Pour le philologue intéressé par la reconstruction de l’histoire des textes et des relations généalogiques des textes (semblable à un arbre généalogique, appelé stemma codicum ), il a été impératif d’étudier ces différentes variantes et de proposer des méthodes pour la construction objective de tels arbres ( méthodes appelées stemmatologie) . ).
Retrouver la lignée généalogique des manuscrits hébreux du Ben Sira (livre de l’Ecclésiastique ou Sirach) a été l’un des axes majeurs du laboratoire Écritures de l’Université de Lorraine. Dans ce projet, nous proposons d’améliorer le travail manuel effectué dans l’édition critique des manuscrits hébreux de Ben Sira en appliquant les dernières avancées en mathématiques appliquées et en traitement du langage naturel pour reconstruire les stemmas des manuscrits hébreux de Ben Sira . Ce premier travail sera ensuite étendu à d’autres traditions textuelles. Ce projet s’inscrit dans le cadre d’un partenariat entre le centre de recherche Écriture , le LORIA et l’IECL .
Dans ce contexte, nous recherchons un boursier de deux ans pour un poste post-doctoral, pour remplir l’objectif de construire la lignée généalogique des manuscrits hébreux de Ben Sira à travers des algorithmes de stemmatologie computationnelle.
Responsabilités du boursier
Au cours du projet, le boursier sera appelé à diriger et à innover pour atteindre les objectifs suivants :
Benchmark des algorithmes de stemmatologie Comme il n’existe pas de suite systématique pour le benchmarking des algorithmes de stemmatologie, le candidat doit fournir sa propre solution pour s’assurer que les arbres de stemmatologie développés sont objectivement corrects et fournissent des résultats fiables dans le domaine de la philologie.
Innover dans le domaine de la stemmatologie Parce que la plupart des algorithmes de stemmatologie reposent sur la phylogénie, nous pensons que concevoir des algorithmes résilients aux contraintes de transmission textuelle et à la complexité du langage humain améliorerait grandement l’état de l’art actuel. Le candidat devrait proposer son propre algorithme de stemmatologie basé sur la PNL, qui surpassera l’état de l’art sur les manuscrits de Ben Sira.
Tirer des conclusions originales concernant la généalogie des manuscrits de Ben Sira Après ces phases de benchmarking et de développement, le candidat appliquera ces algorithmes aux manuscrits de Ben Sira et discutera de leurs résultats avec les experts en philologie pour tirer de nouvelles conclusions concernant la transmission des manuscrits.
Fournir des résultats Open-Source Pour assurer une réception la plus large possible du projet et tendre vers l’objectif de rendre la science accessible à tous, le candidat est tenu de fournir tous les logiciels développés au cours du projet en tant que logiciels Open-Source , respectant toutes les contraintes de qualité du développement logiciel moderne. Les jeux de données générés (regroupés Ben Sira, jeux de données utilisés pour le benchmarking des algorithmes de stemmatologie…) devraient également être mis à disposition du public. Tous les résultats seront publiés dans des revues et des conférences à fort impact.
Compétences requises
Compétences mathématiques Le candidat doit être titulaire d’un doctorat en informatique ou en mathématiques appliquées (intelligence artificielle, traitement du langage naturel…).
Une expérience en traitement automatique du langage naturel ou en modélisation de systèmes complexes est requise.
Une bonne connaissance des algorithmes de stemmatologie et de l’état de l’art actuel serait un énorme plus pour la réussite du projet.
Compétences techniques Le candidat doit être très familier avec l’écosystème Python et R pour la manipulation et l’analyse de données : pandas , sklearn , tensorflow , Keras .
Le candidat doit avoir une expérience préalable dans le développement de logiciels Open-Source et une bonne connaissance des normes de développement actuelles, pour s’assurer que le projet atteigne le plus grand nombre possible d’universitaires : pipelines CI/CD, conteneurisation, déploiements automatisés. Ils seront également amenés à interagir quotidiennement avec des bases de données SQL et NoSQL : mongodb , MariaDB Une bonne compréhension de XML TEI et des outils de collation serait un plus.
Compétences en sciences humaines Connaissance de base du grec classique et de l’hébreu ancien. Des connaissances et un intérêt pour la critique textuelle, la philologie et les études bibliques seraient un plus.
Le candidat doit avoir un bon niveau en anglais. La connaissance du français serait un plus.
Termes et mandat
Ce poste de deux ans sera basé au centre de recherche Ecritures (EA3943), Ile du Saulcy, 5700 Metz. La durée ne peut excéder 24 mois.
La date de début cible pour le poste est le 1er septembre 2023, avec une certaine flexibilité sur la date de début exacte.
comment s’inscrire
Les candidats sont priés de soumettre les documents suivants :
• Une lettre de motivation expliquant leur motivation pour le poste.
• Curriculum Vitae complet et liste des publications.
• Relevés de notes académiques (les versions non officielles conviennent)
La date limite de candidature est le 7 juin 2023. Les candidats seront interviewés par une commission ad hoc avant le 28 juin. Les candidatures ne sont acceptées que par e-mail. Tout document doit être envoyé à frederique.rey@univ-lorraine.fr
lieu de travail
Metz, Lorraine, France
Caractéristiques de l'emploi
Catégorie emploi | Postdoctoral |