Le séquençage est devenu un outil essentiel dans l’analyse génétique et génomique. Il est de plus en plus important pour les scientifiques expérimentaux d’acquérir les compétences bioinformatiques nécessaires pour analyser les grands volumes de données produits par les séquenceurs. Ce cours vise à doter les participants des compétences informatiques essentielles nécessaires pour commencer à analyser les données et appliquer certains des outils et ressources les plus couramment utilisés pour l’analyse des données de séquence.
Le programme couvre les principales technologies de séquençage, la théorie algorithmique et les principes de la bioinformatique, avec un fort accent sur les sessions de calcul pratiques utilisant des techniques et des outils d’analyse de séquence applicables à toute espèce ou taille de génome. Une variété d’applications seront couvertes depuis l’analyse post-séquençage, le contrôle qualité, l’alignement de référence et l’appel de variantes.
Le cours couvrira les sujets suivants :
• Introduction à Unix/Linux et aux flux de travail en cours d’exécution
• Introduction aux technologies de séquençage
• Prétraitement des données de séquençage et CQ
• Alignement sur les séquences de référence
• Appel et annotation de variantes
Public visé:
Les candidats doivent être des scientifiques postdoctoraux, des doctorants seniors, des membres juniors du corps professoral ou des cliniciens / professionnels de la santé activement engagés ou sur le point de commencer des recherches impliquant l’analyse de données de séquençage de nouvelle génération.La priorité sera donnée aux candidats qui 1) ont actuellement ou auront bientôt des données expérimentales NGS à analyser 2) utiliseront les techniques bioinformatiques enseignées dans au moins deux des modules / domaines répertoriés dans le plan du programme dans leurs expériences 3) ont un clair plan/opportunité de diffuser les connaissances parmi leurs pairs. Nous encourageons les candidats à mettre en évidence ces domaines dans leur candidature.
Objectifs d’apprentissage:
Après cet atelier, les participants devraient être en mesure de :
Utiliser la ligne de commande Unix comme outil d’analyse de données
Décrire les différents formats de fichiers de données NGS disponibles
Effectuer une évaluation QC des données de séquençage à haut débit
Expliquer les concepts algorithmiques derrière l’alignement de lecture, l’appel de variantes et la détection de variantes structurelles
Effectuez un alignement de lecture, un appel de variante et une détection de variation structurelle à l’aide d’outils standard