JOBIM2026 Mini-Symposium "L’annotation structurale des gènes dans les génomes Eucaryotes reste-t-elle toujours un défi ?"

Organisateurs : Sophie Lemoine1, Erwan Corre2, Véronique Brunaud3

1- GenomiqueENS - IBENS, CNRS, INSERM, Université PSL slemoine@bio.ens.psl.eu

2- ABIMS - Station Biologique de Roscoff - CNRS-SU erwan.corre@sb-roscoff.fr

3- IPS2- INRAE, CNRS, Univ. Paris-Saclay veronique.brunaud@inrae.fr 

Mots-clés : annotation des génomes, structure des gènes, retour d’expérience 

Le séquençage des génomes eucaryotes connaît une croissance exponentielle, comme l’illustre la base du NCBI, qui recense environ 60000 génomes eucaryotes correspondant à 25000 espèces distinctes (www.ncbi.nlm.nih.gov/datasets/genome/). Néanmoins, l’annotation structurale des gènes demeure une étape qui présente des défis significatifs à la base de l’interprétation fonctionnelle de ces génomes. En effet, de nombreux génomes ne disposent que d’annotations partielles ou absentes (seulement 24% des génomes ont une annotation). En outre, la qualité des modèles de gènes varie fortement selon les espèces et les outils utilisés (Scalzitti et al. 2020). Malgré l’apport du séquençage du transcriptome (RNAseq), ces annotations demeurent biaisées pour définir les frontières des exons, des UTRs et des sites d’épissage alternatif. De plus, l’identification de toutes les isoformes des gènes codants et non codants reste incomplète.

L'objectif de ce mini-symposium est de présenter des retours d'expérience sur l’apport des longues lectures en RNAseq pour l'annotation des gènes codants, non codants et des isoformes. D'explorer les nouveaux outils d’annotation basés sur l'Intelligence Artificielle (IA), tels qu’Helixer (Stiehler et al. 2021), qui combinent réseaux de neurones profonds et modèles de type HMM (Hidden Markov Models). Enfin, les approches fondées sur la détection des ruptures dans les profils d’expression de RNAseq pourraient être une nouvelle façon d’envisager l’annotation des génomes.

Programme: jeudi 2 juillet 15h-18h

15h - Jean-Marc Aury (CEA Genoscope) : "Structural Annotation of Marine Genomes from ATLASea"

15h30 - Audrey Onfroy (IBENS) "When AI meets structural genome annotation: lessons from Helixer in Morpho"

15h55 - Véronique Brunaud (IPS2) "Arabidopsis genome annotations, differences between official and Helixer"

16h20 - 16h40 Pause 

16h40 - Thomas Derrien (IGDR) / Fabien Degalez (Institut Agro) "Genome annotation of lncRNAs using long-read transcriptomics"

17h05 -  Fabrice Legeai (IGEPP) "Gene annotation of insect genome with EGAPx and Helixer"

17h30 -  Arnaud Liehrmann (IPBS-SU) "Detecting transcriptional regulation despite incomplete annotation"

18h - fin du mini-symposium

Ce mini-symposium est coorganisé par deux réseaux métiers de la communauté bioinformatique, le PEPI IBIS (https://pepi-ibis.inrae.fr) INRAE et le réseau MERIT (https://merit.cnrs.fr) du CNRS. Et nous remercions la SFBI (https://www.sfbi.fr/) pour son aide.