C HEZ les mammifères et les plantes supérieures, interpréter les séquences du génome et identifier de nouveaux gènes n'est pas simple. Les ADN codants alternent avec des régions non codantes, un gène peut livrer de nombreux produits différents, il existe des répétitions, etc. Le décodage de la séquence du génome ne peut, en l'état des moyens techniques, être décodé directement de manière fiable pour identifier le spectre des ARNm (le transcriptome) et de leurs produits protéiques (le protéome). Ces difficultés sont illustrées par les estimations variées du nombre des gènes humains : 30 000, 35 000 ou 120 000.
L'une des manières d'aborder la question est de collecter les brins d'ARN messagers produits au moment de l'expression d'un gène, puis de cloner les ADN complémentaires (ADNc). Le séquençage d'un clone complet d'ADNc fournit un indice plus fiable de l'existence et de la structure d'un gène. Le « Mouse Gene Encyclopedia Project » applique cette méthode au génome de la souris, afin d'identifier et de séquencer tous les transcrits.
21 076 clones séquencés
Dans le dernier numéro de « Nature », le consortium international, coordonné par Yoshihide Hayashizaki (du RIKEN Genomic Sciences Center *, Kanagawa, Japon), publie la caractérisation de leur première collection d'ADNc qu'ils ont réalisée chez la souris sur 21 076 clones séquencés à partir d'une vaste librairie d'ADNc, qu'ils avaient constituée, provenant de tissus variés et de différents stades de développement.
Les chercheurs ont découvert plus de 100 clones correspondant à des gènes nouvellement identifiés chez la souris et assignés à des rôles métaboliques variés.
Ensuite, une comparaison avec 288 gènes orthologues (homologues dans une autre espèce) de maladies humaines a été réalisée, et, on a trouvé 118 gènes partageant une identité significative avec un ou plusieurs clones des ADNc séquencés.
Ainsi, ont été identifiés de nouveaux orthologues pour dix gènes de maladies humaines : deux liés au cancer (oncogènes DEK et BCR), trois associés à des troubles neurologiques (dysferline, MJD et USH2A), trois liés à des syndromes malformatifs (CKN1, PEX1 et Tafazzine), et deux liés à des désordres hématologiques (hémoglobine-alpha et XK).
A côté de cela, comme dans les génomes en cours d'identification, beaucoup des nouveaux gènes trouvés sont des membres de grandes familles multigéniques associées à la différenciation cellulaire, à la transduction des signaux et à des gènes de l'homéobox.
Soixante-dix-sept des ADNc démontrent une homologie certaine avec des protéine-phosphatases connues et 193 à des protéine-kinases. Par contre, peu de gènes appartenant au domaine immunitaire ont été trouvés.
* Informations sur le site : www.gsc.riken.go.jp/e/FANTOM/viewer/
« Nature », vol. 409, 8 février 2001, pp. 685-690.
Pause exceptionnelle de votre newsletter
En cuisine avec le Dr Dominique Dupagne
[VIDÉO] Recette d'été : la chakchouka
Florie Sullerot, présidente de l’Isnar-IMG : « Il y a encore beaucoup de zones de flou dans cette maquette de médecine générale »
Covid : un autre virus et la génétique pourraient expliquer des différences immunitaires, selon une étude publiée dans Nature