Une équipe de recherche a mis au point une nouvelle façon de rechercher des gènes et des mutations génétiques susceptibles de contribuer au développement de maladies rares, en contournant certains des défis généralement associés aux analyses génétiques.
Pour des maladies telles que la sclérose latérale amyotrophique (SLA) dans lesquelles on pense que des facteurs génétiques contribuent, cette nouvelle approche pourrait aider les scientifiques à découvrir de manière plus fiable de nouveaux fondements génétiques et de nouveaux mécanismes pathologiques.
Dans la SLA et d’autres maladies comme le cancer du cerveau pédiatrique, on estime que “20 % des patients peuvent s’expliquer par [genetic] prédisposition à la maladie », Gang Wu, PhD, directeur du St. Jude Center for Applied Bioinformatics et auteur principal de l’étude, a déclaré dans un communiqué de presse.
“Nos outils aideront à trouver l’héritabilité inexpliquée restante qui peut contribuer à ces maladies”, a ajouté Wu.
L’étude, “Un cadre d’analyse des variants rares utilisant des décomptes sommaires publics de génotypes pour hiérarchiser les gènes de prédisposition aux maladies“A été publié dans Communication Nature.
Les analyses génétiques aident les scientifiques à mieux comprendre les mécanismes des maladies rares et offrent un aperçu du diagnostic et du traitement. Souvent, les gènes associés à la maladie sont identifiés en comparant les données de séquençage génétique d’un petit groupe de patients atteints de maladies rares avec celles de personnes en bonne santé du même âge incluses dans une grande base de données publique.
Mais trouver des variantes génétiques qui causent véritablement des maladies rares peut être extrêmement difficile. Habituellement, il y a peu de patients atteints de la maladie rare, et il est également difficile de trouver un groupe de participants en bonne santé et du même âge qui soient suffisamment similaires aux patients pour faire une comparaison significative.
En fin de compte, cela signifie qu’il n’y a pas assez de participants et pas assez de cohérence dans les données disponibles pour permettre à tout résultat d’atteindre une signification statistique. En d’autres termes, les études sont limitées dans leur capacité à détecter des relations définitives entre un gène ou une mutation et une maladie d’intérêt.
“Tout cela est un jeu de chiffres”, a déclaré Wu. «Traditionnellement, si vous avez une petite étude de cohorte de 20 à 50 personnes non apparentées atteintes d’une maladie très rare, vous n’avez presque aucun moyen de trouver une nouvelle variante de gène qui atteint une signification statistique dans sa contribution à la maladie sans connaissance préalable des gènes candidats.
“Nous avons maintenant une approche qui peut potentiellement aider à trouver de nouveaux gènes de prédisposition aux maladies”, a ajouté Wu.
Dans cette nouvelle approche, Wu et ses collègues ont créé un outil appelé CoCoRV, ou le test de charge des variantes rares basé sur le nombre de résumés cohérents. En bref, le test compare les données génétiques des patients atteints de maladies rares avec des données récapitulatives qui existent déjà dans de grandes bases de données publiques pour identifier les mutations ou variantes génétiques potentiellement pathogènes.
Étant donné que les données des deux groupes proviennent de sources différentes, CoCoRV utilise également une série de filtres de contrôle de qualité standardisés pour s’assurer que tous les facteurs de confusion susceptibles d’obscurcir les résultats sont supprimés. Seules des “variantes de haute qualité” sont utilisées dans l’analyse, a écrit l’équipe.
Ce pipeline crée essentiellement un groupe de contrôle qui est une comparaison bien adaptée pour le groupe de maladies.
«Lorsque vous disposez d’une grande quantité de données, vous pouvez utiliser ces connaissances pour dériver des règles qui catégorisent systématiquement ce qui est un vrai signal par rapport à ce qui est de mauvaise qualité dans d’autres ensembles de données. Nous avons intégré cette expérience dans un outil qui serait utile à d’autres », a déclaré Wenan Chen, PhD, premier auteur de l’étude.
“Les utilisateurs peuvent donc rechercher en toute confiance des agents pathogènes potentiels [disease-causing] variantes ou essayer d’identifier les gènes à risque pour une maladie rare », a déclaré Chen.
Pour mettre le CoCoRV à l’épreuve, l’équipe l’a utilisé pour rechercher des variantes génétiques dans un ensemble de données d’une étude sur la SLA par rapport à des données de contrôle sain. L’analyse a inclus 3 093 cas de SLA et 8 186 témoins sains, tous de race blanche.
L’analyse a révélé que les gènes connus de la SLA SOD1, NEK1et TBK1 semblaient être parmi les principaux gènes associés à la SLA dans le groupe d’étude, validant l’approche. L’analyse a également permis d’identifier et d’éliminer les résultats “faux positifs”, ont déclaré les chercheurs.
Les chercheurs ont également validé leur approche dans une analyse des données génétiques de patients atteints de cancer.
Bien que l’outil permette de hiérarchiser les gènes susceptibles de contribuer à la maladie, “nous avertissons que CoCoRV doit être utilisé comme un outil de hiérarchisation et non comme un outil de validation statistique”, ont écrit les chercheurs.
“Une fois les gènes intéressants identifiés, un test d’association strict basé sur le génotype complet ou des études fonctionnelles en laboratoire sont nécessaires pour valider les résultats”, ont-ils ajouté. Le génotype fait référence à la composition génétique d’un organisme.
L’équipe a mis l’outil gratuitement à la disposition des chercheurs qui étudient les maladies rares.