Sites Inria

English version

Technologie

Jean-Michel Prima - 4/04/2017

Un outil d'analyse génomique pour le diagnostic cancer

Dominique Lavenier et Patrick Durand, équipe Genscale Dominique Lavenier et Patrick Durand

Développée par l'équipe de recherche GenScale, au centre Inria Rennes – Bretagne Atlantique, GATB est une boîte à outils pour l'analyse des données issues des séquenceurs génomiques de nouvelle génération. Elle comprend aujourd'hui une douzaine de logiciels spécialisés dans différentes tâches de bio-informatique. Les chercheurs prévoient d'y intégrer une nouvelle application destinée à faciliter le diagnostic pour le traitement des cancers dans les hôpitaux.

Depuis dix ans, le séquençage génomique connaît des progrès fulgurants. Son coût chute à vue d’œil. À tel point que la cartographie de l'ADN pourrait devenir aussi banale qu'une prise de sang. Cette petite révolution s'explique par l'arrivée de machines plus performantes. On les appelle les NGS : les séquenceurs de nouvelle génération.

L'exploitation systématique des données issues de ces appareils va permettre aux hôpitaux d'améliorer le ciblage du traitement, en particulier dans le soin du cancer. Mais pour cela, les médecins en charge du diagnostic devront disposer de nouveaux logiciels d'analyse capables d'absorber les énormes volumes de données produites et d'y repérer l'information pertinente.

Recherche de mutations

Pour répondre à ce besoin, les chercheurs de l'équipe de bio-informatique GenScale s'apprêtent à développer une nouvelle application. L'idée ? « Construire un outil qui permettra au médecin d'observer chez le patient un certain nombre de gènes dont l'éventuelle mutation peut être impliquée dans un type de cancer donné, explique Dominique Lavenier , responsable de l'équipe. À partir des mutations observées, le médecin pourra ensuite orienter la thérapie et proposer la molécule la plus adaptée pour interagir avec le gène ciblé . »

 Ce nouveau logiciel s'appuiera sur la librairie de GATB, une boîte à outils dont les algorithmes possèdent une faible empreinte mémoire et travaillent directement à partir de données compressées. Ces caractéristiques constituent un avantage en raison de l'aspect très volumineux des données génomiques. « Grâce à l'utilisation d'une représentation compacte, notre approche va faire gagner énormément de temps, sur le plan à la fois  du traitement et du stockage. »  

Des cancérologues du CHU de Rennes collaborent à ces recherches. « Ce sont eux qui nous guident. Nous sommes actuellement dans une phase visant à bien définir l'outil pour faire en sorte qu'il corresponde exactement aux attentes. Nous voudrions aussi qu'il soit suffisamment générique pour intéresser d'autres établissements hospitaliers ailleurs en France. »

Industrialisation du logiciel

Pour appuyer ce travail scientifique, Inria finance actuellement une action de développement technologique (ADT) qui va permettre l'industrialisation du logiciel. « Nous avons un certain nombre de choses à affiner avec les médecins. Ensuite, il s'agira pour moi de transformer le prototype afin d'en faire un logiciel de classe industrielle, explique Patrick Durand , l'ingénieur de recherche en charge de l'écriture du programme. L'outil devra en particulier respecter un certain nombre de réglementations en matière de logiciel destiné au diagnostic médical. Nous nous dirigerons après cela vers une phase de certification. » 

 Pour l'heure, les efforts se concentrent sur la définition de l'outil. L'une des questions centrales porte sur l'établissement de critères permettant au logiciel de discerner les vraies mutations. « Les séquenceurs ont tendance à produire des erreurs. Il faut donc que le logiciel soit capable de faire la distinction entre une vraie mutation et une simple erreur de séquençage. À cela s'ajoutent les polymorphismes naturels, c'est à dire des différences qui peuvent exister chez un individu par rapport au génome humain de référence et qui, là non plus, ne constituent pas des mutations. »

Comment lever ces doutes ? « Idéalement, à chaque mutation observée, il faudrait associer une probabilité plus ou moins élevée, répond Dominique Lavenier. Au médecin ensuite de décider s'il y a lieu d'investiguer plus profondément. » 

 Ceci étant dit, le travail d'interprétation pourrait, lui aussi, être facilité. « Si le logiciel met en évidence une mutation, c'est intéressant d'interroger les bases de données existantes pour savoir à quoi elle correspond et quelles en sont les conséquences. Ce type d'information existe déjà dans les bases de données, mais de façon dispersée. Nous voudrions donc les agréger pour que, quand le médecin observe une mutation un peu particulière, il puisse savoir qu'elle a déjà été vue à tel endroit et que tel traitement a été appliqué avec tel résultat. Il ne s'agit plus alors seulement de fournir un outil pour montrer une mutation, mais aussi pour aider à l'interpréter. Il existe ainsi une quantité d'informations à exploiter pour ajouter de la connaissance. Et aujourd'hui, c'est ce type d'outils d'aide à la décision qui fait défaut dans les hôpitaux. »

Mots-clés : GATB Bio-informatique INRIA Rennes - Bretagne Atlantique Genscale Patrick Durand Dominique Lavenier

Haut de page

Suivez Inria tout au long de son 50e anniversaire et au-delà !