Sites Inria

English version

Modélisation - Systèmes biologiques

Marie Odin - 6/07/2011

Estimation de paramètres : comment utiliser des données biologiques incomplètes ?

Bactérie E. Coli © Institut Pasteur

Modéliser des systèmes biologiques, notamment au niveau des dynamiques de processus cellulaires : voici l’objectif de l’équipe IBIS. Les données biologiques sont de plus en plus nombreuses mais leur exploitation pour estimer les paramètres mathématiques du modèle reste un problème particulièrement difficile. Sara Berthoumieux, doctorante de l’équipe IBIS, nous présente ses travaux sur le sujet, réalisés dans le cadre de sa thèse.

Quels sont vos axes de recherche ?

Sara Berthoumieux  : Nous travaillons sur la modélisation de systèmes biologiques, et particulièrement des réseaux de gènes et réseaux métaboliques. Nous utilisons des modèles dynamiques qui expliquent l’évolution dans le temps de ces systèmes. Pour ma thèse, nous nous sommes particulièrement intéressés aux réseaux métaboliques. Le métabolisme correspond à l’ensemble des réactions chimiques permettant de produire de l’énergie à partir des nutriments du milieu, ainsi que toutes les protéines indispensables au développement et à la croissance des cellules. Nous nous sommes intéressés au métabolisme de la bactérie Escherichia coli . Cette bactérie est très étudiée en biologie car elle est facile à cultiver. Elle est donc bien connue ce qui facilite la modélisation. L’intérêt de ces recherches est d’étudier le métabolisme pour une meilleure compréhension des processus avec des perspectives notamment d'applications biotechnologiques chez E. coli .

Exemple de réseau métabolique - © LGCB, université Clermont Ferrand

Quelles sont les difficultés rencontrées ?

Sara Berthoumieux  : La difficulté principale est d'obtenir des valeurs pour les paramètres mathématiques du modèle. Ceux-ci correspondent à des coefficients permettant de quantifier les réactions. Ils sont indispensables pour la construction du modèle. Or, ces paramètres ne sont pas directement mesurables car la plupart du temps ils ne sont pas liés à une entité biologique. Nous devons donc les estimer à partir de données biologiques sur les sorties du modèle, notamment ici les concentrations des métabolites, composants des réactions chimiques et les flux de ces réactions. Il faut mentionner qu'il est très difficile de mesurer précisément ces valeurs car les réactions métaboliques sont très rapides et les métabolites des composés instables. Cela nécessite des techniques de mesure sophistiquées, assez récentes, avec des appareils de mesure très puissants. Ces nouvelles techniques produisent de nombreuses informations mais elles contiennent beaucoup de bruit à cause des incertitudes expérimentales importantes. En outre, elles contiennent de nombreuses données manquantes ce qui est fortement problématique pour l’estimation des paramètres du modèle. Nos travaux ont donc consisté à proposer une méthode d’estimation des paramètres, adaptée au modèle que nous étudions, pour faciliter l’exploitation des grands jeux de données biologiques, même si ces données sont incomplètes et imprécises.

Pouvez-vous nous en dire un peu plus sur cette méthode d’estimation des paramètres ?

Sara Berthoumieux  : Nous avons recherché dans la littérature des données biologiques sur les métabolites et nous avons sélectionné le plus gros jeu de données existant, paru dans un article de la revue Science en 2007. Pour l’estimation de paramètres, nous considérons les données manquantes comme des variables aléatoires dont la distribution est définie à partir des données observées. Pour estimer les  valeurs de paramètres à partir de ces données, nous avons adapté une méthode standard dans la littérature. Nous calculons en plus une marge d'erreur pour chaque paramètre, appelée intervalle de confiance. Cependant nous avons pu nous rendre compte que même en utilisant le plus grand jeu de données existant et une méthode validée, les intervalles de confiance obtenus ne permettent pas toujours d'obtenir des estimations précises des valeurs de paramètres. À l'heure actuelle,  il est encore très difficile d'obtenir des données expérimentales suffisamment précises et nombreuses pour calibrer les modèles quantitatifs de grands réseaux métaboliques!

Ces travaux ont été réalisés conjointement avec le Laboratoire de biométrie et de biologie évolutive (LBBE). Le modèle étudié a été conçu spécialement pour l’article par Matteo Brilli, actuellement postdoctorant au sein de l'équipe-projet Bamboo d'Inria.

Sara Berthoumieux remporte le prix Ian Lawson Van Toch  à la conférence ISMB / ECCB 2011.

Logo ISMB - ECCB

La conférence ISMB/ECCB 2011, se déroulant du 15 au 19 juillet 2011 à Vienne, en Autriche, est l’un des plus importants rassemblements en bio-informatique. Pour cette édition 2011, la 19e conférence mondiale Intelligent systems for molecular biology  (ISMB), est organisée conjointement à la 10e conférence européenne European congress of conservation biology  (ECCB). Le principal objectif est le développement et l'application de méthodes avancées de calcul pour des problèmes biologiques. La conférence réunit des scientifiques de l'informatique, de la biologie moléculaire, des mathématiques, des statistiques et autres domaines connexes pour proposer un programme répondant à la diversité des disciplines au sein de la bio-informatique et de la biologie computationnelle.

Mots-clés : Equipe IBIS Sara Berthoumieux Estimation de paramètres Inria Grenoble - Rhône-Alpes Modélisation de systèmes biologiques

Haut de page

Suivez Inria