Journée scientifique
Fouille de texte en biologie
Le PPF Bioinformatique organise une journée scientifique sur les applications de la fouille de texte à la biologie : extraction d'information en génomique,inférence des interactions géniques...seront à l'ordre du jour.
- Date : 20/09/2011
- Lieu : Amphithéatre du batiment IRI-IRCICA, campus CNRS
- Organisateurs : PPF Bio-informatique
La journée se tiendra dans l'amphithéatre du batiment IRI-IRCICA, de 9h45 à 17h00.
Mikaela Keller, membre de l'équipe-projet Inria Mostrare et de de l'Université Lille 3 interviendra sur la découverte du vocabulaire automatisé pour l'analyse de la géo-information sur les épidémies en ligne.
Résumé
Automated vocabulary discovery for geo-parsing online epidemic intelligence
Automated surveillance of the Internet provides a timely and sensitive method for alerting on global emerging infectious disease threats. HealthMap is part of a new generation of online systems designed to monitor and visualize, on a real-time basis, disease outbreak alerts as reported by online news media and public health sources. HealthMap is of specific interest for national and international public health organizations and international travelers. A particular task that makes such a surveillance useful is the automated discovery of the geographic references contained in the retrieved outbreak alerts. This task is sometimes referred to as "geo-parsing". A typical approach to geo-parsing would demand an expensive training corpus of alerts manually tagged by a human. Given that human readers perform this kind of task by using both their lexical and contextual knowledge, we developed an approach which relies on a relatively small expert-built gazetteer, thus limiting the need of human input, but focuses on learning the context in which geographic references appear. We show in a set of experiments, that this approach exhibits a substantial capacity to discover geographic locations outside of its initial lexicon.
La participation est gratuite mais l'inscription obligatoire.
Découvrir le programme complet
Localisation
Mots-clés : Fouille de textes Biologie PPF Bioinformatique Mikaela Keller Equipe-projet Mostrare Centre de recherche Inria Lille - Nord Europe
Inscription
Pour vous inscrire, merci de communiquer les informations ci-dessous à Guillemette Marot :
- Nom
- Laboratoire
- Participation au déjeuner
Inscription gratuite mais obligatoire
Fouille de texte en biologie
La fouille de textes ou l'extraction de connaissances dans les textes est un ensemble de traitements informatiques consistant à extraire des connaissances selon un critère de nouveauté ou de similarité dans des textes produits par des humains pour des humains. Dans la pratique, cela revient à mettre en algorithmes un modèle simplifié des théories linguistiques dans des systèmes informatiques d'apprentissage et de statistiques. Source Wikipédia
Inria
Inria.fr
Inria Channel
