Sites Inria

English version

Equipe de recherche METISS

Modélisation et expérimentation pour le traitement des informations et des signaux sonores

  • Responsable : Frederic Bimbot
  • Centre(s) de recherche : CRI Rennes - Bretagne Atlantique
  • Domaine : Perception, cognition, interaction
  • Thème : Langue, parole et audio
  • Partenaire(s) : Université Rennes 1,CNRS
  • Collaborateur(s) : Institut de recherche en informatique et systèmes aléatoires (IRISA) (UMR6074)

Présentation de l'équipe

Les domaines d'application de METISS sont centrés sur le signal sonore et comportent trois volets : la caractérisation du locuteur (notamment pour la vérification vocale d'identité), le suivi de locuteur et de classes de sons pour l'indexation d'enregistrements sonores et le traitement " avancé " de signaux sonores (par exemple, la séparation de sources dans le cas sous-déterminé). Les fondements scientifiques de nos activités s'inscrivent dans le cadre des mathématiques appliquées, du traitement du signal, de la modélisation probabiliste, de l'estimation statistique et de la théorie de la décision. Nous nous appuyons sur les outils de traitement de signal au niveau de la représentation du signal (représentations adaptatives), de sa paramétrisation (analyse spectrale) et de sa décomposition (séparation de sources). Les approches probabilistes interviennent au niveau de la modélisation acoustique (modèles de distribution) et de la classification (tests d'hypothèses et reconnaissance). Nos travaux font également appe à des algorithmes de décodage et de poursuite tels que l'algorithme de Viterbi et le Matching Pursuit. Les principaux secteurs industriels concernés sont le secteur des télécommunications, celui de l'Internet et du multimédia, et sont susceptibles de s'étendre aux domaines de la production musicale et audiovisuelle et à celui des logiciels éducatifs et des jeux.

Axes de recherche

  • Caractérisation, identification et vérification du locuteur
  • Modélisation, détection d'informations et indexation d'enregistrements audio.
  • Séparation de sources et traitement avancé du son.

Relations industrielles et internationales

  • Laboratoire d'informatique d'Avignon (LIA), ENST, Lyon II - DDL, EPFL,... : consortium ELISA (Participation annuelle aux évaluations NIST en reconnaissance et suivi du locuteur [1997-...]
  • l'INA, les sociétés CS-Systèmes d'Information, Arts Vidéo Interactive et Mémodata, et des équipes de l'IRIT, du CLIP-IMAG, de l'INT, et du LIP6 : projet RNRT AGIR (développement d'un système d'indexation audio-visuelle et de recherche par le contenu) [1998-2001]
  • Ibermatica, BBVA, Oberthur, Thalès Communication, et les laboratoires de l'EPFL, l'IDIAP,Université Carlos III, Université du Surrey : projet BANCA (vérification du locuteur dans les transactions bancaires) [1999-2002]
  • CP8 (ex-Bull) : Vérification du locuteur sur carte à puce, rapide et distribuée [1999-2001]
  • Thomson MultiMédia, IRCCyn, INA, SFRS : projet RNRT Domus Videum (Génération de résumés audio-visuels pour les plates-formes multimédia domestiques [2001-2004].

Mots-clés : Modélisation Expérimentation pour le traitement des informations Signaux sonores

Suivez Inria tout au long de son 50e anniversaire et au-delà !