Conférence

Data et Big Data : le nouvel or noir ?

L’exploitation des données amène des défis technologiques importants auxquels la recherche scientifique a des solutions à apporter. Pour illustrer cela, trois équipes du centre Inria Lille - Nord Europe interviendront sur ce sujet le mercredi 13 mars à 14h, à EuraTechnologies.

  • Date : 13/03/2013
  • Lieu : EuraTechnologies
  • Organisateurs : Inria Lille - Nord Europe
« Les données constituent les briques de base de la société de l'information. Leur quantité est en croissance exponentielle. Elles représentent déjà des masses considérables pour lesquelles on recourt à de nouvelles mesures. Ces données offrent un potentiel extraordinaire que l'on commence à exploiter. Elles permettent de générer des connaissances, qui étaient soit hors d'atteinte, soit inexistantes, parce que hors du domaine du pensable. » Le Monde, 07.01.2013 

Afin d'illustrer les enjeux liés à ces données, trois thèmes seront abordés durant cette conférence.

Thème 1 : « Small or big (data), make it sequentially! »

Par Philippe Preux et Jérémie Maryéquipe-projet Sequel

Philippe Preux

© Jérémie Mary

L'équipe Sequel étudie et utilise des méthodes de fouille de données pour optimiser la prise de décision dans une boucle d'interaction ; les applications typiques sont sur le web (publicités, systèmes de recommandation, etc.) L'équipe proposera un tour d'horizon de ses problématiques et méthodes, ainsi que des applications qu'elle traite notamment en collaboration avec des entreprises.

Dans un second temps, l'exposé se concentrera sur une application de prédiction d'audience pour des sites web.


Thème 2 : « Modélisation et optimisation multi-objectif pour l'extraction de connaissances »

Par Lætitia Jourdan et Clarisse Dhaenens, équipe-projet Dolphin

Laetitia Jourdan

Clarisse Dhaenens

A partir d'un grand volume de données, l'équipe Dolphin modélise des problèmes de datamining en problèmes d'optimisation permettant d'extraire des connaissances pertinentes. Cette modélisation offre la possibilité de considérer différents objectifs que l'on souhaite optimiser simultanément. Multi-objectifs, elle a plusieurs atouts dont notamment la possibilité d'adjoindre, aux critères de qualité classiques de la fouille de données, des critères qualitatifs métiers, ou encore de traiter de grandes volumétries de données. En particulier, le nombre de variables décrivant les données (caractéristiques décrivant des clients, par exemple) peut être important. Les applications sont nombreuses et se trouvent dans différents domaines. Dans le contexte de la distribution par exemple, ces approches permettent notamment d'aider au profilage des clients en identifiant des sous-groupes de clients partageant des caractéristiques communes.


Thème 3 : « Classification probabiliste : générez automatiquement les règles de classement de vos données en classes homogènes »

Par Christophe Biernacki, équipe-projet Modal 

Christophe Biernacki

Les données actuelles défient l'entendement humain, notamment en raison de leur volume,  de la présence d’erreurs ou de données manquantes, mais aussi du nombre important d'individus…

Il est donc difficile,  voir impossible, pour un humain de traiter ces données dans un temps raisonnable. La classification probabiliste permet l’analyse de ces données afin de les organiser automatiquement en catégories homogènes et en générant les règles de classement. Il est ensuite possible de dégager une structure dans les données et de les représenter de manière simple et interprétable. L'exposé présentera également les logiciels aujourd'hui disponibles, ainsi que des démonstrations sur données réelles et les perspectives dans ce domaine.

En (e-)marketing et (e-)commerce, la classification permet le ciblage de typologies de clients. Dans les domaines financiers et boursiers, l'intérêt est d'identifier des catégories de placements ou d'investisseurs.

Un speed dating avec les chercheurs ?

A l'issue de cette conférence, des rendez-vous privés en mode « speed-dating » de 10 minutes chacun seront possibles avec les chercheurs.

Quand ?

  • De 16h30 à 18h sur le Plateau Inria, à l'issue de la conférence.

L'inscription est obligatoire et votre rendez-vous vous sera ensuite validé par mail, selon les places disponibles. Inscrivez-vous !

Cet évènement se déroulera à EuraTechnologies, 165 Avenue de Bretagne à Lille. Descendre à l'arrêt de métro Canteleu.

Localisation

Mots-clés : Big Data Expert Centre de recherche Inria Lille - Nord Europe EuraTechnologies Plateau Inria

Haut de page