Sites Inria

English version

La science dans notre quotidien

Juliette Dunglas (*) - 5/12/2018

À l'interface : Sierra et société

La science dans notre quotidien - Sierra

Sur Netflix , Amazon ou encore Facebook , le mystère des systèmes de recommandations est partout. Tels des génies de la lampe, ces sites proposent toujours plus de produits et de nouveautés qui séduisent l’utilisateur ou utilisatrice en une fraction de secondes. Leur secret ? L’apprentissage statistique.

Big Brother is watching you  

Comment Netflix fait-il pour lire dans les pensées de ses abonnés, les tentant tous les jours avec des films et des séries adaptés au profil de chacun ? Un véritable cercle vertueux dans lequel Netflix puise des informations dans ce que regardent les abonnés du monde entier mais aussi chaque abonné individuellement.
Netflix apprend donc, il apprend de toutes les données qui sont générées chaque jour par les utilisateurs et utilisatrices de la plate-forme de streaming . Il finit donc par savoir ce qu’aiment les gens et cela lui permet de proposer un contenu sur mesure. 

Dans le précédent article, il était question de machine learning : un procédé par lequel un ordinateur, l’entité la plus bête qui soit, apprenait automatiquement une tâche grâce à des algorithmes. Ces derniers d’ailleurs ne tombent pas du ciel. Ils doivent prendre en compte des paramètres bien précis, capricieux et plus ou moins malléables. 

L’apprentissage statistique se base sur des algorithmes qui doivent être modulés en fonction des besoins et des contextes… Une véritable recette de cuisine mathématique.

N’est pas Pikachu qui veut

Fort heureusement, l’apprentissage statistique ne sert pas que pour les systèmes de recommandations. Il permet aussi d’optimiser la production d’électricité par exemple. Selon les périodes de l’année, le jour, l’heure et les utilisateurs et utilisatrices ; les besoins en électricité (et les attaques éclairs) ne sont pas les mêmes. Il est de l’intérêt commun, tant écologique qu’économique, de pouvoir adapter la production aux différentes temporalités. Les informations sus-mentionnées sont données à un algorithme qui peut ainsi prévoir la future consommation électrique en apprenant de toutes les données passées. 

Un travail parcimonieux

Les algorithmes qui se cachent derrière l’apprentissage statistique sont nombreux.
S’il en existe des « génériques », chaque problème spécifique peut trouver son algorithme et ce dernier doit être calibré pour s’adapter au mieux aux données et être le plus précis possible. Pour autant, tout le monde n’a pas besoin d’être Big Brother : si avoir la recette complète peut s’avérer utile, dans certains cas, il faut se simplifier la vie pour que la méthode fonctionne…  
Avec parcimonie, des hypothèses doivent parfois être faites sur les informations réellement importantes ; cela permet aussi de mieux comprendre la recette mathématique. 

Une équipe qui tire le meilleur de la science 

Tels de véritables gâte-sauce, les chercheurs et chercheuses de l’équipe-projet Sierra ajustent les recettes des algorithmes en essayant de prévoir le moindre cafouillage mathématique. Une étude parcimonieuse des modèles qui doit s’adapter à chaque situation tout en gardant comme objectif l’optimisation maximale. 

Une équipe-projet rattachée à l'ENS et au CNRS.
Propos recueillis auprès de Pierre Gaillard, chercheur de l'équipe-projet Sierra

Mots-clés : Parcimonie Sierra Inria de Paris Apprentissage statistique Machine learning Algorithme

Haut de page

Suivez Inria