Sites Inria

English version

Prévision trafic web

17/02/2014

La boule de cristal du trafic web

© corbisrffancy - Fotolia.com

Anticiper l’audience d’un site est devenu indispensable pour vendre au juste prix ses espaces publicitaires. Le nouvel outil développé par Inria, en association avec TBS Group permet d’affiner les prévisions de trafic et de limiter les erreurs.

Et si l’on pouvait prévoir l’audience d’un site web comme on prévoit la météo ? Un rêve pour les innombrables sites internet qui tirent l’essentiel de leurs revenus de la publicité. C’est pour relever ce défi que TBS Group, s’est associé à Inria. Cette société d’ingénierie spécialisée dans la communication a signé un contrat de 18 mois, dont le projet est aujourd'hui terminé, avec Jérémie Mary, maître de conférence à l’université Lille 3 et chercheur au sein de l’équipe-projet Sequel du centre Inria Lille - Nord Europe (commune avec Centrale Lille, et l'université Lille 3*). Objectif de ce partenariat : fournir aux entreprises du Web, et notamment au secteur des médias, un outil capable d’anticiper automatiquement le trafic web sur plusieurs semaines. « Pour un site, cette information est primordiale. Prédire le trafic est un élément décisionnel crucial quand il s'agit de monétiser les visites des espaces premium d'un site web – une page d'accueil par exemple qui sont souvent facturées au coût par 1000* » , explique Jérémie Mary.

Pour un site, cette information est primordiale. Prédire le trafic est un élément décisionnel crucial quand il s'agit de monétiser les visites des espaces premium d'un site web.

Tenir compte de l’actualité

Les plates-formes de publicités (Ad Servers), où se rencontrent annonceurs et sites internet, pratiquent depuis longtemps la prévision d’audience. Mais elles se contentent en général de répliquer une semaine de référence, sans prendre en compte tout événement ayant pu provoquer un impact sur le trafic. Si cette méthode se révèle plutôt fiable à court terme, elle souffre de deux limitations : « D’une part, elle n'inclut pas de tendance, et d’autre part, elle ne prend pas en compte les périodes de vacances ou la météo. Or ces événements modifient sensiblement le trafic web. Quand il pleut, on préfère surfer sur internet que partir en balade ! » , rappelle Jérémie Mary.

Le modèle développé diminue les erreurs de prédiction de 20% sur quatre à six semaines, par rapport aux Ad Servers.

Épaulé par Romain Laby, ingénieur à Inria, il a mis au point un modèle de prédiction mélangeant statistiques de séries temporelles et analyse par ondelettes capable non seulement de rechercher et d’identifier automatiquement des périodicités multiples à l’intérieur des données (Nouvel An, vacances, jour de la semaine), mais aussi de prendre en compte des événements ponctuels susceptibles d’entraîner une augmentation du trafic (mauvais temps) ou un pic d’audience (Catastrophe de Fukushima, affaire DSK…). Mais ce n’est pas tout. L’outil permet à l’utilisateur d’ajouter des événements ponctuels ou récurrents propres à son activité. Par exemple les dates des « semaines de la mode » pour un site de presse féminine : ces événements ayant lieu toujours à peu près aux mêmes dates, le système va pouvoir anticiper les pics de trafic à ces périodes précises. « Ce modèle diminue les erreurs de prédiction de 20% sur quatre à six semaines, par rapport aux Ad Servers » , souligne Jérémie Mary. Un gain précieux pour les sites web. En effet, une mauvaise appréciation du trafic entraîne un manque-à-gagner qui, s’il se répète trop souvent, finit par fragiliser l’entreprise.

 

* au sein de l'UMR 8146 CNRS-Centrale Lille-Lille1, LAGIS et de l'UMR 8022 CNRS-Lille1-Lille 3-Inria, LIFL.

** Le coût par 1000 (CPM) correspond au coût pour 1000 pages visitées comprenant de la publicité (sous forme de bannière, de colonne...) : l'annonceur paie une certaine somme au site, à chaque fois que 1000 visiteurs consultent la page où figure l’une de ses publicités.

Mots-clés : Extraction de tendances Prédiction de trafic web Prévision audience web Equipe SEQUEL

Haut de page

Suivez Inria