Sites Inria

Probabilités

23/05/2011

Des simulations informatiques au service du football

Fabien Torre, Maître de conférence à Lille 3, membre de l'équipe de recherche Mostrare Fabien Torre, équipe Mostrare

Fabien Torre, Maître de conférence à Lille 3, membre de l'équipe de recherche MOSTRARE et bloggeur, nous dévoile sa méthode dédiée aux prévisions et résultats des matchs de ligues 1 et 2 du championnat français de football.

Quels sont vos centres d'intérêt scientifiques ?

Fabien Torre : Ce qui m’intéresse tourne particulièrement autour de l'apprentissage automatique. Dans ce domaine, on cherche à apprendre des règles générales à partir d'exemples.
Certains exemples sont fournis par des experts humains. C’est le cas des diagnostics médicaux où il s'agit de découvrir des règles que les experts appliquent sans toutefois être capables de les exprimer.
Dans d'autres cas, les exemples nous viennent de l'industrie (réacteurs d'avion défectueux ou non en sortie de chaîne de fabrication) ou d'autres domaines scientifiques (molécules déterminées comme  cancérigènes ou non). S’il s'agit toujours d'obtenir des règles cohérentes à partir de ces exemples, on obtient dans ce cas une expertise qui n'est détenue par aucun humain, de véritables découvertes !
 

Sur votre blog figurent les prévisions et résultats des matchs de ligues 1 et 2, pouvez-vous nous en dire plus ?

Fabien Torre : Je sais qu'à chaque saison ces chiffres enflamment les forums de supporters des différentes équipes.  C'est intéressant pour moi d’observer la façon dont ils s’approprient ces résultats ou comment d'autres sont braqués à l'idée que l'on puisse calculer quoi que ce soit sur le football.
Les arguments que chacun développent en disent long sur la perception que les gens ont des probabilités, ainsi que sur l'interprétation qu'ils en font. Le plus amusant est que  la méthode mise en œuvre est assez naïve et a des faiblesses bien identifiées. Ce sont cependant rarement elles qui sont mises en avant par les détracteurs.
 

Sur quelle méthode reposent vos prévisions ?  

Fabien Torre : La méthode consiste, à partir du classement en cours d’un championnat, à tirer aléatoirement les résultats des matchs restants. On obtient un classement final possible. Et je recommence ce processus un grand nombre de fois, disons 1 milliard. Il reste à faire des statistiques sur ce milliard de classements finaux possibles, ainsi dans 97.03 % d'entre eux, Lille est à la première place (chiffre calculé après la 35ème journée). Cette technique est raisonnable car un championnat de football est  finalement, en partie, aléatoire.
Si l'on peut être convaincu que la première équipe est meilleure que la dernière, il est plus difficile de dire laquelle de deux équipes qui se suivent au classement est la meilleure. Cela tient au fait que beaucoup de matchs se terminent sur un score de 1-0  (3 points  pour le vainqueur dans le classement) et  qu'un score peut être obtenu par erreur d'arbitrage, par but contre son camp, etc.  
Ce n'est pas le cas dans d'autres sports comme le basket ou le rugby dans lesquels un score de match traduit de manière plus réaliste la différence de niveau entre deux équipes.
 

Cette méthode a t-elle un rapport avec vos travaux de recherche ?

Fabien Torre : Il y a bien l'idée de faire apparaître une connaissance par un processus aléatoire. Faire des prédictions (de préférence correctes !) en utilisant le hasard est un principe qui revient régulièrement dans mes travaux de recherche, mais hormis ce lien, la méthode n'est pas en rapport avec mes travaux de recherche.
 

Avec cette méthode, vous pariez ? Vous gagnez ?

Fabien Torre : Il y a une dizaine d'années, j’ai remporté un concours organisé par un club de supporters lensois, il s'agissait de prédire la place finale et le nombre de points de Lens.Cela dit, la méthode donne des tendances générales sur la fin du championnat et aucune sur la fin d'un match en particulier. Elle n'est donc pas utilisable pour tous les jeux où il s'agit de parier sur les résultats des matchs.
 

Quel est votre club de cœur ?

Fabien Torre : Les clubs corses ! C'est pour les suivre que j'ai mis cette méthode en place, c'était pour la saison 2000-2001 : Bastia était en ligue 1, Ajaccio en ligue 2. Pour information, Ajaccio a 28.47 % de chances de remonter en ligue 1 l'année prochaine et Bastia sera à coup sûr de retour en ligue 2.
Après la 36ème journée, la méthode donne 99.8 % en faveur de Lille, les 0.2 % manquants correspondent aux cas où Lille perd ses deux derniers matchs, Marseille gagne les deux siens, et cela, avec des différences de buts telles, que Marseille rattrape ses 8 buts de retard sur Lille. Les questions auxquelles la méthode ne répond pas et sur lesquelles chacun peut prendre position sont : est-ce qu'un tel scénario à 0.2 % peut réellement se produire ? S'il se produit, faudra-t-il considérer que la méthode a fait défaut ?

Mots-clés : Satistiques Algorithmes Equipe-projet MOSTRARE Centre de recherche Inria Lille Nord - Europe Simulations informatiques

Haut de page