Fujitsu et Inria travaillent main dans la main pour développer une technologie permettant de créer automatiquement des modèles d'IA détectant les anomalies

Date:
Mis à jour le 18/05/2020
En divisant par 100 le nombre d'heures-homme nécessaires à la création de modèles d'IA à l'aide de l'analyse des données topologiques (TDA), cette nouvelle technologie va permettre d'accélérer le déploiement sur le terrain
Photo de l'équipe-projet DataShape
© Inria / Photo C. Morel

 

Fujitsu Limited, Fujitsu Laboratories Ltd. et Inria ont annoncé le 16 mars 2020, le développement d'une technologie qui permet de créer automatiquement des modèles d'IA capables de détecter des anomalies dans les données de séries temporelles provenant de dispositifs Internet des objets et d'autres sources.

Grâce aux progrès constants réalisés ces dernières années dans le domaine de la technologie de l'IA, on assiste à un déploiement accru de l'IA dans divers domaines d'activité. Malgré la volonté d'accroître les niveaux d'automatisation, la création de modèles d'IA implique encore souvent un travail manuel minutieux de la part d'ingénieurs spécialisés en IA. De plus, comme le processus de construction de nouveaux modèles d'IA repose toujours sur le principe d'essais et d'erreurs, il requiert de nombreuses heures de travail, ce qui entraîne souvent des retards dans le déploiement sur le terrain.

Développement conjoint d'une nouvelle technologie permettant de créer automatiquement des modèles d'IA détectant les anomalies

En s'appuyant sur la technologie exclusive d'analyse de données de séries temporelles mise au point par les laboratoires Fujitsu qui repose sur une analyse de données topologiques (TDA) améliorée (*1), Fujitsu et l'équipe-projet DataShape d'Inria viennent de développer une nouvelle technologie permettant de créer automatiquement des modèles d'IA capables de détecter des anomalies en extrayant les informations nécessaires des données de séries temporelles. Les données de séries temporelles, qui peuvent inclure des données de capteurs provenant de dispositifs IoT ou des données biologiques, telles que la fréquence cardiaque ou les ondes cérébrales, sont constituées d'informations de types très divers et aux interconnexions complexes. Cela signifie que les données de séries temporelles sont souvent sujettes à une grande variabilité, rendant ainsi difficile la détection de schémas ou d'anomalies significatifs dans les données.

Cette technologie permet à tout ingénieur logiciel de créer facilement des modèles d'IA de catégorisation et de détection d'anomalies dans les données de séries temporelles, tout en divisant par cent le nombre d'heures de travail nécessaires par rapport aux méthodes existantes. Cela contribuera à terme à accélérer le déploiement de nouveaux modèles d'IA dans divers domaines d'activité, permettant même à des ingénieurs n’ayant pas de formation spécialisée de créer des modèles de détection d'anomalies.

Figure 1 : Processus de création de modèles d'IA avant et après le déploiement de cette nouvelle technologie
Figure 1 : Processus de création de modèles d'IA avant et après le déploiement de cette nouvelle technologie

Les essais démontrent une amélioration significative des modèles d'IA utilisés à des fins concrètes grâce à cette nouvelle technologie

Des essais ont été menés avec la toute nouvelle technologie permettant de générer automatiquement des modèles de détection d'anomalies. Ils ont révélé de considérables gains en termes d'efficacité qui permettront d'accélérer le déploiement de modèles d'IA pour résoudre des problèmes concrets :

  • Un modèle d'IA pour détecter les dommages internes des ponts

Lors d’une évaluation basée sur des données de vibration recueillies sur 30 ans par des accéléromètres fixés à une plaque de tablier d’un pont factice (*2) pour un usage expérimental, un modèle ayant les mêmes performances de détection que le modèle d'IA développé par des ingénieurs spécialisés en IA sur 5 jours a été créé en 10 minutes.

  • Un modèle d'IA pour détecter des états anormaux, comme la somnolence, dans les données relatives au rythme cardiaque de l’homme

Cette technologie a permis de créer en vingt minutes un modèle dont l'erreur moyenne était dix fois inférieure à celle d'un modèle d'IA créé en quatre jours par des ingénieurs spécialisés en IA à l'aide de méthodes standards.

Disponibilité et projets futurs

Cette nouvelle technologie a été intégrée à GUDHI, une bibliothèque de TDA open source mise au point par Inria qui sera disponible gratuitement pour les utilisateurs du monde entier à compter du 16 mars. Cela permettra non seulement de promouvoir l'utilisation de l'IA dans les entreprises, les instituts de recherche et d'autres organisations, mais aussi de créer des modèles d'IA pour divers cas d'utilisation, car les retours d'information de ces organisations se traduisent par des améliorations technologiques continues. Les laboratoires Fujitsu continueront à perfectionner cette approche, qui constitue l'une des technologies phares de leur portefeuille de solutions d'IA Zinrai axée sur l'être humain.

Cette technologie sera, en partie, présentée à l’occasion de la 23e Conférence internationale sur l'intelligence artificielle et les statistiques (AISTATS 2020), une conférence internationale sur l'apprentissage machine qui se tiendra à Palerme, en Italie, du 3 au 5 juin.

À propos de cette toute nouvelle technologie

Dans le cas des données de séries temporelles, qui comprennent des données de capteurs et des données biologiques, telles que la fréquence cardiaque et les ondes cérébrales, il est généralement nécessaire d'extraire les caractéristiques de données sur une série de fenêtres temporelles différentes, et il peut y avoir un large éventail de types de caractéristiques. Si la bonne combinaison n'est pas sélectionnée, le modèle ne sera pas en mesure d'atteindre ses objectifs de performance, rendant ainsi extrêmement difficile la génération automatique de modèles d'IA.

La technologie développée par Fujitsu et Inria extrait automatiquement les informations nécessaires pour créer des modèles de détection d'anomalies dans les données de séries temporelles. Voici les principales caractéristiques de cette technologie :

1. Développement conjoint d'un algorithme permettant d'extraire des caractéristiques de données de séries temporelles

En s'appuyant sur la technologie exclusive d'analyse de données de séries temporelles mise au point par les laboratoires Fujitsu, les laboratoires Fujitsu et Inria ont développé conjointement un algorithme pour extraire les caractéristiques qui sont importantes pour détecter les anomalies dans les données de séries temporelles. Certaines caractéristiques des données de séries temporelles apparaissent sur de courtes périodes, tandis que d'autres apparaissent sur de longues périodes, si bien qu'il est nécessaire d'extraire les deux, le cas échéant. En outre, il existe dans les diverses sections de données segmentées des caractéristiques telles que la fréquence et l'amplitude ainsi que de nombreuses caractéristiques qui ne peuvent être extraites par des méthodes statistiques ou d'analyse de fréquence.

Grâce à cet algorithme, qui repose sur une technologie d'apprentissage profond mise au point par les laboratoires Fujitsu pour analyser avec précision les données de séries temporelles (*3), les caractéristiques peuvent être cartographiées sous forme de points sur un graphique, les axes étant définis par la durée de la période et par les caractéristiques relatives au comportement de la forme d'onde au cours de cette période. Cela permet à l'utilisateur d'avoir une vue plus complète des informations telles que la durée des périodes et les caractéristiques liées au comportement des données.

Figure 2 : Cartographie des différentes caractéristiques des données de séries temporelles d'un plan
Figure 2 : Cartographie des différentes caractéristiques des données de séries temporelles d'un plan

2. Extraction des informations nécessaires à la détection des anomalies à partir du plan de caractéristiques

Chacune des caractéristiques des différents segments de données de séries temporelles d’entraînement préparées à l'avance est cartographiée sur ces graphiques à l'aide de la technologie d'analyse des données de séries temporelles mise au point par les Laboratoires Fujitsu. Ces graphiques cartographiés sont ensuite comparés, et l'espace est divisé en plusieurs zones : celles où les points de données ordinaires coexistent, celles où ils ne coexistent pas, et celles où les données ne se recoupent pas. Le nombre de zones et la méthode de segmentation sont ensuite optimisés de manière à ce que le nombre de points caractéristiques au sein de chaque zone soit le même, la force du degré de similitude étant calculée comme le degré de similitude, et les zones sont ensuite extraites dans l'ordre de leur degré de similitude. (Figure 3)

Figure 3 : Génération d'un modèle d'IA à partir de données de séries temporelles d’entraînement
Figure 3 : Génération d'un modèle d'IA à partir de données de séries temporelles d’entraînement

Ensuite, pour les données de séries temporelles d’essai, afin de déterminer si les données sont anormales ou non, on cartographie sur un graphique à l'aide de la technologie TDA les caractéristiques extraites des données d'entrée, puis on compte le nombre de points qui se trouvent dans les zones délimitées décrites ci-dessus. En multipliant le nombre de points qui se trouvent dans chaque zone par le degré de similitude de cette zone, puis en additionnant toutes les zones, cette technologie fournit une valeur représentant le degré d'écart, qui est ensuite utilisée pour déterminer l'écart des données d'entrée par rapport aux données standards. (Figure 4)

Figure 4 : Évaluation des données de séries temporelles inconnues l'aide du modèle d’IA
Figure 4 : Évaluation des données de séries temporelles inconnues l'aide du modèle d’IA
  1. Analyse des données topologiques :
    Méthode d'analyse des données qui consiste à regrouper dans un espace les données en un nuage de points et à en extraire des caractéristiques géométriques et topologiques.
     
  2. Pont à tablier en dalle orthotrope :
    Pont dont le tablier comporte des plaques portantes qui permettent de reprendre directement les charges de trafic jusqu’aux piliers du pont
     
  3. Technologie d'apprentissage profond mise au point par les Laboratoires Fujitsu pour analyser avec précision des données de séries temporelles :
    Technologie exclusive des Laboratoires Fujitsu qui, grâce à la TDA, analyse des données de séries temporelles avec une grande précision.