Sites Inria

English version

Démos

Rencontre Inria Industrie

Bertifier

Bertifier est une application Web pour la création rapide de visualisations tabulaires à partir de tableaux/feuilles de calcul. Le système s’inspire de la méthode d’analyse matricielle de Jacques Bertin, dont le but était de « simplifier sans détruire » en encodant visuellement les valeurs de cellules et en regroupant les lignes et colonnes similaires. Bertifier a le potentiel pour rendre accessible la méthode de Bertin à un public large, qu’il possède des compétences techniques ou non ; l’outil offre des possibilités d’analyse de données et de communication qui n’étaient jusqu’alors accessibles qu’à une poignée de spécialistes.

Lire la suite

Rencontre Inria Industrie

Sparklificator

Sparklificator (le nom vient du fait d’ajouter des sparklines dans un document textuel) est une bibliothèque jQuery générale open-source qui facilite le processus d’intégration de word-scale visualisations dans un document HTML, et qui mets à disposition un choix d’options pour ajuster la position (au dessus, sur la droite, en superposition), la taille et l’espacement des visualisations dans le texte.
La bibliothèque contiens des visualisations fixes qui inclut des petits line chart et bar chart, mais peux aussi être utilisé pour intégrer des word-scale visualizations sur mesure, créé en utilisant l’outil Web de visualisation D3.

Lire la suite

Rencontre Inria Industrie

RDT

Dans beaucoup d'applications orientées données,il est important de savoir s'il y a des dépendances plus fortes ou plus faibles entre les différentes classes des données. Par exemple, il serait particulièrement utile de savoir s'il existe une dépendance forte entre l'efficacité d'un médicament et un certain marqueur génétique plutôt qu'un autre. De même que pour les séquences génétiques, nous pouvons tester la topologie des relations entre trois langues. Chacune de ces activités se base sur la question de la dépendance statistique relative entre les paires de variables. RDT fournit des tests statistiques rapides et précis qui peuvent être adaptés de manière flexible à une large gamme d'applications industrielles et scientifiques.

Lire la suite

Rencontre Inria Industrie

TDA

Les méthodes d'analyse des données topologiques.
L’objectif de l’analyse topologique des données est de développer un outil accessible, efficace et largement utilisé pour l'analyse du Big Data. TDA fournit des informations topologiques et géométriques sur les données qui ne sont pas accessibles par d'autres méthodes classiques.
TDA pour les données issues du monde réel est motivé par les grandes contraintes de données: l'accent est mis sur le développement d'approches statistiques pour en déduire des informations topologiques sans tenir compte de l'ensemble des données. Cela conduira à la conception d'algorithmes très rapides pour TDA. Cette approche explore l'avantage de combiner des outils TDA avec l'apprentissage moderne et des technologies de l'intelligence artificielle, comme Watson, pour traiter le Big Data.

Lire la suite

Rencontre Inria Industrie

ToMATo

ToMATo est un schéma nouveau et flexible pour la classification et le regroupement des différents types de données, basé sur une approche topologique. Il fournit à l'utilisateur un retour concernant les données, sous la forme d'un diagramme à 2 dimensions qui reflète l'importance de chaque grappe et permet à l'utilisateur de sélectionner un nombre correspondant des clusters pour traiter les données. Combinés avec des outils stochastiques, ToMATo peut également effectuer le regroupement doux et affecter à chaque point de données la probabilité d'appartenance à chacun des groupes, pour une plus grande flexibilité.

Lire la suite

Rencontre Inria Industrie

Lamark Metadata

Lamark-Metadata est une plateforme web qui simplifie l’accès aux métadonnées des images numériques. Développée avec des technologies innovantes, l’identification rapide et sûre d’une image est possible avec des bases de données de millions d’images.
Lamark-Metadata permet d’extraire via un terminal connecté des informations certifiées associées aux images numériques. L’utilisateur peut signer durablement ses images et construire des nouveaux
champs de métadonnées qui valorisent son catalogue d’images.
Les agences photo et les photographes s’approprient Lamark-Metadata pour communiquer simplement les droits d’auteurs et les droits d’exploitation, mais aussi pour construire de nouveaux moyens d’interaction via l’image même après sa diffusion.
Lamark-Metadata repose sur des technologies brevetées de reconnaissance et de tatouage d’images.

Lire la suite

Rencontre Inria Industrie

Cliquesquare

Plateforme de gestion de données RDF basée sur une architecture Hadoop.
CliqueSquare permet de gérer des très grands volumes de données RDF de façon parallèle, utilisant un cluster Hadoop. Le système utilise son propre modèle de partitionnement et stockage de triples RDF dans le cluster.
Il est capable de traiter des requêtes RDF exprimées dans un sous-ensemble de SPARQL. Il est particulièrement efficace dans le traitement de requêtes complexes, car il les traduit vers des programmes MapReduce garantis d’avoir le nombre d’étapes le plus petit possible.

Lire la suite

Rencontres Inria Industrie

WaRG

Analyse des graphes RDF (Ressource Description Framework -  format de données pour le web sémantique)
WaRG (Warehousing RDF Graphs) est une plateforme analytique spécialement conçue pour l’analyse de graphes de données RDF. WaRG permet de définir des schémas d’analyse des données, comportant des classes et des propriétés d’intérêt pour l’analyste. Ensuite, le schéma d’analyse est matérialisé, ce qui conduit à une instance (graphe RDF) raffiné pour l’analyse. Le schéma d’analyse peut aussi être construit automatiquement à partir de l’instance RDF en entrée. Enfin, des requêtes analytiques sont spécifiées et conduisent à des cubes d’analyse des données RDF.

Lire la suite

Rencontres Inria Industrie

Scikit-Learn

Scikit-learn peut être utilisé comme un middleware pour des tâches de prédiction. Par exemple, un grand nombre de start-ups du Web s’approprient Scikit-learn pour prédire des comportements d’achat d’utilisateurs, proposer des recommandations de produits ou détecter les tendances ainsi que les comportements abusifs (fraudes, spams, etc.)
Scikit Learn sert à extraire la structure de données complexes (textes, images) et à les classifier en utilisant des techniques correspondant à l’état de l’art.
Facile à utiliser, efficace et accessible aux non-experts du data science, Scikit-Learn est une bibliothèque d’apprentissage statistique. Dans une étape d’exploration des données, l’utilisateur entre quelques lignes dans une interface interactive et peut visualiser les résultats de sa requête immédiatement. 
Scikit-learn ne vient pas avec une interface graphique, c’est un moteur de prédiction.  
Scikit learn est développé en open source, et disponible sous licence BSD.

Lire la suite

Rencontre Inria Industrie

Mixmod

Logiciel multi-usages d'exploration de données et d'apprentissage statistique.
MIXMOD est une boite à outils d’apprentissage statistique, conçu pour traiter de grands ensembles de données. MIXMOD offre des algorithmes d'estimation éprouvés et des critères de sélection de modèles efficaces et a été utilisé avec succès dans les domaines du marketing, du crédit scoring, de l’épidémiologie, la génomique et la fiabilité notamment. Grâce au modèle probabiliste des mélanges de lois de probabilité, il offre une panoplie très riche de méthodes de classification. Il est doté d'indices simples et rigoureux pour évaluer la qualité des résultats, propose une interface graphique conviviale (mixmodGUI) et des fonctions pour les environnements R (Rmixmod) et Matlab (mixmodForMatlab). 

Lire la suite

Haut de page

Suivez Inria