Auteurs

Dominique Vaufreydaz

Image

Sciences sociales et apprentissage machine pour l'interaction

Contenu

Il vous est sÃ»rement dÃ©jÃ arrivÃ© de croiser une personne dans la rue qui va vous demander un renseignement. Dans cette situation, avant mÃªme quâ€™elle ne vous parle, son comportement, ses dÃ©placements, son langage corporel, son regard et votre expÃ©rience personnelle ont fait que vous saviez dÃ©jÃ quâ€™elle allait sâ€™adresser Ã vous, et parfois mÃªme de ce quâ€™elle allait vous demander. Câ€™est de cette capacitÃ© de perception, de comprÃ©hension des comportements des personnes et dâ€™anticipation que les chercheurs en interaction Homme-machine souhaiteraient doter les systÃ¨mes interactifs, câ€™est-Ã -dire les systÃ¨mes informatiques et/ou robotiques qui interagissent avec des humains.

Prenons lâ€™exemple du maintien Ã domicile de personnes Ã¢gÃ©es ou fragiles. Dans ce contexte, des recherches sont menÃ©es pour mettre au point des robots compagnons dâ€™assistance destinÃ©s Ã permettre Ã ces personnes de rester le plus longtemps possible en autonomie Ã domicile. Pour rendre ce service, ce compagnon de tous les instants ne doit donc pas sâ€™avÃ©rer dÃ©rangeant en sâ€™adressant Ã la personne assistÃ©e Ã chaque fois que celle-ci est dans son champ de vision ou est simplement proche de lui. Ce comportement, dÃ©placÃ©, serait perÃ§u comme inacceptable et conduirait Ã un rejet du robot compagnon, et donc de son assistance. Le robot doit donc dÃ©tecter les personnes autour de lui avec ses diffÃ©rents capteurs, les identifier, analyser leurs comportements et "comprendre" leurs intentions, câ€™est-Ã -dire calculer des informations pertinentes pour dÃ©cider de la meilleure action Ã rÃ©aliser. Câ€™est ce que lâ€™on nomme la boucle dâ€™interaction : percevoir lâ€™environnement, dÃ©cider de la meilleure action Ã rÃ©aliser et agir, câ€™est-Ã -dire effectuer lâ€™action choisie. Dans notre exemple, la tÃ¢che dâ€™interaction du robot est de pouvoir diffÃ©rencier que quelquâ€™un sâ€™approche de lui avec lâ€™intention dâ€™interagir (lâ€™engagement) ou simplement que cette personne sâ€™approche pour passer prÃ¨s de lui. Dans le premier cas, il doit commencer Ã interagir avec la personne pour rÃ©pondre Ã son engagement, dans le second cas, il ne doit rien faire de particulier.

L'apprentissage automatique et ses biais

Ce besoin de calculer des informations pertinentes est soutenu aujourdâ€™hui par lâ€™intelligence artificielle, avec des avancÃ©es majeures en apprentissage machine (machine learning) notamment en apprentissage dit profond Ã lâ€™aide de rÃ©seaux de neurones (deep learning). Les algorithmes dâ€™apprentissage profond nÃ©cessitent de grandes quantitÃ©s de donnÃ©es pour leur entraÃ®nement. Si lâ€™on sâ€™intÃ©resse Ã un "simple" systÃ¨me de classification dâ€™images (voiture, chien, cheval, avion, personne, vÃ©loâ€¦), celui-ci peut utiliser un ensemble dâ€™images comme ImageNet¹Â comme base dâ€™entraÃ®nement. Cette collection de donnÃ©es disponible pour la communautÃ© scientifique contient plus de 14 millions dâ€™images annotÃ©es, câ€™est-Ã -dire avec un label associÃ© dÃ©crivant ce que contient lâ€™image. Ces collections de donnÃ©es de grande taille sont ce que lâ€™on nomme des mÃ©gadonnÃ©es (bigÂ data). MalgrÃ© leur performance indÃ©niable et les progrÃ¨s quâ€™ils ont permis dans de nombreux domaines, ces algorithmes utilisant de grandes masses de donnÃ©es ne sont pas exempts de dÃ©fauts. Tout dâ€™abord, il existe un problÃ¨me Ã©thique Ã lâ€™usage des mÃ©gadonnÃ©es. Celles-ci nâ€™ont pas toujours Ã©tÃ© collectÃ©es en ayant un consentement parfaitement Ã©clairÃ© de la part des personnes concernÃ©esÂ : combien de ces personnes savent quâ€™elles sont prÃ©sentes dans ces corpus collectÃ©s sur Internet qui sont distribuÃ©s Ã lâ€™Ã©chelle planÃ©taireÂ ? Elles ont acceptÃ©, gÃ©nÃ©ralement sans en comprendre la portÃ©e, le partage de ces donnÃ©es sur un rÃ©seau social par exemple mais ont-elles acceptÃ© tous les usages qui sont faits de celles-ci (reconnaissance faciale, identification de personne, etc.)Â ? Lâ€™Ã©thique se tÃ©lescope donc avec le besoin massif de donnÃ©es pour lâ€™apprentissage des rÃ©seaux de neurones. Des approches utilisant des rÃ©seaux antagonistes gÃ©nÃ©ratifs (Generative adversarial networksÂ ou GAN) sont Ã©tudiÃ©s pour la gÃ©nÃ©ration automatique de donnÃ©es, permettant dâ€™Ã©viter les Ã©cueils concernant le respect de la vie privÃ©e. Par exemple, le site ThisPersonDoesNotExist utilise cette technique pour gÃ©nÃ©rer des visages (parfois imparfaits) alÃ©atoirement. Cependant, des recherches sont encore nÃ©cessaires pour quâ€™ils puissent remplacer les donnÃ©es massives. Une autre problÃ©matique liÃ©e Ã lâ€™usage de ces algorithmes dâ€™apprentissage profond rÃ©side dans leur inexplicabilitÃ©. Il est pour lâ€™instant quasiment impossible dâ€™expliquer prÃ©cisÃ©ment ce quâ€™apprend un rÃ©seau de neurones. Sa performance est mesurÃ©e sur des donnÃ©es connues, c'est-Ã -dire des images dont on sait ce quâ€™elles reprÃ©sentent, mais ne peut en rien certifier son fonctionnement dans des conditions rÃ©elles. Cette problÃ©matique a dâ€™ailleurs donnÃ© naissance Ã un nouveau domaine de recherche, lâ€™intelligence artificielle explicable (explainable AI), sâ€™intÃ©ressant Ã ces problÃ©matiques complexes notamment en termes de crÃ©dibilitÃ© de lâ€™explication fournie Ã lâ€™utilisateur². En complÃ©ment de ces problÃ©matiques thÃ©oriques, un dernier Ã©cueil plus pragmatique concerne lâ€™existence mÃªme de donnÃ©es pour apprendre certaines tÃ¢ches Ã rÃ©aliser par nos systÃ¨mes. Pour de trÃ¨s nombreuses applications en lien avec les interactions avec des humains, les donnÃ©es ne sont pas disponibles ou en quantitÃ© trop faible pour que les algorithmes dâ€™apprentissage (profond) puissent Ãªtre utilisables.

Apport des connaissances issues des recherches en sciences sociales

Ã€ partir de ce constat, comment apprendre aux algorithmes des tÃ¢ches dâ€™interaction avec pas ou peu de donnÃ©es et en les rendant explicables si possibleÂ ? Lâ€™une des rÃ©ponses possibles Ã cette question pour les tÃ¢ches impliquant des humains est de compulser la littÃ©rature scientifique et dâ€™intÃ©grer des connaissances venues des recherches en sciences sociales (sociologie, psychologieâ€¦) pour avoir une vision interdisciplinaire des systÃ¨mes interactifs. Lâ€™apprentissage profond garde son intÃ©rÃªt pour la perception de bas niveau, mais pour lâ€™interprÃ©tation de plus haut niveau de lâ€™interaction, les sciences sociales apportent des Ã©lÃ©ments dâ€™analyse tangibles et perceptibles. Reprenons notre exemple de robot compagnon dâ€™assistance aux personnes Ã¢gÃ©es. Il nâ€™y a pas de donnÃ©es massives pour lâ€™apprentissage de la dÃ©tection dâ€™engagement. Il faudrait recueillir des centaines ou des milliers dâ€™heures dâ€™exemples, les visionner et les annoter pour entraÃ®ner un tel systÃ¨me. Collecter ces donnÃ©es demanderait un effort logistique consÃ©quent, sans mÃªme mentionner la prise en compte de considÃ©rations mÃ©dicales et Ã©thiques concernant lâ€™enregistrement de personnes Ã¢gÃ©es ou fragiles.

Le langage corporel pour les interactions humain-robot

La littÃ©rature scientifique en sociologie peut nous apporter des clÃ©s pour rÃ©soudre ce problÃ¨me. Par exemple, Emanuel A. Schegloff, un sociologue, a Ã©tudiÃ© le langage corporel de personnes engagÃ©es dans des interactions³. Parmi les rÃ©sultats intÃ©ressants de ses recherches, il a montrÃ© que dans ces interactions, lâ€™un des indices pour repÃ©rer le dÃ©but dâ€™une interaction (lâ€™engagement) est de scruter lâ€™orientation des Ã©paules dâ€™une personne en direction de son interlocuteur, indice plus important que lâ€™orientation de la tÃªte, mÃªme si câ€™est contre-intuitif. Ce rÃ©sultat de recherche est trÃ¨s intÃ©ressant pour plusieurs raisons. La premiÃ¨re est que si lâ€™humain se comporte avec le robot comme il le fait avec ses congÃ©nÃ¨res, alors cet indice peut se rÃ©vÃ©ler extrÃªmement utile. La seconde raison est que lâ€™orientation des Ã©paules est calculable par un robot Ã©quipÃ© dâ€™une camÃ©ra standard. En utilisant lâ€™apprentissage profond et les mÃ©gadonnÃ©es disponibles, il est possible de dÃ©tecter efficacement les personnes et les mouvements de leur corps⁴. Ã€ partir de ces informations, extraire lâ€™orientation des Ã©paules des personnes pour dÃ©terminer lâ€™intention dâ€™interagir avec le robot se rÃ©sout par un calcul gÃ©omÃ©trique. Sur un jeu de donnÃ©es expÃ©rimentales, en utilisant cette technique, nous avons corroborÃ© que lâ€™orientation des Ã©paules Ã©tait primordiale pour dÃ©tecter lâ€™intention dâ€™interagir des personnes avec un robot. En la couplant avec dâ€™autres informations standard en interaction (position/vitesse des personnes, dÃ©tection de voix par exemple), il est possible de dÃ©tecter lâ€™engagement avec plus de 90% de prÃ©cision, autrement dit, la dÃ©cision du robot dâ€™interagir, ou pas, est correcte⁵ plus de 9 fois sur 10.

[caption id="attachment_41587" align="aligncenter" width="500"]

DÃ©tection de l'orientation des Ã©paules d'un humain envers un robot aprÃ¨s dÃ©tection des diffÃ©rentes articulations par Machine Learning.[/caption]

En ajoutant sciemment une information de langage corporel Ã©tudiÃ©e en sociologie, le systÃ¨me de perception de lâ€™engagement sâ€™en trouve amÃ©liorÃ©. De plus, cette information ayant une sÃ©mantique forte, elle apporte une part dâ€™explicabilitÃ© au systÃ¨me de dÃ©tectionÂ : Â«Â Comment le robot a-t-il dÃ©cidÃ© que vous souhaitiez interagir avec luiÂ ? Il a analysÃ© votre langage corporel comme vous le faites en permanence avec vos interlocuteursÂ Â». Le mÃªme rÃ©sultat aurait potentiellement pu Ãªtre obtenu en nâ€™utilisant que lâ€™apprentissage profond directement Ã partir de vidÃ©os si lâ€™on avait eu assez de donnÃ©es dâ€™apprentissage. Mais, avec les connaissances actuelles, il aurait Ã©tÃ© difficile voire impossible dâ€™expliciter ce sur quoi se base le rÃ©seau de neurones pour prendre ses dÃ©cisions.

Les comportements des piÃ©tons pour la navigation des vÃ©hicules autonomes

Les approches interdisciplinaires intÃ©grant des sciences sociales montrent une pertinence pour les systÃ¨mes interactifs dans dâ€™autres applications. Ã€ une Ã©chelle plus grande, on peut sâ€™intÃ©resser aux problÃ©matiques de dÃ©placement des vÃ©hicules autonomes dans les centres urbains. Ceux-ci doivent dÃ©cider de la trajectoire idÃ©ale Ã suivre pour quâ€™elle soit sÃ»re, tout dâ€™abord, mais Ã©galement acceptable par les piÃ©tonsÂ : prÃ©dictible, pas trop proche ni trop agressive, etc. Pour cela, les vÃ©hicules autonomes doivent percevoir lâ€™environnement pour anticiper les comportements des piÃ©tons prÃ©sents autour dâ€™eux. Ces comportements sont dÃ©pendants dâ€™un grand nombre de facteurs dont la topologie des lieux et les interactions sociales entre les piÃ©tons. Il est utopique de vouloir obtenir des donnÃ©es reprÃ©sentatives de tous les environnements possibles pour lâ€™apprentissage dâ€™un tel systÃ¨me de prÃ©diction du comportement des piÃ©tons.

Une approche possible est alors de sâ€™inspirer encore une fois de modÃ¨les issus des sciences sociales comme les travaux du psychologue James Jerome Gibson sur la "natural vision". Dans ces travaux⁶, lâ€™auteur dÃ©crit la perception visuelle comme basÃ©e sur des "affordances"Â de lâ€™environnement, câ€™est-Ã -dire la perception dâ€™informations dâ€™intÃ©rÃªt, positives ou nÃ©gatives, guidant le comportement de la personne, cette perception variant selon les individus. Par exemple, les zones dans lesquelles il est facile de marcher sans risque sont perÃ§ues comme des affordances positives et attractives par tout le monde. Un chemin escarpÃ© sera perÃ§u par certains comme une affordance positive, et pour dâ€™autres comme nÃ©gative car celui-ci est trop pÃ©rilleux. Dans leur thÃ©orie de "natural movement"⁷, lâ€™urbaniste Bill Hillier et ses coauteurs dÃ©clinent ce concept en sâ€™intÃ©ressant aux comportements des piÃ©tons en environnement urbain, les dÃ©crivant Ã lâ€™aide dâ€™attracteurs (entrÃ©es de magasin, passages piÃ©tons par exemple) et de rÃ©pulseursÂ (voies de circulation, vÃ©hiculesâ€¦), respectivement Ã©quivalents Ã des affordances positives et nÃ©gatives.

[caption id="attachment_41651" align="aligncenter" width="500"]

ModÃ©lisation statistique des dÃ©placements des piÃ©tons dans un centre urbain. Les diffÃ©rents espaces (trottoirs, bÃ¢timents, routes, passages piÃ©tons, feux tricolores, entrÃ©es de magasin) sont modÃ©lisÃ©s. Les comportements des piÃ©tons (en jaune sur l'image) peuvent ensuite Ãªtre anticipÃ©s par un vÃ©hicule autonome.[/caption]

Les points dâ€™intÃ©rÃªt mentionnÃ©s prÃ©cÃ©demment, les piÃ©tons et les autres usagers de la route sont aujourdâ€™hui dÃ©tectables avec une prÃ©cision suffisante en utilisant les techniques dâ€™apprentissage profond pour les environnements urbains⁸. Ã€ partir de cette dÃ©tection, lâ€™environnement autour du vÃ©hicule autonome, avec ses attracteurs et ses rÃ©pulseurs, peut se reprÃ©senter sous une forme mathÃ©matique permettant dâ€™anticiper les dÃ©placements des piÃ©tons prÃ©sents autour du vÃ©hicule autonome⁹. Les rÃ©sultats que nous avons obtenus montrent de nouveau que, par rapport Ã dâ€™autres approches de pur apprentissage machine, lâ€™approche interdisciplinaire est digne dâ€™intÃ©rÃªt et permet dâ€™amÃ©liorer les performances. Ã€ lâ€™instar de la conduite humaine, cette approche se base sur une perception des Ã©lÃ©ments prÃ©sents autour du vÃ©hicule autonome et construit un modÃ¨le lui permettant dâ€™anticiper les dÃ©placements futurs des piÃ©tons. Son intÃ©rÃªt rÃ©side dans lâ€™adaptation dont elle est capable pour les environnements inconnus rencontrÃ©s par le vÃ©hicule autonome, la condition sine qua non Ã©tant de pouvoir y percevoir les affordances.

Lâ€™interdisciplinaritÃ©, une voie de recherche

Les deux exemples prÃ©cÃ©dents illustrent ce que peut apporter lâ€™interdisciplinaritÃ© entre les sciences sociales et lâ€™apprentissage machine pour les systÃ¨mes interactifs. Cette interdisciplinaritÃ© est Ã contre-courant de lâ€™idÃ©e tendant Ã se rÃ©pandre que nous nâ€™aurions plus besoin dâ€™analyser ou de thÃ©oriser les concepts mais quâ€™il suffirait dâ€™avoir suffisamment dâ€™exemples pour apprendre nâ€™importe quelle tÃ¢che dâ€™intelligence artificielle¹⁰. MÃªme si cela est potentiellement vrai, cela se ferait aux dÃ©pens de lâ€™explicabilitÃ© du systÃ¨me, explicabilitÃ© qui est lâ€™un des leviers dâ€™acceptation de lâ€™intelligence artificielle par le grand public. Il faut donc cultiver les approches interdisciplinaires et sensibiliser les (jeunes) chercheurs des "sciences dures" Ã sâ€™intÃ©resser aux bÃ©nÃ©fices tirÃ©s des autres domaines scientifiques sâ€™intÃ©ressant Ã lâ€™humain. Les potentialitÃ©s pour les systÃ¨mes interactifs sont extraordinaires si l'on considÃ¨re les humains dans toute leur complexitÃ©. Soutenue par les progrÃ¨s encore Ã venir en apprentissage machine et en sciences sociales, lâ€™interdisciplinaritÃ© bÃ©nÃ©ficiera Ã de nombreux autres domaines dâ€™application avec un impact sociÃ©tal fort, pour lâ€™Ã©ducation avec le dÃ©veloppement de salles de classes sensibles aux interactions enseignants/Ã©tudiants permettant dâ€™Ã©tudier et dâ€™amÃ©liorer les pratiques pÃ©dagogiques, et en santÃ© avec de nombreuses applications dans lâ€™assistance et le maintien de personnes fragiles Ã domicile.

RÃ©fÃ©rences

Deng, W. Dong, R. Socher, L.-J. Li, K. Li and L. Fei-Fei, ImageNet: A Large-Scale Hierarchical Image Database, IEEE Computer Vision and Pattern Recognition (CVPR), 2009.Â
Erwan Le Merrer, Gilles TrÃ©dan. Le problÃ¨me du videur : la crÃ©dibilitÃ© des explications de lâ€™IA en question. Interstices, INRIA, 2021.
A. Schegloff. Body Torque. Social Research, 65(3):535â€“596, 1998
shu Fang, S. Xie, Y.W. Tai, and C. Lu. RMPE: Regional multi-person pose estimation. IEEE International Conference on Computer Vision (ICCV), pages 2353â€“2362, 2017.
Vaufreydaz, W. Johal, C. Combe. Starting engagement detection towards a companion robot using multimodal features.Â Robotics and Autonomous Systems, Elsevier, 2015, Robotics and Autonomous Systems, pp.25.
J Gibson, The Ecological Approach to Visual Perception, 1979
B Hillier, A Penn, J Hanson, T Grajewski, J Xu, Natural movement: or, configuration and attraction in urban pedestrian movement, Environment and Planning B: planning and design, 1993
Qiao, S., Zhu, Y., Adam, H., Yuille, A., & Chen, L. C. (2021). Vip-deeplab: Learning visual perception with depth-aware video panoptic segmentation. InÂ Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition(pp. 3997-4008).
Vasishta, D. Vaufreydaz, A. Spalanzani. Building Prior Knowledge: A Markov Based Pedestrian Prediction Model Using Urban Environmental Data.Â ICARCV 2018 - 15th International Conference on Control, Automation, Robotics and Vision, Nov 2018, Singapore, Singapore. pp.1-12.
Calude, and G. Longo, The Deluge of Spurious Correlations in Big Data, Opening Lecture, ColloqueÂ Lois des dieux, des hommes et de la nature, published inFoundations of Science, 1-18, March, 2016.

Contenu

L'apprentissage automatique et ses biais

Apport des connaissances issues des recherches en sciences sociales

Le langage corporel pour les interactions humain-robot

[caption id="attachment_41587" align="aligncenter" width="500"]

DÃ©tection de l'orientation des Ã©paules d'un humain envers un robot aprÃ¨s dÃ©tection des diffÃ©rentes articulations par Machine Learning.[/caption]

Les comportements des piÃ©tons pour la navigation des vÃ©hicules autonomes

[caption id="attachment_41651" align="aligncenter" width="500"]

Lâ€™interdisciplinaritÃ©, une voie de recherche

RÃ©fÃ©rences

Deng, W. Dong, R. Socher, L.-J. Li, K. Li and L. Fei-Fei, ImageNet: A Large-Scale Hierarchical Image Database, IEEE Computer Vision and Pattern Recognition (CVPR), 2009.Â
Erwan Le Merrer, Gilles TrÃ©dan. Le problÃ¨me du videur : la crÃ©dibilitÃ© des explications de lâ€™IA en question. Interstices, INRIA, 2021.
A. Schegloff. Body Torque. Social Research, 65(3):535â€“596, 1998
shu Fang, S. Xie, Y.W. Tai, and C. Lu. RMPE: Regional multi-person pose estimation. IEEE International Conference on Computer Vision (ICCV), pages 2353â€“2362, 2017.
Vaufreydaz, W. Johal, C. Combe. Starting engagement detection towards a companion robot using multimodal features.Â Robotics and Autonomous Systems, Elsevier, 2015, Robotics and Autonomous Systems, pp.25.
J Gibson, The Ecological Approach to Visual Perception, 1979
B Hillier, A Penn, J Hanson, T Grajewski, J Xu, Natural movement: or, configuration and attraction in urban pedestrian movement, Environment and Planning B: planning and design, 1993
Qiao, S., Zhu, Y., Adam, H., Yuille, A., & Chen, L. C. (2021). Vip-deeplab: Learning visual perception with depth-aware video panoptic segmentation. InÂ Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition(pp. 3997-4008).
Vasishta, D. Vaufreydaz, A. Spalanzani. Building Prior Knowledge: A Markov Based Pedestrian Prediction Model Using Urban Environmental Data.Â ICARCV 2018 - 15th International Conference on Control, Automation, Robotics and Vision, Nov 2018, Singapore, Singapore. pp.1-12.
Calude, and G. Longo, The Deluge of Spurious Correlations in Big Data, Opening Lecture, ColloqueÂ Lois des dieux, des hommes et de la nature, published inFoundations of Science, 1-18, March, 2016.

Thèmes scientifiques

Intelligence artificielle

37231

Auteurs

Dominique Vaufreydaz

Contenu

L'apprentissage automatique et ses biais

Apport des connaissances issues des recherches en sciences sociales

Le langage corporel pour les interactions humain-robot

[caption id="attachment_41587" align="aligncenter" width="500"]

DÃ©tection de l'orientation des Ã©paules d'un humain envers un robot aprÃ¨s dÃ©tection des diffÃ©rentes articulations par Machine Learning.[/caption]

[caption id="attachment_41651" align="aligncenter" width="500"]

RÃ©fÃ©rences

Deng, W. Dong, R. Socher, L.-J. Li, K. Li and L. Fei-Fei, ImageNet: A Large-Scale Hierarchical Image Database, IEEE Computer Vision and Pattern Recognition (CVPR), 2009.Â
Erwan Le Merrer, Gilles TrÃ©dan. Le problÃ¨me du videur : la crÃ©dibilitÃ© des explications de lâ€™IA en question. Interstices, INRIA, 2021.
A. Schegloff. Body Torque. Social Research, 65(3):535â€“596, 1998
shu Fang, S. Xie, Y.W. Tai, and C. Lu. RMPE: Regional multi-person pose estimation. IEEE International Conference on Computer Vision (ICCV), pages 2353â€“2362, 2017.
Vaufreydaz, W. Johal, C. Combe. Starting engagement detection towards a companion robot using multimodal features.Â Robotics and Autonomous Systems, Elsevier, 2015, Robotics and Autonomous Systems, pp.25.
J Gibson, The Ecological Approach to Visual Perception, 1979
B Hillier, A Penn, J Hanson, T Grajewski, J Xu, Natural movement: or, configuration and attraction in urban pedestrian movement, Environment and Planning B: planning and design, 1993
Qiao, S., Zhu, Y., Adam, H., Yuille, A., & Chen, L. C. (2021). Vip-deeplab: Learning visual perception with depth-aware video panoptic segmentation. InÂ Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition(pp. 3997-4008).
Vasishta, D. Vaufreydaz, A. Spalanzani. Building Prior Knowledge: A Markov Based Pedestrian Prediction Model Using Urban Environmental Data.Â ICARCV 2018 - 15th International Conference on Control, Automation, Robotics and Vision, Nov 2018, Singapore, Singapore. pp.1-12.
Calude, and G. Longo, The Deluge of Spurious Correlations in Big Data, Opening Lecture, ColloqueÂ Lois des dieux, des hommes et de la nature, published inFoundations of Science, 1-18, March, 2016.

Image

Sans-titre-1_Plan-de-travail-1-1

Thèmes scientifiques

Intelligence artificielle