Sites Inria

Version française

MULTISPEECH Research team

MULTISPEECH team publications

2019

Journal articles

titre
Motion planning for robot audition
auteur
Quan V. Nguyen, Francis Colas, Emmanuel Vincent, François Charpillet
article
Autonomous Robots, Springer Verlag, 2019, 43 (8), pp.2293-2317. ⟨10.1007/s10514-019-09880-1⟩
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-02188342/file/AR_journal_nguyen.pdf BibTex
titre
Audio-Based Search and Rescue with a Drone: Highlights from the IEEE Signal Processing Cup 2019 Student Competition
auteur
Antoine Deleforge, Diego Di Carlo, Martin Strauss, Romain Serizel, Lucio Marcenaro
article
IEEE Signal Processing Magazine, Institute of Electrical and Electronics Engineers, In press, pp.1-7
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-02161897/file/SPCup2019.pdf BibTex
titre
Summarizing videos into a target language: Methodology, architectures and evaluation
auteur
Kamel Smaïli, Dominique Fohr, Carlos-Emiliano González-Gallardo, Michał Grega, Lucjan Janowski, Denis Jouvet, Arian Koźbiał, David Langlois, Mikołaj Leszczuk, Odile Mella, Mohamed-Amine Menacer, Amaia Mendez, Elvys Linhares Pontes, Eric Sanjuan, Juan-Manuel Torres-Moreno, Begona Garcia-Zapirain
article
Journal of Intelligent and Fuzzy Systems, IOS Press, 2019, 1, pp.1-12. ⟨10.3233/JIFS-179350⟩
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-02271287/file/Kamel.pdf BibTex
titre
Sound event detection in the DCASE 2017 Challenge
auteur
Annamaria Mesaros, Aleksandr Diment, Benjamin Elizalde, Toni Heittola, Emmanuel Vincent, Bhiksha Raj, Tuomas Virtanen
article
IEEE/ACM Transactions on Audio, Speech and Language Processing, Institute of Electrical and Electronics Engineers, 2019, 27 (6), pp.992 - 1006
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-02067935/file/mesaros_TASLP19.pdf BibTex
titre
Voice Mimicry Attacks Assisted by Automatic Speaker Verification
auteur
Ville Vestman, Tomi Kinnunen, Rosa Hautamäki, Md Sahidullah
article
Computer Speech and Language, Elsevier, 2019, ⟨10.1016/j.csl.2019.05.005⟩
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-02161773/file/mimicry_attack2019_CSL.pdf BibTex
titre
CRNN-based multiple DoA estimation using acoustic intensity features for Ambisonics recordings
auteur
Lauréline Perotin, Romain Serizel, Emmanuel Vincent, Alexandre Guérin
article
IEEE Journal of Selected Topics in Signal Processing, IEEE, 2019, Special Issue on Acoustic Source Localization and Tracking in Dynamic Real-life Scenes, 13 (1), pp.22 - 33. ⟨10.1109/jstsp.2019.2900164⟩
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01839883/file/Perotin-2019-CRNN-based_multiple_DoA_estimation.pdf BibTex
titre
VoiceHome-2, an extended corpus for multichannel speech processing in real homes
auteur
Nancy Bertin, Ewen Camberlein, Romain Lebarbenchon, Emmanuel Vincent, Sunit Sivasankaran, Irina Illina, Frédéric Bimbot
article
Speech Communication, Elsevier : North-Holland, 2019, 106, pp.68-78. ⟨10.1016/j.specom.2018.11.002⟩
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01923108/file/bertin_SpeechCom18.pdf BibTex
titre
Quality Measures for Speaker Verification with Short Utterances
auteur
Arnab Poddar, Md Sahidullah, Goutam Saha
article
Digital Signal Processing, Elsevier, 2019, ⟨10.1016/j.dsp.2019.01.023⟩
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01998376/file/DSP_ASV.pdf BibTex

Conference papers

titre
Lead2Gold: Towards exploiting the full potential of noisy transcriptions for speech recognition
auteur
Adrien Dufraux, Emmanuel Vincent, Awni Hannun, Armelle Brun, Matthijs Douze
article
IEEE Automatic Speech Recognition and Understanding Workshop, Dec 2019, Singapour, Singapore
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-02316572/file/CAMERA_READY_ASRU_submission.pdf BibTex
titre
Regression versus classification for neural network based audio source localization
auteur
Lauréline Perotin, Alexandre Défossez, Emmanuel Vincent, Romain Serizel, Alexandre Guérin
article
WASPAA 2019 - IEEE Workshop on Applications of Signal Processing to Audio and Acoustics, IEEE, Oct 2019, New Paltz, United States
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-02125985/file/waspaa_perotin_camera_ready.pdf BibTex
titre
Towards a method of dynamic vocal tract shapes generation by combining static 3D and dynamic 2D MRI speech data
auteur
Ioannis Douros, Anastasiia Tsukanova, Karyna Isaieva, Pierre-André Vuissoz, Yves Laprie
article
INTERSPEECH 2019 - 20th Annual Conference of the International Speech Communication Association, Sep 2019, Graz, Austria
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-02181333/file/2D_3D_transform_final.pdf BibTex
titre
Conditional Variational Auto-Encoder for Text-Driven Expressive AudioVisual Speech Synthesis
auteur
Sara Dahmani, Vincent Colotte, Valérian Girard, Slim Ouni
article
INTERSPEECH 2019 - 20th Annual Conference of the International Speech Communication Association, Sep 2019, Graz, Austria
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-02175776/file/interspeech19_sd_26_06.pdf BibTex
titre
Privacy-Preserving Adversarial Representation Learning in ASR: Reality or Illusion?
auteur
Brij Mohan Lal Srivastava, Aurélien Bellet, Marc Tommasi, Emmanuel Vincent
article
INTERSPEECH 2019 - 20th Annual Conference of the International Speech Communication Association, Sep 2019, Graz, Austria
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-02166434/file/srivastava_IS19.pdf BibTex
titre
A Multimodal Real-Time MRI Articulatory Corpus of French for Speech Research
auteur
Ioannis Douros, Jacques Felblinger, Jens Frahm, Karyna Isaieva, Arun Joseph, Yves Laprie, Freddy Odille, Anastasiia Tsukanova, Dirk Voit, Pierre-André Vuissoz
article
INTERSPEECH 2019 - 20th Annual Conference of the International Speech Communication Association, Sep 2019, Graz, Austria
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-02167756/file/db_paper.pdf BibTex
titre
A Statistically Principled and Computationally Efficient Approach to Speech Enhancement using Variational Autoencoders
auteur
Manuel Pariente, Antoine Deleforge, Emmanuel Vincent
article
Interspeech 2019, Sep 2019, Graz, Austria
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-02116165/file/MPADEV_INTERSPEECH_2019.pdf BibTex
titre
I4U Submission to NIST SRE 2018: Leveraging from a Decade of Shared Experiences
auteur
Kong Lee, Ville Hautamäki, Tomi Kinnunen, Hitoshi Yamamoto, Koji Okabe, Ville Vestman, Jing Huang, Guohong Ding, Hanwu Sun, Anthony Larcher, Rohan Das, Haizhou Li, Mickaël Rouvier, Pierre-Michel Bousquet, Wei Rao, Qing Wang, Chunlei Zhang, Fahimeh Bahmaninezhad, Héctor Delgado, Jose Patino, Qiongqiong Wang, Ling Guo, Takafumi Koshinaka, Jiacen Zhang, Koichi Shinoda, Trung Ngo Trong, Md Sahidullah, Fan Lu, Yun Tang, Ming Tu, Kah Kuan Teh, Huy Dat Tran, Kuruvachan George, Ivan Kukanov, Florent Desnous, Jichen Yang, Emre Yılmaz, Longting Xu, Jean-François Bonastre, Chenglin Xu, Zhi Lim, Siong Chng, Shivesh Ranjan, John Hansen, Massimiliano Todisco, Nicholas Evans
article
INTERSPEECH 2019 - 20th Annual Conference of the International Speech Communication Association, Sep 2019, Graz, Austria
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-02280151/file/i4u_interspeech_2019__arXiv_.pdf BibTex
titre
ASVspoof 2019: Future Horizons in Spoofed and Fake Audio Detection
auteur
Massimiliano Todisco, Xin Wang, Ville Vestman, Md Sahidullah, Héctor Delgado, Andreas Nautsch, Junichi Yamagishi, Nicholas Evans, Tomi Kinnunen, Kong Lee
article
INTERSPEECH 2019 - 20th Annual Conference of the International Speech Communication Association, Sep 2019, Graz, Austria
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-02172099/file/asvspoof2019_overview.pdf BibTex
titre
Modeling Labial Coarticulation with Bidirectional Gated Recurrent Networks and Transfer Learning
auteur
Théo Biasutto--Lervat, Sara Dahmani, Slim Ouni
article
INTERSPEECH 2019 - 20th Annual Conference of the International Speech Communication Association, Sep 2019, Graz, Austria
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-02175780/file/2097_Paper.pdf BibTex
titre
An integrative platform to capture the orchestration of gesture and speech
auteur
Christelle Dodane, Dominique Boutet, Ivana Didirkova, Fabrice Hirsch, Slim Ouni, Aliyah Morgenstern
article
GeSpIn 2019 - Gesture and Speech in Interaction, Sep 2019, Paderborn, Germany
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-02278345/file/GeSpIn2019_paper_10.pdf BibTex
titre
Speech Processing and Prosody
auteur
Denis Jouvet
article
TSD 2019 - 22nd International Conference of Text, Speech and Dialogue, TSD 2019 - The twenty-second International Conference on Text, Speech and Dialogue, Sep 2019, Ljubljana, Slovenia
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-02177210/file/D.Jouvet--SpeechProsodyAndProcessing-v1.pdf BibTex
titre
Glottal Opening Measurements in VCV and VCCV Sequences
auteur
Benjamin Elie, Angelique Amelot, Yves Laprie, Shinji Maeda
article
ICA 2019 - 23rd International Congress on Acoustics, Sep 2019, Aachen, Germany
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-02180626/file/ICA_2019_EPGG.pdf BibTex
titre
Acoustic Evaluation of Simplifying Hypotheses Used in Articulatory Synthesis
auteur
Ioannis Douros, Yves Laprie, Pierre-André Vuissoz, Benjamin Elie
article
ICA 2019 - 23rd International Congress on Acoustics, Sep 2019, Aachen, Germany
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-02180617/file/ICA_2019AcousticSimulations.pdf BibTex
titre
Evaluation of text clustering methods and their dataspace embeddings: an exploration
auteur
Alain Lelu, Martine Cadot
article
IFCS 2019 - 16th International of the Federation of Classification Societies, Aug 2019, Thessaloniki, Greece
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-02116493/file/Cadot-Lelu_Cluster-Challenge5.pdf BibTex
titre
German obstruent sequences by French L2 learners
auteur
Anne Bonneau
article
ICPhS 2019 - International Congress of Phonetic Sciences, Aug 2019, Melbourne, Australia
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-02143360/file/German_assim.pdf BibTex
titre
Acoustic impacts of geometric approximation at the level of velum and epiglottis on french vowels
auteur
Ioannis Douros, Pierre-André Vuissoz, Yves Laprie
article
ICPhS 2019 - International Congress of Phonetic Sciences, Aug 2019, Melbourne, Australia
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-02180566/file/ICPhS_2019Velum.pdf BibTex
titre
Comparison between 2D and 3D models for speech production: a study of french vowels
auteur
Ioannis Douros, Pierre-André Vuissoz, Yves Laprie
article
ICPhS 2019 - International Congress of Phonetic Sciences, Aug 2019, Melbourne, Australia
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-02180606/file/ICPhS_2019AcousticSim.pdf BibTex
titre
Can static vocal tract positions represent articulatory targets in continuous speech? Matching static MRI captures against real-time MRI for the french language
auteur
Anastasiia Tsukanova, Ioannis Douros, Anastasia Shimorina, Yves Laprie
article
ICPhS 2019 - International Congress of Phonetic Sciences, Aug 2019, Melbourne, Australia
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-02181314/file/art_targ.pdf BibTex
titre
Effect of head posture on phonation of french vowels
auteur
Ioannis Douros, Pierre-André Vuissoz, Yves Laprie
article
ICPhS 2019 - Proceedings of International Congress of Phonetic Sciences, Aug 2019, Melbourne, Australia
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-02180486/file/ICPhS_2019Position.pdf BibTex
titre
Can prosody meet pragmatics? Case of discourse particles in French
auteur
Lou Lee, Katarina Bartkova, Denis Jouvet, Mathilde Dargnat, Yvon Keromnes
article
ICPhS 2019 - International Congress of Phonetic Sciences, Aug 2019, Melbourne, Australia
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-02177202/file/ICPhS19-DP-1.2-revised-29Mar2019-submitted.pdf BibTex
titre
Sound Event Detection from Partially Annotated Data: Trends and Challenges
auteur
Romain Serizel, Nicolas Turpault
article
IcETRAN conference, Jun 2019, Srebrno Jezero, Serbia
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-02114652/file/IcETRAN2019.pdf BibTex
titre
Machine Translation on a parallel Code-Switched Corpus
auteur
Mohamed Menacer, David Langlois, Denis Jouvet, Dominique Fohr, Odile Mella, Kamel Smaïli
article
Canadian AI 2019 - 32nd Conference on Canadian Artificial Intelligence, May 2019, Ontario, Canada
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-02106010/file/main.pdf BibTex
titre
Layer adaptation for transfer of expressivity in speech synthesis
auteur
Ajinkya Kulkarni, Vincent Colotte, Denis Jouvet
article
LTC'19 - 9th Language & Technology Conference, May 2019, Poznan, Poland
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-02177945/file/LTC19.pdf BibTex
titre
Can We Use Speaker Recognition Technology to Attack Itself? Enhancing Mimicry Attacks Using Automatic Target Speaker Selection
auteur
Tomi Kinnunen, Rosa Hautamäki, Ville Vestman, Md Sahidullah
article
ICASSP 2019 – 44th International Conference on Acoustics, Speech, and Signal Processing, May 2019, Brighton, United Kingdom
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-02051701/file/ICASSP19_Manuscript_UEF_Inria.pdf BibTex
titre
An improved uncertainty propagation method for robust i-vector based speaker recognition
auteur
Dayana Ribas, Emmanuel Vincent
article
ICASSP 2019 - 44th International Conference on Acoustics, Speech, and Signal Processing, May 2019, Brighton, United Kingdom
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-02010199/file/ribas_ICASSP19.pdf BibTex
titre
Mirage: 2D Source Localization Using Microphone Pair Augmentation with Echoes
auteur
Diego Di Carlo, Antoine Deleforge, Nancy Bertin
article
ICASSP 2019 - IEEE International Conferenze on Acoustic, Speech Signal Processing, May 2019, Brighton, United Kingdom. pp.775-779, ⟨10.1109/ICASSP.2019.8683534⟩
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-02160940/file/main.pdf BibTex
titre
F0 modeling using DNN for Arabic parametric speech synthesis
auteur
Imene Zangar, Zied Mnasri, Vincent Colotte, Denis Jouvet
article
INNSBDDL 2019 - INNS Big Data and Deep Learning, Apr 2019, Sestri Levante, Italy
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-02177496/file/conference_INNSBDDL2019.pdf BibTex
titre
Parole & deep learning : succès et grands défis
auteur
Emmanuel Vincent
article
Journée IA, Langage et Citoyens, Mar 2019, Nancy, France
Accès au bibtex
BibTex
titre
Semi-supervised triplet loss based learning of ambient audio embeddings
auteur
Nicolas Turpault, Romain Serizel, Emmanuel Vincent
article
ICASSP, 2019, Brighton, France
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-02025824/file/ssl_triplet.pdf BibTex

Book sections

titre
A Fine-grained Multilingual Analysis Based on the Appraisal Theory: Application to Arabic and English Videos
auteur
Karima Abidi, Dominique Fohr, Denis Jouvet, David Langlois, Odile Mella, Kamel Smaïli
article
Arabic Language Processing: From Theory to Practice 7th International Conference, ICALP 2019, Nancy, France, October 16–17, 2019, Proceedings, Communications in Computer and Information Science book series (CCIS, volume 1108), pp.49-61, 2019, ⟨10.1007/978-3-030-32959-4_4⟩
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-02314244/file/Abidietall.pdf BibTex
titre
Extractive Text-Based Summarization of Arabic videos: Issues, Approaches and Evaluations
auteur
M Menacer, C González-Gallardo, K Abidi, Dominique Fohr, D Jouvet, D Langlois, Odile Mella, F Sadat, J Torres-Moreno, Kamel Smaïli
article
Arabic Language Processing: From Theory to Practice 7th International Conference, ICALP 2019, Nancy, France, October 16–17, 2019, Proceedings, Communications in Computer and Information Science book series (CCIS, volume 1108), pp.65-78, 2019, ⟨10.1007/978-3-030-32959-4_5⟩
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-02314238/file/ICALP2019AMIS.pdf BibTex
titre
Introduction to Voice Presentation Attack Detection and Recent Advances
auteur
Md Sahidullah, Héctor Delgado, Massimiliano Todisco, Tomi Kinnunen, Nicholas Evans, Junichi Yamagishi, Kong-Aik Lee
article
Sébastien Marcel; Mark S. Nixon; Julian Fierrez; Nicholas Evans. Handbook of Biometric Anti-Spoofing: Presentation Attack Detection, Springer, pp.321-361, 2019, Advances in Computer Vision and Pattern Recognition, 978-3-319-92626-1. ⟨10.1007/978-3-319-92627-8_15⟩
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01974528/file/author%20%281%29.pdf BibTex

Reports

titre
A Statistically Principled and Computationally Efficient Approach to Speech Enhancement using Variational Autoencoders : Supporting Document
auteur
Manuel Pariente, Antoine Deleforge, Emmanuel Vincent
article
[Research Report] RR-9268, INRIA. 2019, pp.1-8
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-02089062/file/support_document_final.pdf BibTex
titre
AI in the media and creative industries
auteur
Baptiste Caramiaux, Fabien Lotte, Joost Geurts, Giuseppe Amato, Malte Behrmann, Frédéric Bimbot, Fabrizio Falchi, Ander Garcia, Jaume Gibert, Guillaume Gravier, Hadmut Holken, Hartmut Koenitz, Sylvain Lefebvre, Antoine Liutkus, Andrew Perkis, Rafael Redondo, Enrico Turrin, Thierry Vieville, Emmanuel Vincent
article
[Research Report] New European Media (NEM). 2019, pp.1-35
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-02125504/file/NEM%20White%20Paper%20-%20AI%20in%20the%20creative%20industry.pdf BibTex
titre
I4U Submission to NIST SRE 2018: Leveraging from a Decade of Shared Experiences
auteur
Kong Lee, Ville Hautamäki, Tomi Kinnunen, Hitoshi Yamamoto, Koji Okabe, Ville Vestman, Jing Huang, Guohong Ding, Hanwu Sun, Anthony Larcher, Rohan Das, Haizhou Li, Mickaël Rouvier, Pierre-Michel Bousquet, Wei Rao, Qing Wang, Chunlei Zhang, Fahimeh Bahmaninezhad, Héctor Delgado, Jose Patino, Qiongqiong Wang, Ling Guo, Takafumi Koshinaka, Jiacen Zhang, Koichi Shinoda, Trung Ngo Trong, Md Sahidullah, Fan Lu, Yun Tang, Ming Tu, Kah Kuan Teh, Huy Dat Tran, Kuruvachan George, Ivan Kukanov, Florent Desnous, Jichen Yang, Emre Yılmaz, Longting Xu, Jean-François Bonastre, Chenglin Xu, Zhi Lim, Siong Chng, Shivesh Ranjan, John Hansen, Massimiliano Todisco, Nicholas Evans
article
[Research Report] I4U Consortium. 2019
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-02174317/file/1904.07386.pdf BibTex

Software

titre
Underdetermined Reverberant Source Separation
auteur
Matthieu Kowalski, Emmanuel Vincent, Rémi Gribonval
article
2019
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-02309043/file/URSS_v0.2.zip BibTex

Theses

titre
Processus alpha-stables pour le traitement du signal
auteur
Mathieu Fontaine
article
Traitement du signal et de l'image [eess.SP]. Université de Lorraine, 2019. Français. ⟨NNT : 2019LORR0037⟩
Accès au texte intégral et bibtex
https://tel.archives-ouvertes.fr/tel-02188304/file/these.pdf BibTex

Preprints, Working Papers, ...

titre
Sound event detection in domestic environments with weakly labeled data and soundscape synthesis
auteur
Nicolas Turpault, Romain Serizel, Ankit Parag Shah, Justin Salamon
article
2019
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-02160855/file/Sound_event_detection_in_domestic_environments_with_weakly_labeled_data_and_soundscape_synthesis.pdf BibTex

2018

Journal articles

titre
Evaluation of speech unit modelling for HMM-based speech synthesis for Arabic
auteur
Amal Houidhek, Vincent Colotte, Zied Mnasri, Denis Jouvet
article
International Journal of Speech Technology, Springer Verlag, 2018, pp.1-12. ⟨10.1007/s10772-018-09558-6⟩
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01936963/file/IJST_Accepted_Version.pdf BibTex
titre
Probabilistic Factor Oracles for Multidimensional Machine Improvisation
auteur
Ken Déguernel, Emmanuel Vincent, Gérard Assayag
article
Computer Music Journal, Massachusetts Institute of Technology Press (MIT Press): Arts & Humanities Titles etc, 2018, 42 (2), pp.52-66. ⟨10.1162/comj_a_00460⟩
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01693750/file/Probabilistic_Factor_Oracles_CMJ42-2.pdf BibTex
titre
Rank-1 Constrained Multichannel Wiener Filter for Speech Recognition in Noisy Environments
auteur
Ziteng Wang, Emmanuel Vincent, Romain Serizel, Yonghong Yan
article
Computer Speech and Language, Elsevier, 2018, 49, pp.37-51. ⟨10.1016/j.csl.2017.11.003⟩
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01634449/file/wang_CSL17.pdf BibTex
titre
Adaptation of speech recognition vocabularies for improved transcription of YouTube videos
auteur
Denis Jouvet, David Langlois, Mohamed Menacer, Dominique Fohr, Odile Mella, Kamel Smaïli
article
Journal of International Science and General Applications, ISGA, 2018, 1 (1), pp.1-9. ⟨http://journal-isga.ma/⟩
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01873801/file/DENIS.pdf BibTex
titre
Dynamic Lip Animation from a Limited number of Control Points: Towards an Effective Audiovisual Spoken Communication
auteur
Slim Ouni, Guillaume Gris
article
Speech Communication, Elsevier : North-Holland, 2018, 96, pp.49-57. ⟨10.1016/j.specom.2017.11.006⟩
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01631397/file/lipControl-draft-specom-2015-rev1.compressed.pdf BibTex
titre
DNN Uncertainty Propagation using GMM-Derived Uncertainty Features for Noise Robust ASR
auteur
Karan Nathwani, Emmanuel Vincent, Irina Illina
article
IEEE Signal Processing Letters, Institute of Electrical and Electronics Engineers, 2018, ⟨10.1109/LSP.2018.2791534⟩
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01680658/file/nathwani_SPL18.pdf BibTex

Conference papers

titre
Dynamic Extension of ASR Lexicon Using Wikipedia Data
auteur
Badr Abdullah, Irina Illina, Dominique Fohr
article
IEEE Workshop on Spoken and Language Technology (SLT), Dec 2018, Athènes, Greece
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01874495/file/Abdullah.pdf BibTex
titre
Transforming acoustic characteristics to deceive playback spoofing countermeasures of speaker verification systems
auteur
Fuming Fang, Junichi Yamagishi, Isao Echizen, Md Sahidullah, Tomi Kinnunen
article
WIFS 2018 - IEEE International Workshop on Information Forensics and Security, Dec 2018, Hong Kong, Hong Kong SAR China
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01889910/file/PID5567621.pdf BibTex
titre
MULAN: A Blind and Off-Grid Method for Multichannel Echo Retrieval
auteur
Helena Peic Tukuljac, Antoine Deleforge, Rémi Gribonval
article
NeurIPS 2018 - Thirty-second Conference on Neural Information Processing Systems, Dec 2018, Montréal, Canada. pp.1-11
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01906385/file/main_CR.pdf BibTex
titre
Large-Scale Weakly Labeled Semi-Supervised Sound Event Detection in Domestic Environments
auteur
Romain Serizel, Nicolas Turpault, Hamid Eghbal-Zadeh, Ankit Parag Shah
article
Workshop on Detection and Classification of Acoustic Scenes and Events, Nov 2018, Woking, United Kingdom
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01850270/file/task4.pdf BibTex
titre
DNN-Based Speech Synthesis for Arabic: Modelling and Evaluation
auteur
Amal Houidhek, Vincent Colotte, Zied Mnasri, Denis Jouvet
article
SLSP 2018 - 6th International Conference on Statistical Language and Speech Processing, Oct 2018, Mons, Belgium
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01904512/file/slsp-final-depose-30-juillet-2018.pdf BibTex
titre
DREGON: Dataset and Methods for UAV-Embedded Sound Source Localization
auteur
Martin Strauss, Pol Mordel, Victor Miguet, Antoine Deleforge
article
IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS 2018), Oct 2018, Madrid, Spain. pp.5735-5742, ⟨10.1109/IROS.2018.8593581⟩
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01854878/file/2018_iros_strauss.pdf BibTex
titre
CRNN-based joint azimuth and elevation localization with the Ambisonics intensity vector
auteur
Lauréline Perotin, Romain Serizel, Emmanuel Vincent, Alexandre Guérin
article
IWAENC 2018 - 16th International Workshop on Acoustic Signal Enhancement, Sep 2018, Tokyo, Japan
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01840453/file/articleIWAENC.pdf BibTex
titre
Evaluation of an Open-Source Implementation of the SRP-PHAT Algorithm within the 2018 Locata Challenge
auteur
Romain Lebarbenchon, Ewen Camberlein, Diego Di Carlo, Clément Gaultier, Antoine Deleforge, Nancy Bertin
article
LOCATA Challenge Workshop, a satellite event of IWAENC 2018, Sep 2018, Tokyo, Japan
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-02187964/file/Locata2018.pdf BibTex
titre
An Integrated AMIS Prototype for Automated Summarization and Translation of Newscasts and Reports
auteur
Michał Grega, Kamel Smaïli, Mikołaj Leszczuk, Carlos-Emiliano González-Gallardo, Juan-Manuel Torres-Moreno, Elvys Linhares Pontes, Dominique Fohr, Odile Mella, Mohamed Menacer, Denis Jouvet
article
MISSI 2018 - 11th International Conference on Multimedia and Network Information Systems, Sep 2018, Wroclaw, Poland. pp.415-423, ⟨10.1007/978-3-319-98678-4_42⟩
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01873680/file/Grega2019_Chapter_AnIntegratedAMISPrototypeForAu.pdf BibTex
titre
A Proposed Methodology for Subjective Evaluation of Video and Text Summarization
auteur
Begona Garcia-Zapirain, Cristian Castillo, Aritz Badiola, Sofia Zahia, Amaia Mendez, David Langlois, Denis Jouvet, Juan-Manuel Torres-Moreno, Mikołaj Leszczuk, Kamel Smaïli
article
MISSI 2018 - 11th edition of the International Conference on Multimedia and Network Information Systems, Sep 2018, Wrocław, Poland. pp.396-404, ⟨10.1007/978-3-319-98678-4_40⟩
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01873685/file/Garcia-Zapirain2019_Chapter_AProposedMethodologyForSubject.pdf BibTex
titre
A First Summarization System of a Video in a Target Language
auteur
Kamel Smaïli, Dominique Fohr, Carlos González-Gallardo, Michal Grega, Lucjan Janowski, Denis Jouvet, Artur Komorowski, Arian Kozbial, David Langlois, Mikolaj Leszczuk, Odile Mella, Mohamed Amine Menacer, Amaia Mendez, Elvys Linhares Pontes, Eric Sanjuan, Damian Swist, Juan-Manuel Torres-Moreno, Begona Garcia-Zapirain
article
MISSI 2018 - 11th edition of the International Conference on Multimedia and Network Information Systems, Sep 2018, Wrocław, Poland. pp.1-12
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01819720/file/first-summarization-system.pdf BibTex
titre
The VocADom Project: Speech Interaction for Well-being and Reliance Improvement
auteur
Michel Vacher, Emmanuel Vincent, Marc-Eric Bobillier Chaumon, Thierry Joubert, François Portet, Dominique Fohr, Sybille Caffiau, Thierry Desot
article
MobileHCI 2018 - 20th International Conference on Human-Computer Interaction with Mobile Devices and Services, Sep 2018, Barcelona, Spain
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01830217/file/2018_MobileHCI_Vacher_postprint.pdf BibTex
titre
Centerline articulatory models of the velum and epiglottis for articulatory synthesis of speech
auteur
Yves Laprie, Benjamin Elie, Anastasiia Tsukanova, Pierre-André Vuissoz
article
EUSIPCO 2018 - 26th European Signal Processing Conference, Sep 2018, Rome, Italy
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01921928/file/velumEusipco.pdf BibTex
titre
The fifth 'CHiME' Speech Separation and Recognition Challenge: Dataset, task and baselines
auteur
Jon Barker, Shinji Watanabe, Emmanuel Vincent, Jan Trmal
article
Interspeech 2018 - 19th Annual Conference of the International Speech Communication Association, Sep 2018, Hyderabad, India
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01744021/file/barker_IS18.pdf BibTex
titre
Integrated Presentation Attack Detection and Automatic Speaker Verification: Common Features and Gaussian Back-end Fusion
auteur
Massimiliano Todisco, Héctor Delgado, Kong Lee, Md Sahidullah, Nicholas Evans, Tomi Kinnunen, Junichi Yamagishi
article
Interspeech 2018 - 19th Annual Conference of the International Speech Communication Association, Sep 2018, Hyderabad, India. ⟨10.21437/Interspeech.2018-2289⟩
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01889934/file/integrated-presentation-attack-INTERSPEECH2018.pdf BibTex
titre
Phoneme-to-Articulatory mapping using bidirectional gated RNN
auteur
Théo Biasutto– Lervat, Slim Ouni
article
Interspeech 2018 - 19th Annual Conference of the International Speech Communication Association, Sep 2018, Hyderabad, India
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01862587/file/1202_Paper.pdf BibTex
titre
Keyword-based speaker localization: Localizing a target speaker in a multi-speaker environment
auteur
Sunit Sivasankaran, Emmanuel Vincent, Dominique Fohr
article
Interspeech 2018 - 19th Annual Conference of the International Speech Communication Association, Sep 2018, Hyderabad, India
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01817519/file/single-speaker-localization.pdf BibTex
titre
A French-Spanish Multimodal Speech Communication Corpus Incorporating Acoustic Data, Facial, Hands and Arms Gestures Information
auteur
Lucas Terissi, Gonzalo Sad, Mauricio Cerda, Slim Ouni, Rodrigo Galvez, Juan Gómez, Bernard Girau, Nancy Hitschfeld-Kahler
article
Interspeech 2018 - 19th Annual Conference of the International Speech Communication Association, Sep 2018, Hyderabad, India
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01862585/file/2212_Paper.pdf BibTex
titre
Prosodic and Pragmatic Values of Discourse Particles in French
auteur
Lou Lee, Katarina Bartkova, Mathilde Dargnat, Denis Jouvet
article
ExLing 2018 - 9th Tutorial and Research Workshop on Experimental Linguistics, Aug 2018, Paris, France
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01889925/file/ExLing_2018_Discourse-Particles-V1.2.pdf BibTex
titre
Analysis of prosodic correlates of emotional speech data
auteur
Katarina Bartkova, Denis Jouvet
article
ExLing 2018 - 9th Tutorial and Research Workshop on Experimental Linguistics, Aug 2018, Paris, France
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01889932/file/ExLing_2018_ProsodyEmotionalSpeech-V1.2.pdf BibTex
titre
Phone Merging for Code-switched Speech Recognition
auteur
Sunit Sivasankaran, Brij Mohan Lal Srivastava, Sunayana Sitaram, Kalika Bali, Monojit Choudhury
article
Third Workshop on Computational Approaches to Linguistic Code-switching, collocated with ACL 2018 Jul 2018, Melbourne, Australia
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01800466/file/phone-merging-acl.pdf BibTex
titre
Audiovisual Synchrony Detection with Optimized Audio Features
auteur
Sami Sieranoja, Md Sahidullah, Tomi Kinnunen, Jukka Komulainen, Abdenour Hadid
article
ICSIP 2018 - 3rd International Conference on Signal and Image Processing, Jul 2018, Shenzhen, China
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01889918/file/audiovisual_synchrony_2018.pdf BibTex
titre
Multichannel Audio Modeling with Elliptically Stable Tensor Decomposition
auteur
Mathieu Fontaine, Fabian Robert-Stöter, Antoine Liutkus, Umut Simsekli, Romain Serizel, Roland Badeau
article
LVA/ICA: Latent Variable Analysis and Signal Separation, Jul 2018, Surrey, United Kingdom. pp.13-23, ⟨10.1007/978-3-319-93764-9_2⟩
Accès au texte intégral et bibtex
https://hal-lirmm.ccsd.cnrs.fr/lirmm-01766795/file/LVA-ICA2018_046_original_v5.pdf BibTex
titre
t-DCF: a Detection Cost Function for the Tandem Assessment of Spoofing Countermeasures and Automatic Speaker Verification
auteur
Tomi Kinnunen, Kong Lee, Héctor Delgado, Nicholas Evans, Massimiliano Todisco, Md Sahidullah, Junichi Yamagishi, Douglas Reynolds
article
Speaker Odyssey 2018 The Speaker and Language Recognition Workshop, Jun 2018, Les Sables d’Olonne, France
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01880306/file/tDCF_Odyssey2018.pdf BibTex
titre
ASVspoof 2017 Version 2.0: meta-data analysis and baseline enhancements
auteur
Héctor Delgado, Massimiliano Todisco, Md Sahidullah, Nicholas Evans, Tomi Kinnunen, Kong Lee, Junichi Yamagishi
article
Odyssey 2018 - The Speaker and Language Recognition Workshop, Jun 2018, Les Sables d'Olonne, France
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01880206/file/ASVspoof2.0_Odyssey2018.pdf BibTex
titre
Impact of fluency and segmental categorization in L2: the case of French final fricatives uttered by German speakers
auteur
Anne Bonneau
article
Speech Prosody 2018, Jun 2018, Poznan, Poland. ⟨10.21437/speechprosody.2018-189⟩
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01926657/file/bonneau_sp18_corr.pdf BibTex
titre
Duration modeling using DNN for Arabic speech synthesis
auteur
Imene Zangar, Zied Mnasri, Vincent Colotte, Denis Jouvet, Amal Houidhek
article
9th International Conference on Speech Prosody, Jun 2018, Poznań, Poland
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01889917/file/SP18_paper_78_version_final.pdf BibTex
titre
Exploration de dépendances structurelles mélodiques par réseaux de neurones récurrents
auteur
Nathan Libermann, Frédéric Bimbot, Emmanuel Vincent
article
JIM 2018 - Journées d'Informatique Musicale, May 2018, Amiens, France. pp.81-86
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01791381/file/JIM2018-08-Vincent.pdf BibTex
titre
Multiple-input neural network-based residual echo suppression
auteur
Guillaume Carbajal, Romain Serizel, Emmanuel Vincent, Eric Humbert
article
ICASSP 2018 - IEEE International Conference on Acoustics, Speech and Signal Processing, Apr 2018, Calgary, Canada. pp.1-5
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01723630/file/CARBAJAL_ICASSP_2018.pdf BibTex
titre
Semi-supervised learning with deep neural networks for relative transfer function inverse regression
auteur
Ziteng Wang, Junfeng Li, Yonghong Yan, Emmanuel Vincent
article
ICASSP 2018 – IEEE International Conference on Acoustics, Speech and Signal Processing, Apr 2018, Calgary, Canada
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01797886/file/wang_ICASSP18.pdf BibTex
titre
Multichannel speech separation with recurrent neural networks from high-order ambisonics recordings
auteur
Lauréline Perotin, Romain Serizel, Emmanuel Vincent, Alexandre Guérin
article
43rd IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2018), Apr 2018, Calgary, Canada
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01699759/file/2018-Perotin-Multichannel_speech_separation_hoa.pdf BibTex
titre
Blind Source Separation Using Mixtures of Alpha-Stable Distributions
auteur
Nicolas Keriven, Antoine Deleforge, Antoine Liutkus
article
ICASSP: International Conference on Acoustics, Speech and Signal Processing, Apr 2018, Calgary, Canada. pp.771-775, ⟨10.1109/ICASSP.2018.8462095⟩
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01633215/file/main_ICASSP2018_alphabss_rev.pdf BibTex
titre
Interference reduction on full-length live recordings
auteur
Diego Di Carlo, Antoine Liutkus, Ken Déguernel
article
ICASSP: International Conference on Acoustics, Speech, and Signal Processing, Apr 2018, Calgary, Canada. pp.736-740, ⟨10.1109/ICASSP.2018.8462621⟩
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01713889/file/interference-reduction-full.pdf BibTex
titre
Separake: Source Separation with a Little Help From Echoes
auteur
Robin Scheibler, Diego Di Carlo, Antoine Deleforge, Ivan Dokmanić
article
ICASSP 2018 - IEEE International Conference on Acoustics, Speech and Signal Processing, Apr 2018, Calgary, Canada. pp.6897-6901, ⟨10.1109/ICASSP.2018.8461345⟩
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01909531/file/main.pdf BibTex
titre
Audio source separation with magnitude priors: the BEADS model
auteur
Antoine Liutkus, Christian Rohlfing, Antoine Deleforge
article
ICASSP: International Conference on Acoustics, Speech and Signal Processing, Apr 2018, Calgary, Canada. pp.56-60, ⟨10.1109/ICASSP.2018.8462515⟩
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01713886/file/audio-source-separation.pdf BibTex

Book sections

titre
Audio-Motor Integration for Robot Audition
auteur
Antoine Deleforge, Alexander Schmidt, Walter Kellermann
article
Multimodal Behavior Analysis in the Wild, Academic Press, pp.1-27, 2018
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01929388/file/Book.pdf BibTex
titre
Introduction
auteur
Emmanuel Vincent, Sharon Gannot, Tuomas Virtanen
article
Emmanuel Vincent; Tuomas Virtanen; Sharon Gannot. Audio source separation and speech enhancement, Wiley, 2018, 978-1-119-27989-1
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01881422/file/vincent_book18_chap1.pdf BibTex
titre
Perspectives
auteur
Emmanuel Vincent, Tuomas Virtanen, Sharon Gannot
article
Emmanuel Vincent; Tuomas Virtanen; Sharon Gannot. Audio source separation and speech enhancement, Wiley, 2018, 978-1-119-27989-1. ⟨https://www.wiley.com/en-us/Audio+Source+Separation+and+Speech+Enhancement-p-9781119279891⟩
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01881424/file/vincent_book18_chap19.pdf BibTex
titre
Acoustics - Spatial properties
auteur
Emmanuel Vincent, Sharon Gannot, Tuomas Virtanen
article
Emmanuel Vincent; Tuomas Virtanen; Sharon Gannot. Audio source separation and speech enhancement, Wiley, 2018, 978-1-119-27989-1
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01881423/file/vincent_book18_chap3.pdf BibTex
titre
Spectral masking and filtering
auteur
Timo Gerkmann, Emmanuel Vincent
article
Emmanuel Vincent; Tuomas Virtanen; Sharon Gannot. Audio source separation and speech enhancement, Wiley, 2018, 978-1-119-27989-1
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01881425/file/gerkmann_book18_chap5.pdf BibTex
titre
Time-frequency processing - Spectral properties
auteur
Tuomas Virtanen, Emmanuel Vincent, Sharon Gannot
article
Emmanuel Vincent; Tuomas Virtanen; Sharon Gannot. Audio source separation and speech enhancement, Wiley, 2018, 978-1-119-27989-1
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01881426/file/virtanen_book18_chap2.pdf BibTex
titre
Single-channel audio source separation with NMF: divergences, constraints and algorithms
auteur
Cédric Févotte, Emmanuel Vincent, Alexey Ozerov
article
Audio Source Separation, Springer, 2018
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01631185/file/fevotte_book18.pdf BibTex
titre
An introduction to multichannel NMF for audio source separation
auteur
Alexey Ozerov, Cédric Févotte, Emmanuel Vincent
article
Audio Source Separation, Springer, 2018, Signals and Communication Technology
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01631187/file/ozerov_book18.pdf BibTex
titre
Deep neural network based multichannel audio source separation
auteur
Aditya Arie Nugraha, Antoine Liutkus, Emmanuel Vincent
article
Audio Source Separation, Springer, pp.157-195, 2018, 978-3-319-73030-1. ⟨10.1007/978-3-319-73031-8_7⟩
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01633858/file/nugraha_book18.pdf BibTex
titre
Articulatory Speech Synthesis from Static Context-Aware Articulatory Targets
auteur
Anastasiia Tsukanova, Benjamin Elie, Yves Laprie
article
Qiang Fang; Jianwu Dang; Pascal Perrier; Jianguo Wei; Longbiao Wang; Nan Yan. Studies on Speech Production, Springer, pp.37-47, 2018, Lecture Notes in Computer Science, 978-3-030-00125-4. ⟨10.1007/978-3-030-00126-1_4⟩. ⟨https://link.springer.com/chapter/10.1007%2F978-3-030-00126-1_4⟩
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01937950/file/issp25-tsukanova.pdf BibTex
titre
Bibliometric delineation of scientific fields
auteur
Michel Zitt, Alain Lelu, Martine Cadot, Guillaume Cabanac
article
Wolfgang Glänzel; Henk F. Moed; Ulrich Schmoch; Michael Thelwall. Handbook of Science and Technology Indicators, ⟨Springer International Publishing⟩, In press, Handbook of Science and Technology Indicators, 978-3-030-02510-6. ⟨10.1007/978-3-030-02511-3⟩
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01942528/file/20180427_handbookSpringer.pdf BibTex

Directions of work or proceedings

titre
Audio source separation and speech enhancement
auteur
Emmanuel Vincent, Tuomas Virtanen, Sharon Gannot
article
Wiley, pp.504, 2018, 9781119279860. ⟨10.1002/9781119279860⟩. ⟨https://onlinelibrary.wiley.com/doi/book/10.1002/9781119279860⟩
Accès au bibtex
BibTex

Patents

titre
Image processing device
auteur
Slim Ouni, Guillaume Gris
article
United States, Patent n° : US2018/0061109 A1. 2018
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01862639/file/US20180061109A1.pdf BibTex

Reports

titre
Benchmarking seventeen clustering methods on a text dataset
auteur
Martine Cadot, Alain Lelu, Michel Zitt
article
[Research Report] LORIA. 2018
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01532894/file/ContributionAL-MC-MZ_21Avr2019.pdf BibTex

Theses

titre
Contrôle acoustique d'un parc éolien
auteur
Baldwin Dumortier
article
Systèmes et contrôle [cs.SY]. Université de Lorraine, 2018. Français. ⟨NNT : 2018LORR0131⟩
Accès au texte intégral et bibtex
https://tel.archives-ouvertes.fr/tel-01897853/file/DDOC_T_2018_0131_DUMORTIER.pdf BibTex
titre
Apprentissage de structures musicales en contexte d'improvisation
auteur
Ken Déguernel
article
Intelligence artificielle [cs.AI]. Université de Lorraine, 2018. Français. ⟨NNT : 2018LORR0011⟩
Accès au texte intégral et bibtex
https://tel.archives-ouvertes.fr/tel-01735308/file/DDOC_T_2018_0011_DEGUERNEL.pdf BibTex

Preprints, Working Papers, ...

titre
Can We Use Speaker Recognition Technology to Attack Itself? Enhancing Mimicry Attacks Using Automatic Target Speaker Selection
auteur
Tomi Kinnunen, Rosa González Hautamäki, Ville Vestman, Md Sahidullah
article
2018
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01937767/file/1811.03790%20%281%29.pdf BibTex

2017

Journal articles

titre
Education inclusive pour des élèves avec des troubles spécifiques du langage écrit : Quelle scolarisation en fonction des pays et des langues ?
auteur
Tamara Léonova, Agnès Piquard-Kipffer, Askar Jumageldinov, Marie Robert, Mikhaïl Berebin
article
ANAE - Approche Neuropsychologique des Apprentissages Chez L'enfant, ANAE/PLEIOMEDIA, 2017, n°147 - Troubles de l’apprentissage du langage écrit et prise en charge multidisciplinaire : De la science à la salle de classe, 29 (2)
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01647486/file/TL-APK-VFF-DYS-International.pdf BibTex
titre
Scolarité et handicap : parcours de 170 jeunes dysphasiques ou dyslexiques- dysorthographiques âgés de 6 à 20 ans
auteur
Agnès Piquard-Kipffer, Tamara Léonova
article
ANAE - Approche Neuropsychologique des Apprentissages Chez L'enfant, ANAE/PLEIOMEDIA, 2017
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01402986/file/Scolarite-sit-handicap-170jeunes-APK-VFF2017-1.pdf BibTex
titre
Inclusion scolaire : dispositif pédagogique pour enfants dyslexiques et dysphasiques au sein d'une école spécialisée
auteur
C. Leclerc, Agnès Piquard-Kipffer, C Rosin, M Wernet
article
ANAE - Approche Neuropsychologique des Apprentissages Chez L'enfant, ANAE/PLEIOMEDIA, 2017
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01635918/file/Inclusion-scolaire-CL-APK-2017.pdf BibTex
titre
Acoustic impact of the gradual glottal abduction on the production of fricatives: A numerical study
auteur
Benjamin Elie, Yves Laprie
article
Journal of the Acoustical Society of America, Acoustical Society of America, 2017, 142 (3), pp.1303-1317. ⟨10.1121/1.5000232⟩
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01423206/file/elie_fricatives_jasa17.pdf BibTex
titre
A combined evaluation of established and new approaches for speech recognition in varied reverberation conditions
auteur
Sunit Sivasankaran, Emmanuel Vincent, Irina Illina
article
Computer Speech and Language, Elsevier, 2017, 46, pp.444-460. ⟨10.1016/j.csl.2017.02.003⟩
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01461382/file/sivasankaran_CSL17.pdf BibTex
titre
Multi-microphone speech recognition in everyday environments
auteur
Jon Barker, Ricard Marxer, Emmanuel Vincent, Shinji Watanabe
article
Computer Speech and Language, Elsevier, 2017, 46, pp.386-387. ⟨10.1016/j.csl.2017.02.007⟩
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01483469/file/vincent_CSL17.pdf BibTex
titre
The third 'CHIME' speech separation and recognition challenge: Analysis and outcomes
auteur
Jon Barker, Ricard Marxer, Emmanuel Vincent, Shinji Watanabe
article
Computer Speech and Language, Elsevier, 2017, 46, pp.605-626. ⟨10.1016/j.csl.2016.10.005⟩
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01382108/file/barker_CSL16.pdf BibTex
titre
An analysis of environment, microphone and data simulation mismatches in robust speech recognition
auteur
Emmanuel Vincent, Shinji Watanabe, Aditya Arie Nugraha, Jon Barker, Ricard Marxer
article
Computer Speech and Language, Elsevier, 2017, 46, pp.535-557. ⟨10.1016/j.csl.2016.11.005⟩
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01399180/file/vincent_CSL16.pdf BibTex
titre
Feature Learning with Matrix Factorization Applied to Acoustic Scene Classification
auteur
Victor Bisot, Romain Serizel, Slim Essid, Gaël Richard
article
IEEE/ACM Transactions on Audio, Speech and Language Processing, Institute of Electrical and Electronics Engineers, 2017, 25 (6), pp.1216 - 1229. ⟨10.1109/TASLP.2017.2690570⟩
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01362864/file/bisot2017.pdf BibTex
titre
A consolidated perspective on multi-microphone speech enhancement and source separation
auteur
Sharon Gannot, Emmanuel Vincent, Shmulik Markovich-Golan, Alexey Ozerov
article
IEEE/ACM Transactions on Audio, Speech and Language Processing, Institute of Electrical and Electronics Engineers, 2017, 25 (4), pp.692-730. ⟨10.1109/TASLP.2016.2647702⟩
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01414179/file/gannot_TASLP17.pdf BibTex
titre
Modelling Semantic Context of OOV Words in Large Vocabulary Continuous Speech Recognition
auteur
Imran Sheikh, Dominique Fohr, Irina Illina, Georges Linares
article
IEEE/ACM Transactions on Audio, Speech and Language Processing, Institute of Electrical and Electronics Engineers, 2017, 25 (3), pp.598 - 610. ⟨10.1109/TASLP.2017.2651361⟩
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01461617/file/draft.pdf BibTex
titre
Estimating the structural segmentation of popular music pieces under regularity constraints
auteur
Gabriel Sargent, Frédéric Bimbot, Emmanuel Vincent
article
IEEE/ACM Transactions on Audio, Speech and Language Processing, Institute of Electrical and Electronics Engineers, 2017, ⟨10.1109/TASLP.2016.2635031⟩
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01403210/file/Sargent_et_al_TASLP.pdf BibTex
titre
Étude préliminaire de l’organisation temporelle de la fermeture labiale dans la parole fluente des locuteurs qui bégaient
auteur
Ivana Didirkova, Camille Fauth, Slim Ouni, Hirsch Fabrice
article
Glossa, UNADREO - Union NAtionale pour le Développement de la Recherche en Orthophonie, 2017, Spécial Montpellier, 121, pp.1-14
Accès au bibtex
BibTex
titre
Simulating alveolar trills using a two-mass model of the tongue tip
auteur
Benjamin Elie, Yves Laprie
article
Journal of the Acoustical Society of America, Acoustical Society of America, In press, 142 (5)
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01525882/file/elie_trills_jasa2017.pdf BibTex

Conference papers

titre
Consistent DNN Uncertainty Training and Decoding for Robust ASR
auteur
Karan Nathwani, Emmanuel Vincent, Irina Illina
article
2017 IEEE Automatic Speech Recognition and Understanding Workshop (ASRU), Dec 2017, Okinawa, Japan
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01585956/file/Camera_Ready_ASRU.pdf BibTex
titre
Topic segmentation in ASR transcripts using bidirectional rnns for change detection
auteur
Imran Sheikh, Dominique Fohr, Irina Illina
article
ASRU 2017 - IEEE Automatic Speech Recognition and Understanding Workshop, Dec 2017, Okinawa, Japan
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01599682/file/draft_20Sep2017.pdf BibTex
titre
Data Selection in the Framework of Automatic Speech Recognition
auteur
Ismael Bada, Juan Karsten, Dominique Fohr, Irina Illina
article
ICNLSSP 2017 - International conference on natural language, signal and speech processing 2017, Dec 2017, Casablanca, Morocco. pp.1-5
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01629340/file/ICNLSSP2017final.pdf BibTex
titre
About vocabulary adaptation for automatic speech recognition of video data
auteur
Denis Jouvet, David Langlois, Mohamed Amine Menacer, Dominique Fohr, Odile Mella, Kamel Smaïli
article
ICNLSSP'2017 - International Conference on Natural Language, Signal and Speech Processing, Dec 2017, Casablanca, Morocco. pp.1-5
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01649057/file/AboutTaskAdaptation-v1.2-upload.01November2017.pdf BibTex
titre
Is statistical machine translation approach dead?
auteur
Mohamed Amine Menacer, David Langlois, Odile Mella, Dominique Fohr, Denis Jouvet, Kamel Smaïli
article
ICNLSSP 2017 - International Conference on Natural Language, Signal and Speech Processing, ISGA, Dec 2017, Casablanca, Morocco. pp.1-5
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01660016/file/ICNLSSP2017_paper_21.pdf BibTex
titre
Statistical modelling of speech units in HMM-based speech synthesis for Arabic
auteur
Amal Houidhek, Vincent Colotte, Zied Mnasri, Denis Jouvet, Imene Zangar
article
LTC 2017 - 8th Language & Technology Conference, Nov 2017, Poznań, Poland. pp.1-5
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01649034/file/ltc-27-houidhek--final-version-27Oct2017.pdf BibTex
titre
Out-of-Vocabulary Word Probability Estimation using RNN Language Model
auteur
Irina Illina, Dominique Fohr
article
8th Language & Technology Conference, Nov 2017, Poznan, Poland
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01623784/file/LTC2017_17oct.pdf BibTex
titre
Nonnegative Feature Learning Methods for Acoustic Scene Classification
auteur
Victor Bisot, Romain Serizel, Slim Essid, Gaël Richard
article
DCASE 2017 - Workshop on Detection and Classification of Acoustic Scenes and Events, Nov 2017, Munich, Germany
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01636627/file/nonnegative-feature-learning.pdf BibTex
titre
DCASE 2017 Challenge setup: Tasks, datasets and baseline system
auteur
Annamaria Mesaros, Toni Heittola, Aleksandr Diment, Benjamin Elizalde, Ankit Shah, Emmanuel Vincent, Bhiksha Raj, Tuomas Virtanen
article
DCASE 2017 - Workshop on Detection and Classification of Acoustic Scenes and Events, Nov 2017, Munich, Germany
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01627981/file/mesaros_DCASE17.pdf BibTex
titre
Acoustic correlates of L2 prosodic boundaries by German learners of French
auteur
Anne Bonneau
article
SLaP3 2017 - 3rd Workshop on Second Language Prosody, Nov 2017, Bangor United Kingdom. pp.1
Accès au bibtex
BibTex
titre
Development of the Arabic Loria Automatic Speech Recognition system (ALASR) and its evaluation for Algerian dialect
auteur
Mohamed Menacer, Odile Mella, Dominique Fohr, Denis Jouvet, David Langlois, Kamel Smaïli
article
ACLing 2017 - 3rd International Conference on Arabic Computational Linguistics, Nov 2017, Dubai, United Arab Emirates. pp.1-8
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01583842/file/ACLing2017_22_MenacerMellaFohrJouvetLangloisSmaili%20%281%29.pdf BibTex
titre
Analysis and Automatic Classification of Some Discourse Particles on a Large Set of French Spoken Corpora
auteur
Denis Jouvet, Katarina Bartkova, Mathilde Dargnat, Lou Lee
article
SLSP'2017, 5th International Conference on Statistical Language and Speech Processing, Oct 2017, Le Mans, France
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01585567/file/DiscourseParticles-SLSP-v1.1-submitted-15June2017.pdf BibTex
titre
Articulatory Speech Synthesis from Static Context-Aware Articulatory Targets
auteur
Anastasiia Tsukanova, Benjamin Elie, Yves Laprie
article
ISSP 2017 - 11th International Seminar on Speech Production, Oct 2017, Tianjin, China
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01643487/file/ISSP2017Tsukanova.pdf BibTex
titre
Articulatory model of the epiglottis
auteur
Yves Laprie, Benjamin Elie, Pierre-André Vuissoz, Anastasiia Tsukanova
article
The 11th International Seminar on Speech Production, Oct 2017, Tianjin, China
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01643227/file/epiglottisISSP.pdf BibTex
titre
DYCI2 agents: merging the "free", "reactive", and "scenario-based" music generation paradigms
auteur
Jérôme Nika, Ken Déguernel, Axel Chemla--Romeu-Santos, Emmanuel Vincent, Gérard Assayag
article
International Computer Music Conference, Oct 2017, Shangai, China
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01583089/file/DYCI2_CreativeAgents_Nika_al.pdf BibTex
titre
Explaining the Parameterized Wiener Filter with Alpha-Stable Processes
auteur
Mathieu Fontaine, Antoine Liutkus, Laurent Girin, Roland Badeau
article
IEEE Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA), Oct 2017, New Paltz, New York, United States
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01548508/file/explaining-parameterized-wiener%284%29.pdf BibTex
titre
Lévy NMF for Robust Nonnegative Source Separation
auteur
Paul Magron, Roland Badeau, Antoine Liutkus
article
IEEE Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA 2017), IEEE, Oct 2017, New Paltz, NY, United States
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01548488/file/levy_waspaa17.pdf BibTex
titre
A diagonal plus low-rank covariance model for computationally efficient source separation
auteur
Antoine Liutkus, Kazuyoshi Yoshii
article
IEEE international workshop on machine learning for signal processing (MLSP), Sep 2017, Tokyo, Japan
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01580733/file/mlsp-2017-liutkus.pdf BibTex
titre
Leveraging deep neural networks with nonnegative representations for improved environmental sound classification
auteur
Victor Bisot, Romain Serizel, Slim Essid, Gaël Richard
article
IEEE International Workshop on Machine Learning for Signal Processing MLSP, Sep 2017, Tokyo, Japan
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01576857/file/leveraging-deep-neural.pdf BibTex
titre
When mismatched training data outperform matched data
auteur
Emmanuel Vincent
article
Systematic approaches to deep learning methods for audio, Sep 2017, Vienna, Austria
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01588876/file/vincent_ESI17.pdf BibTex
titre
Etre parent d'enfant atteint des troubles du spectre de l'autisme : Le stress parental à travers l'analyse interprétative phénoménologique.
auteur
Tamara Léonova, Delphine Sardin, Aline Gosse, Marie Robert, Agnès Piquard-Kipffer, Philippe Claudon, Stéphanie Claudel, Stéphanie Caharel
article
14ème congrès international de recherche sur le handicap, Sep 2017, Genève, Suisse
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01645101/file/Com%20orale_Congr%C3%A8s%20de%20Gen%C3%A8ve_2017.pdf BibTex
titre
Lévy NMF : un modèle robuste de séparation de sources non-négatives
auteur
Paul Magron, Roland Badeau, Antoine Liutkus
article
Colloque GRETSI, Sep 2017, Juan-Les-Pins, France
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01540484/file/levy-nmf.pdf BibTex
titre
L'anxiété et les symptômes dépressifs chez les parents d'enfants atteints de syndrome de Dravet
auteur
Tamara Léonova, Anne de Saint-Martin, Rima Nabbout, Stéphane Auvin, Marie Robert, Stéphanie Caharel, Nathalie Coqué, Agnès Piquard-Kipffer
article
SFP 2017 - 58 ème Congrès Accuel de la Société Francaise de Psychologie , Aug 2017, Nice, France. pp.1-2
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01645104/file/Com%20orale_Anxi%C3%A9t%C3%A9%20Dravet_Nice%202017.pdf BibTex
titre
Performance Analysis of Several Pitch Detection Algorithms on Simulated and Real Noisy Speech Data
auteur
Denis Jouvet, Yves Laprie
article
EUSIPCO'2017, 25th European Signal Processing Conference , Aug 2017, Kos, Greece
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01585554/file/D.Jouvet-ComparingF0AlgorithmsOnNoisyData-V2-Upload13June2017.pdf BibTex
titre
Scalable Source Localization with Multichannel Alpha-Stable Distributions
auteur
Mathieu Fontaine, Charles Vanwynsberghe, Antoine Liutkus, Roland Badeau
article
25th European Signal Processing Conference (EUSIPCO), Aug 2017, Kos, Greece. pp.11-15
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01531252/file/EUSIPCO.pdf BibTex
titre
On the quality of an expressive audiovisual corpus: a case study of acted speech
auteur
Slim Ouni, Sara Dahmani, Vincent Colotte
article
The 14th International Conference on Auditory-Visual Speech Processing, KTH, Aug 2017, Stockholm, Sweden
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01596614/file/AVSP2017_paper_22.pdf BibTex
titre
Glottal Opening and Strategies of Production of Fricatives
auteur
Benjamin Elie, Yves Laprie
article
Interspeech 2017, Aug 2017, Stockholm, Sweden. pp.206-209, ⟨10.21437/Interspeech.2017-1039⟩
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01574839/file/elie_interspeech17.pdf BibTex
titre
End-to-End Acoustic Feedback in Language Learning for Correcting Devoiced French Final-Fricatives
auteur
Sucheta Ghosh, Camille Fauth, Yves Laprie, Aghilas Sini
article
Interspeech 2017, Aug 2017, Stockholm, Sweden. pp.1-5, ⟨10.21437/Interspeech.2017-1031⟩
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01721562/file/IS171031.pdf BibTex
titre
Generating Equivalent Chord Progressions to Enrich Guided Improvisation : Application to Rhythm Changes
auteur
Ken Déguernel, Jérôme Nika, Emmanuel Vincent, Gérard Assayag
article
SMC 2017 - 14th Sound and Music Computing Conference, Jul 2017, Espoo, Finland. pp.8
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01528559/file/smc2017-Multi_Level_Progressions_%28finale%29.pdf BibTex
titre
Annotations de particules de discours en français sur une large variété de corpus
auteur
Katarina Bartkova, Mathilde Dargnat, Denis Jouvet, Lou Lee
article
ACor4French - Les corpus annotés du français, TALN'2017 - Traitement Automatique des Langues Naturelles, Jun 2017, Orléans, France
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01585540/file/ParticulesDeDiscours-v1.2-uploaded-02juin2017.pdf BibTex
titre
Gaussian framework for interference reduction in live recordings
auteur
Diego Di Carlo, Ken Déguernel, Antoine Liutkus
article
AES International Conference on Semantic Audio, Jun 2017, Erlangen, Germany
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01515971/file/gaussian-framework-interference.pdf BibTex
titre
Segmentation and Classification of Opinions with Recurrent Neural Networks
auteur
Imran Sheikh, Irina Illina, Dominique Fohr
article
IEEE Information Systems and Economic Intelligence, May 2017, Al Hoceima, Morocco
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01491182/file/draft_13Mar.pdf BibTex
titre
New Paradigm in Speech Recognition: Deep Neural Networks
auteur
Dominique Fohr, Odile Mella, Irina Illina
article
IEEE International Conference on Information Systems and Economic Intelligence, Apr 2017, Marrakech, Morocco
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01484447/file/SIIE.pdf BibTex
titre
An enhanced automatic speech recognition system for Arabic
auteur
Mohamed Menacer, Odile Mella, Dominique Fohr, Denis Jouvet, David Langlois, Kamel Smaïli
article
The third Arabic Natural Language Processing Workshop - EACL 2017, Apr 2017, Valencia, Spain
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01531588/file/ArticleEACL2017VF.pdf BibTex
titre
Supervised Group Nonnegative Matrix Factorisation With Similarity Constraints And Applications To Speaker Identification
auteur
Romain Serizel, Victor Bisot, Slim Essid, Gaël Richard
article
IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), Mar 2017, New Orleans, United States
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01484744/file/supervised-group-nonnegative.pdf BibTex
titre
Recursive Bayesian estimation of the acoustic noise emitted by wind farms
auteur
Baldwin Dumortier, Emmanuel Vincent, Madalina Deaconu
article
2017 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP)., Mar 2017, New Orleans, United States
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01428962/file/dumortier.pdf BibTex
titre
Discriminative importance weighting of augmented training data for acoustic model training
auteur
Sunit Sivasankaran, Emmanuel Vincent, Irina Illina
article
42th International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2017), Mar 2017, New Orleans, United States
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01415759/file/sivasankaran_ICASSP17.pdf BibTex
titre
Very Low Bitrate Spatial Audio Coding with Dimensionality Reduction
auteur
Christian Rohlfing, Jeremy Cohen, Antoine Liutkus
article
42nd International Conference on Acoustics, Speech and Signal Processing (ICASSP), Mar 2017, New Orleans, United States
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01515954/file/Rohlfing17Driss.pdf BibTex
titre
Alpha-Stable Multichannel Audio Source Separation
auteur
Simon Leglaive, Umut Simsekli, Antoine Liutkus, Roland Badeau, Gaël Richard
article
42nd International Conference on Acoustics, Speech and Signal Processing (ICASSP), IEEE, Mar 2017, New Orleans, United States
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01416366/file/alphaStableMASS-ICASSP17.pdf BibTex
titre
A multi-resolution approach to common fate-based audio separation
auteur
Fatemeh Pishdadian, Bryan Pardo, Antoine Liutkus
article
42nd International Conference on Acoustics, Speech and Signal Processing (ICASSP), Mar 2017, New Orleans, United States
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01515951/file/pishdadian.pdf BibTex
titre
Quantization-aware Parameter Estimation for Audio Upmixing
auteur
Christian Rohlfing, Antoine Liutkus, Julian Becker
article
42nd International Conference on Acoustics, Speech and Signal Processing (ICASSP), Mar 2017, New Orleans, United States
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01515955/file/RoLiBe17.pdf BibTex
titre
User Assisted Separation of Repeating Patterns in Time and Frequency using Magnitude Projections
auteur
Derry Fitzgerald, Zafar Rafii, Antoine Liutkus
article
42nd International Conference on Acoustics, Speech and Signal Processing (ICASSP), Mar 2017, New Orleans, United States
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01515956/file/icassp2017_DF.pdf BibTex
titre
Towards Confidence Measures on Fundamental Frequency Estimations
auteur
Boyuan Deng, Denis Jouvet, Yves Laprie, Ingmar Steiner, Aghilas Sini
article
IEEE International Conference on Acoustics, Speech and Signal Processing, Mar 2017, New Orleans, United States
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01493168/file/ConfidenceMeasuresOnPitch-v1.3-Uploaded-final-version-06.01.2017.bis--20170106101029_298162_1555.pdf BibTex
titre
An extended experimental investigation of DNN uncertainty propagation for noise robust ASR
auteur
Karan Nathwani, Juan Morales-Cordovilla, Sunit Sivasankaran, Irina Illina, Emmanuel Vincent
article
5th Joint Workshop on Hands-free Speech Communication and Microphone Arrays (HSCMA 2017), Mar 2017, San Francisco, United States
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01446441/file/nathwani_HSCMA17.pdf BibTex
titre
Long-term robot motion planning for active sound source localization with Monte Carlo tree search
auteur
Quan V. Nguyen, Francis Colas, Emmanuel Vincent, François Charpillet
article
HSCMA 2017 - Hands-free Speech Communication and Microphone Arrays , Mar 2017, San Francisco, United States
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01447787/file/HSCMA2017.pdf BibTex
titre
Sketching for nearfield acoustic imaging of heavy-tailed sources
auteur
Mathieu Fontaine, Charles Vanwynsberghe, Antoine Liutkus, Roland Badeau
article
13th International Conference on Latent Variable Analysis and Signal Separation (LVA/ICA 2017), Feb 2017, Grenoble, France. pp.80-88, ⟨10.1007/978-3-319-53547-0_8⟩
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01401988/file/LVA-ICA-Fontaine-2017.pdf BibTex
titre
The 2016 Signal Separation Evaluation Campaign
auteur
Antoine Liutkus, Fabian Robert-Stöter, Zafar Rafii, Daichi Kitamura, Bertrand Rivet, Nobutaka Ito, Nobutaka Ono, Julie Fontecave
article
13th International Conference on Latent Variable Analysis and Signal Separation (LVA/ICA 2017), Feb 2017, Grenoble, France. pp.323 - 332, ⟨10.1007/978-3-319-53547-0_31⟩
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01472932/file/SiSEC2016report.pdf BibTex

Book sections

titre
The CHiME challenges: Robust speech recognition in everyday environments
auteur
Jon Barker, Ricard Marxer, Emmanuel Vincent, Shinji Watanabe
article
New era for robust speech recognition - Exploiting deep learning, Springer, pp.327-344, 2017, ⟨http://www.springer.com/gp/book/9783319646794⟩
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01383263/file/barker_JSALT16.pdf BibTex
titre
Acoustic Features for Environmental Sound Analysis
auteur
Romain Serizel, Victor Bisot, Slim Essid, Gaël Richard
article
Tuomas Virtanen; Mark D. Plumbley; Dan Ellis. Computational Analysis of Sound Scenes and Events, Springer International Publishing AG, pp.71-101, 2017, 978-3-319-63449-4. ⟨10.1007/978-3-319-63450-0_4⟩
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01575619/file/chapter-4-acoustic.pdf BibTex
titre
Multiview approaches to event detection and scene analysis
auteur
Slim Essid, Sanjeel Parekh, Ngoc Duong, Romain Serizel, Alexey Ozerov, Fabio Antonacci, Augusto Sarti
article
Tuomas Virtanen; Mark D. Plumbley; Dan Ellis. Computational Analysis of Sound Scenes and Events, ⟨Springer⟩, pp.243-276, 2017, 978-3319634494. ⟨10.1007/978-3-319-63450-0_9⟩
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01620341/file/chapter9%20%281%29.pdf BibTex

Directions of work or proceedings

titre
Segmental, prosodic and fluency features in phonetic learner corpora Special issue of the International Journal of Learner Corpus Research 3:2
auteur
Jürgen Trouvain, Frank Zimmerer, Bernd Möbius, Maria Gosy, Anne Bonneau
article
Amsterdam, Netherlands. 3 (2), John Benjamins Publishing Company, pp.176, 2017, Segmental, prosodic and fluency features in phonetic learner corpora, ⟨10.1075/ijlcr.3.2⟩. ⟨http://www.jbe-platform.com⟩
Accès au bibtex
BibTex
titre
The proceedings of the 14th International Conference on Auditory-Visual Speech Processing
auteur
Slim Ouni, Chris Davis, Alexandra Jesse, Jonas Beskow
article
The 14th International Conference on Auditory-Visual Speech Processing (AVSP2017), Aug 2017, Stockholm, Sweden. 2017, ⟨http://avsp2017.loria.fr⟩
Accès au bibtex
BibTex

Master thesis

titre
Apprentissage par renforcement pour l'improvisation musicale automatique
auteur
Rémi Decelle
article
Intelligence artificielle [cs.AI]. 2017
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01591521/file/master_thesis.pdf BibTex

Other publications

titre
La musique comme une langue
auteur
Ken Déguernel, Nathan Libermann, Emmanuel Vincent
article
2017
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01485209/file/deguernel_CFEM17.pdf BibTex

Patents

titre
Procédé de suppression d'écho résiduel dans un signal acoustique
auteur
Guillaume Carbajal, Romain Serizel, Emmanuel Vincent, Eric Humbert
article
France, N° de brevet: 1760200. 2017
Accès au bibtex
BibTex

Theses

titre
Deep neural networks for source separation and noise-robust speech recognition
auteur
Aditya Arie Nugraha
article
Signal and Image Processing. Université de Lorraine, 2017. English. ⟨NNT : 2017LORR0212⟩
Accès au texte intégral et bibtex
https://tel.archives-ouvertes.fr/tel-01684685/file/DDOC_T_2017_0212_ADITYA_ARIE_NUGRAHA.pdf BibTex
titre
Mapping of a sound environment by a mobile robot
auteur
van Quan Nguyen
article
Robotics [cs.RO]. Université de Lorraine, 2017. English. ⟨NNT : 2017LORR0172⟩
Accès au texte intégral et bibtex
https://tel.archives-ouvertes.fr/tel-01661501/file/DDOC_T_2017_0172_NGUYEN.pdf BibTex

2016

Journal articles

titre
Extension of the single-matrix formulation of the vocal tract: consideration of bilateral channels and connection of self-oscillating models of the vocal folds with a glottal chink
auteur
Benjamin Elie, Yves Laprie
article
Speech Communication, Elsevier : North-Holland, 2016, 82, pp.85-96. ⟨10.1016/j.specom.2016.06.002⟩
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01199792/file/Elie2016SPECOM.pdf BibTex
titre
Variational Bayesian Inference for Source Separation and Robust Feature Extraction
auteur
Kamil Adiloğlu, Emmanuel Vincent
article
IEEE Transactions on Audio, Speech and Language Processing, Institute of Electrical and Electronics Engineers, 2016, ⟨10.1109/TASLP.2016.2583794⟩
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00726146/file/double.pdf BibTex
titre
Multichannel audio source separation with deep neural networks
auteur
Aditya Arie Nugraha, Antoine Liutkus, Emmanuel Vincent
article
IEEE/ACM Transactions on Audio, Speech and Language Processing, Institute of Electrical and Electronics Engineers, 2016, 24 (10), pp.1652-1664. ⟨10.1109/TASLP.2016.2580946⟩
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01163369/file/main.pdf BibTex
titre
System & Contrast : A Polymorphous Model of the Inner Organization of Structural Segments within Music Pieces
auteur
Frédéric Bimbot, Emmanuel Deruty, Gabriel Sargent, Emmanuel Vincent
article
Music Perception, University of California Press, 2016, 33 (5), pp.631-661. ⟨10.1525/mp.2016.33.5.631⟩
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01188244/file/Bimbot%20et%20al.%20-%20System%20%26%20Contrast%20%28preprint%29.pdf BibTex
titre
Is markerless acquisition of speech production accurate ?
auteur
Slim Ouni, Sara Dahmani
article
Journal of the Acoustical Society of America, Acoustical Society of America, 2016, EL234, 139 (6), ⟨10.1121/1.4954497⟩
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01315579/file/jasa-el_markerless.pdf BibTex
titre
Projection-based demixing of spatial audio
auteur
Derry Fitzgerald, Antoine Liutkus, Roland Badeau
article
IEEE Transactions on Audio, Speech and Language Processing, Institute of Electrical and Electronics Engineers, 2016, ⟨10.1109/TASLP.2016.2570945⟩
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01260588/file/projection-based_separation_V3C.pdf BibTex
titre
Fusion methods for speech enhancement and audio source separation
auteur
Xabier Jaureguiberry, Emmanuel Vincent, Gaël Richard
article
IEEE Transactions on Audio, Speech and Language Processing, Institute of Electrical and Electronics Engineers, 2016, ⟨10.1109/TASLP.2016.2553441⟩
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01120685/file/taslp16.pdf BibTex
titre
Faire voir une histoire : Louis et son incroyable chien Noisette
auteur
Agnès Piquard-Kipffer
article
Les Cahiers Pédagogiques, Service d'édition et de vente des publications de l'Education nationale, 2016, Dossier Lire et écrire avec la littérature numérique coordonné par Yaël Boublil et Jacques Crinon. Hors série numérique N°42, pp.7
Accès au bibtex
BibTex
titre
Démixer la musique
auteur
Antoine Liutkus, Emmanuel Vincent
article
Interstices, INRIA, 2016, ⟨https://interstices.info/jcms/p_84088/demixer-la-musique⟩
Accès au bibtex
BibTex
titre
Multimodal acquisition of articulatory data: Geometrical and temporal registration
auteur
Michaël Aron, Marie-Odile Berger, Erwan Kerrien, Brigitte Wrobel-Dautcourt, Blaise Potard, Yves Laprie
article
Journal of the Acoustical Society of America, Acoustical Society of America, 2016, 139 (2), pp.13. ⟨10.1121/1.4940666⟩
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01269578/file/acquisitionSystemJASADepotHAL.pdf BibTex
titre
Extraction d’un modèle articulatoire à partir d’une analyse tri-directionnelle de cinéradiographies d’un locuteur
auteur
Martine Cadot, Yves Laprie
article
Revue des Nouvelles Technologies de l'Information, Hermann, 2016, Fouille de Données Complexes (RNTI-E-31), pp.73-92
Accès au bibtex
BibTex

Conference papers

titre
A study of speech distortion conditions in real scenarios for speech processing applications
auteur
Dayana Ribas, Emmanuel Vincent, José Calvo
article
2016 IEEE Workshop on Spoken Language Technology, Dec 2016, San Diego, United States
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01377638/file/ribas_SLT16.pdf BibTex
titre
Dynamic adjustment of language models for automatic speech recognition using word similarity
auteur
Anna Currey, Irina Illina, Dominique Fohr
article
IEEE Workshop on Spoken Language Technology (SLT 2016), Dec 2016, San Diego, CA, United States
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01384365/file/slt-paper%20%286%29.pdf BibTex
titre
Weakly-supervised text-to-speech alignment confidence measure
auteur
Guillaume Serrière, Christophe Cerisara, Dominique Fohr, Odile Mella
article
International Conference on Computational Linguistics (COLING), Dec 2016, Osaka, Japan
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01378355/file/170_Paper.pdf BibTex
titre
Un album numérique pour raconter une histoire avec un avatar narrateur
auteur
Agnès Piquard-Kipffer
article
XVIèmes rencontres internationales en orthophonie - Orthophonie et technologies innovantes, Dec 2016, PARIS, France
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01403204/file/APK-unadreo2016.pdf BibTex
titre
Acoustic and Visual Analysis of Expressive Speech: A Case Study of French Acted Speech
auteur
Slim Ouni, Vincent Colotte, Sara Dahmani, Soumaya Azzi
article
Interspeech 2016, ISCA, Nov 2016, San Francisco, United States. pp.580 - 584, ⟨10.21437/Interspeech.2016-730⟩
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01398528/file/expressive16.pdf BibTex
titre
Localizing an intermittent and moving sound source using a mobile robot
auteur
Quan V. Nguyen, Francis Colas, Emmanuel Vincent, François Charpillet
article
International Conference on Intelligent Robots and Systems (IROS), Oct 2016, Deajeon, South Korea
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01354006/file/IROS16_0849_FI.pdf BibTex
titre
Machine listening techniques as a complement to video image analysis in forensics
auteur
Romain Serizel, Victor Bisot, Slim Essid, Gaël Richard
article
IEEE International Conference on Image Processing, Sep 2016, Phoenix, AZ, United States. pp.948-952, ⟨10.1109/ICIP.2016.7532497⟩
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01393959/file/16-4.pdf BibTex
titre
Mini-batch stochastic approaches for accelerated multiplicative updates in nonnegative matrix factorisation with beta-divergence
auteur
Romain Serizel, Slim Essid, Gael Richard
article
IEEE International Workshop on Machine Learning for Signal Processing (MLSP 2016), Sep 2016, Salerne, Italy
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01393964/file/16-3.pdf BibTex
titre
A French corpus for distant-microphone speech processing in real homes
auteur
Nancy Bertin, Ewen Camberlein, Emmanuel Vincent, Romain Lebarbenchon, Stéphane Peillon, Éric Lamandé, Sunit Sivasankaran, Frédéric Bimbot, Irina Illina, Ariane Tom, Sylvain Fleury, Eric Jamet
article
Interspeech 2016, Sep 2016, San Francisco, United States
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01343060/file/bertin_IS16.pdf BibTex
titre
Improved Neural Bag-of-Words Model to Retrieve Out-of-Vocabulary Words in Speech Recognition
auteur
Imran Sheikh, Irina Illina, Dominique Fohr, Georges Linares
article
INTERSPEECH 2016, Sep 2016, San Francisco, United States. ⟨10.21437/Interspeech.2016-1219⟩
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01384488/file/1219_Paper%20%281%29.pdf BibTex
titre
L1-L2 Interference: The case of final devoicing of French voiced fricatives in final position by German learners
auteur
Sucheta Ghosh, Camille Fauth, Aghilas Sini, Yves Laprie
article
Interspeech 2016, Sep 2016, San Francisco, United States. pp.3156 - 3160, ⟨10.21437/Interspeech.2016-954⟩
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01397176/file/is16_ifcasl.pdf BibTex
titre
Copy synthesis of running speech based on vocal tract imaging and audio recording
auteur
Benjamin Elie, Yves Laprie
article
22nd International Congress on Acoustics (ICA), Sep 2016, Buenos Aires, Argentina
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01372310/file/ICA2016-0699.pdf BibTex
titre
Robust tonal and noise separation in presence of colored noise, and application to voiced fricatives
auteur
Benjamin Elie, Gilles Chardon
article
22nd International Congress on Acoustics (ICA), Sep 2016, Buenos Aires, Argentina
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01372313/file/ICA2016-0722.pdf BibTex
titre
Experiments on the DCASE Challenge 2016: Acoustic scene classification and sound event detection in real life recording
auteur
Benjamin Elizalde, Anurag Kumar, Ankit Shah, Rohan Badlani, Emmanuel Vincent, Bhiksha Raj, Ian Lane
article
DCASE2016 Workshop on Detection and Classification of Acoustic Scenes and Events, Sep 2016, Budapest, Hungary
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01354007/file/elizalde_DCASE16.pdf BibTex
titre
Using Multidimensional Sequences For Improvisation In The OMax Paradigm
auteur
Ken Déguernel, Emmanuel Vincent, Gérard Assayag
article
13th Sound and Music Computing Conference, Aug 2016, Hamburg, Germany
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01346797/file/Using%20Multidimensional%20Sequences%20For%20Improvisation%20In%20The%20OMax%20Paradigm%20%28SMC2016%29.pdf BibTex
titre
Multichannel Music Separation with Deep Neural Networks
auteur
Aditya Arie Nugraha, Antoine Liutkus, Emmanuel Vincent
article
European Signal Processing Conference (EUSIPCO), Aug 2016, Budapest, Hungary. pp.1748-1752
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01334614/file/eusipco_w_ack.pdf BibTex
titre
Evaluation of Audio Source Separation Models Using Hypothesis-Driven Non-Parametric Statistical Methods
auteur
Andrew Simpson, Gerard Roma, Emad Grais, Russell Mason, Chris Hummersone, Antoine Liutkus, Mark Plumbley
article
European Signal Processing Conference, EURASIP, Aug 2016, Budapest, Hungary
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01410176/file/Separation_Stats.pdf BibTex
titre
High spatiotemporal cineMRI films using compressed sensing for acquiring articulatory data
auteur
Benjamin Elie, Yves Laprie, Pierre-André Vuissoz, Freddy Odille
article
EUSIPCO2016, Aug 2016, Budapest, Hungary
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01372320/file/Elie_etal_eusipco2016.pdf BibTex
titre
Copy synthesis of phrase-level utterances
auteur
Benjamin Elie, Yves Laprie
article
EUSIPCO2016, Aug 2016, Budapest, Hungary
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01278462/file/PaperCompressed.pdf BibTex
titre
Learning Word Importance with the Neural Bag-of-Words Model
auteur
Imran Sheikh, Irina Illina, Dominique Fohr, Georges Linares
article
ACL, Representation Learning for NLP (Repl4NLP) workshop, Aug 2016, Berlin, Germany
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01331720/file/repl4nlp_draft21Jun16.pdf BibTex
titre
Methods of investigating vowel interferences of French learners of German
auteur
Frank Zimmerer, Jürgen Trouvain, Anne Bonneau
article
New Sounds 2016, Jun 2016, Aarhus, Denmark
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01400005/file/NS_aarhus.pdf BibTex
titre
Prosodic Parameters and Prosodic Structures of French Emotional Data
auteur
Katarina Bartkova, Denis Jouvet, Elisabeth Delais-Roussarie
article
Speech Prosody 2016, May 2016, Boston, United States
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01293516/file/Emotion-V1.2a.pdf BibTex
titre
Influence of L1 prominence on L2 production: French and German speakers
auteur
Frank Zimmerer, Anne Bonneau, Bistra Andreeva
article
Speech Prosody 2016, May 2016, Boston, United States. pp.370 - 374, ⟨10.21437/SpeechProsody.2016-76⟩
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01399974/file/290.pdf BibTex
titre
How Diachronic Text Corpora Affect Context based Retrieval of OOV Proper Names for Audio News
auteur
Imran Sheikh, Irina Illina, Dominique Fohr
article
LREC 2016, May 2016, Portoroz, Slovenia
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01331714/file/draft_7Mar2016.pdf BibTex
titre
The IFCASL Corpus of French and German Non-native and Native Read Speech
auteur
Jürgen Trouvain, Anne Bonneau, Vincent Colotte, Camille Fauth, Dominique Fohr, Denis Jouvet, Jeanin Jügler, Yves Laprie, Odile Mella, Bernd Möbius, Frank Zimmerer
article
LREC'2016, 10th edition of the Language Resources and Evaluation Conference, May 2016, Portorož, Slovenia
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01293935/file/LREC_2016--251_Paper_2016.03.10.pdf BibTex
titre
Séparation de sources: quand l'acoustique rencontre le machine learning
auteur
Emmanuel Vincent
article
13e Congrès Français d'Acoustique, Apr 2016, Le Mans, France
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01398720/file/keynoteCFA16.pdf BibTex
titre
Acquisition temps-réel de données articulatoires par IRM : application à la synthèse par copie
auteur
Benjamin Elie, Yves Laprie, Pierre-André Vuissoz
article
13ème Congrès Français d'Acoustique (CFA 2016), SFA, Apr 2016, Le Mans, France
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01314313/file/000266.pdf BibTex
titre
A glottal chink model for the synthesis of voiced fricatives
auteur
Benjamin Elie, Yves Laprie
article
International Conference on Acoustics, Speech and Signal Processing (ICASSP), IEEE, Mar 2016, Shanghai, China
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01314308/file/ElieLaprie_ICASSP16.pdf BibTex
titre
Document Level Semantic Context for Retrieving OOV Proper Names
auteur
Imran Sheikh, Irina Illina, Dominique Fohr, Georges Linares
article
2016 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) , Mar 2016, Shanghai, China. pp.6050-6054, ⟨10.1109/ICASSP.2016.7472839⟩
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01331716/file/draft-16Jan16%20%281%29.pdf BibTex
titre
Du fichier audio à l’intonation en Français : Graphes pour l’apprentissage de 3 classes intonatives
auteur
Martine Cadot, Anne Bonneau
article
Fouille de données complexes (FDC@EGC2016), Jan 2016, Reims, France
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01292121/file/cadot_bonneau_FDCEGC2016.pdf BibTex
titre
PROJET - Spatial Audio Separation Using Projections
auteur
Derry Fitzgerald, Antoine Liutkus, Roland Badeau
article
41st International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2016, Shanghai, China
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01248014/file/Projet_ICASSP_SaS.pdf BibTex
titre
Common Fate Model for Unison source Separation
auteur
Fabian Robert-Stöter, Antoine Liutkus, Roland Badeau, Bernd Edler, Paul Magron
article
41st International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2016, Shanghai, China
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01248012/file/common_fate_icassp2016.pdf BibTex

Book sections

titre
Recoder les variables pour obtenir un modèle implicatif optimal
auteur
Martine Cadot
article
Régis Gras. L'Analyse Statisqtique Implicative, ⟨Cépaduès⟩, 2016
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01398229/file/Cadot_ASI_livre_2016_prepublication.pdf BibTex
titre
Temporal and Lexical Context of Diachronic Text Documents for Automatic Out-Of-Vocabulary Proper Name Retrieval
auteur
Irina Illina, Dominique Fohr, Georges Linares, Imane Nkairi
article
Zygmunt Vetulani; Hans Uszkoreit; Marek Kubis Human Language Technology. Challenges for Computer Science and Linguistics, 9561, Springer, pp.41-54, 2016, Lecture Notes in Computer Science, 978-3-319-43808-5. ⟨10.1007/978-3-319-43808-5_4⟩
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01475080/file/LNAI_2015_VocabularyIncreasing_v1808.pdf BibTex

Patents

titre
Dispositif de traitement d’image
auteur
Slim Ouni, Guillaume Gris
article
France, N° de brevet: 15 52058 2016
Accès au bibtex
BibTex

Poster communications

titre
Improvisation musicale multidimensionnelle dans le paradigme OMax
auteur
Ken Déguernel, Emmanuel Vincent, Gérard Assayag
article
Journées Jeunes Chercheurs en Acoustique, Audition et Signal, Nov 2016, Paris, France. 2016
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01437490/file/Poster_JJCAAS2016.pdf BibTex

Reports

titre
Supplementary material to the article: Estimating the structural segmentation of popular music pieces under regularity constraints
auteur
Gabriel Sargent, Frédéric Bimbot, Emmanuel Vincent
article
[Research Report] IRISA-INRIA, Campus de Beaulieu, 35042 Rennes cedex; INRIA Nancy, équipe Multispeech. 2016
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01368683/file/Sargent_et_al_TASLP_supplementary_material.pdf BibTex
titre
Generalized Wiener filtering for positive alpha-stable random variables
auteur
Paul Magron, Roland Badeau, Antoine Liutkus
article
[Research Report] 2016D000, Télécom ParisTech. 2016
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01340797/file/publication-301.pdf BibTex

Theses

titre
Exploiting Semantic and Topic Context to Improve Recognition of Proper Names in Diachronic Audio Documents
auteur
Imran Sheikh
article
Human-Computer Interaction [cs.HC]. Université de Lorraine, 2016. English. ⟨NNT : 2016LORR0260⟩
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/tel-01534608/file/thesis_SheikhImran.pdf BibTex

Preprints, Working Papers, ...

titre
Efficient optimisation of wind power under acoustic constraints
auteur
Baldwin Dumortier, Emmanuel Vincent, Madalina Deaconu, Patrice Cornu
article
2016
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01393125/file/bare_jrnl_short.pdf BibTex

2015

Journal articles

titre
Nonparametric uncertainty estimation and propagation for noise robust ASR
auteur
Dung T. Tran, Emmanuel Vincent, Denis Jouvet
article
IEEE/ACM Transactions on Audio, Speech and Language Processing, Institute of Electrical and Electronics Engineers, 2015, 23 (11), pp.1835-1846. ⟨10.1109/TASLP.2015.2450497⟩
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01114329/file/FinalVersion.pdf BibTex
titre
A preliminary study on improving the recognition of esophageal speech using a hybrid system based on statistical voice conversion
auteur
Othman Lachhab, Joseph Di Martino, El Hassane Ibn Elhaj, Ahmed Hammouch
article
SpringerPlus, SpringerOpen, 2015, ⟨10.1186/s40064-015-1428-2⟩
Accès au bibtex
BibTex
titre
Alpha-Stable Matrix Factorization
auteur
Umut Simsekli, Antoine Liutkus, Taylan Cemgil
article
IEEE Signal Processing Letters, Institute of Electrical and Electronics Engineers, 2015, pp.5
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01194354/file/simsekli_alpha_NMF_2015.pdf BibTex
titre
An architectural comparison of signal reconstruction algorithms from short-time Fourier transform magnitude spectra
auteur
Mouhcine Chami, Maryem Immassi, Joseph Di Martino
article
International Journal of Speech Technology, Springer Verlag, 2015, 18 (3), pp.9. ⟨10.1007/s10772-015-9281-9⟩
Accès au bibtex
BibTex
titre
Multi-channel audio source separation using multiple deformed references
auteur
Nathan Souviraà-Labastie, Anaik Olivero, Emmanuel Vincent, Frédéric Bimbot
article
IEEE Transactions on Audio, Speech and Language Processing, Institute of Electrical and Electronics Engineers, 2015, 23 (11), pp.1775-1787
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01070298/file/multi_ss_replicas_taslp_jrnl_halv3.pdf BibTex
titre
Blind suppression of nonstationary diffuse noise based on spatial covariance matrix decomposition
auteur
Nobutaka Ito, Emmanuel Vincent, Tomohiro Nakatani, Nobutaka Ono, Shoko Araki, Shigeki Sagayama
article
Journal of Signal Processing Systems, Springer, 2015, 79 (2), pp.145-157
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01020255/file/ito_JSPS14.pdf BibTex
titre
Reference-less measurement of the transmission matrix of a highly scattering material using a DMD and phase retrieval techniques
auteur
Angélique Drémeau, Antoine Liutkus, David Martina, Ori Katz, Christophe Schülke, Florent Krzakala, Sylvain Gigan, Laurent Daudet
article
Optics Express, Optical Society of America, 2015, 29 (9), pp.11898-11911. ⟨10.1364/OE.23.011898⟩
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01146782/file/oe-23-9-11898.pdf BibTex

Conference papers

titre
Different word representations and their combination for proper name retrieval from diachronic documents
auteur
Irina Illina, Dominique Fohr
article
IEEE Automatic Speech Recognition and Understanding Workshop (ASRU 2015) , Dec 2015, Scottsdale, United States
Accès au bibtex
BibTex
titre
The third `CHiME' Speech Separation and Recognition Challenge: Dataset, task and baselines
auteur
Jon Barker, Ricard Marxer, Emmanuel Vincent, Shinji Watanabe
article
2015 IEEE Automatic Speech Recognition and Understanding Workshop (ASRU 2015), Dec 2015, Scottsdale, AZ, United States
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01211376/file/barker_ASRU15.pdf BibTex
titre
Robust ASR using neural network based speech enhancement and feature simulation
auteur
Sunit Sivasankaran, Aditya Arie Nugraha, Emmanuel Vincent, Juan Andrés Morales Cordovilla, Siddharth Dalmia, Irina Illina, Antoine Liutkus
article
2015 IEEE Automatic Speech Recognition and Understanding Workshop (ASRU 2015), Dec 2015, Arizona, United States
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01204553/file/INRIA.pdf BibTex
titre
Terminal portable de communication et affichage de la reconnaissance vocale. Enjeux et rapports à l'écrit. Etude préliminaire auprès d'adultes déficients auditifs.
auteur
Agnès Piquard-Kipffer
article
3ème COLLOQUE INTERNATIONAL IDEKI 2015. Didactiques, Métiers de l'humain et Intelligence collective. Construction de savoirs et de dispositifs. , IDEKI, Dec 2015, COLMAR, France
Accès au bibtex
BibTex
titre
Terminal portable de communication et affichage de la reconnaissance vocale. Enjeux et rapports à l'écrit. Étude préliminaire auprès d'adultes déficients auditifs
auteur
Agnès Piquard-Kipffer, Odile Mella, Jérémy Miranda, Denis Jouvet, Luiza Orosanu
article
3ème colloque international Ideki, Dec 2015, Colmar, France. pp.1-15
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01239910/file/APK_teminal-port-de-communication_2017.pdf BibTex
titre
Neural Networks Revisited for Proper Name Retrieval from Diachronic Documents
auteur
Irina Illina, Dominique Fohr
article
LTC Language & Technology Conference, Nov 2015, Poznan, Poland. pp.120-124
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01240480/file/ltc-009-illina.pdf BibTex
titre
Acoustical Frame Rate and Pronunciation Variant Statistics
auteur
Denis Jouvet, Katarina Bartkova
article
International Conference on Statistical Language and Speech Processing, Nov 2015, Budapest, Hungary
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01184195/file/main.pdf BibTex
titre
Discourse Particles In French: Prosodic Parameters Extraction and Analysis
auteur
Mathilde Dargnat, Katarina Bartkova, Denis Jouvet
article
International Conference on Statistical Language and Speech Processing, Nov 2015, Budapest, Hungary
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01184197/file/main.pdf BibTex
titre
Combining lexical and prosodic features for automatic detection of sentence modality in French
auteur
Luiza Orosanu, Denis Jouvet
article
International Conference on Statistical Language and Speech Processing, Nov 2015, Budapest, Hungary
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01184196/file/articleSLSP2015-SentenceModality-aug2015.pdf BibTex
titre
Toward Realistic Expressive Audiovisual Speech Synthesis
auteur
Slim Ouni
article
Expressive Virtual ​​Actors​ workshop, Gipsa-Lab, Nov 2015, Grenoble, France
Accès au bibtex
BibTex
titre
Acoustic control of wind farms
auteur
Baldwin Dumortier, Emmanuel Vincent, Madalina Deaconu
article
Ewea 2015 - The European Wind Energy Association Conference, Nov 2015, Paris, France
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01233730/file/1457_ewea2015presentation%20%281%29.pdf BibTex
titre
Transforming quantitative variables into qualitative ones: rationale and method. Application to French intonation.
auteur
Martine Cadot, Anne Bonneau
article
ASI-8, Nov 2015, Radès, France
Accès au bibtex
BibTex
titre
The timing of geminate consonants in Tarifit Berber
auteur
Fayssal Bouarourou, Béatrice Vaxelaire, Yves Laprie, Rachid Ridouane, Rudolph Sock
article
1st International Conference on Natural Language and Speech Processing, Oct 2015, Algiers, Algeria
Accès au texte intégral et bibtex
https://halshs.archives-ouvertes.fr/halshs-01258309/file/ICNLSP_%202015.pdf BibTex
titre
Textual Data Selection for Language Modelling in the Scope of Automatic Speech Recognition
auteur
Freha Mezzoudj, David Langlois, Denis Jouvet, Abdelkader Benyettou
article
International Conference on Natural Language and Speech Processing, Oct 2015, Alger, Algeria
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01184192/file/ICNLSP15-V8-final-aug2015.pdf BibTex
titre
Detection of sentence modality on French automatic speech-to-text transcriptions
auteur
Luiza Orosanu, Denis Jouvet
article
International Conference on Natural Language and Speech Processing, Oct 2015, Alger, Algeria
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01184193/file/articleICNLSP2015-QD-final.pdf BibTex
titre
Adding new words into a language model using parameters of known words with similar behavior
auteur
Luiza Orosanu, Denis Jouvet
article
International Conference on Natural Language and Speech Processing, Oct 2015, Alger, Algeria
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01184194/file/articleICNLSP2015-NW-final.pdf BibTex
titre
Cauchy Nonnegative Matrix Factorization
auteur
Antoine Liutkus, Derry Fitzgerald, Roland Badeau
article
IEEE Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA), Oct 2015, New Paltz, NY, United States
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01170924/file/CauchyNMF-WASPAA2015.pdf BibTex
titre
Source Separation for Target Enhancement of Food Intake Acoustics from Noisy Recordings
auteur
Antoine Liutkus, Temiloluwa Olubanjo, Elliot Moore, Maysam Ghovanloo
article
IEEE Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA), Oct 2015, New Paltz, NY, United States
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01174886/file/FIM-WASPAA2015_Final.pdf BibTex
titre
Qualitative investigation of the display of speech recognition results for communication with deaf people
auteur
Agnès Piquard-Kipffer, Odile Mella, Jérémy Miranda, Denis Jouvet, Luiza Orosanu
article
6th Workshop on Speech and Language Processing for Assistive Technologies, SIG-SLPAT, Sep 2015, Dresden, Germany. pp.7
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01183349/file/slpat2015_loria_finale.pdf BibTex
titre
German non-native realizations of French voiced fricatives in final position of a group of words
auteur
Anne Bonneau, Martine Cadot
article
Interspeech 2015, Möller, S., Ney, H., Moebius, B., Nöth, E., Sep 2015, Dresde, Germany
Accès au bibtex
BibTex
titre
Uncertainty propagation through deep neural networks
auteur
Ahmed H. Abdelaziz, Shinji Watanabe, John R. Hershey, Emmanuel Vincent, Dorothea Kolossa
article
Interspeech 2015, Sep 2015, Dresden, Germany
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01162550/file/abdelaziz_IS15.pdf BibTex
titre
Continuous Word Representation using Neural Networks for Proper Name Retrieval from Diachronic Documents
auteur
Dominique Fohr, Irina Illina
article
Interspeech 2015, Sep 2015, Dresden, Germany
Accès au bibtex
BibTex
titre
Uncertainty propagation for noise robust speaker recognition: the case of NIST-SRE
auteur
Dayana Ribas, Emmanuel Vincent, José Ramon Calvo
article
Interspeech 2015, Sep 2015, Dresden, Germany. pp.5
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01158775/file/UPivector_2015.pdf BibTex
titre
Study of Entity-Topic Models for OOV Proper Name Retrieval
auteur
Imran Sheikh, Irina Illina, Dominique Fohr
article
Interspeech 2015, Sep 2015, Dresden, Germany
Accès au bibtex
BibTex
titre
Full multicondition training for robust i-vector based speaker recognition
auteur
Dayana Ribas, Emmanuel Vincent, José Ramon Calvo
article
Interspeech 2015, Sep 2015, Dresden, Germany
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01158774/file/multicondition_2015.pdf BibTex
titre
Accuracy of a markerless acquisition technique for studying speech articulators. In Interspeech 2015
auteur
Andrea Bandini, Slim Ouni, Piero Cosi, Silvia Orlandi, Claudia Manfredi
article
Interspeech 2015, Sep 2015, Dresden, Germany
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01189000/file/837_Paper-Bandini.pdf BibTex
titre
Analysis of phone confusion matrices in a manually annotated French-German learner corpus
auteur
Denis Jouvet, Anne Bonneau, Jürgen Trouvain, Frank Zimmerer, Yves Laprie, Bernd Möbius
article
Workshop on Speech and Language Technology in Education, Sep 2015, Leipzig, Germany
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01184186/file/SLATE-ConfusionMatrixAndProficiencyLevel-V1.8.pdf BibTex
titre
De l'importance de l'homogénéisation des conventions de transcription pour l'alignement automatique de corpus oraux de parole spontanée
auteur
Dominique Fohr, Odile Mella, Denis Jouvet
article
8es Journées Internationales de Linguistique de Corpus (JLC2015), Sep 2015, Orléans, France
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01183352/file/JLC2015_v4.pdf BibTex
titre
Inter-annotator agreement for a speech corpus pronounced by French and German language learners
auteur
Odile Mella, Dominique Fohr, Anne Bonneau
article
Workshop on Speech and Language Technology in Education, ISCA Special Interest Group (SIG) on Speech and Language Technology in Education, Sep 2015, Leipzig, Germany
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01185194/file/slate_agreement_v7.pdf BibTex
titre
Detection of Phone Boundaries for Non-Native Speech using French-German Models
auteur
Dominique Fohr, Odile Mella
article
Workshop on Speech and Language Technology in Education, Sep 2015, Leipzig, Germany
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01185195/file/SLaTE_modeles_v8.pdf BibTex
titre
Evaluation of PNCC and extended spectral subtraction methods for robust speech recognition
auteur
Thibaut Fux, Denis Jouvet
article
EUSIPCO 2015 - 23rd European Signal Processing Conference , Aug 2015, Nice, France
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01183645/file/Eusipco-FinalUpdate-June2015--1570104069.pdf BibTex
titre
The 2015 Signal Separation Evaluation Campaign
auteur
Nobutaka Ono, Zafar Rafii, Daichi Kitamura, Nobutaka Ito, Antoine Liutkus
article
International Conference on Latent Variable Analysis and Signal Separation (LVA/ICA), Aug 2015, Liberec, France. pp.387-395, ⟨10.1007/978-3-319-22482-4_45⟩
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01188725/file/LVA-ICA2015_055_original_v1.pdf BibTex
titre
Speech enhancement with LSTM recurrent neural networks and its application to noise-robust ASR
auteur
Felix Weninger, Hakan Erdogan, Shinji Watanabe, Emmanuel Vincent, Jonathan Le Roux, John R. Hershey, Björn Schuller
article
12th International Conference on Latent Variable Analysis and Signal Separation (LVA/ICA), Aug 2015, Liberec, Czech Republic
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01163493/file/weninger_LVA15.pdf BibTex
titre
Extraction of Temporal Patterns in Multi-rate and Multi-modal Datasets
auteur
Antoine Liutkus, Umut Şimşekli, Taylan Cemgil
article
International Conference on Latent Variable Analysis and Signal Separation (LVA/ICA), Aug 2015, Liberec, Czech Republic
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01170932/file/lva_convolutive_final.pdf BibTex
titre
One corpus, one research question, three methods “German vowels produced by French speakers”
auteur
Frank Zimmerer, Jürgen Trouvain, Anne Bonneau
article
Worshop on Phonetic learner corpora. Satellite meeting of ICPhS 2015., Trouvain, J., Zimmerer, F., Gosy, M., Bonneau, A., Aug 2015, Glasgow, United Kingdom
Accès au bibtex
BibTex
titre
Impact of frame rate on automatic speech-text alignment for corpus-based phonetic studies
auteur
Katarina Bartkova, Denis Jouvet
article
ICPhS'2015 - 18th International Congress of Phonetic Sciences, Aug 2015, Glasgow, United Kingdom
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01183637/file/FrameRateAndSpeechTextALignment-V1.2.pdf BibTex
titre
Realizations of French voiced fricatives by German learners as a function of speaker level and prosodic boundaries
auteur
Anne Bonneau
article
18th International Congress of Phonetic Sciences, ICPhS 2015, University of Glasgow, Aug 2015, Glasgow, United Kingdom. pp.5
Accès au bibtex
BibTex
titre
2D Articulatory Velum Modeling Applied to Copy Synthesis of Sentences Containing Nasal Phonemes
auteur
Yves Laprie, Benjamin Elie, Anastasiia Tsukanova
article
International Congress of Phonetic Sciences, Aug 2015, Glasgow, United Kingdom
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01188738/file/icphs2015YvesCorrect.pdf BibTex
titre
Experience of an International Intensive Project with First Year Programming Students
auteur
James Paterson, Markku Karhu, Walter Cazzola, Irina Illina, Dario Malchiodi, Marisa Maximiano, Catarina Silva
article
IEEE International Computers, Software & Applications Conference, COMPSAC2015, Jul 2015, Taichung, Taiwan. ⟨10.1109/COMPSAC.2015.49⟩
Accès au bibtex
BibTex
titre
Reconnaissance de la parole, application aux personnes sourdes et malentendantes
auteur
Agnès Piquard-Kipffer
article
Journées scientifiques d'Inria, Inria, Jun 2015, Villers-Les-nancy, France
Accès au bibtex
BibTex
titre
An articulatory model of the velum developed from cineradiographic data
auteur
Yves Laprie
article
169th Meeting: Acoustical Society of America, May 2015, Pittsburgh, United States
Accès au bibtex
BibTex
titre
Contribution of the acoustic cues to the non-native accent
auteur
Yves Laprie
article
169th meeting: Acoustical Society of America, May 2015, Pittsburgh, United States
Accès au bibtex
BibTex
titre
Audio source localization by optimal control of a mobile robot
auteur
Emmanuel Vincent, Aghilas Sini, François Charpillet
article
IEEE 2015 International Conference on Acoustics, Speech and Signal Processing (ICASSP), Apr 2015, Brisbane, Australia
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01103949/file/vincent_ICASSP15.pdf BibTex
titre
Music separation guided by cover tracks: designing the joint NMF model
auteur
Nathan Souviraà-Labastie, Emmanuel Vincent, Frédéric Bimbot
article
40th IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) 2015, Apr 2015, Brisbane, Australia
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01108675/file/cover_gss_icassp15.pdf BibTex
titre
Fast DNN training based on auxiliary function technique
auteur
Dung T. Tran, Nobutaka Ono, Emmanuel Vincent
article
ICASSP 2015 - 40th IEEE International Conference on Acoustics, Speech and Signal Processing, Apr 2015, Brisbane, Queensland, Australia
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01107809/file/Dung2015ICASSP_v6_final.pdf BibTex
titre
Discriminative uncertainty estimation for noise robust ASR
auteur
Dung Tien Tran, Emmanuel Vincent, Denis Jouvet
article
40th IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) 2015, Apr 2015, Brisbane, Queensland, Australia
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01103969/file/Icassp2015_bmmi.pdf BibTex
titre
Generalized Wiener filtering with fractional power spectrograms
auteur
Antoine Liutkus, Roland Badeau
article
40th International Conference on Acoustics, Speech and Signal Processing (ICASSP), Apr 2015, Brisbane, Australia
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01110028/file/ICASSP-harmonizable2.pdf BibTex
titre
MICbots: collecting large realistic datasets for speech and audio research using mobile robots
auteur
Jonathan Le Roux, Emmanuel Vincent, John R. Hershey, Daniel P.W. Ellis
article
IEEE 2015 International Conference on Acoustics, Speech and Signal Processing (ICASSP), Apr 2015, Brisbane, Australia
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01116822/file/leroux_ICASSP15.pdf BibTex
titre
A simple user interface system for recovering patterns repeating in time and frequency in mixtures of sounds
auteur
Zafar Rafii, Antoine Liutkus, Bryan Pardo
article
IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), Apr 2015, Brisbane, France
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01116689/file/Rafii-Liutkus-Pardo%20-%20A%20Simple%20User%20Interface%20System%20for%20Recovering%20Patterns%20Repeating%20in%20Time%20and%20Frequency%20in%20Mixtures%20of%20Sounds%20-%20ICASSP%202015.pdf BibTex
titre
Scalable audio separation with light kernel additive modelling
auteur
Antoine Liutkus, Derry Fitzgerald, Zafar Rafii
article
IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), IEEE, Apr 2015, Brisbane, Australia
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01114890/file/ICASSP-lightKAM.pdf BibTex
titre
Kernel additive modeling for interference reduction in multi-channel music recordings
auteur
Thomas Prätzlich, Rachel Bittner, Antoine Liutkus, Meinard Müller
article
IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), Apr 2015, Brisbane, Australia
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01116686/file/2015_PraetzlichBittnerLiutkusMueller_KAMIR_ICASSP.pdf BibTex
titre
Recognition of OOV Proper Names in Diachronic Audio News
auteur
Imran Sheikh, Irina Illina, Dominique Fohr
article
IEEE International Conference on Information Systems and Economic Intelligence, 2015, Hammamet, Tunisia
Accès au bibtex
BibTex
titre
Neural Networks for Proper Name Retrieval in the Framework of Automatic Speech Recognition
auteur
Dominique Fohr, Irina Illina
article
IEEE International Conference on Information Systems and Economic Intelligence, 2015, hammamet, Tunisia
Accès au bibtex
BibTex
titre
OOV Proper Name Retrieval using Topic and Lexical Context Model
auteur
Imran Sheikh, Irina Illina, Dominique Fohr, Georges Linarès
article
IEEE International Conference on Acoustics, Speech and Signal Processing, 2015, Brisbane, Australia
Accès au bibtex
BibTex

Directions of work or proceedings

titre
LNCS 9237 - Proceedings of the 12th International Conference on Latent Variable Analysis and Signal Separation
auteur
Emmanuel Vincent, Arie Yeredor, Zbynek Koldovsky, Petr Tichavsky
article
12th International Conference, LVA/ICA 2015, Aug 2015, Liberec, Czech Republic. Springer, 2015, 978-3-319-22481-7. ⟨http://www.springer.com/us/book/9783319224817⟩
Accès au bibtex
BibTex

Master thesis

titre
Apprentissage de structures multi-dimensionnelles pour l'improvisation musicale
auteur
Ken Deguernel
article
Informatique et langage [cs.CL]. 2015
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01267408/file/DEGUERNEL_Ken_Rapport.pdf BibTex

Other publications

titre
La dyslexie du point de vue des chercheurs et des praticiens
auteur
Agnès Piquard-Kipffer
article
2015
Accès au bibtex
BibTex
titre
Is audio signal processing still useful in the era of machine learning?
auteur
Emmanuel Vincent
article
2015
Accès au bibtex
BibTex
titre
Advanced spatial speech and audio processing
auteur
Emmanuel Vincent, Emanuël Habets
article
2015
Accès au bibtex
BibTex
titre
Les troubles Dys : la dyslexie-dysorthographie
auteur
Agnès Piquard-Kipffer
article
2015
Accès au bibtex
BibTex

Poster communications

titre
Improvements for a German Vowel Trainer CAPT Tool
auteur
Patrick Carroll, Jürgen Trouvain, Frank Zimmerer, Yves Laprie, Odile Mella, Dominique Fohr
article
Individualized Feedback for Computer-Assisted Spoken Language Learning, Nov 2015, Tholey, Germany. 2015
Accès au bibtex
BibTex
titre
Dynamic realistic lip animation using a limited number of control points
auteur
Slim Ouni, Guillaume Gris
article
ACM. SIGGRAPH 2015, Aug 2015, Los Angeles, California, United States. ACM, Proceeding SIGGRAPH '15 ACM SIGGRAPH 2015 Posters, pp.1, 2015, Proceeding SIGGRAPH '15 ACM SIGGRAPH 2015 Posters. ⟨http://s2015.siggraph.org⟩. ⟨10.1145/2787626.2787628⟩
Accès au bibtex
BibTex
titre
Sound synchronization and motion compensated reconstruction for speech Cine MRI
auteur
Pierre-André Vuissoz, Freddy Odille, Yves Laprie, Emmanuel Vincent, Jacques Felblinger
article
ISMRM 2015 Annual Meeting, May 2015, Toronto, Canada
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01183504/file/vuissoz_ISMRM15.pdf BibTex
titre
Synchronisation vocale et mouvement compensé en reconstruction pour une ciné IRM de la parole
auteur
Pierre-André Vuissoz, Freddy Odille, Emmanuel Vincent, Jacques Felblinger, Yves Laprie
article
2e Congrès de la SFRMBM (Société Française de Résonance Magnétique en Biologie et Médecine), Mar 2015, Grenoble, France
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01104230/file/vuissoz_SFRMBM15.pdf BibTex

Reports

titre
JCorpusRecorder
auteur
Vincent Colotte, Emilien Casano
article
[Technical Report] Université de Lorraine. 2015
Accès au bibtex
BibTex
titre
Combining blockwise and multi-coefficient stepwise approches in a general framework for online audio source separation
auteur
Laurent S. R. Simon, Emmanuel Vincent
article
[Research Report] RR-8766, Inria. 2015, pp.18
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01186948/file/RR-8766.pdf BibTex
titre
Listening to features
auteur
Manuel Moussallam, Antoine Liutkus, Laurent Daudet
article
[Research Report] Institut Langevin, ESPCI - CNRS - Paris Diderot University - UPMC. 2015, pp.24
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01118307/file/LDM_listening_to_features.pdf BibTex
titre
Scale-Space Peak Picking
auteur
Antoine Liutkus
article
[Research Report] Inria Nancy - Grand Est (Villers-lès-Nancy, France). 2015
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-01103123/file/SSPP.pdf BibTex

Theses

titre
Reconnaissance de la parole pour l’aide à la communication pour les sourds et malentendants
auteur
Luiza Orosanu
article
Traitement du signal et de l'image [eess.SP]. Université de Lorraine, 2015. Français. ⟨NNT : 2015LORR0172⟩
Accès au texte intégral et bibtex
https://hal.inria.fr/tel-01251128/file/memoireRapsodie.pdf BibTex
titre
Détection de motifs audio pour la séparation de sources guidée. Application aux bandes- son de films.
auteur
Nathan Souviraà-Labastie
article
Son [cs.SD]. Université de Rennes 1, 2015. Français
Accès au texte intégral et bibtex
https://hal.inria.fr/tel-01245318/file/these_souviraa_hal.pdf BibTex
titre
Uncertainty learning for noise robust ASR
auteur
Dung Tien Tran
article
Sound [cs.SD]. Université de Lorraine, 2015. English. ⟨NNT : 2015LORR0236⟩
Accès au texte intégral et bibtex
https://hal.inria.fr/tel-01754497/file/phdthesis_tempcut.pdf BibTex

2014

Journal articles

titre
Quand les sons se séparent
auteur
Emmanuel Vincent, Joanna Jongwane
article
Interstices, INRIA, 2014, ⟨https://interstices.info/jcms/nn_73045/quand-les-sons-se-separent⟩
Accès au bibtex
BibTex
titre
Modal Overlap Factor of a beam with an acoustic black hole termination
auteur
Vivien Denis, Adrien Pelat, François Gautier, Benjamin Elie
article
Journal of Sound and Vibration, Elsevier, 2014, 333 (12), pp.2475-2488. ⟨10.1016/j.jsv.2014.02.005⟩
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-01288274/file/Denis14_preprint.pdf BibTex

Conference papers

titre
Pronunciation variation in read and conversational austrian german
auteur
Barbara Schuppler, Martine Adda-Decker, Juan Andrés Morales Cordovilla
article
15th Annual Conference of the Inter- national Speech Communication Association (INTERSPEECH 2014) , Sep 2014, Singapour, Singapore. pp.1453-1457
Accès au bibtex
BibTex
titre
Fusion of Multiple Uncertainty Estimators and Propagators for Noise Robust ASR
auteur
Dung Tien Tran, Denis Jouvet, Emmanuel Vincent
article
2014 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), May 2014, Florence, Italy
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00955185/file/Icassp2014_fusion.pdf BibTex
titre
Extension of uncertainty propagation to dynamic MFCCs for noise robust ASR
auteur
Dung Tien Tran, Emmanuel Vincent, Denis Jouvet
article
2014 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), May 2014, Florence, Italy
Accès au texte intégral et bibtex
https://hal.inria.fr/hal-00954654/file/Icassp2014_extension.pdf BibTex

Other publications

titre
Poursuivre une scolarité avec une langue déficiente
auteur
Agnès Piquard-Kipffer
article
2014
Accès au bibtex
BibTex

2013

Conference papers

titre
What we can learn from asr errors about low-resourced languages: a case-study of luxembourgish and austrian
auteur
Martine Adda-Decker, Barbara Schuppler, Lori Lamel, Juan Andrés Morales Cordovilla, Gilles Adda
article
Errors by Humans and Machines in Multimedia, Multimodal, Multilingual Data Processing (ERRARE 2013), Nov 2013, Ermenonville, France
Accès au bibtex
BibTex
titre
Statistics Based Features for Unvoiced Sound Classification
auteur
Sunit Sivasankaran, Kmm Prabhu
article
MLSP 2013 - IEEE International Workshop on Machine Learning for Signal Processing, Sep 2013, Southampton, United Kingdom. ⟨10.1109/MLSP.2013.6661986⟩
Accès au bibtex
BibTex

2012

Conference papers

titre
Je peux voir les mots que tu dis ! Histoire d'un projet
auteur
Agnès Piquard-Kipffer, Christian Blonz
article
13ème édition du Festival du film de chercheur CNRS 2012, Jun 2012, Nancy, France
Accès au bibtex
BibTex
titre
Speech clarity and coarticulatory effects in standard and dialectal Arabic
auteur
Mohamed Embarki, Slim Ouni, Fathi Salam
article
Journées d’Études sur la Parole, Association Francophone pour la Communication Parlée, Jun 2012, Grenoble, France
Accès au texte intégral et bibtex
https://hal.archives-ouvertes.fr/hal-00762581/file/EMBARKI-OUNI-SALAM-V2.pdf BibTex

Directions of work or proceedings

titre
Special Issue on Latent Variable Analysis and Signal Separation
auteur
Vincent Vigneron, Vicente Zarzoso, Rémi Gribonval, Emmanuel Vincent
article
France. 92, 2012, Signal Processing
Accès au bibtex
BibTex

Other publications

titre
Développement et apprentissages : enjeux, démarches, perspectives
auteur
Agnès Piquard-Kipffer
article
2012
Accès au bibtex
BibTex
titre
Je peux voir les mots que tu dis !
auteur
Agnès Piquard-Kipffer, Blonz Christian
article
2012, pp.4
Accès au bibtex
BibTex

2011

Conference papers

titre
Predicting Tongue Positions from Acoustics and Facial Features
auteur
Asterios Toutios, Slim Ouni
article
12th Annual Conference of the International Speech Communication Association - Interspeech 2011, Aug 2011, Florence, Italy
Accès au texte intégral et bibtex
https://hal.inria.fr/inria-00602412/file/paper.pdf BibTex

Reports

titre
Parcours des enfants présentant des Troubles Spécifiques du Langage (TSL) en situation de handicap. Région Lorraine Enfance de 4 à 20 ans
auteur
Tamara Léonova, Piquard-Kipffer Agnès
article
[Rapport de recherche] ARS. 2011, pp.111
Accès au bibtex
BibTex