- Présentation
- Publications HAL
- Rapports d'activité
Equipe de recherche SEQUEL
Publications de l'équipe SEQUEL
2012
Articles dans des revues avec comité de lecture
- Titre
- Semi-Supervised Apprenticeship Learning
- Auteurs
- Michal Valko; Mohammad Ghavamzadeh; Alessandro Lazaric
- Détail
- Journal of Machine Learning Research: Workshop and Conference Proceedings, Sparc, 2012, The 10th European Workshop on Reinforcement Learning, 24
- Accès au texte intégral et bibtex
-
- Titre
- Sequential approaches for learning datum-wise sparse representations
- Auteurs
- Gabriel Dulac-Arnold; Ludovic Denoyer; Philippe Preux; Patrick Gallinari
- Détail
- Machine Learning, Springer, 2012, 89 (1-2), pp. 87-122
- Accès au texte intégral et bibtex
-
- Titre
- Outlier detection for patient monitoring and alerting.
- Auteurs
- Milos Hauskrecht; Iyad Batal; Michal Valko; Shyam Visweswaran; Gregory F Cooper; Gilles Clermont
- Détail
- Journal of Biomedical Informatics, Elsevier, 2012, epub ahead of print
- Accès au bibtex
-
- Titre
- Dislocation detection in field environments: A belief functions contribution
- Auteurs
- S.N. Razavi; Emmanuel Duflos
; Carl Haas; Philippe Vanheeghe - Détail
- Expert Systems with Applications, 2012, 39 (10), pp. 8505-8513
- Accès au bibtex
-
- Titre
- Dirichlet Process Mixtures for Density Estimation in Dynamic Nonlinear Modeling: Application to GPS Positioning in Urban Canyons
- Auteurs
- Asma Rabaoui
; Nicolas Viandier; Juliette Marais; Emmanuel Duflos
; Philippe Vanheeghe - Détail
- IEEE Transactions on Signal Processing, 2012, 60 (4), pp. 1638 - 1655
- Accès au texte intégral et bibtex
-
- Titre
- Testing composite hypotheses about discrete ergodic processes
- Auteurs
- Daniil Ryabko
- Détail
- test, Springer, 2012, 21 (2), pp. 317-329
- Accès au bibtex
-
- Titre
- Managing advertising campaigns -- an approximate planning approach
- Auteurs
- Sertan Girgin; Jérémie Mary; Philippe Preux; Olivier Nicol
- Détail
- Frontiers of Computer Science, Springer, 2012, 6 (2), pp. 209-229
- Accès au texte intégral et bibtex
-
- Titre
- ICML Exploration & Exploitation challenge: Keep it simple!
- Auteurs
- Olivier Nicol; Jérémie Mary; Philippe Preux
- Détail
- Journal of Machine Learning research Workshop and Conference Proceedings, sans, 2012, 26, pp. 62-85
- Accès au texte intégral et bibtex
-
- Titre
- Stumping along a Summary for Exploration & Exploitation Challenge 2011
- Auteurs
- Christophe Salperwyck
; Tanguy Urvoy - Détail
- JMLR Workshop and Conference Proceedings, Dorota Glowacka, Louis Dorard and John Shawe-Taylor, 2012, Workshop on On-line Trading of Exploration and Exploitation 2011, 26, pp. 86-97
- Accès au texte intégral et bibtex
-
Communications avec actes
- Titre
- Learning from a Single Labeled Face and a Stream of Unlabeled Data
- Auteurs
- Branislav Kveton; Michal Valko
- Détail
- 10th IEEE International Conference on Automatic Face and Gesture Recognition, Apr 2013, Shanghai, China. 2012
- Accès au bibtex
-
- Titre
- Towards dictionary learning from images with non Gaussian noise
- Auteurs
- Pierre Chainais

- Détail
- IEEE Int. Workshop on Machine Learning for Signal Processing, Sep 2012, Santander, Spain. pp. 0000
- Accès au texte intégral et bibtex
-
- Titre
- A Dantzig Selector Approach to Temporal Difference Learning
- Auteurs
- Matthieu Geist; Bruno Scherrer; Alessandro Lazaric; Mohammad Ghavamzadeh
- Détail
- John Langford and Joelle Pineau. ICML-12, Jun 2012, Edinburgh, United Kingdom. Omnipress, pp. 1399-1406
- Accès au bibtex
-
- Titre
- Approximate Modified Policy Iteration
- Auteurs
- Bruno Scherrer
; Mohammad Ghavamzadeh; Victor Gabillon; Matthieu Geist - Détail
- ICML 2012, Jun 2012, Edinburgh, United Kingdom.
- Accès au texte intégral et bibtex
-
- Titre
- DPM pour l'inférence dans les modèles dynamiques non linéaires avec des bruits de mesure alpha-stable
- Auteurs
- Nouha Jaoua; Emmanuel Duflos
; Philippe Vanheeghe - Détail
- 44ème Journées de Statistique, May 2012, Bruxelles, Belgium. pp. 1-4
- Accès au bibtex
-
- Titre
- Optimistic Planning for Markov Decision Processes
- Auteurs
- Lucian Busoniu
; Remi Munos - Détail
- 15th International Conference on Artificial Intelligence and Statistics, AISTATS-12, Apr 2012, La Palma, Canary Islands, Spain. 22, pp. 182-189, Journal of Machine Learning Research: Workshop and Conference Proceedings
- Accès au texte intégral et bibtex
-
- Titre
- Reducing statistical time-series problems to binary classification
- Auteurs
- Daniil Ryabko; Jérémie Mary
- Détail
- NIPS, Dec 2012, Lake Tahoe, United States.
- Accès au texte intégral et bibtex
-
- Titre
- Approximations de l'Algorithme Itérations sur les Politiques Modifié
- Auteurs
- Bruno Scherrer; Victor Gabillon; Mohammad Ghavamzadeh; Matthieu Geist
- Détail
- Olivier Buffet. Journées Francophones sur la planification, la décision et l'apprentissage pour le contrôle des systèmes - JFPDA 2012, May 2012, Villers-lès-Nancy, France. 1 p
- Accès au bibtex
-
- Titre
- Un sélecteur de Dantzig pour l'apprentissage par différences temporelles
- Auteurs
- Matthieu Geist; Bruno Scherrer; Alessandro Lazaric; Mohammad Ghavamzadeh
- Détail
- Olivier Buffet. Journées Francophones sur la planification, la décision et l'apprentissage pour le contrôle des systèmes - JFPDA 2012, May 2012, Villers-lès-Nancy, France. 13 p
- Accès au texte intégral et bibtex
-
- Titre
- Apprentissage par renforcement rapide pour des grands ensembles d'actions en utilisant des codes correcteurs d'erreur
- Auteurs
- Gabriel Dulac-Arnold; Ludovic Denoyer; Philippe Preux; Patrick Gallinari
- Détail
- Olivier Buffet. Journées Francophones sur la planification, la décision et l'apprentissage pour le contrôle des systèmes - JFPDA 2012, May 2012, Villers-lès-Nancy, France. 12 p
- Accès au texte intégral et bibtex
-
- Titre
- Fast Reinforcement Learning with Large Action Sets Using Error-Correcting Output Codes for MDP Factorization
- Auteurs
- Gabriel Dulac-Arnold; Ludovic Denoyer; Philippe Preux; Patrick Gallinari
- Détail
- European Conference on Machine Learning, 2012, Bristol, United Kingdom. Springer, Machine Learning and Knowledge Discovery in Databases, 2, pp. 180-194
- Accès au texte intégral et bibtex
-
- Titre
- CLOP: Confident Local Optimization for Noisy Black-Box Parameter Tuning
- Auteurs
- Rémi Coulom

- Détail
- van den Herik, H. Jaap and Plaat, Aske. Advances in Computer Games - 13th International Conference, Nov 2011, Tilburg, Netherlands. Springer, Advances in Computer Games, 7168, pp. 146-157, 2012, Lecture Notes in Computer Science
- Accès au bibtex
-
Communications sans actes
- Titre
- Incremental Decision Tree based on order statistics
- Auteurs
- Christophe Salperwyck
; Vincent Lemaire - Détail
- Workshop on Active and Incremental Learning, 2012, Montpellier, France.
- Accès au texte intégral et bibtex
-
Chapitres d'ouvrages scientifiques
- Titre
- A Review of Optimistic Planning in Markov Decision Processes
- Auteurs
- Lucian Busoniu
; Remi Munos; Robert Babuska 
- Détail
- Frank Lewis and Derong Liu. Reinforcement Learning and Adaptive Dynamic Programming for Feedback Control, Wiley, To appear, corrected proof, Nov. 2012
- Accès au bibtex
-
Rapports
- Titre
- Best Arm Identification: A Unified Approach to Fixed Budget and Fixed Confidence
- Auteurs
- Victor Gabillon; Mohammad Ghavamzadeh; Alessandro Lazaric
- Détail
- [Research Report], 2012
- Accès au texte intégral et bibtex
-
- Titre
- Approximate Modified Policy Iteration
- Auteurs
- Bruno Scherrer
; Victor Gabillon; Mohammad Ghavamzadeh; Matthieu Geist - Détail
- [Research Report], 2012
- Accès au texte intégral et bibtex
-
- Titre
- A Generalized Kernel Approach to Structured Output Learning
- Auteurs
- Hachem Kadri
; Mohammad Ghavamzadeh; Philippe Preux - Détail
- [Research Report], 2012. RR-7956
- Accès au texte intégral et bibtex
-
- Titre
- Multiple Operator-valued Kernel Learning
- Auteurs
- Hachem Kadri
; Alain Rakotomamonjy; Francis Bach; Philippe Preux - Détail
- [Research Report], 2012. RR-7900
- Accès au texte intégral et bibtex
-
- Titre
- A Truthful Learning Mechanism for Contextual Multi-Slot Sponsored Search Auctions with Externalities
- Auteurs
- Alessandro Lazaric; Nicola Gatti; Trov\'{o} Francesco
- Détail
- [Research Report], 2012
- Accès au bibtex
-
- Titre
- Bandit Theory meets Compressed Sensing for high dimensional Stochastic Linear Bandit
- Auteurs
- Alexandra Carpentier
; Rémi Munos - Détail
- [Technical Report], 2012
- Accès au texte intégral et bibtex
-
- Titre
- The optimistic principle applied to games, optimization and planning: Towards Foundations of Monte-Carlo Tree Search
- Auteurs
- Rémi Munos

- Détail
- [Report], 2012
- Accès au texte intégral et bibtex
-
Documents sans référence de publication
- Titre
- Kullback-Leibler Upper Confidence Bounds for Optimal Sequential Allocation
- Auteurs
- Olivier Cappé; Aurélien Garivier; Odalric-Ambrym Maillard; Rémi Munos; Gilles Stoltz
- Détail
- Oct. 2012
- Accès au texte intégral et bibtex
-
- Titre
- Minimax Number of Strata for Online Stratified Sampling given Noisy Samples
- Auteurs
- Alexandra Carpentier
; Rémi Munos - Détail
- May. 2012
- Accès au texte intégral et bibtex
-
2011
Articles dans des revues avec comité de lecture
- Titre
- X-Armed Bandits
- Auteurs
- Sébastien Bubeck; Rémi Munos; Gilles Stoltz; Csaba Szepesvari
- Détail
- Journal of Machine Learning Research, 2011, 12, pp. 1655-1695
- Accès au texte intégral et bibtex
-
- Titre
- Pure exploration in finitely-armed and continuous-armed bandits
- Auteurs
- Gilles Stoltz; Sébastien Bubeck; Rémi Munos
- Détail
- Theoretical Computer Science, 2011, Vol.412, issue 19, p.1832-1852
- Accès au bibtex
-
- Titre
- On the relation between realizable and non-realizable cases of the sequence prediction problem
- Auteurs
- Daniil Ryabko
- Détail
- Journal of Machine Learning Research, Microtome Publishing, 2011, 12, pp. 2161-2180
- Accès au bibtex
-
- Titre
- Constructing perfect steganographic systems
- Auteurs
- Boris Ryabko; Daniil Ryabko
- Détail
- Information and Computation, Elsevier, 2011, 209 (9), pp. 1223-1230
- Accès au bibtex
-
- Titre
- Identification of microbial and proteomic biomarkers in early childhood caries
- Auteurs
- Thomas Hart; Patricia Corby; Milos Hauskrecht; Ok Hee Ryu; Richard Pelikan; Michal Valko; Maria Oliveira; Gerald Hoehn; Walter Bretz
- Détail
- International Journal of Dentistry, Hindawi Publishing Corporation, 2011, 2011, pp. 196721
- Accès au texte intégral et bibtex
-
- Titre
- Aligned carbon nanotube based ultrasonic microtransducers for durability monitoring in civil engineering
- Auteurs
- Bérengère Lebental; Pierre Chainais
; Pascale Chenevier; Nicolas Chevalier; Eric Delevoye; Jean-Marc Fabbri; Sergio Nicoletti; Philippe Renaux; Anne Ghis - Détail
- Nanotechnology, 2011, 22 (39), pp. 395501
- Accès au texte intégral et bibtex
-
Communications avec actes
- Titre
- Selecting the State-Representation in Reinforcement Learning
- Auteurs
- Odalric-Ambrym Maillard; Rémi Munos; Daniil Ryabko
- Détail
- Neural Information Processing Systems, Dec 2011, Granada, Spain.
- Accès au bibtex
-
- Titre
- Conditional Anomaly Detection Using Soft Harmonic Functions: An Application to Clinical Alerting
- Auteurs
- Michal Valko; Hamed Valizadegan; Branislav Kveton; Gregory Cooper; Milos Hauskrecht
- Détail
- The 28th International Conference on Machine Learning Workshop on Machine Learning for Global Challenges, Jun 2011, Seattle, United States.
- Accès au texte intégral et bibtex
-
- Titre
- Classification-based Policy Iteration with a Critic
- Auteurs
- Victor Gabillon; Alessandro Lazaric; Mohammad Ghavamzadeh; Bruno Scherrer
- Détail
- International Conference on Machine Learning (ICML), Jun 2011, Seattle, United States. ACM, Proceedings of the 28 th International Conference on Machine Learning, pp. 1049-1056
- Accès au texte intégral et bibtex
-
- Titre
- Multi-Sensor PHD by Space Partionning: Computation of a True Reference Density Within The PHD Framework
- Auteurs
- Emmanuel Delande; Emmanuel Duflos; Philippe Vanheeghe; Dominique Heurguier
- Détail
- IEEE - Signal Processing Society. Statistical Signal Processing Workshop (SSP), 2011, Jun 2011, Nice, France. IEEE - Signal Processing Society, Statistical Signal Processing Workshop (SSP), pp. 333 - 336
- Accès au texte intégral et bibtex
-
- Titre
- A Finite-Time Analysis of Multi-armed Bandits Problems with Kullback-Leibler Divergences
- Auteurs
- Odalric-Ambrym Maillard; Rémi Munos; Gilles Stoltz
- Détail
- Sham Kakade & Ulrike von Luxburg. 24th Annual Conference on Learning Theory : COLT'11, Jul 2011, Budapest, Hungary. pp. 18
- Accès au texte intégral et bibtex
-
- Titre
- Learning vocal tract variables with multi-task kernels
- Auteurs
- Hachem Kadri; Emmanuel Duflos
; Philippe Preux - Détail
- International Conference on Acoustic, Speech and Signal Processing (ICASSP), May 2011, Pragues, Czech Republic. pp. 2200-2203
- Accès au bibtex
-
- Titre
- On selecting the hyperparameters of the DPM models for the density estimation of observation errors
- Auteurs
- Asma Rabaoui
; Emmanuel Duflos
; Juliette Marais; Nicolas Viandier - Détail
- International Conference on Acoustic, Speech and Signal Processing (ICASSP°, May 2011, Prague, Czech Republic. pp. 4092-4095
- Accès au bibtex
-
- Titre
- Multi-sensor PHD: Construction and implementation by space partitioning
- Auteurs
- Emmanuel Delande; Emmanuel Duflos
; Philippe Vanheeghe; Dominique Heurguier - Détail
- IEEE International Conference on Acoustic Speech and Signal Processing, May 2011, Prague, Czech Republic. pp. 3632-3635
- Accès au bibtex
-
- Titre
- Multi-Sensor PHD: Construction and Implementation by Space Partitioning
- Auteurs
- Emmanuel Delande; Emmanuel Duflos; Philippe Vanheeghe; Dominique Heurguier
- Détail
- IEEE - Signal Processing Society. International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2011, May 2011, Prague, Czech Republic. IEEE - Signal Processing Society, pp. 3632 - 3635
- Accès au texte intégral et bibtex
-
- Titre
- Impulsive Interference Mitigation in Ad Hoc Networks Based on Alpha-Stable Modeling and Particle Filtering
- Auteurs
- Nouha Jaoua; Emmanuel Duflos; Philippe Vanheeghe; Laurent Clavier; François Septier
- Détail
- IEEE - Signal Processing Society. International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2011, May 2011, Prague, Czech Republic. IEEE - Signal Processing Society, pp. 3548 - 3551
- Accès au texte intégral et bibtex
-
- Titre
- Handling Expensive Optimization with Large Noise
- Auteurs
- Rémi Coulom; Philippe Rolet; Nataliya Sokolovska; Olivier Teytaud
- Détail
- ACM. Foundations of Genetic Algorithms, Jan 2011, Austria. pp. TBA
- Accès au texte intégral et bibtex
-
- Titre
- Confidence Sets in Time-Series Filtering
- Auteurs
- Boris Ryabko; Daniil Ryabko
- Détail
- IEEE International Symposium on Information Theory, Jul 2011, St. Petersburg, Russian Federation. IEEE, Proceedings of IEEE International Symposium on Information Theory, pp. 2436-2438
- Accès au bibtex
-
- Titre
- Conditional Anomaly Detection with Soft Harmonic Functions
- Auteurs
- Michal Valko; Branislav Kveton; Hamed Valizadegan; Gregory Cooper; Milos Hauskrecht
- Détail
- Proceedings of the 2011 IEEE International Conference on Data Mining, Dec 2011, Vancouver, Canada.
- Accès au texte intégral et bibtex
-
Conférences invitées
- Titre
- Finite-Time Analysis of Stratified Sampling for Monte Carlo
- Auteurs
- Alexandra Carpentier; Rémi Munos
- Détail
- NIPS - Twenty-Fifth Annual Conference on Neural Information Processing Systems, Dec 2011, Grenade, Spain.
- Accès au texte intégral et bibtex
-
- Titre
- Upper-Confidence-Bound Algorithms for Active Learning in Multi-Armed Bandits
- Auteurs
- Alexandra Carpentier
; Alessandro Lazaric; Mohammad Ghavamzadeh; Rémi Munos; Peter Auer - Détail
- ALT - the 22nd conference on Algorithmic Learning Theory, Oct 2011, Espoo, Finland.
- Accès au texte intégral et bibtex
-
Chapitres d'ouvrages scientifiques
- Titre
- Bandit view on noisy optimization
- Auteurs
- Jean-Yves Audibert; Sébastien Bubeck; Rémi Munos
- Détail
- Optimization for Machine Learning, MIT Press, pp. 431-454, Dec. 2011, 978-0-262-01646-9
- Accès au bibtex
-
HDR
- Titre
- APPRENABILITÉ DANS LES PROBLÈMES DE L'INFÉRENCE SÉQUENTIELLE
- Auteurs
- Daniil Ryabko

- Détail
- Université des Sciences et Technologie de Lille - Lille I, Dec. 2011. English
- Accès au texte intégral et bibtex
-
Rapports
- Titre
- Multi-Bandit Best Arm Identification
- Auteurs
- Victor Gabillon; Mohammad Ghavamzadeh; Alessandro Lazaric; Sébastien Bubeck
- Détail
- [Report], 2011
- Accès au texte intégral et bibtex
-
- Titre
- Reinforcement Learning with a Near Optimal Rate of Convergence
- Auteurs
- Mohammad Gheshlaghi Azar; Rémi Munos; Mohammad Ghavamzadeh; Hilbert Kappen
- Détail
- [Technical Report], 2011
- Accès au texte intégral et bibtex
-
- Titre
- Automatic motor task selection via a bandit algorithm for a brain-controlled button
- Auteurs
- Joan Fruitet; Alexandra Carpentier; Rémi Munos; Maureen Clerc
- Détail
- [Research Report], 2011. RR-7721
- Accès au texte intégral et bibtex
-
- Titre
- Transfer from Multiple MDPs
- Auteurs
- Alessandro Lazaric; Marcello Restelli
- Détail
- [Technical Report], 2011
- Accès au texte intégral et bibtex
-
- Titre
- Classification-based Policy Iteration with a Critic
- Auteurs
- Victor Gabillon; Alessandro Lazaric; Mohammad Ghavamzadeh; Bruno Scherrer
- Détail
- [Report], 2011
- Accès au texte intégral et bibtex
-
- Titre
- Operator-Valued Kernels for Nonparametric Operator Estimation
- Auteurs
- Hachem Kadri; Philippe Preux; Emmanuel Duflos; Stephane Canu
- Détail
- [Research Report], 2011. RR-7607
- Accès au texte intégral et bibtex
-
- Titre
- Adaptive Bandits: Towards the best history-dependent strategy
- Auteurs
- Odalric-Ambrym Maillard; Rémi Munos
- Détail
- [Technical Report], 2011, pp. 14
- Accès au texte intégral et bibtex
-
Thèses
- Titre
- Adaptive Graph-Based Algorithms for Conditional Anomaly Detection and Semi-Supervised Learning
- Auteurs
- Michal Valko

- Détail
- information cognition et apprentissages. University of Pittsburgh, Aug. 2011. English
- Accès au texte intégral et bibtex
-
Documents sans référence de publication
- Titre
- Datum-Wise Classification: A Sequential Approach to Sparsity
- Auteurs
- Gabriel Dulac-Arnold; Ludovic Denoyer; Philippe Preux; Patrick Gallinari
- Détail
- Aug. 2011. ECML2011
- Accès au bibtex
-
2010
Articles dans des revues avec comité de lecture
- Titre
- Regret Bounds and Minimax Policies under Partial Monitoring
- Auteurs
- Jean-Yves Audibert; Sébastien Bubeck
- Détail
- Journal of Machine Learning Research, 2010, 11, pp. 2785-2836
- Accès au texte intégral et bibtex
-
- Titre
- Discrimination between B-processes is impossible
- Auteurs
- Daniil Ryabko
- Détail
- Journal of Theoretical Probability, Sprnger, 2010, 23 (2), pp. 565-575
- Accès au bibtex
-
- Titre
- Nonparametric Statistical Inference for Ergodic Processes
- Auteurs
- Daniil Ryabko; Boris Ryabko
- Détail
- IEEE Transactions on Information Theory, IEEE, 2010, 56 (3), pp. 1430-1435
- Accès au texte intégral et bibtex
-
- Titre
- On Finding Predictors for Arbitrary Families of Processes
- Auteurs
- Daniil Ryabko
- Détail
- Journal of Machine Learning Research, Microtome Publishing, 2010, 11, pp. 581-602
- Accès au texte intégral et bibtex
-
Communications avec actes
- Titre
- The Iso-regularization Descent Algorithm for the LASSO
- Auteurs
- Manuel Loth; Philippe Preux
- Détail
- 17th International Conference on Neural Information Processing, Nov 2010, Sidney, Australia.
- Accès au texte intégral et bibtex
-
- Titre
- Advertising Campaigns Management: Should We Be Greedy?
- Auteurs
- Sertan Girgin; Jérémie Mary; Philippe Preux; Olivier Nicol
- Détail
- IEEE International Conference on Data Mining, Dec 2010, Sydney, Australia.
- Accès au texte intégral et bibtex
-
- Titre
- Advanced signal processing techniques for multipath mitigation in land transportation environment
- Auteurs
- Juliette Marais; Emmanuel Duflos
; Nicolas Viandier; Donnay Nahimana; Asma Rabaoui 
- Détail
- International IEEE Conference on Intelligent Transportation Systems (ITSC), Sep 2010, Funchal, France. pp. 1480-1485
- Accès au bibtex
-
- Titre
- GNSS pseudorange error density tracking using Dirichlet Process Mixture
- Auteurs
- Nicolas Viandier; Asma Rabaoui
; Juliette Marais; Emmanuel Duflos 
- Détail
- FUSION 2010, Jul 2010, Edinburgh, United Kingdom. pp. 1-7
- Accès au bibtex
-
- Titre
- Online Semi-Supervised Perception: Real-Time Learning without Explicit Feedback
- Auteurs
- Branislav Kveton; Michal Valko; Mathai Phillipose; Ling Huang
- Détail
- 4th IEEE Online Learning for Computer Vision Workshop, Jun 2010, San Francisco, United States.
- Accès au texte intégral et bibtex
-
- Titre
- Online Semi-Supervised Learning on Quantized Graphs
- Auteurs
- Michal Valko; Branislav Kveton; Huang Ling; Ting Daniel
- Détail
- The 26nd Annual Conference on Uncertainty in Artificial Intelligence, Jun 2010, Catalina Island, United States.
- Accès au texte intégral et bibtex
-
- Titre
- Semi-Supervised Learning with Max-Margin Graph Cuts
- Auteurs
- Branislav Kveton; Michal Valko; Ali Rahimi; Ling Huang
- Détail
- Thirteenth International Conference on Artificial Intelligence and Statistics, May 2010, Chia Laguna, Sardinia, Italy.
- Accès au texte intégral et bibtex
-
- Titre
- Studies on DPM for the density estimation of pseudorange noises and evaluations on real data
- Auteurs
- Juliette Marais; Asma Rabaoui
; Emmanuel Duflos 
- Détail
- Position Location and Navigation Symposium (PLANS), 2010 IEEE/ION, May 2010, Indian Wells, CA, USA, United States. pp. 1154-1161
- Accès au bibtex
-
- Titre
- Nonlinear functional regression: a functional RKHS approach
- Auteurs
- Hachem Kadri; Emmanuel Duflos; Philippe Preux; Stephane Canu; Manuel Davy
- Détail
- Thirteenth International Conference on Artificial Intelligence and Statistics (AISTATS'10), 2010, Italy. 9, pp. 374-380
- Accès au texte intégral et bibtex
-
- Titre
- Testing composite hypotheses about discrete-valued stationary processes
- Auteurs
- Daniil Ryabko
- Détail
- IEEE Information Theory Workshop, 2010, Cairo, Egypt. IEEE, pp. 291-295
- Accès au bibtex
-
- Titre
- Uniform hypothesis testing for ergodic time series distributions
- Auteurs
- Daniil Ryabko
- Détail
- IEEE R8 International Conference on Computational Technologies in Electrical and Electronics Engineering, 2010, Irkutsk, Russian Federation. IEEE, pp. 23-27
- Accès au bibtex
-
- Titre
- Feature importance analysis for patient management decisions
- Auteurs
- Michal Valko; Milos Hauskrecht
- Détail
- 13th International Congress on Medical Informatics MEDINFO 2010, Sep 2010, Cape Town, South Africa. IOS Press, MEDINFO 2010 - Proceedings of the 13th World Congress on Medical Informatics, pp. 861-865
- Accès au texte intégral et bibtex
-
- Titre
- Best Arm Identification in Multi-Armed Bandits
- Auteurs
- Jean-Yves Audibert; Sébastien Bubeck
- Détail
- COLT - 23th Conference on Learning Theory - 2010, Jun 2010, Haifa, Israel. 13 p.
- Accès au texte intégral et bibtex
-
- Titre
- Sequence prediction in realizable and non-realizable cases
- Auteurs
- Daniil Ryabko
- Détail
- Conference on Learning Theory, 2010, Haifa, Israel. pp. 119-131, COLT
- Accès au texte intégral et bibtex
-
- Titre
- Clustering processes
- Auteurs
- Daniil Ryabko
- Détail
- 27th International Conference on Machine Learning, Jun 2010, Haifa, Israel. pp. 919-926
- Accès au texte intégral et bibtex
-
- Titre
- Online Learning in Adversarial Lipschitz Environments
- Auteurs
- Odalric Maillard; Rémi Munos
- Détail
- European Conference on Machine Learing, 2010, Barcelone, Spain. Springer
- Accès au texte intégral et bibtex
-
Communications sans actes
- Titre
- Simulation-based search of combinatorial games
- Auteurs
- Lukasz Lew; Rémi Coulom
- Détail
- ICML 2010 : Workshop on Machine Learning and Games, Jun 2010, Haifa, Israel.
- Accès au bibtex
-
Chapitres d'ouvrages scientifiques
- Titre
- Robust Unsupervised Speaker Segmentation for Audio Diarization
- Auteurs
- Kadri Hachem; Manuel Davy; Noureddine Ellouze
- Détail
- Signal Processing, INTECH, pp. 307-320, 2010
- Accès au texte intégral et bibtex
-
Documents associés à des manifestations scientifiques (Tutoriel, poster/prés./préface, papier court, digest de conférence, …)
- Titre
- Finite sample analysis of Least Squares Temporal Differences
- Auteurs
- Rémi Munos
- Détail
- [Conference digest]. Journées MAS et Journée en l'honneur de Jacques Neveu, Aug 2010, Talence, France
- Accès au texte intégral et bibtex
-
Rapports
- Titre
- Linear regression with random projections
- Auteurs
- Odalric-Ambrym Maillard; Rémi Munos
- Détail
- [Technical Report], 2010, pp. 22
- Accès au texte intégral et bibtex
-
- Titre
- LSPI with Random Projections
- Auteurs
- Mohammad Ghavamzadeh; Alessandro Lazaric; Odalric Maillard; Rémi Munos
- Détail
- [Technical Report], 2010
- Accès au texte intégral et bibtex
-
- Titre
- Finite-Sample Analysis of Least-Squares Policy Iteration
- Auteurs
- Alessandro Lazaric; Mohammad Ghavamzadeh; Rémi Munos
- Détail
- [Technical Report], 2010
- Accès au texte intégral et bibtex
-
- Titre
- Multi-target PHD filtering: proposition of extensions to the multi-sensor case
- Auteurs
- Emmanuel Delande; Emmanuel Duflos; Dominique Heurguier; Philippe Vanheeghe
- Détail
- [Research Report], 2010, pp. 64. RR-7337
- Accès au texte intégral et bibtex
-
- Titre
- Brownian Motions and Scrambled Wavelets for Least-Squares Regression
- Auteurs
- Odalric-Ambrym Maillard; Rémi Munos
- Détail
- [Technical Report], 2010, pp. 13
- Accès au texte intégral et bibtex
-
- Titre
- Finite-Sample Analysis of LSTD
- Auteurs
- Alessandro Lazaric; Mohammad Ghavamzadeh; Remi Munos
- Détail
- [Technical Report], 2010
- Accès au texte intégral et bibtex
-
- Titre
- Analysis of a Classification-based Policy Iteration Algorithm
- Auteurs
- Alessandro Lazaric; Mohammad Ghavamzadeh; Remi Munos
- Détail
- [Technical Report], 2010
- Accès au texte intégral et bibtex
-
- Titre
- Bayesian Multi-Task Reinforcement Learning
- Auteurs
- Alessandro Lazaric; Mohammad Ghavamzadeh
- Détail
- [Technical Report], 2010
- Accès au texte intégral et bibtex
-
- Titre
- Brownian Motions and Scrambled Wavelets for Least-Squares Regression
- Auteurs
- Odalric-Ambrym Maillard; Rémi Munos
- Détail
- [Research Report], 2010
- Accès au texte intégral et bibtex
-
- Titre
- Uniform hypothesis testing for ergodic time series distributions
- Auteurs
- Daniil Ryabko
- Détail
- [Research Report], 2010
- Accès au texte intégral et bibtex
-
Documents sans référence de publication
- Titre
- Pure Exploration for Multi-Armed Bandit Problems
- Auteurs
- Sébastien Bubeck; Rémi Munos; Gilles Stoltz
- Détail
- Jun. 2010
- Accès au texte intégral et bibtex
-
2009
Articles dans des revues avec comité de lecture
- Titre
- Radar Optimal Times Detection Allocation in Multitarget Environment
- Auteurs
- Marie De Vilmorin; Emmanuel Duflos; Philippe Vanheeghe
- Détail
- Systems Journal, IEEE, IEEE, 2009, Systems Journal, IEEE, 3 (2), pp. 210-220
- Accès au texte intégral et bibtex
-
- Titre
- Asymptotically Optimal Perfect Steganographic Systems
- Auteurs
- Boris Ryabko; Daniil Ryabko
- Détail
- Problems of Information Transmission, MAIK Nauka/Interperiodica, 2009, 45 (2), pp. 184-190
- Accès au bibtex
-
- Titre
- Using data compressors to construct order tests for homogeneity and component independence
- Auteurs
- Daniil Ryabko; Juergen Schmidhuber
- Détail
- Applied Mathematics Letters, Elsevier, 2009, 22 (7), pp. 1029-1032
- Accès au bibtex
-
- Titre
- Exploration-exploitation tradeoff using variance estimates in multi-armed bandits
- Auteurs
- Jean-Yves Audibert; Remi Munos; Csaba Szepesvari
- Détail
- Theoretical Computer Science, 2009, 410 (19), pp. 1876-1902
- Accès au bibtex
-
- Titre
- Hybrid Stochastic-Adversarial On-line Learning
- Auteurs
- Lazaric Alessandro; Rémi Munos
- Détail
- COLT, COLT, 2009
- Accès au texte intégral et bibtex
-
Communications avec actes
- Titre
- ECON: a Kernel Basis Pursuit Algorithm with Automatic Feature Parameter Tuning, and its Application to Photometric Solids Approximation
- Auteurs
- Loth Manuel; Preux Philippe; Delepoulle Samuel; Renaud Christophe
- Détail
- IEEE Press. International Conference on Machine Learning and Applications, Dec 2009, Miami, United States.
- Accès au texte intégral et bibtex
-
- Titre
- Compressed Least-Squares Regression
- Auteurs
- Odalric-Ambrym Maillard; Rémi Munos
- Détail
- NIPS 2009, Dec 2009, Vancouver, Canada.
- Accès au texte intégral et bibtex
-
- Titre
- Enhancement of Galileo and multi-constellation accuracy by modeling pseudorange noises
- Auteurs
- Nicolas Viandier; Asma Rabaoui
; Juliette Marais; Emmanuel Duflos 
- Détail
- Intelligent Transport Systems Telecommunications, (ITST), Oct 2009, Lille, France. pp. 459-464
- Accès au bibtex
-
- Titre
- On the use of Dirichlet process mixtures for the modelling of pseudorange errors in multi-constellation based localisation
- Auteurs
- Asma Rabaoui
; Nicolas Viandier; Juliette Marais; Emmanuel Duflos 
- Détail
- International Conference on Intelligent Transport Systems Telecommunications, (ITST), Oct 2009, Lille, France. pp. 465-470
- Accès au bibtex
-
- Titre
- Real world implementation of belief function theory to detect dislocation of materials in construction
- Auteurs
- S.N. Razavi; Carl Haas; Philippe Vanheeghe; Emmanuel Duflos

- Détail
- FUSION 2009, Jul 2009, Seattle, WA, United States. pp. 748-755
- Accès au bibtex
-
- Titre
- Feature Discovery in Approximate Dynamic Programming
- Auteurs
- Philippe Preux; Sertan Girgin; Manuel Loth
- Détail
- Approximate Dynamic Programming and Reinforcement Learning, Mar 2009, Nashville, United States. IEEE
- Accès au bibtex
-
- Titre
- Using Kolmogorov Complexity for Understanding Some Limitations on Steganography
- Auteurs
- Boris Ryabko; Daniil Ryabko
- Détail
- IEEE International Symposium on Information Theory, 2009, seoul, Korea, Republic Of. IEEE, pp. 2733-2736
- Accès au bibtex
-
- Titre
- An impossibility result for process discrimination
- Auteurs
- Daniil Ryabko
- Détail
- IEEE International Symposium on Information Theory, 2009, seoul, Korea, Republic Of. IEEE, pp. 1734-1738
- Accès au bibtex
-
- Titre
- Characterizing predictable classes of processes
- Auteurs
- Daniil Ryabko
- Détail
- UAI, 2009, Montreal, Canada. Proceedings of the 25th Conference on Uncertainty in Artificial Intelligence (UAI'09), pp. 471-478
- Accès au texte intégral et bibtex
-
Directions d'ouvrages
- Titre
- Recent Advances in Reinforcement Learning
- Auteurs
- Sertan Girgin; Manuel Loth; Rémi Munos; Philippe Preux; Daniil Ryabko
- Détail
- Springer, Lectures Notes in Artificial Intelligence (LNAI), vol. 5323, pp. 281, Feb. 2009
- Accès au bibtex
-
- Titre
- Recent Advances in Reinforcement Learning
- Auteurs
- Sertan Girgin; Manuel Loth; Rémi Munos; Philippe Preux; Daniil Ryabko
- Détail
- Sertan Girgin and Manuel Loth and Rémi Munos and Philippe Preux and Daniil Ryabko. LNAI 5323, Springer, pp. 281, 2009
- Accès au bibtex
-
Rapports
- Titre
- General Framework for Nonlinear Functional Regression with Reproducing Kernel Hilbert Spaces
- Auteurs
- Hachem Kadri; Emmanuel Duflos; Manuel Davy; Philippe Preux; Stephane Canu
- Détail
- [Research Report], 2009. RR-6908
- Accès au texte intégral et bibtex
-
- Titre
- A criterion for hypothesis testing for stationary processes
- Auteurs
- Daniil Ryabko
- Détail
- [Research Report], 2009
- Accès au texte intégral et bibtex
-
2008
Articles dans des revues avec comité de lecture
- Titre
- Using One-Class SVMs and Wavelets for Audio Surveillance
- Auteurs
- Asma Rabaoui; Manuel Davy; Stéphane Rossignol; Noureddine Ellouze
- Détail
- IEEE Transactions on Information Forensics and Security, 2008, 3 (4), pp. 763-775
- Accès au bibtex
-
- Titre
- Least commited basic belief density induced by a multivariate Gaussian: formulation with applications.
- Auteurs
- Francois Caron; Branko Ristic; Emmanuel Duflos; Philippe Vanheeghe
- Détail
- International Journal of Approximate Reasoning, 2008, 48(2), pp. 419-436
- Accès au bibtex
-
- Titre
- On the Possibility of Learning in Reactive Environments with Arbitrary Dependence
- Auteurs
- Daniil Ryabko; M. Hutter
- Détail
- Theoretical Computer Science, Elsevier, 2008, 405, pp. 274-284
- Accès au bibtex
-
- Titre
- Predicting Non-Stationary Processes
- Auteurs
- Daniil Ryabko; M. Hutter
- Détail
- Applied Mathematics Letters, Elsevier, 2008, 21 (5), pp. 477-482
- Accès au bibtex
-
Communications avec actes
- Titre
- Incremental Basis Function Expansion in Reinforcement Learning using Cascade-Correlation Networks
- Auteurs
- Sertan Girgin; Philippe Preux
- Détail
- International Conference on Machine Learning and Applications, Dec 2008, San Diego, United States. IEEE Press, pp. 75-82
- Accès au bibtex
-
- Titre
- Some Sufficient Conditions on an Arbitrary Class of Stochastic Processes for the Existence of a Predictor
- Auteurs
- Daniil Ryabko
- Détail
- International Conference on Algorithmic Learning Theory, 2008, Budapest, Hungary. Springer, LNAI 5254, pp. 169-182
- Accès au bibtex
-
- Titre
- Conditional anomaly detection methods for patient-management alert systems
- Auteurs
- Michal Valko; Gregory Cooper; Amy Seybert; Shyam Visweswaran; Melissa Saul; Milos Hauskrecht
- Détail
- Workshop on Machine Learning in Health Care Applications in The 25th International Conference on Machine Learning, Jul 2008, Helsinki, Finland.
- Accès au texte intégral et bibtex
-
- Titre
- Distance Metric Learning for Conditional Anomaly Detection
- Auteurs
- Michal Valko; Milos Hauskrecht
- Détail
- Twenty-First International Florida Artificial Intelligence Research Society Conference, May 2008, Coconut Grove, Florida, United States. AAAI Press
- Accès au texte intégral et bibtex
-
- Titre
- Learning predictive models for combinations of heterogeneous proteomic data sources
- Auteurs
- Michal Valko; Richard Pelikan; Milos Hauskrecht
- Détail
- AMIA Summit on Translational Bioinformatics, Mar 2008, San Francisco, United States.
- Accès au texte intégral et bibtex
-
- Titre
- Whole-History Rating: A Bayesian Rating System for Players of Time-Varying Strength
- Auteurs
- Rémi Coulom
- Détail
- van den Herik, H. J. and Xu, Xinhe and Ma, Zongming and Winands, M.H.M.. Computer and Games, Sep 2008, Beijing, China. Springer, Computers and Games, 5131, pp. 113-124, Lectures Notes in Computer Science
- Accès au texte intégral et bibtex
-
- Titre
- Online Optimization in X-Armed Bandits
- Auteurs
- Sébastien Bubeck; Rémi Munos; Gilles Stoltz; Csaba Szepesvari
- Détail
- Twenty-Second Annual Conference on Neural Information Processing Systems, Dec 2008, Vancouver, Canada.
- Accès au texte intégral et bibtex
-
- Titre
- Basis Function Construction in Reinforcement Learning using Cascade-Correlation Learning Architecture
- Auteurs
- Sertan Girgin; Philippe Preux
- Détail
- 8th International Conference on Machine Learning and Applications, Dec 2008, La Jolla, United States. IEEE
- Accès au bibtex
-
- Titre
- Basis Expansion in Natural Actor Critic Methods
- Auteurs
- Sertan Girgin; Philippe Preux
- Détail
- Sertan Girgin and Manuel Loth and Rémi Munos and Philippe Preux and Daniil Ryabko. European Workshop on Reinforcement Learning, Jun 2008, Villeneuve d'Ascq, France. Springer, Recent Advances in Reinforcement Learning, 5323, pp. 111-124, Lecture Notes in Artificial Intelligence
- Accès au texte intégral et bibtex
-
- Titre
- Some sufficient conditions on an arbitrary class of stochastic processes for the existence of a predictor.
- Auteurs
- Daniil Ryabko
- Détail
- Freund, Y.; Györfi, L.; Turán, G.; Zeugmann, Th.. 19th International Conference on Algorithmic Learning Theory, ALT 2008, Oct 2008, Budapest, Hungary. 5254, Lecture Notes in Artificial Intelligence
- Accès au texte intégral et bibtex
-
- Titre
- Feature Discovery in Approximate Dynamic Programming
- Auteurs
- Philippe Preux; Sertan Girgin; Manuel Loth
- Détail
- IEEE International Symposium on Adaptive Dynamic Programming and Reinforcement Learning, Mar 2009, Nashville, United States. 2008
- Accès au bibtex
-
- Titre
- Incremental Basis Function Expansion in Reinforcement Learning using Cascade-Correlation Networks
- Auteurs
- Sertan Girgin; Philippe Preux
- Détail
- 8th International Conference on Machine Learning and Applications, Dec 2008, San Diego, United States. IEEE Press
- Accès au texte intégral et bibtex
-
- Titre
- Reception State Estimation of GNSS satellites in urban environment using particle filtering
- Auteurs
- Donnay Fleury Nahimana; Emmanuel Duflos; Juliette Marais
- Détail
- FUSION 2008, Jun 2008, Cologne, Germany.
- Accès au texte intégral et bibtex
-
- Titre
- Optimal Policies Search for Sensor Management
- Auteurs
- Thomas Bréhard; Emmanuel Duflos; Philippe Vanheeghe; Pierre-Arnaud Coquelin
- Détail
- FUSION 2008, Jun 2008, Cologne, Germany. pp. 1 - 8
- Accès au texte intégral et bibtex
-
Rapports
- Titre
- Using Data Compressors to Construct Rank Tests
- Auteurs
- Daniil Ryabko; Juergen Schmidhuber
- Détail
- [Research Report], 2008
- Accès au texte intégral et bibtex
-
- Titre
- Incremental Basis Function Expansion in Reinforcement Learning using Cascade-Correlation Networks
- Auteurs
- Sertan Girgin; Philippe Preux
- Détail
- [Research Report], 2008. RR-6505
- Accès au texte intégral et bibtex
-
- Titre
- An impossibility result for process discrimination
- Auteurs
- Daniil Ryabko
- Détail
- [Research Report], 2008
- Accès au texte intégral et bibtex
-
- Titre
- Sensitivity Analysis in Particle Filters. Application to Policy Optimization in POMDPs
- Auteurs
- Pierre Arnaud Coquelin; Romain Deguest; Rémi Munos
- Détail
- [Research Report], 2008. RR-6710
- Accès au texte intégral et bibtex
-
- Titre
- The Equi-Correlation Network: a New Kernelized-LARS with Automatic Kernel Parameters Tuning
- Auteurs
- Manuel Loth; Philippe Preux
- Détail
- [Research Report], 2008. RR-6794
- Accès au texte intégral et bibtex
-
2007
Articles dans des revues avec comité de lecture
- Titre
- Analyse en norme Lp de l'algorithme d'itérations sur les valeurs avec approximations
- Auteurs
- Rémi Munos
- Détail
- Revue d'Intelligence Artificielle, Lavoisier, 2007, 21
- Accès au texte intégral et bibtex
-
- Titre
- Performance Bounds in Lp norm for Approximate Value Iteration
- Auteurs
- Rémi Munos
- Détail
- SIAM Journal on Control and Optimization, SIAM, 2007
- Accès au texte intégral et bibtex
-
Articles dans des revues sans comité de lecture
- Titre
- L'Ordinateur, champion de go ?
- Auteurs
- Sylvain Gelly; Rémi Munos
- Détail
- Pour la sciences, Pour La Science, 2007, 354, pp. 28-35
- Accès au bibtex
-
Communications avec actes
- Titre
- A Unified View of TD Algorithms; Introducing Full-Gradient TD and Equi-Gradient Descent TD
- Auteurs
- Manuel Loth; Philippe Preux; Manuel Davy
- Détail
- European Symposium on Artificial Neural Networks, Apr 2007, Bruges, Belgium, Belgium.
- Accès au texte intégral et bibtex
-
- Titre
- Sparse Temporal Difference Learning using LASSO
- Auteurs
- Manuel Loth; Manuel Davy; Philippe Preux
- Détail
- IEEE International Symposium on Approximate Dynamic Programming and Reinforcement Learning, Apr 2007, Hawaï, USA, United States.
- Accès au texte intégral et bibtex
-
- Titre
- Value-Iteration Based Fitted Policy Iteration: Learning with a Single Trajectory
- Auteurs
- Andras Antos; Csaba Szepesvari; Rémi Munos
- Détail
- IEEE International Symposium on Approximate Dynamic Programming and Reinforcement Learning, 2007, Hawai, United States. pp. 2007
- Accès au texte intégral et bibtex
-
- Titre
- A Dynamic Programming Approach to Viability Problems
- Auteurs
- Pierre-Arnaud Coquelin; Sophie Martin; Rémi Munos
- Détail
- IEEE ADPRL, Apr 2007, Hawai. Proceedings of the 2007 IEEE Symposium on Approximate Dynamic Programming and Reinforcement Learning (ADPRL 2007), pp. 178-184
- Accès au texte intégral et bibtex
-
- Titre
- Computing Elo Ratings of Move Patterns in the Game of Go
- Auteurs
- Rémi Coulom
- Détail
- van den Herik, H. Jaap and Mark Winands and Jos Uiterwijk and Maarten Schadd. Computer Games Workshop, Jun 2007, Amsterdam, Netherlands.
- Accès au texte intégral et bibtex
-
- Titre
- Bandit Algorithms for Tree Search
- Auteurs
- Pierre-Arnaud Coquelin; Rémi Munos
- Détail
- Uncertainty in Artificial Intelligence, 2007, Vancouver, Canada.
- Accès au texte intégral et bibtex
-
- Titre
- Fitted Q-iteration in continuous action-space MDPs
- Auteurs
- Andras Antos; Rémi Munos; Csaba Szepesvari
- Détail
- Neural Information Processing Systems, 2007, Vancouver, Canada.
- Accès au texte intégral et bibtex
-
- Titre
- Tuning bandit algorithms in stochastic environments
- Auteurs
- Jean-Yves Audibert; Rémi Munos; Csaba Szepesvari
- Détail
- Algorithmic Learning Theory, 2007, Sendai, Japan. pp. 150-165
- Accès au texte intégral et bibtex
-
- Titre
- Time Allocation of a Set of Radars in a Multitarget Environment
- Auteurs
- Emmanuel Duflos; Marie De Vilmorin; Philippe Vanheeghe
- Détail
- FUSION 2007, 2007, Québec, Canada.
- Accès au texte intégral et bibtex
-
Conférences invitées
- Titre
- Monte-Carlo Tree Search in Crazy Stone
- Auteurs
- Rémi Coulom
- Détail
- Takeshi Ito and Akihiro Kishimoto. 12th Game Programming Workshop, Nov 2007, Hakone, Japan.
- Accès au bibtex
-
- Titre
- Consistent Minimization of Clustering Objective Functions
- Auteurs
- Ulrike Von Luxburg; Sébastien Bubeck; Stefanie Jegelka; Michael Kaufmann
- Détail
- Neural Information Processing Systems, Dec 2007, Vancouver, Canada.
- Accès au texte intégral et bibtex
-
Rapports
- Titre
- Finite Time Bounds for Sampling-Based Fitted Value Iteration
- Auteurs
- Rémi Munos; Csaba Szepesvari
- Détail
- [Research Report], 2007, pp. 46
- Accès au texte intégral et bibtex
-
- Titre
- Numerical methods for sensitivity analysis of Feynman-Kac models
- Auteurs
- Pierre-Arnaud Coquelin; Romain Deguest; Rémi Munos
- Détail
- [Research Report], 2007
- Accès au texte intégral et bibtex
-
- Titre
- Bandit Algorithms for Tree Search
- Auteurs
- Pierre-Arnaud Coquelin; Rémi Munos
- Détail
- [Research Report], 2007, pp. 20. RR-6141
- Accès au texte intégral et bibtex
-
- Titre
- Fitted Q-iteration in continuous action-space MDPs
- Auteurs
- Andras Antos; Rémi Munos; Csaba Szepesvari
- Détail
- [Technical Report], 2007, pp. 24
- Accès au texte intégral et bibtex
-
- Titre
- Feature Discovery in Reinforcement Learning using Genetic Programming
- Auteurs
- Sertan Girgin; Philippe Preux
- Détail
- [Research Report], 2007
- Accès au texte intégral et bibtex
-
- Titre
- Optimal Policies Search for Sensor Management : Application to the AESA Radar
- Auteurs
- Thomas Bréhard; Pierre-Arnaud Coquelin; Emmanuel Duflos
- Détail
- [Research Report], 2007, pp. 21. RR-6361
- Accès au texte intégral et bibtex
-
Documents sans référence de publication
- Titre
- Nearest Neighbor Clustering: A Baseline Method for Consistent Clustering with Arbitrary Objective Functions
- Auteurs
- Sébastien Bubeck; Ulrike Von Luxburg
- Détail
- Nov. 2007
- Accès au texte intégral et bibtex
-
- Titre
- A Dynamic Programming Approach to Viability Problems
- Auteurs
- Pierre-Arnaud Coquelin; Sophie Martin; Rémi Munos
- Détail
- Jan. 2007
- Accès au texte intégral et bibtex
-
- Titre
- Numerical methods for sensitivity analysis of Feynman-Kac models
- Auteurs
- Pierre-Arnaud Coquelin; Romain Deguest; Rémi Munos
- Détail
- Jan. 2007
- Accès au texte intégral et bibtex
-
2006
Articles dans des revues avec comité de lecture
- Titre
- Policy Gradient in Continuous Time
- Auteurs
- Rémi Munos
- Détail
- Journal of Machine Learning Research, Microtome Publishing, 2006, 7, pp. 771-791
- Accès au texte intégral et bibtex
-
- Titre
- Geometric Variance Reduction in Markov Chains: Application to Value Function and Gradient Estimation
- Auteurs
- Rémi Munos
- Détail
- Journal of Machine Learning Research, Microtome Publishing, 2006, 7, pp. 413-427
- Accès au texte intégral et bibtex
-
- Titre
- An anti-diffusive scheme for viability problems
- Auteurs
- Olivier Bokanowski; Sophie Martin; Rémi Munos; Hasnaa Zidani
- Détail
- Applied Numerical Mathematics, Elsevier, 2006, 56 (9), pp. 1147-1162
- Accès au texte intégral et bibtex
-
- Titre
- Numerical methods for the pricing of Swing options: a stochastic control approach
- Auteurs
- Christophe Barrera-Esteve; Florent Bergeret; Charles Dossal; Emmanuel GOBET; Asma Meziou; Rémi Munos; Damien Reboul-Salze
- Détail
- Methodology And Computing In Applied Probability, Springer Netherlands, 2006, Methodology and Computing in Applied Probability, 8 (4), pp. 517-540
- Accès au texte intégral et bibtex
-
- Titre
- Bayesian Analysis of Polyphonic western tonal Music
- Auteurs
- Manuel Davy; Simon J. Godsill; Jérôme Idier
- Détail
- Journal of the Acoustical Society of America, American Inst of Physics, USA, 2006, 119 (4), pp. 2498-2517
- Accès au bibtex
-
- Titre
- An Online Support Vector Machine for Abnormal Events Detection
- Auteurs
- Manuel Davy; Frederic Desobry; Arthur Gretton; Christian Doncarli
- Détail
- Signal Processing, Elsevier, 2006, 86 (8), pp. 2009-2025
- Accès au bibtex
-
- Titre
- Bayesian Inference for Linear Dynamic Models with Dirichlet Process Mixtures
- Auteurs
- François Caron; Manuel Davy; Arnaud Doucet; Emmanuel Duflos; Philippe Vanheeghe
- Détail
- IEEE Transactions on Signal Processing, IEEE Signal Processing Society, 2006
- Accès au texte intégral et bibtex
-
- Titre
- Intrinsic 2D/3D registration based on a hybrid approach: use in the radiosurgical imaging process.
- Auteurs
- Maximilien Vermandel; Nacim Betrouni; Jean-Yves Gauvrit; David Pasquier; Christrian Vasseur; Jean Rousseau
- Détail
- Cellular and Molecular Biology (Noisy-le-Grand, France), 2006, 52 (6), pp. 44-53
- Accès au texte intégral et bibtex
-
Communications avec actes
- Titre
- Equi-Gradient Temporal Difference Learning
- Auteurs
- Manuel Loth; Manuel Davy; Rémi Coulom; Philippe Preux
- Détail
- Kernel Methods and Reinforcement Learning, workshop of ICML 2006, Jun 2006, Pittsburgh, USA, United States.
- Accès au texte intégral et bibtex
-
- Titre
- A Comparison of Chief Complaints and Emergency Department Reports for Identifying Patients with Acute Lower Respiratory Syndrome
- Auteurs
- Wendy Chapman; John Dowling; Gregory F Cooper; Milos Hauskrecht; Michal Valko
- Détail
- 2006 Conference of the International Society for Disease Surveillance, Oct 2006, Baltimore, United States.
- Accès au texte intégral et bibtex
-
- Titre
- Efficient Selectivity and Backup Operators in Monte-Carlo Tree Search
- Auteurs
- Rémi Coulom
- Détail
- Paolo Ciancarini and H. Jaap van den Herik. 5th International Conference on Computer and Games, May 2006, Turin, Italy.
- Accès au texte intégral et bibtex
-
- Titre
- Learning near-optimal policies with Bellman-residual minimization based fitted policy iteration and a single sample path
- Auteurs
- Andras Antos; Csaba Szepesvari; Rémi Munos
- Détail
- Conference On Learning Theory, Jun 2006, Pittsburgh, USA.
- Accès au texte intégral et bibtex
-
- Titre
- MAXIMUM LIKELIHOOD PARAMETER ESTIMATION FOR LATENT VARIABLE MODELS USING SEQUENTIAL MONTE CARLO
- Auteurs
- Adam Johansen; Arnaud Doucet; Manuel Davy
- Détail
- 2006 IEEE International Conference on Acoustics, Speech, and Signal Processing : conference proceedings, May 14-19, 2006, Toulouse, 2006, Toulouse, France.
- Accès au texte intégral et bibtex
-
- Titre
- Bayesian Inference for Dynamic Models with Dirichlet Process Mixtures
- Auteurs
- Francois Caron; Manuel Davy; Arnaud Doucet; Emmanuel Duflos; Philippe Vanheeghe
- Détail
- 9th IEEE International Conference on Information Fusion, 2006, Florence, Italy.
- Accès au texte intégral et bibtex
-
- Titre
- JOINT SEGMENTATION OF PIECEWISE CONSTANT AUTOREGRESSIVE PROCESSES BY USING A HIERARCHICAL MODEL AND A BAYESIAN SAMPLING APPROACH
- Auteurs
- Nicolas Dobigeon; Jean-Yves Tourneret; Manuel Davy
- Détail
- IEEE ICASSP 2006, 2006, Toulouse, France.
- Accès au texte intégral et bibtex
-
- Titre
- Application des machines a vecteurs support mono-classe a l'indexation en locuteurs de documents audio
- Auteurs
- Belkacem Fergani; Manuel Davy; Amrane Houacine
- Détail
- Journees d'Etude sur la Parole 2006, 2006, Dinard, France.
- Accès au texte intégral et bibtex
-
- Titre
- ESTIMATION OF MINIMUM MEASURE SETS IN REPRODUCING KERNEL HILBERT SPACES AND APPLICATIONS.
- Auteurs
- Manuel Davy; Frederic Desobry; Stephane Canu
- Détail
- IEEE ICASSP 2006, 2006, Toulouse, France.
- Accès au texte intégral et bibtex
-
Chapitres d'ouvrages scientifiques
- Titre
- Feature Selection and Dimensionality Reduction in Genomics and Proteomics
- Auteurs
- Milos Hauskrecht; Richard Pelikan; Michal Valko; James Lyons-Weiler
- Détail
- Werner Dubitzky, Martin Granzow and Daniel Berrar. Fundamentals of Data Mining in Genomics and Proteomics, Springer, pp. 149-172, 2006
- Accès au texte intégral et bibtex
-
Autres publications
- Titre
- Use of variance estimation in the multi-armed bandit problem
- Auteurs
- Jean-Yves Audibert; Rémi Munos; Csaba Szepesvari
- Détail
- 2006. NIPS Workshop on On-line Trading of Exploration and ExploitationWorkshop
- Accès au texte intégral et bibtex
-
Ouvrages scientifiques
- Titre
- Signal Processing Methods for Music Transcription
- Auteurs
- Anssi Klapuri; Manuel Davy
- Détail
- Springer, pp. 456, 2006, 0-387-30667-6
- Accès au bibtex
-
Rapports
- Titre
- Modification of UCT with Patterns in Monte-Carlo Go
- Auteurs
- Sylvain Gelly; Yizao Wang; Rémi Munos; Olivier Teytaud
- Détail
- [Research Report], 2006. RR-6062
- Accès au texte intégral et bibtex
-
2005
Documents sans référence de publication
- Titre
- Evolving Neural Networks for Statistical Decision Theory
- Auteurs
- Michal Valko
- Détail
- May. 2005. master thesis
- Accès au texte intégral et bibtex
-
Archives
En savoir plus
Retrouvez toutes les publications scientifiques de nos équipes de recherche sur HAL Inria
Inria
Inria.fr
Inria Channel

Voir aussi