Equipe de recherche SEQUEL

Publications de l'équipe SEQUEL

2012

Articles dans des revues avec comité de lecture

Titre
Semi-Supervised Apprenticeship Learning
Auteurs
Michal Valko; Mohammad Ghavamzadeh; Alessandro Lazaric
Détail
Journal of Machine Learning Research: Workshop and Conference Proceedings, Sparc, 2012, The 10th European Workshop on Reinforcement Learning, 24
Accès au texte intégral et bibtex
paper.pdf BibTex
Titre
Sequential approaches for learning datum-wise sparse representations
Auteurs
Gabriel Dulac-Arnold; Ludovic Denoyer; Philippe Preux; Patrick Gallinari
Détail
Machine Learning, Springer, 2012, 89 (1-2), pp. 87-122
Accès au texte intégral et bibtex
versionPublieeMLJ.pdf BibTex
Titre
Outlier detection for patient monitoring and alerting.
Auteurs
Milos Hauskrecht; Iyad Batal; Michal Valko; Shyam Visweswaran; Gregory F Cooper; Gilles Clermont
Détail
Journal of Biomedical Informatics, Elsevier, 2012, epub ahead of print
Accès au bibtex
BibTex
Titre
Dislocation detection in field environments: A belief functions contribution
Auteurs
S.N. Razavi; Emmanuel Duflos url; Carl Haas; Philippe Vanheeghe
Détail
Expert Systems with Applications, 2012, 39 (10), pp. 8505-8513
Accès au bibtex
BibTex
Titre
Dirichlet Process Mixtures for Density Estimation in Dynamic Nonlinear Modeling: Application to GPS Positioning in Urban Canyons
Auteurs
Asma Rabaoui url; Nicolas Viandier; Juliette Marais; Emmanuel Duflos url; Philippe Vanheeghe
Détail
IEEE Transactions on Signal Processing, 2012, 60 (4), pp. 1638 - 1655
Accès au texte intégral et bibtex
IEEE-TSP-2011-SubmitVersion.pdf BibTex
Titre
Testing composite hypotheses about discrete ergodic processes
Auteurs
Daniil Ryabko
Détail
test, Springer, 2012, 21 (2), pp. 317-329
Accès au bibtex
BibTex
Titre
Managing advertising campaigns -- an approximate planning approach
Auteurs
Sertan Girgin; Jérémie Mary; Philippe Preux; Olivier Nicol
Détail
Frontiers of Computer Science, Springer, 2012, 6 (2), pp. 209-229
Accès au texte intégral et bibtex
FCS-11073.final.pdf BibTex
Titre
ICML Exploration & Exploitation challenge: Keep it simple!
Auteurs
Olivier Nicol; Jérémie Mary; Philippe Preux
Détail
Journal of Machine Learning research Workshop and Conference Proceedings, sans, 2012, 26, pp. 62-85
Accès au texte intégral et bibtex
nicol12a.pdf BibTex
Titre
Stumping along a Summary for Exploration & Exploitation Challenge 2011
Auteurs
Christophe Salperwyck url; Tanguy Urvoy
Détail
JMLR Workshop and Conference Proceedings, Dorota Glowacka, Louis Dorard and John Shawe-Taylor, 2012, Workshop on On-line Trading of Exploration and Exploitation 2011, 26, pp. 86-97
Accès au texte intégral et bibtex
Explochallenge_JMLR_Salperwyck_Urvoy.pdf BibTex

Communications avec actes

Titre
Learning from a Single Labeled Face and a Stream of Unlabeled Data
Auteurs
Branislav Kveton; Michal Valko
Détail
10th IEEE International Conference on Automatic Face and Gesture Recognition, Apr 2013, Shanghai, China. 2012
Accès au bibtex
BibTex
Titre
Towards dictionary learning from images with non Gaussian noise
Auteurs
Pierre Chainais url
Détail
IEEE Int. Workshop on Machine Learning for Signal Processing, Sep 2012, Santander, Spain. pp. 0000
Accès au texte intégral et bibtex
MLSP2012_final_web.pdf BibTex
Titre
A Dantzig Selector Approach to Temporal Difference Learning
Auteurs
Matthieu Geist; Bruno Scherrer; Alessandro Lazaric; Mohammad Ghavamzadeh
Détail
John Langford and Joelle Pineau. ICML-12, Jun 2012, Edinburgh, United Kingdom. Omnipress, pp. 1399-1406
Accès au bibtex
BibTex
Titre
Approximate Modified Policy Iteration
Auteurs
Bruno Scherrer url; Mohammad Ghavamzadeh; Victor Gabillon; Matthieu Geist
Détail
ICML 2012, Jun 2012, Edinburgh, United Kingdom.
Accès au texte intégral et bibtex
icml-short.pdf BibTex
Titre
DPM pour l'inférence dans les modèles dynamiques non linéaires avec des bruits de mesure alpha-stable
Auteurs
Nouha Jaoua; Emmanuel Duflos url; Philippe Vanheeghe
Détail
44ème Journées de Statistique, May 2012, Bruxelles, Belgium. pp. 1-4
Accès au bibtex
BibTex
Titre
Optimistic Planning for Markov Decision Processes
Auteurs
Lucian Busoniu url; Remi Munos
Détail
15th International Conference on Artificial Intelligence and Statistics, AISTATS-12, Apr 2012, La Palma, Canary Islands, Spain. 22, pp. 182-189, Journal of Machine Learning Research: Workshop and Conference Proceedings
Accès au texte intégral et bibtex
aistats12.pdf BibTex
Titre
Reducing statistical time-series problems to binary classification
Auteurs
Daniil Ryabko; Jérémie Mary
Détail
NIPS, Dec 2012, Lake Tahoe, United States.
Accès au texte intégral et bibtex
red_hal2.pdf BibTex
Titre
Approximations de l'Algorithme Itérations sur les Politiques Modifié
Auteurs
Bruno Scherrer; Victor Gabillon; Mohammad Ghavamzadeh; Matthieu Geist
Détail
Olivier Buffet. Journées Francophones sur la planification, la décision et l'apprentissage pour le contrôle des systèmes - JFPDA 2012, May 2012, Villers-lès-Nancy, France. 1 p
Accès au bibtex
BibTex
Titre
Un sélecteur de Dantzig pour l'apprentissage par différences temporelles
Auteurs
Matthieu Geist; Bruno Scherrer; Alessandro Lazaric; Mohammad Ghavamzadeh
Détail
Olivier Buffet. Journées Francophones sur la planification, la décision et l'apprentissage pour le contrôle des systèmes - JFPDA 2012, May 2012, Villers-lès-Nancy, France. 13 p
Accès au texte intégral et bibtex
3.pdf BibTex
Titre
Apprentissage par renforcement rapide pour des grands ensembles d'actions en utilisant des codes correcteurs d'erreur
Auteurs
Gabriel Dulac-Arnold; Ludovic Denoyer; Philippe Preux; Patrick Gallinari
Détail
Olivier Buffet. Journées Francophones sur la planification, la décision et l'apprentissage pour le contrôle des systèmes - JFPDA 2012, May 2012, Villers-lès-Nancy, France. 12 p
Accès au texte intégral et bibtex
2.pdf BibTex
Titre
Fast Reinforcement Learning with Large Action Sets Using Error-Correcting Output Codes for MDP Factorization
Auteurs
Gabriel Dulac-Arnold; Ludovic Denoyer; Philippe Preux; Patrick Gallinari
Détail
European Conference on Machine Learning, 2012, Bristol, United Kingdom. Springer, Machine Learning and Knowledge Discovery in Databases, 2, pp. 180-194
Accès au texte intégral et bibtex
version.officielle.Springer.pdf BibTex
Titre
CLOP: Confident Local Optimization for Noisy Black-Box Parameter Tuning
Auteurs
Rémi Coulom url
Détail
van den Herik, H. Jaap and Plaat, Aske. Advances in Computer Games - 13th International Conference, Nov 2011, Tilburg, Netherlands. Springer, Advances in Computer Games, 7168, pp. 146-157, 2012, Lecture Notes in Computer Science
Accès au bibtex
BibTex

Communications sans actes

Titre
Incremental Decision Tree based on order statistics
Auteurs
Christophe Salperwyck url; Vincent Lemaire
Détail
Workshop on Active and Incremental Learning, 2012, Montpellier, France.
Accès au texte intégral et bibtex
AIL_V1.4_submitted-23-07-2012.pdf BibTex

Chapitres d'ouvrages scientifiques

Titre
A Review of Optimistic Planning in Markov Decision Processes
Auteurs
Lucian Busoniu url; Remi Munos; Robert Babuska url
Détail
Frank Lewis and Derong Liu. Reinforcement Learning and Adaptive Dynamic Programming for Feedback Control, Wiley, To appear, corrected proof, Nov. 2012
Accès au bibtex
BibTex

Rapports

Titre
Best Arm Identification: A Unified Approach to Fixed Budget and Fixed Confidence
Auteurs
Victor Gabillon; Mohammad Ghavamzadeh; Alessandro Lazaric
Détail
[Research Report], 2012
Accès au texte intégral et bibtex
nips2012l.pdf BibTex
Titre
Approximate Modified Policy Iteration
Auteurs
Bruno Scherrer url; Victor Gabillon; Mohammad Ghavamzadeh; Matthieu Geist
Détail
[Research Report], 2012
Accès au texte intégral et bibtex
article.pdf BibTex
Titre
A Generalized Kernel Approach to Structured Output Learning
Auteurs
Hachem Kadri url; Mohammad Ghavamzadeh; Philippe Preux
Détail
[Research Report], 2012. RR-7956
Accès au texte intégral et bibtex
RR-7956.pdf RR-7956.ps BibTex
Titre
Multiple Operator-valued Kernel Learning
Auteurs
Hachem Kadri url; Alain Rakotomamonjy; Francis Bach; Philippe Preux
Détail
[Research Report], 2012. RR-7900
Accès au texte intégral et bibtex
RR-7900.pdf RR-7900.ps BibTex
Titre
A Truthful Learning Mechanism for Contextual Multi-Slot Sponsored Search Auctions with Externalities
Auteurs
Alessandro Lazaric; Nicola Gatti; Trov\'{o} Francesco
Détail
[Research Report], 2012
Accès au bibtex
BibTex
Titre
Bandit Theory meets Compressed Sensing for high dimensional Stochastic Linear Bandit
Auteurs
Alexandra Carpentier url; Rémi Munos
Détail
[Technical Report], 2012
Accès au texte intégral et bibtex
SparseBanditsAISTATS.pdf SparseBanditsAISTATS.ps BibTex
Titre
The optimistic principle applied to games, optimization and planning: Towards Foundations of Monte-Carlo Tree Search
Auteurs
Rémi Munos url
Détail
[Report], 2012
Accès au texte intégral et bibtex
FTML2012.pdf BibTex

Documents sans référence de publication

Titre
Kullback-Leibler Upper Confidence Bounds for Optimal Sequential Allocation
Auteurs
Olivier Cappé; Aurélien Garivier; Odalric-Ambrym Maillard; Rémi Munos; Gilles Stoltz
Détail
Oct. 2012
Accès au texte intégral et bibtex
klucb-HAL.pdf klucb-HAL.ps BibTex
Titre
Minimax Number of Strata for Online Stratified Sampling given Noisy Samples
Auteurs
Alexandra Carpentier url; Rémi Munos
Détail
May. 2012
Accès au texte intégral et bibtex
FixedStrata.pdf BibTex

2011

Articles dans des revues avec comité de lecture

Titre
X-Armed Bandits
Auteurs
Sébastien Bubeck; Rémi Munos; Gilles Stoltz; Csaba Szepesvari
Détail
Journal of Machine Learning Research, 2011, 12, pp. 1655-1695
Accès au texte intégral et bibtex
HOO-arXiv.ps HOO-arXiv.pdf BibTex
Titre
Pure exploration in finitely-armed and continuous-armed bandits
Auteurs
Gilles Stoltz; Sébastien Bubeck; Rémi Munos
Détail
Theoretical Computer Science, 2011, Vol.412, issue 19, p.1832-1852
Accès au bibtex
BibTex
Titre
On the relation between realizable and non-realizable cases of the sequence prediction problem
Auteurs
Daniil Ryabko
Détail
Journal of Machine Learning Research, Microtome Publishing, 2011, 12, pp. 2161-2180
Accès au bibtex
BibTex
Titre
Constructing perfect steganographic systems
Auteurs
Boris Ryabko; Daniil Ryabko
Détail
Information and Computation, Elsevier, 2011, 209 (9), pp. 1223-1230
Accès au bibtex
BibTex
Titre
Identification of microbial and proteomic biomarkers in early childhood caries
Auteurs
Thomas Hart; Patricia Corby; Milos Hauskrecht; Ok Hee Ryu; Richard Pelikan; Michal Valko; Maria Oliveira; Gerald Hoehn; Walter Bretz
Détail
International Journal of Dentistry, Hindawi Publishing Corporation, 2011, 2011, pp. 196721
Accès au texte intégral et bibtex
hart2011indentification.pdf BibTex
Titre
Aligned carbon nanotube based ultrasonic microtransducers for durability monitoring in civil engineering
Auteurs
Bérengère Lebental; Pierre Chainais url; Pascale Chenevier; Nicolas Chevalier; Eric Delevoye; Jean-Marc Fabbri; Sergio Nicoletti; Philippe Renaux; Anne Ghis
Détail
Nanotechnology, 2011, 22 (39), pp. 395501
Accès au texte intégral et bibtex
Lebental_Nanotechnology_2011.pdf BibTex

Communications avec actes

Titre
Selecting the State-Representation in Reinforcement Learning
Auteurs
Odalric-Ambrym Maillard; Rémi Munos; Daniil Ryabko
Détail
Neural Information Processing Systems, Dec 2011, Granada, Spain.
Accès au bibtex
BibTex
Titre
Conditional Anomaly Detection Using Soft Harmonic Functions: An Application to Clinical Alerting
Auteurs
Michal Valko; Hamed Valizadegan; Branislav Kveton; Gregory Cooper; Milos Hauskrecht
Détail
The 28th International Conference on Machine Learning Workshop on Machine Learning for Global Challenges, Jun 2011, Seattle, United States.
Accès au texte intégral et bibtex
valko2011conditional.pdf BibTex
Titre
Classification-based Policy Iteration with a Critic
Auteurs
Victor Gabillon; Alessandro Lazaric; Mohammad Ghavamzadeh; Bruno Scherrer
Détail
International Conference on Machine Learning (ICML), Jun 2011, Seattle, United States. ACM, Proceedings of the 28 th International Conference on Machine Learning, pp. 1049-1056
Accès au texte intégral et bibtex
dpi-critic.pdf BibTex
Titre
Multi-Sensor PHD by Space Partionning: Computation of a True Reference Density Within The PHD Framework
Auteurs
Emmanuel Delande; Emmanuel Duflos; Philippe Vanheeghe; Dominique Heurguier
Détail
IEEE - Signal Processing Society. Statistical Signal Processing Workshop (SSP), 2011, Jun 2011, Nice, France. IEEE - Signal Processing Society, Statistical Signal Processing Workshop (SSP), pp. 333 - 336
Accès au texte intégral et bibtex
SSP2011.pdf BibTex
Titre
A Finite-Time Analysis of Multi-armed Bandits Problems with Kullback-Leibler Divergences
Auteurs
Odalric-Ambrym Maillard; Rémi Munos; Gilles Stoltz
Détail
Sham Kakade & Ulrike von Luxburg. 24th Annual Conference on Learning Theory : COLT'11, Jul 2011, Budapest, Hungary. pp. 18
Accès au texte intégral et bibtex
66-Maillard-Munos-Stoltz.pdf 66-Maillard-Munos-Stoltz.ps BibTex
Titre
Learning vocal tract variables with multi-task kernels
Auteurs
Hachem Kadri; Emmanuel Duflos url; Philippe Preux
Détail
International Conference on Acoustic, Speech and Signal Processing (ICASSP), May 2011, Pragues, Czech Republic. pp. 2200-2203
Accès au bibtex
BibTex
Titre
On selecting the hyperparameters of the DPM models for the density estimation of observation errors
Auteurs
Asma Rabaoui url; Emmanuel Duflos url; Juliette Marais; Nicolas Viandier
Détail
International Conference on Acoustic, Speech and Signal Processing (ICASSP°, May 2011, Prague, Czech Republic. pp. 4092-4095
Accès au bibtex
BibTex
Titre
Multi-sensor PHD: Construction and implementation by space partitioning
Auteurs
Emmanuel Delande; Emmanuel Duflos url; Philippe Vanheeghe; Dominique Heurguier
Détail
IEEE International Conference on Acoustic Speech and Signal Processing, May 2011, Prague, Czech Republic. pp. 3632-3635
Accès au bibtex
BibTex
Titre
Multi-Sensor PHD: Construction and Implementation by Space Partitioning
Auteurs
Emmanuel Delande; Emmanuel Duflos; Philippe Vanheeghe; Dominique Heurguier
Détail
IEEE - Signal Processing Society. International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2011, May 2011, Prague, Czech Republic. IEEE - Signal Processing Society, pp. 3632 - 3635
Accès au texte intégral et bibtex
ICASSP2011.pdf BibTex
Titre
Impulsive Interference Mitigation in Ad Hoc Networks Based on Alpha-Stable Modeling and Particle Filtering
Auteurs
Nouha Jaoua; Emmanuel Duflos; Philippe Vanheeghe; Laurent Clavier; François Septier
Détail
IEEE - Signal Processing Society. International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2011, May 2011, Prague, Czech Republic. IEEE - Signal Processing Society, pp. 3548 - 3551
Accès au texte intégral et bibtex
ICASSP2011.pdf BibTex
Titre
Handling Expensive Optimization with Large Noise
Auteurs
Rémi Coulom; Philippe Rolet; Nataliya Sokolovska; Olivier Teytaud
Détail
ACM. Foundations of Genetic Algorithms, Jan 2011, Austria. pp. TBA
Accès au texte intégral et bibtex
foga10noise.pdf BibTex
Titre
Confidence Sets in Time-Series Filtering
Auteurs
Boris Ryabko; Daniil Ryabko
Détail
IEEE International Symposium on Information Theory, Jul 2011, St. Petersburg, Russian Federation. IEEE, Proceedings of IEEE International Symposium on Information Theory, pp. 2436-2438
Accès au bibtex
BibTex
Titre
Conditional Anomaly Detection with Soft Harmonic Functions
Auteurs
Michal Valko; Branislav Kveton; Hamed Valizadegan; Gregory Cooper; Milos Hauskrecht
Détail
Proceedings of the 2011 IEEE International Conference on Data Mining, Dec 2011, Vancouver, Canada.
Accès au texte intégral et bibtex
valko2011conditionala.pdf BibTex

Conférences invitées

Titre
Finite-Time Analysis of Stratified Sampling for Monte Carlo
Auteurs
Alexandra Carpentier; Rémi Munos
Détail
NIPS - Twenty-Fifth Annual Conference on Neural Information Processing Systems, Dec 2011, Grenade, Spain.
Accès au texte intégral et bibtex
mc-ucb_3.pdf BibTex
Titre
Upper-Confidence-Bound Algorithms for Active Learning in Multi-Armed Bandits
Auteurs
Alexandra Carpentier url; Alessandro Lazaric; Mohammad Ghavamzadeh; Rémi Munos; Peter Auer
Détail
ALT - the 22nd conference on Algorithmic Learning Theory, Oct 2011, Espoo, Finland.
Accès au texte intégral et bibtex
adapt_alloc_tech-report.pdf BibTex

Chapitres d'ouvrages scientifiques

Titre
Bandit view on noisy optimization
Auteurs
Jean-Yves Audibert; Sébastien Bubeck; Rémi Munos
Détail
Optimization for Machine Learning, MIT Press, pp. 431-454, Dec. 2011, 978-0-262-01646-9
Accès au bibtex
BibTex

HDR

Titre
APPRENABILITÉ DANS LES PROBLÈMES DE L'INFÉRENCE SÉQUENTIELLE
Auteurs
Daniil Ryabko url
Détail
Université des Sciences et Technologie de Lille - Lille I, Dec. 2011. English
Accès au texte intégral et bibtex
hdr_hal.pdf BibTex

Rapports

Titre
Multi-Bandit Best Arm Identification
Auteurs
Victor Gabillon; Mohammad Ghavamzadeh; Alessandro Lazaric; Sébastien Bubeck
Détail
[Report], 2011
Accès au texte intégral et bibtex
multi-bandit_techreport.pdf BibTex
Titre
Reinforcement Learning with a Near Optimal Rate of Convergence
Auteurs
Mohammad Gheshlaghi Azar; Rémi Munos; Mohammad Ghavamzadeh; Hilbert Kappen
Détail
[Technical Report], 2011
Accès au texte intégral et bibtex
SQL_vNov19.pdf BibTex
Titre
Automatic motor task selection via a bandit algorithm for a brain-controlled button
Auteurs
Joan Fruitet; Alexandra Carpentier; Rémi Munos; Maureen Clerc
Détail
[Research Report], 2011. RR-7721
Accès au texte intégral et bibtex
RR-7721.pdf BibTex
Titre
Transfer from Multiple MDPs
Auteurs
Alessandro Lazaric; Marcello Restelli
Détail
[Technical Report], 2011
Accès au texte intégral et bibtex
sourcetransfer-tech.pdf sourcetransfer-tech.ps BibTex
Titre
Classification-based Policy Iteration with a Critic
Auteurs
Victor Gabillon; Alessandro Lazaric; Mohammad Ghavamzadeh; Bruno Scherrer
Détail
[Report], 2011
Accès au texte intégral et bibtex
dpi-critic-techReport.pdf BibTex
Titre
Operator-Valued Kernels for Nonparametric Operator Estimation
Auteurs
Hachem Kadri; Philippe Preux; Emmanuel Duflos; Stephane Canu
Détail
[Research Report], 2011. RR-7607
Accès au texte intégral et bibtex
RR-7607.pdf BibTex
Titre
Adaptive Bandits: Towards the best history-dependent strategy
Auteurs
Odalric-Ambrym Maillard; Rémi Munos
Détail
[Technical Report], 2011, pp. 14
Accès au texte intégral et bibtex
AdaptiveBandits_HAL.pdf BibTex

Thèses

Titre
Adaptive Graph-Based Algorithms for Conditional Anomaly Detection and Semi-Supervised Learning
Auteurs
Michal Valko url
Détail
information cognition et apprentissages. University of Pittsburgh, Aug. 2011. English
Accès au texte intégral et bibtex
valko2011adaptive_1.pdf BibTex

Documents sans référence de publication

Titre
Datum-Wise Classification: A Sequential Approach to Sparsity
Auteurs
Gabriel Dulac-Arnold; Ludovic Denoyer; Philippe Preux; Patrick Gallinari
Détail
Aug. 2011. ECML2011
Accès au bibtex
BibTex

2010

Articles dans des revues avec comité de lecture

Titre
Regret Bounds and Minimax Policies under Partial Monitoring
Auteurs
Jean-Yves Audibert; Sébastien Bubeck
Détail
Journal of Machine Learning Research, 2010, 11, pp. 2785-2836
Accès au texte intégral et bibtex
JMLR10.pdf BibTex
Titre
Discrimination between B-processes is impossible
Auteurs
Daniil Ryabko
Détail
Journal of Theoretical Probability, Sprnger, 2010, 23 (2), pp. 565-575
Accès au bibtex
BibTex
Titre
Nonparametric Statistical Inference for Ergodic Processes
Auteurs
Daniil Ryabko; Boris Ryabko
Détail
IEEE Transactions on Information Theory, IEEE, 2010, 56 (3), pp. 1430-1435
Accès au texte intégral et bibtex
3s_fa.pdf 3s_fa.ps BibTex
Titre
On Finding Predictors for Arbitrary Families of Processes
Auteurs
Daniil Ryabko
Détail
Journal of Machine Learning Research, Microtome Publishing, 2010, 11, pp. 581-602
Accès au texte intégral et bibtex
pq3+.pdf pq3+.ps BibTex

Communications avec actes

Titre
The Iso-regularization Descent Algorithm for the LASSO
Auteurs
Manuel Loth; Philippe Preux
Détail
17th International Conference on Neural Information Processing, Nov 2010, Sidney, Australia.
Accès au texte intégral et bibtex
master.pdf BibTex
Titre
Advertising Campaigns Management: Should We Be Greedy?
Auteurs
Sertan Girgin; Jérémie Mary; Philippe Preux; Olivier Nicol
Détail
IEEE International Conference on Data Mining, Dec 2010, Sydney, Australia.
Accès au texte intégral et bibtex
RR-7388.pdf BibTex
Titre
Advanced signal processing techniques for multipath mitigation in land transportation environment
Auteurs
Juliette Marais; Emmanuel Duflos url; Nicolas Viandier; Donnay Nahimana; Asma Rabaoui url
Détail
International IEEE Conference on Intelligent Transportation Systems (ITSC), Sep 2010, Funchal, France. pp. 1480-1485
Accès au bibtex
BibTex
Titre
GNSS pseudorange error density tracking using Dirichlet Process Mixture
Auteurs
Nicolas Viandier; Asma Rabaoui url; Juliette Marais; Emmanuel Duflos url
Détail
FUSION 2010, Jul 2010, Edinburgh, United Kingdom. pp. 1-7
Accès au bibtex
BibTex
Titre
Online Semi-Supervised Perception: Real-Time Learning without Explicit Feedback
Auteurs
Branislav Kveton; Michal Valko; Mathai Phillipose; Ling Huang
Détail
4th IEEE Online Learning for Computer Vision Workshop, Jun 2010, San Francisco, United States.
Accès au texte intégral et bibtex
kveton2010online.pdf BibTex
Titre
Online Semi-Supervised Learning on Quantized Graphs
Auteurs
Michal Valko; Branislav Kveton; Huang Ling; Ting Daniel
Détail
The 26nd Annual Conference on Uncertainty in Artificial Intelligence, Jun 2010, Catalina Island, United States.
Accès au texte intégral et bibtex
valko2010online.pdf BibTex
Titre
Semi-Supervised Learning with Max-Margin Graph Cuts
Auteurs
Branislav Kveton; Michal Valko; Ali Rahimi; Ling Huang
Détail
Thirteenth International Conference on Artificial Intelligence and Statistics, May 2010, Chia Laguna, Sardinia, Italy.
Accès au texte intégral et bibtex
kveton2010semi-supervised.pdf BibTex
Titre
Studies on DPM for the density estimation of pseudorange noises and evaluations on real data
Auteurs
Juliette Marais; Asma Rabaoui url; Emmanuel Duflos url
Détail
Position Location and Navigation Symposium (PLANS), 2010 IEEE/ION, May 2010, Indian Wells, CA, USA, United States. pp. 1154-1161
Accès au bibtex
BibTex
Titre
Nonlinear functional regression: a functional RKHS approach
Auteurs
Hachem Kadri; Emmanuel Duflos; Philippe Preux; Stephane Canu; Manuel Davy
Détail
Thirteenth International Conference on Artificial Intelligence and Statistics (AISTATS'10), 2010, Italy. 9, pp. 374-380
Accès au texte intégral et bibtex
HK_AISTATS2010.pdf BibTex
Titre
Testing composite hypotheses about discrete-valued stationary processes
Auteurs
Daniil Ryabko
Détail
IEEE Information Theory Workshop, 2010, Cairo, Egypt. IEEE, pp. 291-295
Accès au bibtex
BibTex
Titre
Uniform hypothesis testing for ergodic time series distributions
Auteurs
Daniil Ryabko
Détail
IEEE R8 International Conference on Computational Technologies in Electrical and Electronics Engineering, 2010, Irkutsk, Russian Federation. IEEE, pp. 23-27
Accès au bibtex
BibTex
Titre
Feature importance analysis for patient management decisions
Auteurs
Michal Valko; Milos Hauskrecht
Détail
13th International Congress on Medical Informatics MEDINFO 2010, Sep 2010, Cape Town, South Africa. IOS Press, MEDINFO 2010 - Proceedings of the 13th World Congress on Medical Informatics, pp. 861-865
Accès au texte intégral et bibtex
valko2010feature.pdf BibTex
Titre
Best Arm Identification in Multi-Armed Bandits
Auteurs
Jean-Yves Audibert; Sébastien Bubeck
Détail
COLT - 23th Conference on Learning Theory - 2010, Jun 2010, Haifa, Israel. 13 p.
Accès au texte intégral et bibtex
COLT10.pdf BibTex
Titre
Sequence prediction in realizable and non-realizable cases
Auteurs
Daniil Ryabko
Détail
Conference on Learning Theory, 2010, Haifa, Israel. pp. 119-131, COLT
Accès au texte intégral et bibtex
pqout.pdf pqout.ps BibTex
Titre
Clustering processes
Auteurs
Daniil Ryabko
Détail
27th International Conference on Machine Learning, Jun 2010, Haifa, Israel. pp. 919-926
Accès au texte intégral et bibtex
clust_hal.pdf clust_hal.ps BibTex
Titre
Online Learning in Adversarial Lipschitz Environments
Auteurs
Odalric Maillard; Rémi Munos
Détail
European Conference on Machine Learing, 2010, Barcelone, Spain. Springer
Accès au texte intégral et bibtex
ALF_ecml10.pdf BibTex

Communications sans actes

Titre
Simulation-based search of combinatorial games
Auteurs
Lukasz Lew; Rémi Coulom
Détail
ICML 2010 : Workshop on Machine Learning and Games, Jun 2010, Haifa, Israel.
Accès au bibtex
BibTex

Chapitres d'ouvrages scientifiques

Titre
Robust Unsupervised Speaker Segmentation for Audio Diarization
Auteurs
Kadri Hachem; Manuel Davy; Noureddine Ellouze
Détail
Signal Processing, INTECH, pp. 307-320, 2010
Accès au texte intégral et bibtex
HK_Intech_BookChapter.pdf BibTex

Documents associés à des manifestations scientifiques (Tutoriel, poster/prés./préface, papier court, digest de conférence, …)

Titre
Finite sample analysis of Least Squares Temporal Differences
Auteurs
Rémi Munos
Détail
[Conference digest]. Journées MAS et Journée en l'honneur de Jacques Neveu, Aug 2010, Talence, France
Accès au texte intégral et bibtex
REN-Munos.pdf BibTex

Rapports

Titre
Linear regression with random projections
Auteurs
Odalric-Ambrym Maillard; Rémi Munos
Détail
[Technical Report], 2010, pp. 22
Accès au texte intégral et bibtex
jmlr_blsr.pdf BibTex
Titre
LSPI with Random Projections
Auteurs
Mohammad Ghavamzadeh; Alessandro Lazaric; Odalric Maillard; Rémi Munos
Détail
[Technical Report], 2010
Accès au texte intégral et bibtex
randproj-lspi.pdf BibTex
Titre
Finite-Sample Analysis of Least-Squares Policy Iteration
Auteurs
Alessandro Lazaric; Mohammad Ghavamzadeh; Rémi Munos
Détail
[Technical Report], 2010
Accès au texte intégral et bibtex
lspi-jmlr.pdf BibTex
Titre
Multi-target PHD filtering: proposition of extensions to the multi-sensor case
Auteurs
Emmanuel Delande; Emmanuel Duflos; Dominique Heurguier; Philippe Vanheeghe
Détail
[Research Report], 2010, pp. 64. RR-7337
Accès au texte intégral et bibtex
PHD-21-12-10.pdf BibTex
Titre
Brownian Motions and Scrambled Wavelets for Least-Squares Regression
Auteurs
Odalric-Ambrym Maillard; Rémi Munos
Détail
[Technical Report], 2010, pp. 13
Accès au texte intégral et bibtex
blsr.pdf BibTex
Titre
Finite-Sample Analysis of LSTD
Auteurs
Alessandro Lazaric; Mohammad Ghavamzadeh; Remi Munos
Détail
[Technical Report], 2010
Accès au texte intégral et bibtex
lstd-tech.pdf BibTex
Titre
Analysis of a Classification-based Policy Iteration Algorithm
Auteurs
Alessandro Lazaric; Mohammad Ghavamzadeh; Remi Munos
Détail
[Technical Report], 2010
Accès au texte intégral et bibtex
dpi-jmlr.pdf BibTex
Titre
Bayesian Multi-Task Reinforcement Learning
Auteurs
Alessandro Lazaric; Mohammad Ghavamzadeh
Détail
[Technical Report], 2010
Accès au texte intégral et bibtex
bmtl.pdf BibTex
Titre
Brownian Motions and Scrambled Wavelets for Least-Squares Regression
Auteurs
Odalric-Ambrym Maillard; Rémi Munos
Détail
[Research Report], 2010
Accès au texte intégral et bibtex
blsr.pdf BibTex
Titre
Uniform hypothesis testing for ergodic time series distributions
Auteurs
Daniil Ryabko
Détail
[Research Report], 2010
Accès au texte intégral et bibtex
1u_arx.pdf 1u_arx.ps BibTex

Documents sans référence de publication

Titre
Pure Exploration for Multi-Armed Bandit Problems
Auteurs
Sébastien Bubeck; Rémi Munos; Gilles Stoltz
Détail
Jun. 2010
Accès au texte intégral et bibtex
BMS--TCS09.pdf BMS--TCS09.ps BibTex

2009

Articles dans des revues avec comité de lecture

Titre
Radar Optimal Times Detection Allocation in Multitarget Environment
Auteurs
Marie De Vilmorin; Emmanuel Duflos; Philippe Vanheeghe
Détail
Systems Journal, IEEE, IEEE, 2009, Systems Journal, IEEE, 3 (2), pp. 210-220
Accès au texte intégral et bibtex
article.pdf BibTex
Titre
Asymptotically Optimal Perfect Steganographic Systems
Auteurs
Boris Ryabko; Daniil Ryabko
Détail
Problems of Information Transmission, MAIK Nauka/Interperiodica, 2009, 45 (2), pp. 184-190
Accès au bibtex
BibTex
Titre
Using data compressors to construct order tests for homogeneity and component independence
Auteurs
Daniil Ryabko; Juergen Schmidhuber
Détail
Applied Mathematics Letters, Elsevier, 2009, 22 (7), pp. 1029-1032
Accès au bibtex
BibTex
Titre
Exploration-exploitation tradeoff using variance estimates in multi-armed bandits
Auteurs
Jean-Yves Audibert; Remi Munos; Csaba Szepesvari
Détail
Theoretical Computer Science, 2009, 410 (19), pp. 1876-1902
Accès au bibtex
BibTex
Titre
Hybrid Stochastic-Adversarial On-line Learning
Auteurs
Lazaric Alessandro; Rémi Munos
Détail
COLT, COLT, 2009
Accès au texte intégral et bibtex
estochad.pdf BibTex

Communications avec actes

Titre
ECON: a Kernel Basis Pursuit Algorithm with Automatic Feature Parameter Tuning, and its Application to Photometric Solids Approximation
Auteurs
Loth Manuel; Preux Philippe; Delepoulle Samuel; Renaud Christophe
Détail
IEEE Press. International Conference on Machine Learning and Applications, Dec 2009, Miami, United States.
Accès au texte intégral et bibtex
icmla2009.pdf BibTex
Titre
Compressed Least-Squares Regression
Auteurs
Odalric-Ambrym Maillard; Rémi Munos
Détail
NIPS 2009, Dec 2009, Vancouver, Canada.
Accès au texte intégral et bibtex
cls_nips.pdf BibTex
Titre
Enhancement of Galileo and multi-constellation accuracy by modeling pseudorange noises
Auteurs
Nicolas Viandier; Asma Rabaoui url; Juliette Marais; Emmanuel Duflos url
Détail
Intelligent Transport Systems Telecommunications, (ITST), Oct 2009, Lille, France. pp. 459-464
Accès au bibtex
BibTex
Titre
On the use of Dirichlet process mixtures for the modelling of pseudorange errors in multi-constellation based localisation
Auteurs
Asma Rabaoui url; Nicolas Viandier; Juliette Marais; Emmanuel Duflos url
Détail
International Conference on Intelligent Transport Systems Telecommunications, (ITST), Oct 2009, Lille, France. pp. 465-470
Accès au bibtex
BibTex
Titre
Real world implementation of belief function theory to detect dislocation of materials in construction
Auteurs
S.N. Razavi; Carl Haas; Philippe Vanheeghe; Emmanuel Duflos url
Détail
FUSION 2009, Jul 2009, Seattle, WA, United States. pp. 748-755
Accès au bibtex
BibTex
Titre
Feature Discovery in Approximate Dynamic Programming
Auteurs
Philippe Preux; Sertan Girgin; Manuel Loth
Détail
Approximate Dynamic Programming and Reinforcement Learning, Mar 2009, Nashville, United States. IEEE
Accès au bibtex
BibTex
Titre
Using Kolmogorov Complexity for Understanding Some Limitations on Steganography
Auteurs
Boris Ryabko; Daniil Ryabko
Détail
IEEE International Symposium on Information Theory, 2009, seoul, Korea, Republic Of. IEEE, pp. 2733-2736
Accès au bibtex
BibTex
Titre
An impossibility result for process discrimination
Auteurs
Daniil Ryabko
Détail
IEEE International Symposium on Information Theory, 2009, seoul, Korea, Republic Of. IEEE, pp. 1734-1738
Accès au bibtex
BibTex
Titre
Characterizing predictable classes of processes
Auteurs
Daniil Ryabko
Détail
UAI, 2009, Montreal, Canada. Proceedings of the 25th Conference on Uncertainty in Artificial Intelligence (UAI'09), pp. 471-478
Accès au texte intégral et bibtex
pq3_a.pdf pq3_a.ps BibTex

Directions d'ouvrages

Titre
Recent Advances in Reinforcement Learning
Auteurs
Sertan Girgin; Manuel Loth; Rémi Munos; Philippe Preux; Daniil Ryabko
Détail
Springer, Lectures Notes in Artificial Intelligence (LNAI), vol. 5323, pp. 281, Feb. 2009
Accès au bibtex
BibTex
Titre
Recent Advances in Reinforcement Learning
Auteurs
Sertan Girgin; Manuel Loth; Rémi Munos; Philippe Preux; Daniil Ryabko
Détail
Sertan Girgin and Manuel Loth and Rémi Munos and Philippe Preux and Daniil Ryabko. LNAI 5323, Springer, pp. 281, 2009
Accès au bibtex
BibTex

Rapports

Titre
General Framework for Nonlinear Functional Regression with Reproducing Kernel Hilbert Spaces
Auteurs
Hachem Kadri; Emmanuel Duflos; Manuel Davy; Philippe Preux; Stephane Canu
Détail
[Research Report], 2009. RR-6908
Accès au texte intégral et bibtex
RR-6908.pdf BibTex
Titre
A criterion for hypothesis testing for stationary processes
Auteurs
Daniil Ryabko
Détail
[Research Report], 2009
Accès au texte intégral et bibtex
1c.pdf 1c.ps BibTex

2008

Articles dans des revues avec comité de lecture

Titre
Using One-Class SVMs and Wavelets for Audio Surveillance
Auteurs
Asma Rabaoui; Manuel Davy; Stéphane Rossignol; Noureddine Ellouze
Détail
IEEE Transactions on Information Forensics and Security, 2008, 3 (4), pp. 763-775
Accès au bibtex
BibTex
Titre
Least commited basic belief density induced by a multivariate Gaussian: formulation with applications.
Auteurs
Francois Caron; Branko Ristic; Emmanuel Duflos; Philippe Vanheeghe
Détail
International Journal of Approximate Reasoning, 2008, 48(2), pp. 419-436
Accès au bibtex
BibTex
Titre
On the Possibility of Learning in Reactive Environments with Arbitrary Dependence
Auteurs
Daniil Ryabko; M. Hutter
Détail
Theoretical Computer Science, Elsevier, 2008, 405, pp. 274-284
Accès au bibtex
BibTex
Titre
Predicting Non-Stationary Processes
Auteurs
Daniil Ryabko; M. Hutter
Détail
Applied Mathematics Letters, Elsevier, 2008, 21 (5), pp. 477-482
Accès au bibtex
BibTex

Communications avec actes

Titre
Incremental Basis Function Expansion in Reinforcement Learning using Cascade-Correlation Networks
Auteurs
Sertan Girgin; Philippe Preux
Détail
International Conference on Machine Learning and Applications, Dec 2008, San Diego, United States. IEEE Press, pp. 75-82
Accès au bibtex
BibTex
Titre
Some Sufficient Conditions on an Arbitrary Class of Stochastic Processes for the Existence of a Predictor
Auteurs
Daniil Ryabko
Détail
International Conference on Algorithmic Learning Theory, 2008, Budapest, Hungary. Springer, LNAI 5254, pp. 169-182
Accès au bibtex
BibTex
Titre
Conditional anomaly detection methods for patient-management alert systems
Auteurs
Michal Valko; Gregory Cooper; Amy Seybert; Shyam Visweswaran; Melissa Saul; Milos Hauskrecht
Détail
Workshop on Machine Learning in Health Care Applications in The 25th International Conference on Machine Learning, Jul 2008, Helsinki, Finland.
Accès au texte intégral et bibtex
valko2008conditional.pdf BibTex
Titre
Distance Metric Learning for Conditional Anomaly Detection
Auteurs
Michal Valko; Milos Hauskrecht
Détail
Twenty-First International Florida Artificial Intelligence Research Society Conference, May 2008, Coconut Grove, Florida, United States. AAAI Press
Accès au texte intégral et bibtex
Valko.pdf BibTex
Titre
Learning predictive models for combinations of heterogeneous proteomic data sources
Auteurs
Michal Valko; Richard Pelikan; Milos Hauskrecht
Détail
AMIA Summit on Translational Bioinformatics, Mar 2008, San Francisco, United States.
Accès au texte intégral et bibtex
valko2008learning.pdf BibTex
Titre
Whole-History Rating: A Bayesian Rating System for Players of Time-Varying Strength
Auteurs
Rémi Coulom
Détail
van den Herik, H. J. and Xu, Xinhe and Ma, Zongming and Winands, M.H.M.. Computer and Games, Sep 2008, Beijing, China. Springer, Computers and Games, 5131, pp. 113-124, Lectures Notes in Computer Science
Accès au texte intégral et bibtex
WHR.pdf BibTex
Titre
Online Optimization in X-Armed Bandits
Auteurs
Sébastien Bubeck; Rémi Munos; Gilles Stoltz; Csaba Szepesvari
Détail
Twenty-Second Annual Conference on Neural Information Processing Systems, Dec 2008, Vancouver, Canada.
Accès au texte intégral et bibtex
HOO_non-anonymous.pdf BibTex
Titre
Basis Function Construction in Reinforcement Learning using Cascade-Correlation Learning Architecture
Auteurs
Sertan Girgin; Philippe Preux
Détail
8th International Conference on Machine Learning and Applications, Dec 2008, La Jolla, United States. IEEE
Accès au bibtex
BibTex
Titre
Basis Expansion in Natural Actor Critic Methods
Auteurs
Sertan Girgin; Philippe Preux
Détail
Sertan Girgin and Manuel Loth and Rémi Munos and Philippe Preux and Daniil Ryabko. European Workshop on Reinforcement Learning, Jun 2008, Villeneuve d'Ascq, France. Springer, Recent Advances in Reinforcement Learning, 5323, pp. 111-124, Lecture Notes in Artificial Intelligence
Accès au texte intégral et bibtex
ewrl08.pdf BibTex
Titre
Some sufficient conditions on an arbitrary class of stochastic processes for the existence of a predictor.
Auteurs
Daniil Ryabko
Détail
Freund, Y.; Györfi, L.; Turán, G.; Zeugmann, Th.. 19th International Conference on Algorithmic Learning Theory, ALT 2008, Oct 2008, Budapest, Hungary. 5254, Lecture Notes in Artificial Intelligence
Accès au texte intégral et bibtex
pq_.pdf BibTex
Titre
Feature Discovery in Approximate Dynamic Programming
Auteurs
Philippe Preux; Sertan Girgin; Manuel Loth
Détail
IEEE International Symposium on Adaptive Dynamic Programming and Reinforcement Learning, Mar 2009, Nashville, United States. 2008
Accès au bibtex
BibTex
Titre
Incremental Basis Function Expansion in Reinforcement Learning using Cascade-Correlation Networks
Auteurs
Sertan Girgin; Philippe Preux
Détail
8th International Conference on Machine Learning and Applications, Dec 2008, San Diego, United States. IEEE Press
Accès au texte intégral et bibtex
icmla08.pdf BibTex
Titre
Reception State Estimation of GNSS satellites in urban environment using particle filtering
Auteurs
Donnay Fleury Nahimana; Emmanuel Duflos; Juliette Marais
Détail
FUSION 2008, Jun 2008, Cologne, Germany.
Accès au texte intégral et bibtex
Paper_Fusion2008.pdf BibTex
Titre
Optimal Policies Search for Sensor Management
Auteurs
Thomas Bréhard; Emmanuel Duflos; Philippe Vanheeghe; Pierre-Arnaud Coquelin
Détail
FUSION 2008, Jun 2008, Cologne, Germany. pp. 1 - 8
Accès au texte intégral et bibtex
Fusion2008_SensorManagement_EDuflos.pdf Fusion2008_SensorManagement_EDuflos.ps BibTex

Rapports

Titre
Using Data Compressors to Construct Rank Tests
Auteurs
Daniil Ryabko; Juergen Schmidhuber
Détail
[Research Report], 2008
Accès au texte intégral et bibtex
tests.pdf tests.ps BibTex
Titre
Incremental Basis Function Expansion in Reinforcement Learning using Cascade-Correlation Networks
Auteurs
Sertan Girgin; Philippe Preux
Détail
[Research Report], 2008. RR-6505
Accès au texte intégral et bibtex
inria.ps inria.pdf BibTex
Titre
An impossibility result for process discrimination
Auteurs
Daniil Ryabko
Détail
[Research Report], 2008
Accès au texte intégral et bibtex
discr.pdf discr.ps BibTex
Titre
Sensitivity Analysis in Particle Filters. Application to Policy Optimization in POMDPs
Auteurs
Pierre Arnaud Coquelin; Romain Deguest; Rémi Munos
Détail
[Research Report], 2008. RR-6710
Accès au texte intégral et bibtex
RR6710.pdf BibTex
Titre
The Equi-Correlation Network: a New Kernelized-LARS with Automatic Kernel Parameters Tuning
Auteurs
Manuel Loth; Philippe Preux
Détail
[Research Report], 2008. RR-6794
Accès au texte intégral et bibtex
RR-6794.pdf BibTex

2007

Articles dans des revues avec comité de lecture

Titre
Analyse en norme Lp de l'algorithme d'itérations sur les valeurs avec approximations
Auteurs
Rémi Munos
Détail
Revue d'Intelligence Artificielle, Lavoisier, 2007, 21
Accès au texte intégral et bibtex
avi_RIA_final.pdf BibTex
Titre
Performance Bounds in Lp norm for Approximate Value Iteration
Auteurs
Rémi Munos
Détail
SIAM Journal on Control and Optimization, SIAM, 2007
Accès au texte intégral et bibtex
avi_siam_final.pdf avi_siam_final.ps BibTex

Articles dans des revues sans comité de lecture

Titre
L'Ordinateur, champion de go ?
Auteurs
Sylvain Gelly; Rémi Munos
Détail
Pour la sciences, Pour La Science, 2007, 354, pp. 28-35
Accès au bibtex
BibTex

Communications avec actes

Titre
A Unified View of TD Algorithms; Introducing Full-Gradient TD and Equi-Gradient Descent TD
Auteurs
Manuel Loth; Philippe Preux; Manuel Davy
Détail
European Symposium on Artificial Neural Networks, Apr 2007, Bruges, Belgium, Belgium.
Accès au texte intégral et bibtex
unified.ps unified.pdf BibTex
Titre
Sparse Temporal Difference Learning using LASSO
Auteurs
Manuel Loth; Manuel Davy; Philippe Preux
Détail
IEEE International Symposium on Approximate Dynamic Programming and Reinforcement Learning, Apr 2007, Hawaï, USA, United States.
Accès au texte intégral et bibtex
lassoTd.pdf BibTex
Titre
Value-Iteration Based Fitted Policy Iteration: Learning with a Single Trajectory
Auteurs
Andras Antos; Csaba Szepesvari; Rémi Munos
Détail
IEEE International Symposium on Approximate Dynamic Programming and Reinforcement Learning, 2007, Hawai, United States. pp. 2007
Accès au texte intégral et bibtex
sapi_adprl_final.pdf sapi_adprl_final.ps BibTex
Titre
A Dynamic Programming Approach to Viability Problems
Auteurs
Pierre-Arnaud Coquelin; Sophie Martin; Rémi Munos
Détail
IEEE ADPRL, Apr 2007, Hawai. Proceedings of the 2007 IEEE Symposium on Approximate Dynamic Programming and Reinforcement Learning (ADPRL 2007), pp. 178-184
Accès au texte intégral et bibtex
viabilite.pdf BibTex
Titre
Computing Elo Ratings of Move Patterns in the Game of Go
Auteurs
Rémi Coulom
Détail
van den Herik, H. Jaap and Mark Winands and Jos Uiterwijk and Maarten Schadd. Computer Games Workshop, Jun 2007, Amsterdam, Netherlands.
Accès au texte intégral et bibtex
MMGoPatterns.pdf BibTex
Titre
Bandit Algorithms for Tree Search
Auteurs
Pierre-Arnaud Coquelin; Rémi Munos
Détail
Uncertainty in Artificial Intelligence, 2007, Vancouver, Canada.
Accès au texte intégral et bibtex
BAST.pdf BibTex
Titre
Fitted Q-iteration in continuous action-space MDPs
Auteurs
Andras Antos; Rémi Munos; Csaba Szepesvari
Détail
Neural Information Processing Systems, 2007, Vancouver, Canada.
Accès au texte intégral et bibtex
rlca.pdf BibTex
Titre
Tuning bandit algorithms in stochastic environments
Auteurs
Jean-Yves Audibert; Rémi Munos; Csaba Szepesvari
Détail
Algorithmic Learning Theory, 2007, Sendai, Japan. pp. 150-165
Accès au texte intégral et bibtex
ucb_alt.pdf BibTex
Titre
Time Allocation of a Set of Radars in a Multitarget Environment
Auteurs
Emmanuel Duflos; Marie De Vilmorin; Philippe Vanheeghe
Détail
FUSION 2007, 2007, Québec, Canada.
Accès au texte intégral et bibtex
fusion2007_final.pdf fusion2007_final.ps BibTex

Conférences invitées

Titre
Monte-Carlo Tree Search in Crazy Stone
Auteurs
Rémi Coulom
Détail
Takeshi Ito and Akihiro Kishimoto. 12th Game Programming Workshop, Nov 2007, Hakone, Japan.
Accès au bibtex
BibTex
Titre
Consistent Minimization of Clustering Objective Functions
Auteurs
Ulrike Von Luxburg; Sébastien Bubeck; Stefanie Jegelka; Michael Kaufmann
Détail
Neural Information Processing Systems, Dec 2007, Vancouver, Canada.
Accès au texte intégral et bibtex
LuxburgBubeckJegelka_nips07.pdf BibTex

Rapports

Titre
Finite Time Bounds for Sampling-Based Fitted Value Iteration
Auteurs
Rémi Munos; Csaba Szepesvari
Détail
[Research Report], 2007, pp. 46
Accès au texte intégral et bibtex
savi_1.5.pdf savi_1.5.ps BibTex
Titre
Numerical methods for sensitivity analysis of Feynman-Kac models
Auteurs
Pierre-Arnaud Coquelin; Romain Deguest; Rémi Munos
Détail
[Research Report], 2007
Accès au texte intégral et bibtex
gradient.pdf BibTex
Titre
Bandit Algorithms for Tree Search
Auteurs
Pierre-Arnaud Coquelin; Rémi Munos
Détail
[Research Report], 2007, pp. 20. RR-6141
Accès au texte intégral et bibtex
RR-6141.pdf RR-6141.ps BibTex
Titre
Fitted Q-iteration in continuous action-space MDPs
Auteurs
Andras Antos; Rémi Munos; Csaba Szepesvari
Détail
[Technical Report], 2007, pp. 24
Accès au texte intégral et bibtex
rlca.pdf BibTex
Titre
Feature Discovery in Reinforcement Learning using Genetic Programming
Auteurs
Sertan Girgin; Philippe Preux
Détail
[Research Report], 2007
Accès au texte intégral et bibtex
RR-6358.pdf RR-6358.ps BibTex
Titre
Optimal Policies Search for Sensor Management : Application to the AESA Radar
Auteurs
Thomas Bréhard; Pierre-Arnaud Coquelin; Emmanuel Duflos
Détail
[Research Report], 2007, pp. 21. RR-6361
Accès au texte intégral et bibtex
RR-6361.pdf RR-6361.ps BibTex

Documents sans référence de publication

Titre
Nearest Neighbor Clustering: A Baseline Method for Consistent Clustering with Arbitrary Objective Functions
Auteurs
Sébastien Bubeck; Ulrike Von Luxburg
Détail
Nov. 2007
Accès au texte intégral et bibtex
bubeck09a.pdf BibTex
Titre
A Dynamic Programming Approach to Viability Problems
Auteurs
Pierre-Arnaud Coquelin; Sophie Martin; Rémi Munos
Détail
Jan. 2007
Accès au texte intégral et bibtex
viabilite.pdf BibTex
Titre
Numerical methods for sensitivity analysis of Feynman-Kac models
Auteurs
Pierre-Arnaud Coquelin; Romain Deguest; Rémi Munos
Détail
Jan. 2007
Accès au texte intégral et bibtex
gradient.pdf BibTex

2006

Articles dans des revues avec comité de lecture

Titre
Policy Gradient in Continuous Time
Auteurs
Rémi Munos
Détail
Journal of Machine Learning Research, Microtome Publishing, 2006, 7, pp. 771-791
Accès au texte intégral et bibtex
munos06b.pdf BibTex
Titre
Geometric Variance Reduction in Markov Chains: Application to Value Function and Gradient Estimation
Auteurs
Rémi Munos
Détail
Journal of Machine Learning Research, Microtome Publishing, 2006, 7, pp. 413-427
Accès au texte intégral et bibtex
fast_mc_jmlr.pdf BibTex
Titre
An anti-diffusive scheme for viability problems
Auteurs
Olivier Bokanowski; Sophie Martin; Rémi Munos; Hasnaa Zidani
Détail
Applied Numerical Mathematics, Elsevier, 2006, 56 (9), pp. 1147-1162
Accès au texte intégral et bibtex
bokanowski.pdf bokanowski.ps BibTex
Titre
Numerical methods for the pricing of Swing options: a stochastic control approach
Auteurs
Christophe Barrera-Esteve; Florent Bergeret; Charles Dossal; Emmanuel GOBET; Asma Meziou; Rémi Munos; Damien Reboul-Salze
Détail
Methodology And Computing In Applied Probability, Springer Netherlands, 2006, Methodology and Computing in Applied Probability, 8 (4), pp. 517-540
Accès au texte intégral et bibtex
swing.pdf BibTex
Titre
Bayesian Analysis of Polyphonic western tonal Music
Auteurs
Manuel Davy; Simon J. Godsill; Jérôme Idier
Détail
Journal of the Acoustical Society of America, American Inst of Physics, USA, 2006, 119 (4), pp. 2498-2517
Accès au bibtex
BibTex
Titre
An Online Support Vector Machine for Abnormal Events Detection
Auteurs
Manuel Davy; Frederic Desobry; Arthur Gretton; Christian Doncarli
Détail
Signal Processing, Elsevier, 2006, 86 (8), pp. 2009-2025
Accès au bibtex
BibTex
Titre
Bayesian Inference for Linear Dynamic Models with Dirichlet Process Mixtures
Auteurs
François Caron; Manuel Davy; Arnaud Doucet; Emmanuel Duflos; Philippe Vanheeghe
Détail
IEEE Transactions on Signal Processing, IEEE Signal Processing Society, 2006
Accès au texte intégral et bibtex
IEEESP06R3.pdf IEEESP06R3.ps BibTex
Titre
Intrinsic 2D/3D registration based on a hybrid approach: use in the radiosurgical imaging process.
Auteurs
Maximilien Vermandel; Nacim Betrouni; Jean-Yves Gauvrit; David Pasquier; Christrian Vasseur; Jean Rousseau
Détail
Cellular and Molecular Biology (Noisy-le-Grand, France), 2006, 52 (6), pp. 44-53
Accès au texte intégral et bibtex
CellMolBiol_vermandel.pdf BibTex

Communications avec actes

Titre
Equi-Gradient Temporal Difference Learning
Auteurs
Manuel Loth; Manuel Davy; Rémi Coulom; Philippe Preux
Détail
Kernel Methods and Reinforcement Learning, workshop of ICML 2006, Jun 2006, Pittsburgh, USA, United States.
Accès au texte intégral et bibtex
Loth_ICML_KRL_2006.pdf BibTex
Titre
A Comparison of Chief Complaints and Emergency Department Reports for Identifying Patients with Acute Lower Respiratory Syndrome
Auteurs
Wendy Chapman; John Dowling; Gregory F Cooper; Milos Hauskrecht; Michal Valko
Détail
2006 Conference of the International Society for Disease Surveillance, Oct 2006, Baltimore, United States.
Accès au texte intégral et bibtex
chapman2006comparison.pdf BibTex
Titre
Efficient Selectivity and Backup Operators in Monte-Carlo Tree Search
Auteurs
Rémi Coulom
Détail
Paolo Ciancarini and H. Jaap van den Herik. 5th International Conference on Computer and Games, May 2006, Turin, Italy.
Accès au texte intégral et bibtex
CG2006.pdf BibTex
Titre
Learning near-optimal policies with Bellman-residual minimization based fitted policy iteration and a single sample path
Auteurs
Andras Antos; Csaba Szepesvari; Rémi Munos
Détail
Conference On Learning Theory, Jun 2006, Pittsburgh, USA.
Accès au texte intégral et bibtex
antos-colt06.pdf BibTex
Titre
MAXIMUM LIKELIHOOD PARAMETER ESTIMATION FOR LATENT VARIABLE MODELS USING SEQUENTIAL MONTE CARLO
Auteurs
Adam Johansen; Arnaud Doucet; Manuel Davy
Détail
2006 IEEE International Conference on Acoustics, Speech, and Signal Processing : conference proceedings, May 14-19, 2006, Toulouse, 2006, Toulouse, France.
Accès au texte intégral et bibtex
Johansen_ICASSP_2006.pdf BibTex
Titre
Bayesian Inference for Dynamic Models with Dirichlet Process Mixtures
Auteurs
Francois Caron; Manuel Davy; Arnaud Doucet; Emmanuel Duflos; Philippe Vanheeghe
Détail
9th IEEE International Conference on Information Fusion, 2006, Florence, Italy.
Accès au texte intégral et bibtex
Caron_Fusion_2006.pdf BibTex
Titre
JOINT SEGMENTATION OF PIECEWISE CONSTANT AUTOREGRESSIVE PROCESSES BY USING A HIERARCHICAL MODEL AND A BAYESIAN SAMPLING APPROACH
Auteurs
Nicolas Dobigeon; Jean-Yves Tourneret; Manuel Davy
Détail
IEEE ICASSP 2006, 2006, Toulouse, France.
Accès au texte intégral et bibtex
Dobigeon_ICASSP_2006.pdf BibTex
Titre
Application des machines a vecteurs support mono-classe a l'indexation en locuteurs de documents audio
Auteurs
Belkacem Fergani; Manuel Davy; Amrane Houacine
Détail
Journees d'Etude sur la Parole 2006, 2006, Dinard, France.
Accès au texte intégral et bibtex
final-28.pdf BibTex
Titre
ESTIMATION OF MINIMUM MEASURE SETS IN REPRODUCING KERNEL HILBERT SPACES AND APPLICATIONS.
Auteurs
Manuel Davy; Frederic Desobry; Stephane Canu
Détail
IEEE ICASSP 2006, 2006, Toulouse, France.
Accès au texte intégral et bibtex
Desobry_ICASSP_2006.pdf BibTex

Chapitres d'ouvrages scientifiques

Titre
Feature Selection and Dimensionality Reduction in Genomics and Proteomics
Auteurs
Milos Hauskrecht; Richard Pelikan; Michal Valko; James Lyons-Weiler
Détail
Werner Dubitzky, Martin Granzow and Daniel Berrar. Fundamentals of Data Mining in Genomics and Proteomics, Springer, pp. 149-172, 2006
Accès au texte intégral et bibtex
chapter-Hauskrecht.ps chapter-Hauskrecht.pdf BibTex

Autres publications

Titre
Use of variance estimation in the multi-armed bandit problem
Auteurs
Jean-Yves Audibert; Rémi Munos; Csaba Szepesvari
Détail
2006. NIPS Workshop on On-line Trading of Exploration and ExploitationWorkshop
Accès au texte intégral et bibtex
ucbtuned.pdf BibTex

Ouvrages scientifiques

Titre
Signal Processing Methods for Music Transcription
Auteurs
Anssi Klapuri; Manuel Davy
Détail
Springer, pp. 456, 2006, 0-387-30667-6
Accès au bibtex
BibTex

Rapports

Titre
Modification of UCT with Patterns in Monte-Carlo Go
Auteurs
Sylvain Gelly; Yizao Wang; Rémi Munos; Olivier Teytaud
Détail
[Research Report], 2006. RR-6062
Accès au texte intégral et bibtex
RR-6062.pdf BibTex

2005

Documents sans référence de publication

Titre
Evolving Neural Networks for Statistical Decision Theory
Auteurs
Michal Valko
Détail
May. 2005. master thesis
Accès au texte intégral et bibtex
nesdt.pdf BibTex