8èmes Journées Francophones sur la Planification, la Décision et l'Apprentissage pour la conduite de systèmes, Lille, 01-02 juillet 2013.
Les Journées Francophones sur la Planification, la Décision et l'Apprentissage pour la conduite des systèmes (JFPDA) ont pour but de rassembler la communauté de chercheurs francophones travaillant sur les problèmes d'intelligence artificielle, d'apprentissage par renforcement, de programmation dynamique et de tous les domaines liés à la prise de décision séquentielle et à la planification. Les travaux présentés traitent aussi bien d'aspects purement théoriques que de l'application de ces méthodes à la conduite de systèmes virtuels (jeux, simulateurs) et réels (robots, drones). Ces journées sont aussi l'occasion de présenter des travaux en cours de la part de doctorants, postdoctorants et chercheurs confirmés dans un cadre laissant une large place à la discussion constructive et bienveillante.
Après Toulouse (2006), Grenoble (2007), Metz (2008), Paris (2009), Besançon (2010), Rouen (2011) et Nancy (2012), les journées se tiendront en 2013 à Lille, dans le cadre de la plate-forme AFIA.
Les travaux soumis aux JFPDA peuvent prendre différentes formes :
Dans tous les cas, la version finale pourra être en anglais ou en français et devra comporter 16 pages au maximum dans le format donné ci-dessous. Les versions finales des papiers seront disponibles via des liens url qui seront communiqués par les auteurs eux-mêmes et rassemblés sur cette page web.
Le comité de programme proposera pour chaque travail soit une présentation en session orale (avec la possibilité de présenter en poster également si les auteurs le souhaitent), soit uniquement une présentation en session poster. Cela permettra à tous les auteurs de concourir pour le prix (symbolique) du meilleur poster (voir section “Prix du meilleur poster”).
Le prix du meilleur poster a été attribué à Emilie Kaufmann et Shivaram Kalyanakrishnan pour leur contribution Information Complexity in Bandit Subset Selection.
Un prix a également été attribué à l'équipe de recherche ayant le plus grand nombre de travaux acceptés aux JFPDA 2013. Ce prix a été remis à l'équipe MAIA (MAchines Intelligentes Autonomes) du centre Inria Nancy - Grand Est pour leurs 5 contributions :
* Jilles Dibangoye, Christopher Amato, Olivier Buffet et François Charpillet, Optimally Solving Dec-POMDPs as Continuous-State MDPs
* Bruno Scherrer et Boris Lesner, Sur l'utilisation de politiques non-stationnaires pour les processus de décision Markoviens à horizon infini
* Bruno Scherrer, Quelques majorants de la complexité de l'algorithme itérations sur les politiques
* Manel Tagorti, Bruno Scherrer, Olivier Buffet et Joerg Hoffmann, Abstraction Pathologies In Markov Decision Processes
* Mauricio Araya-López, Olivier Buffet et Vincent Thomas, Active Diagnosis Through Information-Lookahead Planning.
Président du comité de programme
Rémi Munos
Membres du comité de programme
Marta Soare
Raphael Fonteneau
Michal Valko
Alessandro Lazaric
Autres membres du comité scientifique
Olivier Buffet (Inria - Loria, Nancy)
Lucian Busoniu (CNRS - Université de Lorraine - CRAN, Nancy)
Olivier Cappé (CNRS - Telecom ParisTech, Paris)
Yann Chevaleyre (Université Paris Dauphine - LAMSADE, Paris)
Rémi Coulom (Université Lille 3 - Inria, Lille)
Boris Defourny (Princeton University, Princeton, USA)
Christos Dimitrakakis (Ecole Polytechnique Fédérale de Lausanne, Suisse)
Alain Dutech (Inria - Loria, Nancy)
Damien Ernst (Université de Liège, Belgique)
Patrick Fabiani (ONERA, Toulouse)
Humbert Fiorino (Université Joseph Fourier - LIG, Grenoble)
Aurélien Garivier (Université Paul Sabatier - IMT, Toulouse)
Matthieu Geist (SUPELEC, Metz)
Mohammad Ghavamzadeh (Inria, Lille)
Nathaniel Korda (Inria, Lille)
Guillaume Laurent (École Nationale Supérieure de Mécanique et des Microtechniques - FEMTO, Besançon)
Manuel Lopes (Inria, Bordeaux)
Francis Maes (Katholieke Universiteit Leuven, Belgique)
Odalric-Ambrym Maillard (Israel Institute of Technology, Haifa, Israel)
Laetitia Matignon (Université Claude Bernard Lyon 1 - LIRIS, Lyon)
Cyril Pain-Barre (Aix-Marseille Université - LSIS, Aix-en-Provence)
Olivier Pietquin (SUPELEC - CNRS - GeorgiaTech, Metz)
Joëlle Pineau (McGill University, Montréal, Canada)
Cédric Pralet (Onera, Toulouse)
Philippe Preux (Université Lille 3 - LIFL - Inria, Lille)
Emmanuel Rachelson (ISAE, Toulouse)
Daniil Ryabko (Inria, Lille)
Régis Sabbadin (INRA, Toulouse)
Olivier Sigaud (Université Pierre et Marie Curie, Paris)
Balazs Szorenyi (Inria, Lille & MTA-SZTE Research Group on AI, Szeged, Hongrie)
Florent Teichteil-Königsbuch (Onera, Toulouse)
Olivier Teytaud (Inria, Saclay)
Vincent Thomas (Université de Lorraine - Loria, Nancy)
Gérard Verfaillie (Onera, Toulouse)
Thierry Vidal (Ecole Nationale d'Ingénieurs de Tarbes)
Vincent Vidal (Onera, Toulouse)
Paul Weng (Université Pierre et Marie Curie - LIP6, Paris)
Bruno Zanuttini (Université de Caen Basse-Normandie - GREYC, Caen)
Date limite de soumission des papiers : 05/04/2013, minuit
Notification aux auteurs : 15/05/2013
Date limite de soumission de la version finale : 07/06/2013
Conférence : du 01/07/2013 au 02/07/2013
A partir du 01 mars 2013, vous pourrez soumettre vos travaux à l'adresse suivante:
https://www.easychair.org/conferences/?conf=jfpda2013
Le format de soumission est simple : on attend un fichier au format pdf exclusivement, idéalement créé avec pdfLaTeX et le style suivant.
Session 1 - président de séance : Rémi Munos
9h10 – 9h30 Processus Décisionnels de Markov Possibilistes à Observabilité Mixte - Nicolas Drougard, Florent Teichteil-Königsburg, Jean-Loup Farges et Didier Dubois
9h30 – 9h50 Abstraction Pathologies In Markov Decision Processes - Manel Tagorti, Bruno Scherrer, Olivier Buffet et Joerg Hoffmann
9h50 – 10h10 Apprentissage par démonstrations : Vaut-il la peine d'estimer une fonction de récompense? - Bilal Piot, Matthieu Geist et Olivier Pietquin
10h10 – 10h30 Quelques majorants de la complexité de l'algorithme itérations sur les politiques - Bruno Scherrer
10h30 – 11h30 Pause poster 1
Session 2 - président de séance : Marta Soare
11h30 – 11h50 Optimally Solving Dec-POMDPs as Continuous-State MDPs - Jilles Dibangoye, Christopher Amato, Olivier Buffet et François Charpillet
11h50 – 12h10 Planification dynamique en ligne: vers des modèles à base d’invariants - Cédric Pralet et Gérard Verfaillie
12h10 – 12h30 Classification régularisée par la récompense pour l'Apprentissage par Imitation - Bilal Piot, Matthieu Geist et Olivier Pietquin
12h30 – 14h30 Repas
14h30 – 15h30 Invité AFIA : Joelle Pineau
15h30 – 16h00 Pause
Session 3 - président de séance : Michal Valko
16h00 – 16h20 Généralisation Min Max pour l'Apprentissage par Renforcement Batch et Déterministe : Relaxations pour le Cas Général T Etapes - Raphael Fonteneau, Damien Ernst, Bernard Boigelot et Quentin Louveaux
16h20 – 16h40 Décision séquentielle pour la perception active : p-POMDP versus POMDP - Caroline Ponzoni Carvalho Chanel, Florent Teichteil-Königsbuch et Patrick Fabiani
16h40 – 17h00 Pause
17h00 – 17h20 A timeline, event, and constraint-based modeling framework for planning and scheduling problems - Gérard Verfaillie et Cédric Pralet
17h20 – 17h40 Instance-Based Image Classification: a New Sequential Paradigm - Ludovic Denoyer, Gabriel Dulac-Arnold, Nicolas Thome et Matthieu Cord
17h40 – 18h00 Pause
Session 4 - président de séance : Alessandro Lazaric
18h00 – 18h20 Active Diagnosis Through Information-Lookahead Planning - Mauricio Araya-López, Olivier Buffet et Vincent Thomas
18h20 – 18h40 Optimistic Planning for Continuous-Action Deterministic Systems - Lucian Busoniu, Alexander Daniels, Remi Munos et Robert Babuska
18h40 – 19h00 Planification Optimiste dans les Processus Décisionnels de Markov avec Croyance - Raphael Fonteneau, Lucian Busoniu et Remi Munos
Session 5 - président de séance : Raphael Fonteneau
9h10 – 9h30 Finite Time Analysis of Kernelised Contextual Bandits - Nathaniel Korda, Michal Valko, Remi Munos, Ilias Flounas et Nello Cristianini
9h30 – 9h50 Vers des bornes inferieures dépendant de la distribution en temps fini pour le problème du bandit stochastique - Adrien Hoarau et Remi Munos
9h50 – 10h10 Information Complexity in Bandit Subset Selection - Emilie Kaufmann et Shivaram Kalyanakrishnan
10h10 – 10h30 Apprentissage par renforcement inverse en cascadant classification et régression - Edouard Klein, Bilal Piot, Matthieu Geist et Olivier Pietquin
10h30 – 11h30 Pause poster 2
Session 6 - président de séance : Nathan Korda
11h30 – 11h50 Optimisation par essaims particulaires de stratégies de dialogue - Lucie Daubigney, Matthieu Geist et Olivier Pietquin
11h50 – 12h10 OMAR : un outil d'aide à la décision pour optimiser, suivre, alerter et réparer en gestion de crise - Hélène Soubaras, Florence Aligne et Pierre Savéant
12h10 – 12h30 Learning Exploration Strategies in Model-Based Reinforcement Learning - Todd Hester, Manuel Lopes et Peter Stone
12h30 – 14h30 Repas
14h30 – 15h30 Invité AFIA : Hans van Ditmarsch
15h30 – 16h00 Pause
Session 7 - président de séance : Adrien Hoarau
16h00 – 16h20 Policy Improvement: Between Black-Box Optimization and Episodic Reinforcement Learning - Freek Stulp et Olivier Sigaud
16h20 – 16h40 Exploration in Model-based Reinforcement Learning by Empirically Estimating Learning Progress - Manuel Lopes, Tobias Lang, Marc Toussaint et Pierre-Yves Oudeyer
16h40 – 17h00 Sur l'utilisation de politiques non-stationnaires pour les processus de décision Markoviens à horizon infini - Bruno Scherrer et Boris Lesner
17h00 – 17h20 Pause
Session 8 - président de séance : Rémi Munos
17h20 – 17h40 Résolution approchée par décomposition de processus décisionnels de Markov appliquée à l'exploration en robotique mobile - Guillaume Lozenguez, Lounis Adouane, Aurelie Beynier, Philippe Martinet et Abdel-Illah Mouaddib
17h40 – 18h00 Knowledge-Based Programs as Plans: Succinctness and the Complexity of Plan Existence - Jérôme Lang et Bruno Zanuttini
18h00 – 19h00 AG AFIA