JFPDA

JFPDA

8èmes Journées Francophones sur la Planification, la Décision et l'Apprentissage pour la conduite de systèmes, Lille, 01-02 juillet 2013.

Présentation

Les Journées Francophones sur la Planification, la Décision et l'Apprentissage pour la conduite des systèmes (JFPDA) ont pour but de rassembler la communauté de chercheurs francophones travaillant sur les problèmes d'intelligence artificielle, d'apprentissage par renforcement, de programmation dynamique et de tous les domaines liés à la prise de décision séquentielle et à la planification. Les travaux présentés traitent aussi bien d'aspects purement théoriques que de l'application de ces méthodes à la conduite de systèmes virtuels (jeux, simulateurs) et réels (robots, drones). Ces journées sont aussi l'occasion de présenter des travaux en cours de la part de doctorants, postdoctorants et chercheurs confirmés dans un cadre laissant une large place à la discussion constructive et bienveillante.

Après Toulouse (2006), Grenoble (2007), Metz (2008), Paris (2009), Besançon (2010), Rouen (2011) et Nancy (2012), les journées se tiendront en 2013 à Lille, dans le cadre de la plate-forme AFIA.

Invités

Joelle Pineau (McGill University, Montréal, Canada)

Thèmes principaux

Processus décisionnels de Markov, totalement ou partiellement observables, factorisés ou hiérarchiques, centralisés ou décentralisés

Programmation Dynamique approchée (ADP), apprentissage par renforcement (RL)

RL Bayésien, RL inverse, RL batch, RL multi-agents, RL multi-objectifs

Convergence et bornes sur les performances des algorithmes RL/ADP

Complexité en RL/ADP

Apprentissage statistique, bornes PAC en RL/ADP

Méthodes de Monte Carlo et quasi Monte Carlo

Recherche directe de politiques, architectures acteur-critique

Apprentissage de fonctions de valeurs, généralisation, représentations parcimonieuses, méthodes à base de noyaux en RL/ADP

Planification classique, planification temporelle

Replanification, planification en ligne

Contrôle de systèmes continus ou discrets, réels ou simulés, mono ou multi-agents

Approches d’inspiration biologique

Applications et confrontations au monde réel.

Appel à communications

Les travaux soumis aux JFPDA peuvent prendre différentes formes :

Résumé étendu (6 pages maximum),

Article long original,

Article long soumis ou accepté dans un atelier ou une conférence internationale.

Dans tous les cas, la version finale pourra être en anglais ou en français et devra comporter 16 pages au maximum dans le format donné ci-dessous. Les versions finales des papiers seront disponibles via des liens url qui seront communiqués par les auteurs eux-mêmes et rassemblés sur cette page web.

Le comité de programme proposera pour chaque travail soit une présentation en session orale (avec la possibilité de présenter en poster également si les auteurs le souhaitent), soit uniquement une présentation en session poster. Cela permettra à tous les auteurs de concourir pour le prix (symbolique) du meilleur poster (voir section “Prix du meilleur poster”).

Prix du meilleur poster

Le prix du meilleur poster a été attribué à Emilie Kaufmann et Shivaram Kalyanakrishnan pour leur contribution Information Complexity in Bandit Subset Selection.

Prix d'équipe

Un prix a également été attribué à l'équipe de recherche ayant le plus grand nombre de travaux acceptés aux JFPDA 2013. Ce prix a été remis à l'équipe MAIA (MAchines Intelligentes Autonomes) du centre Inria Nancy - Grand Est pour leurs 5 contributions :

* Jilles Dibangoye, Christopher Amato, Olivier Buffet et François Charpillet, Optimally Solving Dec-POMDPs as Continuous-State MDPs

* Bruno Scherrer et Boris Lesner, Sur l'utilisation de politiques non-stationnaires pour les processus de décision Markoviens à horizon infini

* Bruno Scherrer, Quelques majorants de la complexité de l'algorithme itérations sur les politiques

* Manel Tagorti, Bruno Scherrer, Olivier Buffet et Joerg Hoffmann, Abstraction Pathologies In Markov Decision Processes

* Mauricio Araya-López, Olivier Buffet et Vincent Thomas, Active Diagnosis Through Information-Lookahead Planning.

Comité scientifique

Président du comité de programme

Rémi Munos

Membres du comité de programme

Marta Soare

Raphael Fonteneau

Michal Valko

Alessandro Lazaric

Autres membres du comité scientifique

Olivier Buffet (Inria - Loria, Nancy)

Lucian Busoniu (CNRS - Université de Lorraine - CRAN, Nancy)

Olivier Cappé (CNRS - Telecom ParisTech, Paris)

Yann Chevaleyre (Université Paris Dauphine - LAMSADE, Paris)

Rémi Coulom (Université Lille 3 - Inria, Lille)

Boris Defourny (Princeton University, Princeton, USA)

Christos Dimitrakakis (Ecole Polytechnique Fédérale de Lausanne, Suisse)

Alain Dutech (Inria - Loria, Nancy)

Damien Ernst (Université de Liège, Belgique)

Patrick Fabiani (ONERA, Toulouse)

Humbert Fiorino (Université Joseph Fourier - LIG, Grenoble)

Aurélien Garivier (Université Paul Sabatier - IMT, Toulouse)

Matthieu Geist (SUPELEC, Metz)

Mohammad Ghavamzadeh (Inria, Lille)

Nathaniel Korda (Inria, Lille)

Guillaume Laurent (École Nationale Supérieure de Mécanique et des Microtechniques - FEMTO, Besançon)

Manuel Lopes (Inria, Bordeaux)

Francis Maes (Katholieke Universiteit Leuven, Belgique)

Odalric-Ambrym Maillard (Israel Institute of Technology, Haifa, Israel)

Laetitia Matignon (Université Claude Bernard Lyon 1 - LIRIS, Lyon)

Cyril Pain-Barre (Aix-Marseille Université - LSIS, Aix-en-Provence)

Olivier Pietquin (SUPELEC - CNRS - GeorgiaTech, Metz)

Joëlle Pineau (McGill University, Montréal, Canada)

Cédric Pralet (Onera, Toulouse)

Philippe Preux (Université Lille 3 - LIFL - Inria, Lille)

Emmanuel Rachelson (ISAE, Toulouse)

Daniil Ryabko (Inria, Lille)

Régis Sabbadin (INRA, Toulouse)

Olivier Sigaud (Université Pierre et Marie Curie, Paris)

Balazs Szorenyi (Inria, Lille & MTA-SZTE Research Group on AI, Szeged, Hongrie)

Florent Teichteil-Königsbuch (Onera, Toulouse)

Olivier Teytaud (Inria, Saclay)

Vincent Thomas (Université de Lorraine - Loria, Nancy)

Gérard Verfaillie (Onera, Toulouse)

Thierry Vidal (Ecole Nationale d'Ingénieurs de Tarbes)

Vincent Vidal (Onera, Toulouse)

Paul Weng (Université Pierre et Marie Curie - LIP6, Paris)

Bruno Zanuttini (Université de Caen Basse-Normandie - GREYC, Caen)

Dates clés

Date limite de soumission des papiers : 05/04/2013, minuit

Notification aux auteurs : 15/05/2013

Date limite de soumission de la version finale : 07/06/2013

Conférence : du 01/07/2013 au 02/07/2013

Soumission d'articles

A partir du 01 mars 2013, vous pourrez soumettre vos travaux à l'adresse suivante:

https://www.easychair.org/conferences/?conf=jfpda2013

Le format de soumission est simple : on attend un fichier au format pdf exclusivement, idéalement créé avec pdfLaTeX et le style suivant.

Programme

LUNDI 01 JUILLET 2013

Session 1 - président de séance : Rémi Munos

9h10 – 9h30 Processus Décisionnels de Markov Possibilistes à Observabilité Mixte - Nicolas Drougard, Florent Teichteil-Königsburg, Jean-Loup Farges et Didier Dubois

9h30 – 9h50 Abstraction Pathologies In Markov Decision Processes - Manel Tagorti, Bruno Scherrer, Olivier Buffet et Joerg Hoffmann

9h50 – 10h10 Apprentissage par démonstrations : Vaut-il la peine d'estimer une fonction de récompense? - Bilal Piot, Matthieu Geist et Olivier Pietquin

10h10 – 10h30 Quelques majorants de la complexité de l'algorithme itérations sur les politiques - Bruno Scherrer

10h30 – 11h30 Pause poster 1

Session 2 - président de séance : Marta Soare

11h30 – 11h50 Optimally Solving Dec-POMDPs as Continuous-State MDPs - Jilles Dibangoye, Christopher Amato, Olivier Buffet et François Charpillet

11h50 – 12h10 Planification dynamique en ligne: vers des modèles à base d’invariants - Cédric Pralet et Gérard Verfaillie

12h10 – 12h30 Classification régularisée par la récompense pour l'Apprentissage par Imitation - Bilal Piot, Matthieu Geist et Olivier Pietquin

12h30 – 14h30 Repas

14h30 – 15h30 Invité AFIA : Joelle Pineau

15h30 – 16h00 Pause

Session 3 - président de séance : Michal Valko

16h00 – 16h20 Généralisation Min Max pour l'Apprentissage par Renforcement Batch et Déterministe : Relaxations pour le Cas Général T Etapes - Raphael Fonteneau, Damien Ernst, Bernard Boigelot et Quentin Louveaux

16h20 – 16h40 Décision séquentielle pour la perception active : p-POMDP versus POMDP - Caroline Ponzoni Carvalho Chanel, Florent Teichteil-Königsbuch et Patrick Fabiani

16h40 – 17h00 Pause

17h00 – 17h20 A timeline, event, and constraint-based modeling framework for planning and scheduling problems - Gérard Verfaillie et Cédric Pralet

17h20 – 17h40 Instance-Based Image Classification: a New Sequential Paradigm - Ludovic Denoyer, Gabriel Dulac-Arnold, Nicolas Thome et Matthieu Cord

17h40 – 18h00 Pause

Session 4 - président de séance : Alessandro Lazaric

18h00 – 18h20 Active Diagnosis Through Information-Lookahead Planning - Mauricio Araya-López, Olivier Buffet et Vincent Thomas

18h20 – 18h40 Optimistic Planning for Continuous-Action Deterministic Systems - Lucian Busoniu, Alexander Daniels, Remi Munos et Robert Babuska

18h40 – 19h00 Planification Optimiste dans les Processus Décisionnels de Markov avec Croyance - Raphael Fonteneau, Lucian Busoniu et Remi Munos

MARDI 02 JUILLET 2013

Session 5 - président de séance : Raphael Fonteneau

9h10 – 9h30 Finite Time Analysis of Kernelised Contextual Bandits - Nathaniel Korda, Michal Valko, Remi Munos, Ilias Flounas et Nello Cristianini

9h30 – 9h50 Vers des bornes inferieures dépendant de la distribution en temps fini pour le problème du bandit stochastique - Adrien Hoarau et Remi Munos

9h50 – 10h10 Information Complexity in Bandit Subset Selection - Emilie Kaufmann et Shivaram Kalyanakrishnan

10h10 – 10h30 Apprentissage par renforcement inverse en cascadant classification et régression - Edouard Klein, Bilal Piot, Matthieu Geist et Olivier Pietquin

10h30 – 11h30 Pause poster 2

Session 6 - président de séance : Nathan Korda

11h30 – 11h50 Optimisation par essaims particulaires de stratégies de dialogue - Lucie Daubigney, Matthieu Geist et Olivier Pietquin

11h50 – 12h10 OMAR : un outil d'aide à la décision pour optimiser, suivre, alerter et réparer en gestion de crise - Hélène Soubaras, Florence Aligne et Pierre Savéant

12h10 – 12h30 Learning Exploration Strategies in Model-Based Reinforcement Learning - Todd Hester, Manuel Lopes et Peter Stone

12h30 – 14h30 Repas

14h30 – 15h30 Invité AFIA : Hans van Ditmarsch

15h30 – 16h00 Pause

Session 7 - président de séance : Adrien Hoarau

16h00 – 16h20 Policy Improvement: Between Black-Box Optimization and Episodic Reinforcement Learning - Freek Stulp et Olivier Sigaud

16h20 – 16h40 Exploration in Model-based Reinforcement Learning by Empirically Estimating Learning Progress - Manuel Lopes, Tobias Lang, Marc Toussaint et Pierre-Yves Oudeyer

16h40 – 17h00 Sur l'utilisation de politiques non-stationnaires pour les processus de décision Markoviens à horizon infini - Bruno Scherrer et Boris Lesner

17h00 – 17h20 Pause

Session 8 - président de séance : Rémi Munos

17h20 – 17h40 Résolution approchée par décomposition de processus décisionnels de Markov appliquée à l'exploration en robotique mobile - Guillaume Lozenguez, Lounis Adouane, Aurelie Beynier, Philippe Martinet et Abdel-Illah Mouaddib

17h40 – 18h00 Knowledge-Based Programs as Plans: Succinctness and the Complexity of Plan Existence - Jérôme Lang et Bruno Zanuttini

18h00 – 19h00 AG AFIA