Apprenabilité dans les problèmes de l'inférence séquentielle

URL d'accès : http://ori-nuxeo.univ-lille1.fr/nuxeo/site/esupver...

Auteur(s):  Ryabko, Daniil
Date de soutenance : 2011
Éditeur(s) : Université Lille1 - Sciences et Technologies 

Langue : Français
Garant ou directeur :  Preux, Philippe
Classification : Mathématiques
Discipline : Mathématiques
Mots-clés : Inférence statistique Prédiction séquentielle
Inférence statistique Prédiction séquentielle
Processus stochastiques --
Tests d'hypothèses (statistique) --
Classification automatique --
Apprentissage automatique --
Séries chronologiques --
Processus stationnaires --
Analyse séquentielle --

Résumé : Les travaux présentés sont dédiés à la possibilité de faire de l'inférence statistique à partir de données séquentielles. Le problème est le suivant. Étant donnée une suite d'observations x1, ...,xn,..., on cherche à faire de l'inférence sur le processus aléatoire ayant produit la suite. Plusieurs problèmes, qui d'ailleurs ont des applications multiples dans différents domaines des mathématiques et de l'informatique, peuvent être formulés ainsi. Par exemple, on peut vouloir prédire la probabilité d'apparition de l'observation suivante, xn+1 (le problème de prédiction séquentielle); ou répondre à la question de savoir si le processus aléatoire qui produit la suite appartient à un certain ensemble H_0 versus il appartient à un ensemble différent H_1 (test d'hypothèse); ou encore, effectuer une action avec le but de maximiser une certaine fonction d'utilité. Dans chacun de ces problèmes, pour rendre l'inférence possible il faut d'abord faire certaines hypothèses sur le processus aléatoire qui produit les données. Les hypothèses typiques sont que les observations xi sont indépendantes et identiquement distribuées, ou que la distribution de la suite x1, ...,xn,... appartient à une certaine famille paramétrique. La question centrale adressée dans les travaux présentés est la suivante : sous quelles hypothèses l'inférence est-elle possible ? Cette question est posée et analysée pour des problèmes d'inférence différents, parmi lesquels se trouvent la prédiction séquentielle, les tests d'hypothèse, la classification et l'apprentissage par renforcement. Les résultats les plus marquants obtenus sont les suivants. Pour le problème de test d'hypothèse, une caractérisation topologique complète (conditions nécessaires et suffisantes) est obtenue des hypothèses composites H_0, contenues dans l'ensemble E des distributions stationnaires et ergodiques sur un alphabet fini, pour lesquelles il existe un test valide contre l'hypothèse E\H_0. La méthode d'analyse développée à cette fin est également utilisée afin d'élaborer des procédures non-paramétrique pour les problèmes d'estimation de points de rupture, de classification et de clustering des séries temporelles. Ces procédures sont consistantes sous une seule hypothèse : les données sont stationnaires et ergodiques (sur un alphabet réel). Cette hypothèse est beaucoup plus générale que celles qui ont été utilisées jusqu'alors dans ce domaine. Il est démontré aussi que le problème d'homogénéité n'a pas de solution sous cette hypothèse, ce qui était conjecturé il y a 20 ans mais n'a pas été démontré jusqu'alors. Pour le problème de prédiction séquentielle il est démontré que s'il existe une méthode de prédiction qui est consistante avec chaque élément d'un ensemble C, alors il existe une méthode Bayesienne qui elle aussi est consistante avec chaque élément de cet ensemble C et dont la distribution a priori est discrète. Ce résultat est valable sans aucune hypothèse sur C ni sur ses éléments (ils ne doivent être ni i.i.d., ni stationnaires, etc.). Par ailleurs, plusieurs conditions suffisantes (dont la séparabilité, ainsi que quelques conditions locales) pour de tels ensemble C permettant l'existence de prédicteurs consistants sont obtenue.



Cité Scientifique BP 30155 59653 VILLENEUVE D'ASCQ CEDEX Tél.:+33 (0)3 20 43 44 10