par Konen, Dimitri
Président du jury Verdebout, Thomas
Promoteur Paindaveine, Davy
Publication Non publié, 2022-12-09
Thèse de doctorat
Résumé : L’objectif de cette thèse est de mieux comprendre et d’étendre les concept de quantiles et rangs spatiaux et de profondeur spatiale. Avec d’autres notions, dites de profondeur, ces concepts ont été développés pour tenter de trouver des façons appropriées de faire de la géométrie par rapport à un jeu de données. La question principale est la suivante : si je dispose d’un jeu de données, dans quelle mesure un point donné de l’espace est-il loin de ce jeu de données ? Cette question est en réalité profondément liée à la notion de fonction de répartition d’une loi de probabilité et aux quantiles qui lui sont associés. Ces notions sont bien déterminées dans un espace à une dimension, c’est-à-dire lorsque les observations sont des nombres réels. La conceptualisation de ces objets est beaucoup plus délicate pour des données vivant dans des espaces de dimension supérieure. En effet, la fonction de répartition et les quantiles sont fondés sur la possibilité d’ordonner les nombres du plus petit au plus grand, une propriété qui n’existe intrinsèquement qu’en dimension une. Pour cette raison, la communauté statistique a développé des outils adaptés aux supérieures pour permettre de retrouver une forme « d’ordre » entre des observations. Il s’agit des concepts de fonctions de profondeur et de rangs. Un des concepts développés à cet effet est la profondeur spatiale et les rangs spatiaux.Dans le premier chapitre de la thèse, nous investiguons en détails le lien qui existe entre une distribution de probabilité et le rang spatial qui lui est associé. Plus spécifiquement, nous nous posons la question suivante : étant donnée une distribution de probabilité et son rang spatial, est-il possible de retrouver entièrement la distribution si on ne connait que son rang spatial ? Il était déjà connu que le rang spatial caractérise entièrement la distribution de probabilité sous-jacente, mais ce résultat était abstrait et ne donnait pas de description de la façon dont ces deux objets sont reliés, ni même si un tel lien existe. Dans ce chapitre, nous montrons qu’une relation explicite existe bel et bien au travers d’une équation aux dérivées partielles.Dans le second chapitre de la thèse, nous remplaçons la fonction de coût L1 définissant les quantiles spatiaux par un coût Lp, pour « p » quelconque. Les fonctions de coût Lp sont connues pour être plus adaptées à l’évaluation de risques financiers, par exemple. Nous introduisons alors un concept de quantiles spatiaux Lp et étudions de façon systématique les propriétés de ces nouveaux quantiles, qui ont révélé des comportements fondamentalement différents en fonction des valeurs de « p », offrant au praticien de la souplesse selon le problème dans lequel il utilise ce concept.Dans le dernier chapitre, nous étendons la notion de quantiles spatiaux à des données vivant intrinsèquement sur une sphère. De telles situations sont étudiées dans un domaine appelé « Les statistiques directionnelles », dans lequel seul la direction des observations compte, indépendamment de leur magnitude. Nous étudions les propriétés des quantiles spatiaux sphériques de façon systématique et proposons un exemple d’application inférentielle relié à des tests de symétrie rotationnelle.