Issue |
ESAIM: ProcS
Volume 74, 2023
Journées MAS 2020 - Random Modelization and Physics
|
|
---|---|---|
Page(s) | 119 - 136 | |
DOI | https://doi.org/10.1051/proc/202374119 | |
Published online | 18 December 2023 |
Topics in robust statistical learning*
1
Univ. Rennes 2, Rennes, France
e-mail: claire.brecheteau@univ-rennes2.fr
2
CREST, ENSAI, Univ. Rennes, LumenAI, Tours, France
e-mail: egenetay@lumenai.fr
3
INRIA, Scool team. Univ. Lille, CRIStAL, CNRS, France
e-mail: timothee.mathieu@inria.fr
4
CREST, ENSAI, Univ. Rennes, Bruz, France
e-mail: adrien.saumard@ensai.fr
Some recent contributions to robust inference are presented. Firstly, the classical problem of robust M-estimation of a location parameter is revisited using an optimal transport approach - with specifically designed Wasserstein-type distances - that reduces robustness to a continuity property. Secondly, a procedure of estimation of the distance function to a compact set is described, using union of balls. This methodology originates in the field of topological inference and offers as a byproduct a robust clustering method. Thirdly, a robust Lloyd-type algorithm for clustering is constructed, using a bootstrap variant of the median-of-means strategy. This algorithm comes with a robust initialization.
Résumé
Quelques contributions récentes à l’inférence robuste sont présentées. Premièrement, le problème classique de la M-estimation robuste d’un paramètre de localisation est revisité en utilisant une approche de transport optimal, avec des distances de type Wasserstein spécifiquement conçues, qui réduit la robustesse à une propriété de continuité. La deuxième contribution décrit une procédure d’estimation de la fonction de distance à un ensemble compact, en utilisant une union de boules. Cette méthodologie trouve son origine dans le domaine de l’inférence topologique et offre comme sous-produit une méthode de clustering robuste. Enfin, un algorithme robuste de type Lloyd pour le clustering est présenté, en utilisant une variante bootstrap de la stratégie “median-of-means”. Cet algorithme s’accompagne notamment d’une initialisation robuste.
© EDP Sciences, SMAI 2023
This is an Open Access article distributed under the terms of the Creative Commons Attribution License (https://creativecommons.org/licenses/by/4.0), which permits unrestricted use, distribution, and reproduction in any medium, provided the original work is properly cited.
Current usage metrics show cumulative count of Article Views (full-text article views including HTML views, PDF and ePub downloads, according to the available data) and Abstracts Views on Vision4Press platform.
Data correspond to usage on the plateform after 2015. The current usage metrics is available 48-96 hours after online publication and is updated daily on week days.
Initial download of the metrics may take a while.