Issue |
ESAIM: ProcS
Volume 74, 2023
Journées MAS 2020 - Random Modelization and Physics
|
|
---|---|---|
Page(s) | 158 - 168 | |
DOI | https://doi.org/10.1051/proc/202374158 | |
Published online | 18 December 2023 |
Machine learning and optimal transport: some statistical and algorithmic tools*
CNRS, IRIT, Université de Toulouse
In this paper, we focus on the analysis of data that can be described by probability measures supported on a Euclidean space, by way of optimal transport. Our main objective is to present a first and second order statistical analyses in the space of distributions in a concise manner, as a first approach to understand the general modes of variation of a set of observations. In the context of optimal transport, these studies correspond to the barycenter and the decomposition into geodesic principal components in theWasserstein space. In particular, we aim attention at a regularised estimator of the barycenter, in order to handle the noise coming from the observations. Additionally, we leverage these tools for time series analysis, whose spectral informations are compared using optimal transport.
Résumé
Dans cet article, nous nous concentrons sur l’analyse de données pouvant être décrites par des mesures de probabilité supportées sur un espace Euclidien, au moyen du transport optimal. Notre objectif principal est de présenter de manière concise l’analyse statistique de premier et second ordre dans l’espace des distributions comme une première approche pour comprendre les tendances générales d’un ensemble d’observations. Dans le contexte du transport optimal, ces études correspondent au barycentre et à la décomposition en composantes géodésiques principales dans l’espace de Wasserstein. Notamment, nous nous intéressons à un estimateur régularisé du barycentre, afin de gérer le bruit provenant des observations. Par ailleurs, nous exploitons ces outils pour l’analyse des séries temporelles, dont les informations spectrales sont comparées à l’aide du transport optimal.
© EDP Sciences, SMAI 2023
This is an Open Access article distributed under the terms of the Creative Commons Attribution License (https://creativecommons.org/licenses/by/4.0), which permits unrestricted use, distribution, and reproduction in any medium, provided the original work is properly cited.
Current usage metrics show cumulative count of Article Views (full-text article views including HTML views, PDF and ePub downloads, according to the available data) and Abstracts Views on Vision4Press platform.
Data correspond to usage on the plateform after 2015. The current usage metrics is available 48-96 hours after online publication and is updated daily on week days.
Initial download of the metrics may take a while.