Random monotone operators and application to stochastic optimization

Cette thèse porte essentiellement sur l'étude d'algorithmes d'optimisation. Les problèmes de programmation intervenant en apprentissage automatique ou en traitement du signal sont dans beaucoup de cas composites, c'est-à-dire qu'ils sont contraints ou régularisés par des ter...

Full description

Bibliographic Details
Main Author:	Salim, Adil
Other Authors:	Université Paris-Saclay (ComUE)
Language:	en
Published:	2018
Subjects:	Optimisation distribuée Apprentissage statistique Approximation stochastique Opérateurs monotones aléatoires Algorithmes proximaux Distributed optimization Machine learning Stochastic approximation Random monotone operators Proximal algorithms
Online Access:	http://www.theses.fr/2018SACLT021/document

id	ndltd-theses.fr-2018SACLT021
record_format	oai_dc
spelling	ndltd-theses.fr-2018SACLT0212020-02-03T15:25:49Z Random monotone operators and application to stochastic optimization Opérateurs monotones aléatoires et application à l'optimisation stochastique Optimisation distribuée Apprentissage statistique Approximation stochastique Opérateurs monotones aléatoires Algorithmes proximaux Distributed optimization Machine learning Stochastic approximation Random monotone operators Proximal algorithms Cette thèse porte essentiellement sur l'étude d'algorithmes d'optimisation. Les problèmes de programmation intervenant en apprentissage automatique ou en traitement du signal sont dans beaucoup de cas composites, c'est-à-dire qu'ils sont contraints ou régularisés par des termes non lisses. Les méthodes proximales sont une classe d'algorithmes très efficaces pour résoudre de tels problèmes. Cependant, dans les applications modernes de sciences des données, les fonctions à minimiser se représentent souvent comme une espérance mathématique, difficile ou impossible à évaluer. C'est le cas dans les problèmes d'apprentissage en ligne, dans les problèmes mettant en jeu un grand nombre de données ou dans les problèmes de calcul distribué. Pour résoudre ceux-ci, nous étudions dans cette thèse des méthodes proximales stochastiques, qui adaptent les algorithmes proximaux aux cas de fonctions écrites comme une espérance. Les méthodes proximales stochastiques sont d'abord étudiées à pas constant, en utilisant des techniques d'approximation stochastique. Plus précisément, la méthode de l'Equation Differentielle Ordinaire est adaptée au cas d'inclusions differentielles. Afin d'établir le comportement asymptotique des algorithmes, la stabilité des suites d'itérés (vues comme des chaines de Markov) est étudiée. Ensuite, des généralisations de l'algorithme du gradient proximal stochastique à pas décroissant sont mises au point pour resoudre des problèmes composites. Toutes les grandeurs qui permettent de décrire les problèmes à résoudre s'écrivent comme une espérance. Cela inclut un algorithme primal dual pour des problèmes régularisés et linéairement contraints ainsi qu'un algorithme d'optimisation sur les grands graphes. This thesis mainly studies optimization algorithms. Programming problems arising in signal processing and machine learning are composite in many cases, i.e they exhibit constraints and non smooth regularization terms. Proximal methods are known to be efficient to solve such problems. However, in modern applications of data sciences, functions to be minimized are often represented as statistical expectations, whose evaluation is intractable. This cover the case of online learning, big data problems and distributed computation problems. To solve this problems, we study in this thesis proximal stochastic methods, that generalize proximal algorithms to the case of cost functions written as expectations. Stochastic proximal methods are first studied with a constant step size, using stochastic approximation techniques. More precisely, the Ordinary Differential Equation method is adapted to the case of differential inclusions. In order to study the asymptotic behavior of the algorithms, the stability of the sequences of iterates (seen as Markov chains) is studied. Then, generalizations of the stochastic proximal gradient algorithm with decreasing step sizes are designed to solve composite problems. Every quantities used to define the optimization problem are written as expectations. This include a primal dual algorithm to solve regularized and linearly constrained problems and an optimization over large graphs algorithm. Electronic Thesis or Dissertation Text en http://www.theses.fr/2018SACLT021/document Salim, Adil 2018-11-26 Université Paris-Saclay (ComUE) Hachem, Walid
collection	NDLTD
language	en
sources	NDLTD
topic	Optimisation distribuée Apprentissage statistique Approximation stochastique Opérateurs monotones aléatoires Algorithmes proximaux Distributed optimization Machine learning Stochastic approximation Random monotone operators Proximal algorithms
spellingShingle	Optimisation distribuée Apprentissage statistique Approximation stochastique Opérateurs monotones aléatoires Algorithmes proximaux Distributed optimization Machine learning Stochastic approximation Random monotone operators Proximal algorithms Salim, Adil Random monotone operators and application to stochastic optimization
description	Cette thèse porte essentiellement sur l'étude d'algorithmes d'optimisation. Les problèmes de programmation intervenant en apprentissage automatique ou en traitement du signal sont dans beaucoup de cas composites, c'est-à-dire qu'ils sont contraints ou régularisés par des termes non lisses. Les méthodes proximales sont une classe d'algorithmes très efficaces pour résoudre de tels problèmes. Cependant, dans les applications modernes de sciences des données, les fonctions à minimiser se représentent souvent comme une espérance mathématique, difficile ou impossible à évaluer. C'est le cas dans les problèmes d'apprentissage en ligne, dans les problèmes mettant en jeu un grand nombre de données ou dans les problèmes de calcul distribué. Pour résoudre ceux-ci, nous étudions dans cette thèse des méthodes proximales stochastiques, qui adaptent les algorithmes proximaux aux cas de fonctions écrites comme une espérance. Les méthodes proximales stochastiques sont d'abord étudiées à pas constant, en utilisant des techniques d'approximation stochastique. Plus précisément, la méthode de l'Equation Differentielle Ordinaire est adaptée au cas d'inclusions differentielles. Afin d'établir le comportement asymptotique des algorithmes, la stabilité des suites d'itérés (vues comme des chaines de Markov) est étudiée. Ensuite, des généralisations de l'algorithme du gradient proximal stochastique à pas décroissant sont mises au point pour resoudre des problèmes composites. Toutes les grandeurs qui permettent de décrire les problèmes à résoudre s'écrivent comme une espérance. Cela inclut un algorithme primal dual pour des problèmes régularisés et linéairement contraints ainsi qu'un algorithme d'optimisation sur les grands graphes. === This thesis mainly studies optimization algorithms. Programming problems arising in signal processing and machine learning are composite in many cases, i.e they exhibit constraints and non smooth regularization terms. Proximal methods are known to be efficient to solve such problems. However, in modern applications of data sciences, functions to be minimized are often represented as statistical expectations, whose evaluation is intractable. This cover the case of online learning, big data problems and distributed computation problems. To solve this problems, we study in this thesis proximal stochastic methods, that generalize proximal algorithms to the case of cost functions written as expectations. Stochastic proximal methods are first studied with a constant step size, using stochastic approximation techniques. More precisely, the Ordinary Differential Equation method is adapted to the case of differential inclusions. In order to study the asymptotic behavior of the algorithms, the stability of the sequences of iterates (seen as Markov chains) is studied. Then, generalizations of the stochastic proximal gradient algorithm with decreasing step sizes are designed to solve composite problems. Every quantities used to define the optimization problem are written as expectations. This include a primal dual algorithm to solve regularized and linearly constrained problems and an optimization over large graphs algorithm.
author2	Université Paris-Saclay (ComUE)
author_facet	Université Paris-Saclay (ComUE) Salim, Adil
author	Salim, Adil
author_sort	Salim, Adil
title	Random monotone operators and application to stochastic optimization
title_short	Random monotone operators and application to stochastic optimization
title_full	Random monotone operators and application to stochastic optimization
title_fullStr	Random monotone operators and application to stochastic optimization
title_full_unstemmed	Random monotone operators and application to stochastic optimization
title_sort	random monotone operators and application to stochastic optimization
publishDate	2018
url	http://www.theses.fr/2018SACLT021/document
work_keys_str_mv	AT salimadil randommonotoneoperatorsandapplicationtostochasticoptimization AT salimadil operateursmonotonesaleatoiresetapplicationaloptimisationstochastique
_version_	1719311611902033920

Random monotone operators and application to stochastic optimization

Similar Items