Régression logistique bayésienne : comparaison de densités a priori
La régression logistique est un modèle de régression linéaire généralisée (GLM) utilisé pour des variables à expliquer binaires. Le modèle cherche à estimer la probabilité de succès de cette variable par la linéarisation de variables explicatives. Lorsque l’objectif est d’estimer le plus précisém...
Main Author: | |
---|---|
Other Authors: | |
Language: | fr |
Published: |
2015
|
Subjects: | |
Online Access: | http://hdl.handle.net/1866/12575 |
id |
ndltd-umontreal.ca-oai-papyrus.bib.umontreal.ca-1866-12575 |
---|---|
record_format |
oai_dc |
spelling |
ndltd-umontreal.ca-oai-papyrus.bib.umontreal.ca-1866-125752017-03-17T08:18:55Z Régression logistique bayésienne : comparaison de densités a priori Deschênes, Alexandre Angers, Jean-François Régression logistique Bayésien Densité a priori Simulation MCMC Logistic regression Bayesian Prior density MCMC simulation Mathematics / Mathématiques (UMI : 0405) La régression logistique est un modèle de régression linéaire généralisée (GLM) utilisé pour des variables à expliquer binaires. Le modèle cherche à estimer la probabilité de succès de cette variable par la linéarisation de variables explicatives. Lorsque l’objectif est d’estimer le plus précisément l’impact de différents incitatifs d’une campagne marketing (coefficients de la régression logistique), l’identification de la méthode d’estimation la plus précise est recherchée. Nous comparons, avec la méthode MCMC d’échantillonnage par tranche, différentes densités a priori spécifiées selon différents types de densités, paramètres de centralité et paramètres d’échelle. Ces comparaisons sont appliquées sur des échantillons de différentes tailles et générées par différentes probabilités de succès. L’estimateur du maximum de vraisemblance, la méthode de Gelman et celle de Genkin viennent compléter le comparatif. Nos résultats démontrent que trois méthodes d’estimations obtiennent des estimations qui sont globalement plus précises pour les coefficients de la régression logistique : la méthode MCMC d’échantillonnage par tranche avec une densité a priori normale centrée en 0 de variance 3,125, la méthode MCMC d’échantillonnage par tranche avec une densité Student à 3 degrés de liberté aussi centrée en 0 de variance 3,125 ainsi que la méthode de Gelman avec une densité Cauchy centrée en 0 de paramètre d’échelle 2,5. Logistic regression is a model of generalized linear regression (GLM) used to explain binary variables. The model seeks to estimate the probability of success of this variable by the linearization of explanatory variables. When the goal is to estimate more accurately the impact of various incentives from a marketing campaign (coefficients of the logistic regression), the identification of the choice of the optimum prior density is sought. In our simulations, using the MCMC method of slice sampling, we compare different prior densities specified by different types of density, location and scale parameters. These comparisons are applied to samples of different sizes generated with different probabilities of success. The maximum likelihood estimate, Gelman’s method and Genkin’s method complement the comparative. Our simulations demonstrate that the MCMC method with a normal prior density centered at 0 with variance of 3,125, the MCMC method with a Student prior density with 3 degrees of freedom centered at 0 with variance of 3,125 and Gelman’s method with a Cauchy density centered at 0 with scale parameter of 2,5 get estimates that are globally the most accurate of the coefficients of the logistic regression. 2015-10-28T18:47:43Z NO_RESTRICTION 2015-10-28T18:47:43Z 2015-09-30 2015-07 Thèse ou Mémoire numérique / Electronic Thesis or Dissertation http://hdl.handle.net/1866/12575 fr |
collection |
NDLTD |
language |
fr |
sources |
NDLTD |
topic |
Régression logistique Bayésien Densité a priori Simulation MCMC Logistic regression Bayesian Prior density MCMC simulation Mathematics / Mathématiques (UMI : 0405) |
spellingShingle |
Régression logistique Bayésien Densité a priori Simulation MCMC Logistic regression Bayesian Prior density MCMC simulation Mathematics / Mathématiques (UMI : 0405) Deschênes, Alexandre Régression logistique bayésienne : comparaison de densités a priori |
description |
La régression logistique est un modèle de régression linéaire généralisée
(GLM) utilisé pour des variables à expliquer binaires. Le modèle cherche à
estimer la probabilité de succès de cette variable par la linéarisation de variables
explicatives. Lorsque l’objectif est d’estimer le plus précisément l’impact
de différents incitatifs d’une campagne marketing (coefficients de la régression
logistique), l’identification de la méthode d’estimation la plus précise
est recherchée. Nous comparons, avec la méthode MCMC d’échantillonnage
par tranche, différentes densités a priori spécifiées selon différents types de
densités, paramètres de centralité et paramètres d’échelle. Ces comparaisons
sont appliquées sur des échantillons de différentes tailles et générées par différentes
probabilités de succès. L’estimateur du maximum de vraisemblance, la
méthode de Gelman et celle de Genkin viennent compléter le comparatif. Nos
résultats démontrent que trois méthodes d’estimations obtiennent des estimations
qui sont globalement plus précises pour les coefficients de la régression
logistique : la méthode MCMC d’échantillonnage par tranche avec une densité
a priori normale centrée en 0 de variance 3,125, la méthode MCMC d’échantillonnage
par tranche avec une densité Student à 3 degrés de liberté aussi centrée
en 0 de variance 3,125 ainsi que la méthode de Gelman avec une densité
Cauchy centrée en 0 de paramètre d’échelle 2,5. === Logistic regression is a model of generalized linear regression (GLM) used
to explain binary variables. The model seeks to estimate the probability of success
of this variable by the linearization of explanatory variables. When the
goal is to estimate more accurately the impact of various incentives from a
marketing campaign (coefficients of the logistic regression), the identification
of the choice of the optimum prior density is sought. In our simulations, using
the MCMC method of slice sampling, we compare different prior densities specified
by different types of density, location and scale parameters. These comparisons
are applied to samples of different sizes generated with different probabilities
of success. The maximum likelihood estimate, Gelman’s method and
Genkin’s method complement the comparative. Our simulations demonstrate
that the MCMC method with a normal prior density centered at 0 with variance
of 3,125, the MCMC method with a Student prior density with 3 degrees
of freedom centered at 0 with variance of 3,125 and Gelman’s method with a
Cauchy density centered at 0 with scale parameter of 2,5 get estimates that are
globally the most accurate of the coefficients of the logistic regression. |
author2 |
Angers, Jean-François |
author_facet |
Angers, Jean-François Deschênes, Alexandre |
author |
Deschênes, Alexandre |
author_sort |
Deschênes, Alexandre |
title |
Régression logistique bayésienne : comparaison de
densités a priori |
title_short |
Régression logistique bayésienne : comparaison de
densités a priori |
title_full |
Régression logistique bayésienne : comparaison de
densités a priori |
title_fullStr |
Régression logistique bayésienne : comparaison de
densités a priori |
title_full_unstemmed |
Régression logistique bayésienne : comparaison de
densités a priori |
title_sort |
régression logistique bayésienne : comparaison de
densités a priori |
publishDate |
2015 |
url |
http://hdl.handle.net/1866/12575 |
work_keys_str_mv |
AT deschenesalexandre regressionlogistiquebayesiennecomparaisondedensitesapriori |
_version_ |
1718426480326737920 |