Modelos de regresión gamma generalizada cero-inflacionada para la media con aplicación a gastos en educación
Acceso a Texto completo
Abstract
Cuando los valores posibles de una variable aleatoria son continuos y no negativos, incluyendo
el valor cero con probabilidad no nula, la variable es denominada semicontinua o
cero-in acionada y posiblemente sea pertinente suponer que presenta una distribución mixta
de probabilidades constituida por una distribución de Bernoulli para explicar si la respuesta
toma el valor cero o no y una distribución continua positiva para explicar si ésta última
no es cero. En el análisis de regresión, el modelo de dos partes (MDP) es tradicionalmente
usado para explicar una variable semicontinua. En el MDP la respuesta presenta este tipo
de distribución mixta y sus parámetros son expresados de tal manera que posibilite estimar
el efecto de un conjunto de covariables sobre la media de esta respuesta condicionada a que
tome valores positivos y sobre la probabilidad de que la respuesta tome el valor cero.
El objetivo de la tesis es estudiar un modelo alternativo al MDP, que llamaremos modelo
de regresión cero-in acionada a la media (MCIM), cuya parametrización permita estimar e
interpretar efectos de covariables sobre la media total de la respuesta, en lugar de la media
condicionada a valores positivos. Además, optamos por la distribución gamma generalizada
(MCIM-GG) para modelar ciertas características de los valores positivos de la respuesta, tales
como, por ejemplo, la asimetría positiva y la curtosis pronunciada. Estas características, junto
con el exceso de valores cero, son típicas en diferentes ejemplos de variables respuestas en la
Economía y la Medicina.
Los resultados del estudio de simulación muestran un adecuado desempeño de las estimaciones
de máxima verosimilitud del MCIM-GG bajo diferentes escenarios de nidos según
porcentajes de valores ceros de la respuesta y tamaños de muestra. Por último, los resultados
de la aplicación muestran que el MCIM-GG puede tener un mejor ajuste a los datos respecto
al MDP-GG, así como proporcionar una más directa interpretación de los efectos de ciertas
covariables sobre la media de los gastos en educación de adolescentes participantes del estudio
Niños del Milenio en el Perú.