Estadística
URI permanente para esta colecciónhttp://54.81.141.168/handle/123456789/9075
Explorar
Ítem Texto completo enlazado A beta inflated mean regression model with mixed effects for fractional response variables(Pontificia Universidad Católica del Perú, 2017-06-20) Fernández Villegas, Renzo; Bayes Rodríguez, Cristian LuisIn this article we propose a new mixed effects regression model for fractional bounded response variables. Our model allows us to incorporate covariates directly to the expected value, so we can quantify exactly the influence of these covariates in the mean of the variable of interest rather than to the conditional mean. Estimation is carried out from a Bayesian perspective and due to the complexity of the augmented posterior distribution we use a Hamiltonian Monte Carlo algorithm, the No-U-Turn sampler, implemented using Stan software. A simulation study for comparison, in terms of bias and RMSE, was performed showing that our model has a better performance than other traditional longitudinal models for bounded variables. Finally, we applied our Beta Inflated mixed-effects regression model to real data which consists of utilization of credit lines in the peruvian financial system.Ítem Texto completo enlazado An empirical application of stochastic volatility models to Latin-American stock returns using GH skew student's t-distribution(Pontificia Universidad Católica del Perú, 2015-07-17) Lengua Lafosse, Patricia; Bayes Rodríguez, Cristian LuisThis paper represents empirical studies of stochastic volatility (SV) models for daily stocks returns data of a set of Latin American countries (Argentina, Brazil, Chile, Mexico and Peru) for the sample period 1996:01-2013:12. We estimate SV models incorporating both leverage effects and skewed heavy-tailed disturbances taking into account the GH Skew Student’s t-distribution using the Bayesian estimation method proposed by Nakajima and Omori (2012). A model comparison between the competing SV models with symmetric Student´s t-disturbances is provided using the log marginal likelihoods in the empirical study. A prior sensitivity analysis is also provided. The results suggest that there are leverage effects in all indices considered but there is not enough evidence for Peru, and skewed heavy-tailed disturbances is confirmed only for Argentina, symmetric heavy-tailed disturbances for Mexico, Brazil and Chile, and symmetric Normal disturbances for Peru. Furthermore, we find that the GH Skew Student s t-disturbance distribution in the SV model is successful in describing the distribution of the daily stock return data for Peru, Argentina and Brazil over the traditional symmetric Student´s t-disturbance distribution.Ítem Texto completo enlazado Análisis de influencia bajo inferencia bayesiana en evaluaciones escolares de altas consecuencias(Pontificia Universidad Católica del Perú, 2018-07-30) Christiansen Trujillo, Andrés Guillermo; Bayes Rodríguez, Cristian LuisLa presente investigación estudia una metodología para la detección de observaciones atípicas mediante un análisis de influencia bajo la perspectiva de la inferencia bayesiana. Se utiliza la medida de phi-divergencia y el estimador de Monte Carlo, derivado de ésta, trabajados previamente por Peng y Dey (1995), para el cálculo de las divergencias Kullback-Leibler, distancia rectilínea y ji-cuadrado. Además, en el presente trabajo se busca realizar este análisis de influencia en evaluaciones de altas consecuencias (evaluaciones cuyos resultados tienen un alto impacto en la vida de los estudiantes o docentes). El estudio de simulación revela que es posible recuperar observaciones previamente distorsionadas como atípicas. Finalmente, se aplica la metodología a una evaluación realizada por el Ministerio de Educación. Esta aplicación revela que la metodología estudiada es capaz de identificar escuelas con resultados no esperados dadas sus condiciones y resultados anteriores.Ítem Texto completo enlazado Una aplicación de intervalos de confianza para la mediana de supervivencia en el modelo de regresión de Cox(Pontificia Universidad Católica del Perú, 2015-07-17) Mondragón Arbocco, Jorge Adolfo; Bayes Rodríguez, Cristian LuisEl presente trabajo estudiará el método propuesto por Tze y Zheng (2006) aplicándolo a la obtención de intervalos de confianza para la mediana de supervivencia de líneas móviles de una empresa de telecomunicaciones. Esta metodología se aplicará con el objeto de conocer el riesgo de vida promedio de la línea móvil así como de qué manera inciden las covariables sobre el tiempo hasta el incumplimiento del pago de los clientes de la empresa. Para ello se hará uso de una extensión del modelo de Cox haciendo uso de la estimación máximo verosímil para obtener nuevas estimaciones del vector de parámetros mediante el método bootstrap lo que permita la construcción de los intervalos de confianza para la mediana de supervivencia.Ítem Texto completo enlazado Estimación bayesiana de efectos de red: el modelo Logit mixto(Pontificia Universidad Católica del Perú, 2017-10-02) Chahuara Vargas, Paulo Roberto; Bayes Rodríguez, Cristian LuisLos efectos o externalidades de red son factores que pueden condicionar las decisiones de contratación de los consumidores en favor de empresas ya establecidas y en contra de los nuevos competidores, pudiendo limitar la competencia efectiva y potencial de los mercados, en especial, en aquellas industrias donde el número de empresas es bajo y la entrada de nuevos competidores es poco frecuente. Por ello, es importante verificar su existencia y la magnitud de sus efectos sobre las decisiones de compra de los consumidores con el objetivo de justificar o establecer medidas que impulsen una competencia más equilibrada entre las empresas. Además, teniendo en consideración que los consumidores pueden tener cierto grado de heterogeneidad en sus comportamientos de adquisición, también resulta relevante estudiar el grado de diferenciación de los efectos de red entre los consumidores a fin de mejorar las políticas que fomenten la competencia. Este trabajo tiene por objetivo estimar un modelo logit mixto bajo el enfoque de la inferencia bayesiana, para estudiar empíricamente la existencia y heterogeneidad de los efectos de red sobre las decisiones de contratación de los consumidores en la industria de telefonía móvil peruana. El análisis se hace con base a una muestra que combina información de la Encuestas Residencial de Servicios de Telecomunicaciones (ERESTEL) del a˜no 2015 e información de las empresas operadoras del servicio de telefonía móvil. Los resultados de las estimaciones realizadas sugieren que los efectos de red tendrían un condicionamiento importante sobre las decisiones de contración del servicio de telefonía móvil, además de presentar un grado de heterogeneidad estadísticamente significativo en la magnitud de sus efectos.Ítem Texto completo enlazado Estudio de tres propuestas de distribución skew-t(Pontificia Universidad Católica del Perú, 2016-06-20) Kantor Benavides, Alejandro; Bayes Rodríguez, Cristian LuisEste trabajo compara tres distribuciones skew-t. En particular, las propuestas por Branco y Dey (2001) y Azzalini y Capitanio (2003), Fernández y Steel (1998), y Jones y Faddy (2003). Se analiza la relación entre los parámetros y el nivel de asimetría a través de la medida de Patil et al. (2014). Se propone una nueva parametrización de la distribución skew-t de Jones y Faddy (2003) que modela mejor la asimetría. Las distribuciones son ajustadas a datos reales basados en el retorno logarítmico de la tasa de cambio de PEN a USD.Ítem Texto completo enlazado Inferencia bayesiana en el modelo de regresión beta rectangular(Pontificia Universidad Católica del Perú, 2018-05-07) Calderón Pozo, Francisco German; Bayes Rodríguez, Cristian LuisSe conoce que el modelo lineal normal no es apropiado para situaciones en la que la variable respuesta es una proporción que solo toma valores en un rango limitado (0; 1), pues, se pueden obtener valores ajustados para la variable de inter es que exceden sus límites inferior y superior. Ante dicha situación, una propuesta es utilizar la distribución beta ya que es bastante flexible para modelar proporciones. Este modelo de regresión, sin embargo, puede ser influenciado por la presencia de valores atípicos o extremos. Debido a ello, se ha propuesto en la literatura, un modelo de mayor robustez llamado modelo de regresión beta rectangular, el cual permite una mayor incidencia de tales valores. El objetivo general de la tesis es estudiar las propiedades, estimar y aplicar a un conjunto de datos reales el modelo de regresión beta rectangular desde el punto de vista de la estadística bayesiana. Para cumplir con el objetivo planteado, se estudian las características y propiedades de las distribuciones beta y beta rectangular. Luego, se desarrolla el análisis bayesiano del modelo de regresión beta rectangular considerando las distribuciones a priori y a posteriori, los criterios de selección de modelos y simulaciones de Montecarlo v a cadenas de Markov. También, se realizan estudios de simulación para demostrar que el nuevo modelo es m as robusto que el modelo de regresión beta. Adicionalmente, se presenta una aplicación para mostrar la utilidad del modelo de regresión beta rectangular.Ítem Texto completo enlazado Inferencia bayesiana en el modelo de regresión spline penalizado con una aplicación a los tiempos en cola de una agencia bancaria(Pontificia Universidad Católica del Perú, 2013-04-08) Huaraz Zuloaga, Diego Eduardo; Bayes Rodríguez, Cristian LuisEn diversos campos de aplicación se requiere utilizar modelos de regresión para analizar la relación entre dos variables. Cuando esta relación es compleja, es difícil modelar los datos usando técnicas paramétricas tradicionales, por lo que estos casos requieren de la flexibilidad de los modelos no paramétricos para ajustar los datos. Entre los diferentes modelos no paramétricos está la regresión spline penalizada, que puede ser formulada dentro de un marco de modelos lineales mixtos. De este modo, los programas computacionales desarrollados originalmente para la inferencia clásica y Bayesiana de modelos mixtos pueden ser utilizados para estimarlo. La presente tesis se centra en el estudio de la inferencia Bayesiana en el modelo de regresión spline penalizado. Para lograr esto, este trabajo proporciona un marco teórico breve de este modelo semiparamétrico y su relación con el modelo lineal mixto, la inferencia Bayesiana de este modelo, y un estudio de simulación donde se comparan la inferencia clásica y Bayesiana en diferentes escenarios considerando diversos valores del n umero de nodos, tamaños de muestra y niveles de dispersión en la data simulada. Finalmente, en base a los resultados del estudio de simulación, el modelo se aplica para estimar el tiempo de espera en cola de los clientes en agencias bancarias con el fin de calcular la capacidad de personal óptima bajo determinadas metas de nivel de servicio.Ítem Texto completo enlazado Inferencia bayesiana en un modelo de regresión cuantílica autorregresivo(Pontificia Universidad Católica del Perú, 2021-06-14) Quintos Choy, Manuel Alejandro; Bayes Rodríguez, Cristian LuisEl modelo de regresión cuantílica autorregresivo permite modelar el cuantil condicional de una serie de tiempo a partir de los rezagos de la serie. En el presente trabajo se presenta la estimación de este modelo desde la perspectiva bayesiana asumiendo que los errores se distribuyen según la distribución asimétrica de Laplace (ALD). Luego, el proceso de generación de muestras de la distribución a posteriori es simplificado utilizando una representación estocástica de la ALD propuesta por Kotz et al. (2001) y el algoritmo de datos aumentados de Tanner y Wong (1987), siguiendo la propuesta de Kozumi y Kobayashi (2011), así como las adaptaciones para el modelamiento de series de tiempo de Cai et al. (2012) y Liu y Luger (2017). Los estudios de simulación demuestran que el supuesto sobre la distribución del término error no es limitante para estimar el cuantil condicional de series de tiempo con otras distribuciones. El modelo es aplicado en la predicción del Valor en Riesgo (VaR) en la serie de tiempo de los retornos diarios de la tasa de cambio de PEN a USD, y sus resultados son comparados con las predicciones obtenidas por las metodologías RiskMetrics, GARCH(1,1) y CAVIaR. Al respecto, la evidencia numérica permite concluir que el modelo QAR es una alternativa válida para estimar el VaR.Ítem Texto completo enlazado Inferencia bayesiana en un modelo de regresión cuantílica semiparamétrico(Pontificia Universidad Católica del Perú, 2015-07-20) Agurto Mejía, Hugo Miguel; Bayes Rodríguez, Cristian LuisEste trabajo propone un Modelo de Regresión Cuantílica Semiparamétrico. Nosotros empleamos la metodología sugerida por Crainiceanu et al. (2005) para un modelo semiparamétrico en el contexto de un modelo de regresión cuantílica. Un enfoque de inferencia Bayesiana es adoptado usando Algoritmos de Montecarlo vía Cadenas de Markov (MCMC). Se obtuvieron formas cerradas para las distribuciones condicionales completas y así el algoritmo muestrador de Gibbs pudo ser fácilmente implementado. Un Estudio de Simulación es llevado a cabo para ilustrar el enfoque Bayesiano para estimar los parámetros del modelo. El modelo desarrollado es ilustrado usando conjuntos de datos reales.Ítem Texto completo enlazado Jointly modelling of cluster dependent pro les of fractional and binary variables from a Bayesian point of view(Pontificia Universidad Católica del Perú, 2020-10-27) Cortés Tejada, Fernando Javier; Bayes Rodríguez, Cristian LuisEn la presente tesis se proponen modelos de clasificación basados en regresiones beta inflacionadas cero-uno con efectos mixtos para modelar perfiles longitudinales de variables fraccionarias mixtas y variables binarias de forma conjunta con formación de clústeres. Las distintas parametrizaciones de los modelos propuestos permiten modelar distintos efectos, como modelar directamente la media marginal a través de covariables e interpretar fácilmente su efecto sobre ella o modelar la media condicional y las probabilidades de inflación de forma separada. Además, se forman clústeres de grupos de individuos con perfiles longitudinales similares a través de una variable latente, asumiendo que las variables respuesta siguen un modelo de mixtura finita. Debido a la complejidad de los modelos, los parámetros se estiman desde un punto de vista bayesiano, a partir de simulaciones MCMC utilizando el software JAGS en R. Se prueban los modelos propuestos sobre diferentes bases de datos simulados para medir el desempeño de los mismos y se comparan con otros modelos a fin de verificar cual ajusta mejor los perfiles longitudinales de variables fraccionarias mixtas y variables binarias. Por último, se aplican los modelos propuestos a datos reales de un banco peruano, con información del ratio de uso de tarjetas de crédito en el periodo de un año, estado de default del cliente y otras covariables correspondientes al cliente poseedor de la tarjeta, con el objetivo de obtener clústeres de individuos con similar ratio de uso de tarjeta de crédito y relacionarlos con la probabilidad de caer en default que presenta cada grupo.Ítem Texto completo enlazado Métodos de selección de variables bajo el enfoque bayesiano para el modelo lineal normal(Pontificia Universidad Católica del Perú, 2021-01-18) Blas Oyola, Sthip Frank; Bayes Rodríguez, Cristian LuisEn muchos casos prácticos, al realizar un análisis de regresión, se cuenta con un gran número de potenciales variables explicativas de las cuáles sólo algunas serán importantes para explicar la variable respuesta. Por lo tanto, un problema importante para la construcción de un modelo de regresión es encontrar un adecuado conjunto de variables explicativas. A los métodos que lidian con este problema se les denomina métodos de selección de variables. En el presente proyecto de tesis, se estudiarán tres métodos de selección de variables bajo inferencia bayesiana para el modelo de regresión lineal normal los cuales fueron propuestos por George y McCulloch (1993), Kuo y Mallick (1998) y Dellaportas et al. (2002). Estos métodos, a diferencia de los métodos tradicionales, consideran la selección de variables dentro del mismo modelo, por ejemplo, introduciendo variables latentes que indiquen la presencia o ausencia de una variable explicativa. Se realizaron comparaciones de estos métodos bayesianos con los métodos Lasso y Stepwise por ser los más tradicionales. A través de un estudio con datos simulados, en diversos escenarios se observa que los métodos bayesianos permiten una adecuada selección de las variables explicativas. Adicionalmente se presentan los resultados de una aplicación con datos reales.Ítem Texto completo enlazado Modelamiento del tiempo a la ocurrencia de un evento con tiempos discretos(Pontificia Universidad Católica del Perú, 2021-01-18) Huertas Quispe, Anthony Enrique; Bayes Rodríguez, Cristian LuisEn este trabajo de tesis, se plantea estudiar el tiempo a la ocurrencia de un evento en un proceso discreto. Para ello, se considera un modelo mixtura de fracción de cura sobre una población segmentada en dos tipos de individuos: sujetos curados, o también denominados sobrevivientes a largo plazo, haciendo referencia a aquellos sujetos que no alcanzarán el evento de interés en estudio; y sujetos no curados, o también denominados sujetos susceptibles, quienes en un tiempo específico, experimentarán dicho evento de interés. Los objetivos principales de esta tesis, son el de estimar la fracción de cura, la cual está definida como la proporción de individuos curados al final del estudio, y estimar el tiempo de falla para los individuos susceptibles, entendiéndose como el tiempo a la ocurrencia del evento. Este análisis se llevará a cabo con la presencia de covariables y datos censurados, siendo la simulación e inferencia de los datos efectuados vía el software estadístico R, en donde los procesos de simulación abordarán distintos escenarios para evaluar la performance del modelo propuesto.Ítem Texto completo enlazado Modelo de regresión a la media simplex inflacionada para proporciones(Pontificia Universidad Católica del Perú, 2018-11-15) Chámpac Flores, Juan Carlos; Bayes Rodríguez, Cristian LuisEl presente trabajo de tesis propone el modelo de regresión a la media simplex inflacionada, que permite modelar variables aleatorias continuas limitadas en el intervalo cerrado [0; 1] al considerar un conjunto de ecuaciones de regresión para estimar la media de la respuesta y los parámetros que modelan las probabilidades de los valores extremos 0 y 1. Asimismo, se desarrolla un estudio de simulación con el fin de evaluar si el método propuesto permite recuperar los parámetros del modelo desde el punto de vista de la estadística clásica. Por otro lado, se desarrolla la aplicación del modelo para determinar el grado de dolarización de empresas que registran deudas en el Sistema Financiero, y para evaluar el desempeño del mismo, se compara contra el modelo de regresión a la media beta inflacionada. Los resultados muestran un mejor ajuste del modelo propuesto en esta tesis.Ítem Texto completo enlazado Modelo de regresión semiparamétrico robusto(Pontificia Universidad Católica del Perú, 2021-05-11) Esquivel Segura, Henry John; Bayes Rodríguez, Cristian LuisEl presente trabajo de tesis presenta un modelo de regresión semiparamétrico con errores t-Student, que permite estudiar el comportamiento de una variable dependiente dado un conjunto de variables explicativas cuando los supuestos de linealidad y normalidad no se cumplen. La estimación de los parámetros se realiza bajo el enfoque bayesiano a través del algoritmo de Gibbs. En el estudio de simulación se observa que el modelo propuesto es más robusto ante la presencia de valores atípicos que el usual modelo regresión semiparamétrico normal. Asimismo se presenta una aplicación con datos reales para ilustrar esta característica.Ítem Texto completo enlazado Portafolios óptimos bajo estimadores robustos clásicos y bayesianos con aplicaciones al mercado peruano de acciones(Pontificia Universidad Católica del Perú, 2015-07-20) Vera Chipoco, Alberto Manuel; Bayes Rodríguez, Cristian LuisEl Modelo del Portafolio, propuesto por Markowitz (1952), es uno de los más importantes en el ámbito nanciero. En él, un agente busca lograr un nivel óptimo de sus inversiones considerando el nivel de riesgo y rentabilidad de un portafolio, conformado por un conjunto de acciones bursátiles. En este trabajo se propone una extensión a la estimación clásica del riesgo en el Modelo del Portafolio usando Estimadores Robustos tales como los obtenidos por los métodos del Elipsoide de Volumen mínimo, el Determinante de Covarianza Mínima, el Estimador Ortogonalizado de Gnanadesikan y Kettenring, el Estimador con base en la matriz de Covarianzas de la distribución t-student Multivariada y la Inferencia Bayesiana. En este último caso se hace uso de los modelos Normal Multivariado y t-student multivariado. En todos los modelos descritos se evalúa el impacto económico y las bondades estadísticas que se logran si se usaran estas técnicas en el Portafolio del inversionista en lugar de la estimación clásica. Para esto se utilizarán activos de la Bolsa de Valores de Lima.Ítem Texto completo enlazado Regresión cuantílica binaria: un enfoque bayesiano basado en la distribución asimétrica de Laplace(Pontificia Universidad Católica del Perú, 2024-02-15) Baldeon Molleda, Dante Reynaldo; Bayes Rodríguez, Cristian LuisLa regresión cuantílica es una técnica estadística que permite analizar la relación entre variables en distintos cuantiles de la distribución de la variable respuesta. No obstante, su aplicación en variables respuesta binaria puede contraintuitivo, pues la definición tradicional de cuantiles se conceptualiza para variables continuas y no tienen una interpretación directa en una variable binaria. A pesar de que una variable de respuesta binaria sólo toma dos valores y no permite una definición tradicional de cuantiles, es posible extender la regresión cuantílica para modelar los cuantiles de la variable latente subyacente a la variable de respuesta binaria. Esta variable latente es continua y permite aplicar la regresión cuantílica en contextos donde la variable de respuesta sea binaria. En este estudio, adoptamos un enfoque bayesiano para la regresión cuantílica binarios basado en la distribución asimétrica de Laplace (ALD); aplicaremos el modelo en un conjunto de datos correspondiente a resultados de descarte de pruebas COVID-19 en pacientes oncológicos y estimaremos los coeficientes de la regresión mediante el paquete bayesQR desarrollado en R.