Tesis y Trabajos de Investigación PUCP
URI permanente para esta comunidadhttp://54.81.141.168/handle/123456789/6
El Repositorio Digital de Tesis y Trabajos de Investigación PUCP aporta al Repositorio Institucional con todos sus registros, organizados por grado: Doctorado, Maestría, Licenciatura y Bachillerato. Se actualiza permanentemente con las nuevas tesis y trabajos de investigación sustentados y autorizados, así como también con los que que fueron sustentados años atrás.
Ingresa a su web: Repositorio Digital de Tesis y Trabajos de Investigación PUCP
Explorar
36 resultados
Resultados de búsqueda
Ítem Texto completo enlazado Modelos de regresión con mixtura de escala Gaussiana bajo regularización bayesiana(Pontificia Universidad Católica del Perú, 2024-09-09) Urbano Burgos, Alejandrina Margarita; Valdivieso Serrano, Luis HilmarLa presente tesis busca estudiar las propiedades, estimación y aplicación a dos conjuntos de datos reales de diversas técnicas de regularización bayesiana sobre un modelo de regresión lineal múltiple con mixtura de escala Gaussiana, modelo que incluye al de una regresión logística. Estas técnicas de regresión penalizada bayesiana plantean distribuciones a priori que realizan la penalización, introduciendo el concepto de esparcidad, el cual se refiere al hecho de que solo un reducido número de variables tengan valores distintos de cero en sus coeficientes de regresión; es decir, es una especie de truncamiento de coeficientes llevados a cero que produce a su vez modelos más manejables e interpretables. De particular interés en este trabajo, fue la comparación de las técnicas de regularización bajo penalización y las derivadas de introducir las prioris de Horseshoe y de Horseshoe + a los coeficientes de regresión del modelo. Mostrando en la presente tesis, de manera explícita, cómo realizar un muestreo de Gibbs para la estimación de estos modelos, detallando no solo las distribuciones condicionales completas necesarias; sino también como es posible, mediante el uso del paquete bayesreg de R, optimizar algunas de estas propuestas de muestreo.Ítem Texto completo enlazado Modelo de regresión lineal usando una mixtura de distribuciones senh-normal(Pontificia Universidad Católica del Perú, 2023-09-27) Palomino Ore, Roussel Simpson; Benites Sánchez, Luis EnriqueLa distribución Senohiperbólico-Normal, denominada también como una variación de la distribución Birnbaum-Saunders, surgió inicialmente para estimar el deterioro en la calidad de los materiales sujetos a estrés. Asimismo, los modelos de mixtura han suscitado considerable interés en el campo de estadística debido a que permiten lidiar con situaciones en las que el comportamiento de los errores de un modelo con ajuste lineal se aleja significativamente de la normalidad. Esta tesis aborda los dos temas mencionados mediante la presentación de un modelo de ajuste lineal usando una mixtura de distribuciones Senohiperbólico Normal o Log-Birnbaum-Saunders. Esta propuesta es una familia versátil de distribuciones de probabilidad que posibilita representar datos que presentan multimodalidad además de provenir de poblaciones heterogéneas. Para conseguir los estimadores de máxima verosimilitud se emplea el algoritmo EM con maximización condicional. Asimismo, se llevan a cabo estudios de simulación y análisis de conjuntos de datos reales para demostrar la utilidad del método propuesto. Por último, se implementa la propuesta del algoritmo y los métodos en el software R.Ítem Texto completo enlazado Modelo de regresión para el pronóstico de la cantidad de denuncias por delitos que se registran en las Comisarías de la Policía Nacional de Perú en Lima Metropolitana(Pontificia Universidad Católica del Perú, 2023-08-31) Chipa Sierra, Roger; Beltrán Castañón, César ArmandoEn nuestro país, la cantidad promedio de denuncias por delitos de manera mensual en el año 2019 presenta 30,000 casos, lo cual se ha ido incrementando a lo largo de los años, por lo que es de crucial importancia generar estrategias de seguridad ciudadana que ayuden a mejorar el bienestar de la sociedad peruana, para ello es crucial tener información fiable y de calidad para la toma de decisiones; asimismo, tiene una Dirección de Tecnologías de la Información y Comunicación de la Policía (DIRTIC), la cual dentro de su estructura tiene a su cargo a la División de Estadística (DIVEST) y la División de Informática (DIVINFOR), las cuales tienen como función el control del Sistema de Denuncias Policiales en la cual el 80 % de las comisarías de la Policía Nacional del Perú se encuentran interconectadas y existe un 20 % que no se encuentran interconectadas, por lo cual el 20 % de comisarías no registra información en el Sistema de Denuncias Policiales, generando una incertidumbre para la toma de decisiones. Es por tal motivo que la División de Estadística (DIVEST) propone un modelo para el pronóstico de la cantidad de denuncias por delitos que se registran en las comisarías de la Policía Nacional de Perú en Lima Metropolitana, en base a la técnica de regresión RANDOM FOREST REGRESSOR Y ÁRBOL DE DECISIÓN DE REGRESIÓN, con la cual se podrá conocer cuál de las dos técnicas genera un mejor pronóstico en base a la información que proviene del SIDPOL y del INEI.Ítem Texto completo enlazado M-Splines baseline hazard approximation for the proportional hazard model with right censored data(Pontificia Universidad Católica del Perú, 2023-07-20) Juarez García, Omar Alejandro; Sal Y Rosas Celi, Victor GiancarloThe proportional hazard model plays a fundamental role in the analysis of time-to-event data. In this thesis, we conduct a simulation study to evaluate the performance of M-splines to estimate the baseline cumulative hazard function for the proportional hazard model. We assess the effect of sample size and number of knots in the estimation process. Finally, we apply this method to a sample of students from a university where the event of interest is the payment on time of the last tuition fee.Ítem Texto completo enlazado Modelo de regresión lineal con censura basado en una mixtura finita de una distribución normal asimétrica(Pontificia Universidad Católica del Perú, 2023-05-29) Yábar Geldres, Ingrid Alicia; Benites Sánchez, Luis EnriqueEl presente trabajo de tesis propone estudiar el modelo de regresión lineal con censura basado en una mixtura finita de una distribución normal asimétrica (NA), con adaptación a diferente número de componentes. Este enfoque permite modelar datos continuos con gran flexibilidad, acomodando simultáneamente multimodalidad, colas pesadas y asimetría, dependiendo de la estructura de los componentes de la mixtura. Se implementa un algoritmo de tipo EM analíticamente manejable y eficiente para calcular iterativamente las estimaciones de máxima verosimilitud de los parámetros, mediante aproximaciones estocásticas (SAEM). El algoritmo propuesto tiene algunas expresiones cerradas en el paso-E, por lo que la obtención de los errores estándar se da por el método Bootstrap. Asimismo, se realiza un estudio de simulación con el fin de evaluar si el método propuesto permite recuperar los parámetros del modelo mediante el uso del algoritmo SAEM. Por otro lado, se realiza la aplicación del modelo propuesto para el estudio de la participación en la fuerza laboral de las mujeres casadas usando la base de datos de la Universidad de Michigan (Mroz, 1987). Como segunda aplicación se utiliza un conjunto de datos de clientes que entraron en campaña en una entidad financiera local con el fin de estimar sus ingresos.Ítem Texto completo enlazado Estimación del consumo de combustible de ómnibus interprovinciales por el método de análisis de regresión lineal múltiple basado en parámetros operacionales y estilos de conducción en la ruta Lima - Trujillo(Pontificia Universidad Católica del Perú, 2023-04-04) Gamboa Gonzáles, Willy Alexander; Cuisano Egusquiza, Julio CesarEl sector transporte es el mayor consumidor de combustibles líquidos en el Perú (41.8% de la energía final neta) contribuyendo con 21,047.88 GgCO2eq que representan el 10.25% de gases de efecto invernadero presentes en el ambiente (MINAM, 2019). En el caso específico del transporte interprovincial de pasajeros, el combustible representa una parte importante de sus costos de operación (de 30% a 40%) según Pineda et al. (2021). Esta investigación propone una metodología para desarrollar un modelo de consumo de combustible óptimo que se utilice por empresas de transportes para desplegar sus propios planes de control y gestión de costos. Para lograr este propósito se identificaron los factores (variables regresoras1) que afectan significativamente al consumo de combustible en la operación de tres ómnibus de transporte de pasajeros. Los coeficientes de las variables regresoras se estimaron utilizando el método de regresión lineal múltiple utilizando el software Rstudio2 constituyendo una herramienta de gestión muy significativa para reducir el consumo de combustible y la emisión de gases de efecto invernadero. Conociendo la influencia de estas variables regresoras en el consumo de combustible, el estudio permitiría a las empresas de transporte enfocarse en aquellas variables conductuales y operativas de mayor contribución, para rediseñar sus estrategias de conducción y mejorar los índices energéticos y ambientales. Los datos para desarrollar el modelo de regresión lineal múltiple tienen un carácter no determinista y estocástico con presencia de variables discretas y continuas que se recogieron manualmente (pesaje del ómnibus), aplicativos de previsiones meteorológicas (Windfinder), sistema de diagnóstico a bordo (OBD II) y sistema de satélites de navegación global (GNSS). Los datos obtenidos a través del OBD II y GNSS se transmitieron a través del módulo telemático (Teltonika FMB630); pues de investigaciones precedentes se reconoció que era la forma más efectiva y económica para obtener información. El modelo matemático obtenido por regresión lineal múltiple permitió cuantificar la influencia de cada una de las variables y estimar que las mejores condiciones conductuales y operacionales consiguen ahorros de hasta 5.76 galones por viaje en la ruta Trujillo – Lima, acumulando al año 2047.09 galones por año/bus. Sí esta mejora se consiguiera en el 25% de la flota vehicular matriculada en el Perú entre el 2010 y 2018 se alcanzaría un ahorro de combustible de 878,201.69 galones y una reducción de 9´348,688 Kg CO2eq al año. La flota de ómnibus matriculados en el Perú del 2010 en adelante, son tecnológicamente aptas para el control y uso de la inercia y reducción de la inyección de combustible electrónicamente.Ítem Texto completo enlazado Aplicación de técnicas de Data Analytics: Clustering y Regresión Lineal Múltiple, para la segmentación de la oferta y proyección de ciclos inmobiliarios en el mercado de oficinas prime(Pontificia Universidad Católica del Perú, 2023-02-13) Jhon Rios, Luis Priamo; Silva Alarco, LucianoEl presente trabajo de investigación desarrolla la aplicación de las técnicas clustering (clúster) y regresión lineal múltiple, para la segmentación de la oferta y proyección de ciclos inmobiliarios en el mercado de oficinas prime. Estas herramientas corresponden al ámbito de data analytics (análisis de datos), el cual consiste en el procesamiento y ejecución de análisis estadísticos en conjuntos de datos de entrada, los cuales para el caso de esta investigación, corresponden a información de indicadores del mercado inmobiliario de oficinas en los últimos 10 años. En primer lugar, la aplicación de la técnica descriptiva de clúster, permitirá segmentar el mercado inmobiliario de oficinas, agrupando las diferentes edificaciones según sus características afines, generando una segmentación que permita profundizar un mejor entendimiento de la oferta existente y de esta manera optimizar las estrategias de comercialización utilizadas por los agentes del mercado. En segundo lugar, utilizando la información histórica de los principales indicadores inmobiliarios, se plantea la construcción de un modelo predictivo de regresión múltiple que permitirá proyectar el comportamiento de la oferta y demanda del mercado, estimando de esta manera la fase del ciclo inmobiliario que atraviesa el mercado: expansión, sobreoferta, re1cesión o recuperación. Para desarrollar el presente trabajo, se realizó la revisión bibliográfica de las principales investigaciones que aplican modelos de clúster y regresión lineal múltiple, considerando también que el contenido puede resultar útil para la toma de decisiones de inversionistas, empresas desarrolladoras y analistas comerciales del sector inmobiliario, puesto que les permitirá deslumbrar tendencias en el mercado y les servirá como ayuda para determinar cuáles son los momentos adecuados para invertir en un nuevo proyecto inmobiliario y/o comercializar un contrato de arrendamiento de oficinas.Ítem Texto completo enlazado Regresión beta usando cópulas gaussianas para analizar series de tiempo(Pontificia Universidad Católica del Perú, 2023-01-11) Cajavilca Gonzales, Ana Rosa; Quiroz Cornejo, Zaida JesúsEste trabajo presenta una alternativa para analizar series de tiempo que se encuentran restringidas al intervalo (0; 1). Se detalla el modelo propuesto Masarotto y Varin (2012) y Guolo y Varin (2014), el cual permite capturar los efectos producidos por covariables a través de una regresión beta y adicionalmente, con el empleo de cópulas permite modelar la dependencia temporal mediante un proceso de autorregresivo de medias móviles. Como ventaja de la aplicación de este modelo se tiene que evita la necesidad de transformar la variable dependiente, así como también evita someterla al cumplimiento de diversos supuestos como los de normalidad y estacionariedad. Además, permite diferenciar los efectos de las covariables y de la dependencia temporal, lo cual coadyuva a mejorar el análisis de los resultados. Se realizó una aplicación a la tasa de desempleo desde enero de 2003 hasta octubre de 2019 en Lima Metropolitana y debido a la distribución que presenta esta variable se usó un modelo de regresión beta usando cópulas gaussianas. Para la estimación se incluyó el logaritmo del índice del PBI, así como un componente de estacionalidad anual como covariables y para tomar en cuenta la dependencia temporal se incorporó un proceso autorregresivo de medias móviles ARMA(1; 1) a través de una cópula gaussiana.Ítem Texto completo enlazado Modelo de regresión robusta con censura intervalar(Pontificia Universidad Católica del Perú, 2023-01-10) Aliaga Flores, Luis Carlos; Bayes Rodriguez, Cristian LuisEl presente trabajo de tesis propone el modelo de regresion log t de Student, el cual permite modelar variables respuesta que presentan censura intervalar y se muestra robusto frente a la presencia de observaciones atípicas. Luego, se desarrolla aquí un estudio de simulacion clásico, con el n de analizar la sensibilidad frente a distintos niveles de valores atípicos. Finalmente, se desarrolla la aplicacion del modelo para la estimación de las demoras en órdenes de compras de los proveedores de las empresas en el Perú, concluyendo que el modelo propuesto en esta tesis tiene un mejor ajuste a los datos en comparación con el modelo Log Normal.Ítem Texto completo enlazado Modelo de regresión cuantílica para respuestas positivas con censura intervalar(Pontificia Universidad Católica del Perú, 2022-03-21) Manrique Urbina, Justo Andrés; Bayes Rodriguez, Cristian LuisLa presente tesis propone un modelo de regresi on cuant lica en d onde la variable es no negativa y posee censura intervalar, es decir que esta no es directamente observable, y la unica informaci on que se conoce sobre ella es que se encuentra en cierto intervalo. Para evaluar si la metodolog a de estimaci on captura adecuadamente los par ametros poblacionales desde el punto de vista de la inferencia cl asica, se desarrolla un estudio de simulaci on. Finalmente, se aplica el modelo a los datos de la Encuesta Nacional de Satisfacci on de Salud ejecutada el a~no 2015. La estructura del modelo permite evaluar los factores relacionados al sueldo de los profesionales en salud (el cual hab a sido censurado desde el proceso de recolecci on de datos). El presente modelo es una extensi on al modelo de regresi on de censura intervalar expuesto en Sal y Rosas et al. (2019), pues eval ua los factores subyacentes a una variable respuesta a lo largo de sus cuantiles.