Tesis y Trabajos de Investigación PUCP

URI permanente para esta comunidadhttp://54.81.141.168/handle/123456789/6

El Repositorio Digital de Tesis y Trabajos de Investigación PUCP aporta al Repositorio Institucional con todos sus registros, organizados por grado: Doctorado, Maestría, Licenciatura y Bachillerato. Se actualiza permanentemente con las nuevas tesis y trabajos de investigación sustentados y autorizados, así como también con los que que fueron sustentados años atrás.
Ingresa a su web: Repositorio Digital de Tesis y Trabajos de Investigación PUCP

Explorar

Resultados de búsqueda

Mostrando 1 - 5 de 5
  • Ítem
    Algoritmo bioinspirado Lobo Gris (Grey Wolf) para la optimización de índices en bases de datos relacionales
    (Pontificia Universidad Católica del Perú, 2024-05-29) Verástegui Sánchez, Fernando Guillermo; Cueva Moscoso, Rony
    Dentro del mundo empresarial actual, los datos cobran una importancia crucial para el desarrollo de una compañía, ya sea para análisis, seguimiento comercial, estrategias de negocios, entre otros. Por lo que, su almacenamiento y extracción son una parte importante para su uso. Las bases de datos sirven para almacenar esta información, para que luego puedan ser consultadas. Estas pueden ser tanto relacionales como no relacionales, siendo la primera en donde los datos que se almacenan están relacionados entre ellos. La información se organiza mediante tablas, que incluyen columnas y filas, pudiendo obtener acceso a estos datos de diferentes maneras (AWS, n.d.). Para los administradores de base de datos (DBA) e investigadores la mejora del rendimiento de las bases de datos ha sido un reto persistente a lo largo de los años. Este desafío está fuertemente relacionado con la forma de organización lógica de los registros y, especialmente, a la rapidez con la que se accede y procesa esos registros. En ese sentido, los índices ejercen como un modo de acceso más rápido a la información. Siendo un caso de ejemplo, cuando los datos son solicitados, el sistema de gestión de base de datos primero verifica si existe un índice y su estructura, la cual está ordenada y contiene la dirección física del dato, permitiendo así recuperar la información directamente en el disco duro, simplificando el trabajo de búsqueda (Pedrozo & Vaz, 2014). Si bien los índices sirven para acelerar la recuperación de los datos, uno mal diseñado deteriora el rendimiento general. Esto se debe a los diferentes factores que influyen en su creación, como lo son: El tipo de dato, la estructura de la tabla, el número de veces que se buscó un campo específico, la frecuencia de ciertas consultas, la frecuencia de valores distintos en una columna, la carga de trabajo, el número de operaciones de lectura y escritura, entre otros (Naik, 2018). En consecuencia, el propósito de este proyecto consiste en mejorar la eficiencia del tiempo de respuesta en las consultas mediante el uso de índices, brindando la mejor opción para la creación de estos, sobre las tablas dentro un sistema de gestión de bases de datos relacionales (RDBMS). Para este proyecto se plantea utilizar un algoritmo metaheurístico aplicado al problema de selección de índices (ISP), el cual consiste en, dado una base de datos y un conjunto de consultas, seleccionar automáticamente un conjunto apropiado de índices (Chaudhuri, Datar, and Narasayya 2004). Este problema es considerado un “NP-Hard Problem”, la elección de utilizar un algoritmo metaheurístico, en combinación con la amplia gama de variables que pueden influir, se revela como una opción óptima en comparación con otros tipos de algoritmos.
  • Ítem
    Algoritmo metaheurístico para la optimización de consultas SQL en bases de datos distribuidas relacionales
    (Pontificia Universidad Católica del Perú, 2024-04-09) Sangama Ramirez, Jesus Angel Eduardo; Cueva Moscoso, Rony
    En el contexto empresarial, los datos tienen una importancia significativa tanto para la operación del día a día en una organización como para la toma de decisiones dentro de esta. Por ello, resulta vital que consultar dichos datos sea un proceso lo más eficiente posible. Para las bases de datos relacionales, una forma de lograr esto es la optimización de consultas SQL, y entre los diferentes métodos de optimización se encuentran los algoritmos metaheurísticos. El presente trabajo realiza una investigación de la literatura académica centrada en estos algoritmos aplicados a la optimización de consultas en bases de datos distribuidas relacionales y decide realizar una comparación entre el algoritmo genético (el cual cuenta con gran popularidad en este ámbito) y el memético, con el fin de evaluar si la aplicación de este último resulta viable para este tipo de optimización. Para lograr lo planteado anteriormente, el trabajo busca definir variables, parámetros y restricciones del problema de optimización de consultas; las cuales posteriormente son utilizadas para implementar adaptaciones propias de los algoritmos genético y memético orientadas a dicho problema. Finalmente, se realiza una comparación de eficacia y eficiencia entre ambas implementaciones a través de experimentación numérica. Tras finalizar todas las tareas anteriores, se concluye que se logró implementar un algoritmo memético para optimizar consultas SQL en bases de datos distribuidas relacionales cuyo rendimiento puede superar al algoritmo genético para escenarios de complejidad creciente (es decir, bases de datos con numerosas tablas y sitios).
  • Ítem
    Business IT consulting para Laboratorio Clínico ROE
    (Pontificia Universidad Católica del Perú, 2022-06-20) Velez Sanchez, Augusto Andree; More Montoya, Alejandro Enrique; Guizado Serrano, Juan Pablo; Carlos Soto, Marlene Elisa; Negron Naldos, Luis Alfredo
    La importancia en el uso de los datos por parte de las empresas está relacionado directamente a la generación de valor para nuevas oportunidades de negocio en base a ellos, la industria de la salud no es indiferente a esta relación, en específico los Laboratorios Clínicos tienen la posibilidad de monetizar la información que almacenan y crear valor adicional a los resultados médicos que hoy entregan, pasar de solo entregar un resultado numérico de los exámenes a proponer mejoras en la salud de los pacientes de manera pro activa mejorando la experiencia de los pacientes. Laboratorio Clínico ROE es líder en el mercado nacional y su rubro no es ajeno a esta necesidad, es por lo que el propósito de investigación es realizar un Business IT Consulting que permita crear una ventaja competitiva diferenciadora sostenible en base a los datos, diferenciándose de la competencia creando valor para sus pacientes con nuevos servicios digitales, en base a la información que tiene por más de 50 años dentro del mercado peruano. La consultoría ha pasado por una serie de actividades de recolección de información, análisis del mercado de salud del país y la situación de la empresa, así como las necesidades que tiene internamente para generar esta ventaja competitiva, se analizó las causas de los tres problemas principales, así como las posibles soluciones en base a un esquema de priorización que permitió encontrar las estrategias necesarias para llegar a tener esta ventaja diferenciadora. Se propone para el Laboratorio implementar un programa de detección temprana de enfermedades y un programa de seguimiento de pacientes crónicos pasando por la adquisición de habilidades analíticas con la creación de nuevos roles y perfiles dentro de ROE. Esto en paralelo con el establecimiento de lineamientos estratégicos para los datos, democratizando su uso e integrando a la empresa las herramientas analíticas necesarias.
  • Ítem
    Implementación de un algoritmo memético para optimizar la asignación de tablas a unidades de almacenamiento de bases de datos relacionales
    (Pontificia Universidad Católica del Perú, 2022-06-06) Lucas Ramos, Jhamir Arturo; Cueva Moscoso, Rony
    En la actualidad, los sistemas de bases de datos son considerados como un componente fundamental para casi cualquier organización, ya que estos sistemas permiten acceder a información puntual de forma segura y rápida, lo cual es clave para una correcta toma de decisiones y una adecuada atención a los usuarios. Sin embargo, debido al rápido desarrollo de las tecnologías de información, cada vez más sistemas de información generan enormes cantidades de datos y necesitan lidiar con estos de forma eficiente y, dado que las bases de datos relacionales juegan un rol vital en muchos sistemas de información, el rendimiento de estos mismos sistemas depende directamente del rendimiento del sistema de base de datos. En ese sentido, se considera crítico aplicar diversos métodos para optimizar el rendimiento del sistema de base de datos. Uno de estos métodos es la asignación de tablas, el cual consiste en distribuir de manera adecuada a las tablas de una base de datos en los dispositivos de almacenamiento disponibles. Dicho método es útil porque permite mejorar el rendimiento del sistema de base de datos y aprovechar de mejor manera los recursos de hardware disponibles. Sin embargo, muchas veces esta tarea se realiza considerando sólo algunas variables o factores al momento de tomar una decisión. Asimismo, existe una ausencia en el empleo de esta técnica por parte de muchos sistemas modernos. Esto, sumado al hecho de que la asignación suele realizarse de manera manual y también a que los estudios presentes en el estado del arte utilizan, en su gran mayoría, soluciones basadas en heurísticas o cálculos simples, las cuales pueden no brindar buenos resultados, conducen a que se realice una deficiente asignación de tablas a unidades de almacenamiento. Esta situación provoca un bajo rendimiento del sistema de base de datos, un deficiente funcionamiento de la entrada y salida de disco y que las tareas de administración sean más propensas a errores. Ante esta situación, se torna necesario el uso de métodos que automaticen y optimicen esta tarea, en ese sentido, el presente trabajo de tesis propone el diseño y la implementación de un algoritmo memético que permita optimizar la asignación de tablas a unidades de almacenamiento de bases de datos relacionales.
  • Ítem
    La generación de valor mediante el uso de data science en la toma de decisiones comerciales de tiendas por departamento
    (Pontificia Universidad Católica del Perú, 2021-06-14) Pignano Bravo, Angelo Santino; Pino Carmona, Piero Jesús; Ponce Regalado, María de Fátima
    La presente investigación plantea la importancia que ha cobrado el aprovechamiento de los datos en este contexto conocido como la era del big data. La importancia del análisis de dichos datos ha creado la necesidad de que cada vez más organizaciones se alineen a nuevas tecnologías que permiten la recolección, análisis y sintetización de los datos a fin de obtener información relevante para la toma de decisiones organizacionales. La aproximación de la investigación se enfoca en cómo la integración del data science en los procesos de toma de decisiones puede generar valor en el área comercial de las tiendas por departamento, para analizar ello el modelo ensemble es considerado como el más completo y sobre el cual se construye el marco analítico de la presente investigación. Se seleccionó este modelo luego de un estudio de bibliografía especializada en temas referentes al data science, toma de decisiones, gestión del área comercial y contexto de las tiendas por departamento a fin de analizar la situación actual de las tiendas por departamento y observar si verdaderamente existe una necesidad de que se dé mayor importancia en la adaptación del data science en dicho rubro. Posteriormente, se analiza el sector de tiendas por departamento a nivel mundial, latinoamericano y peruano; asimismo, se realiza estudios de caso de diversas organizaciones del rubro tiendas por departamento en el mundo a fin de conocer qué factores fueron determinantes para su implementación que pueden o no ser replicables en otros contextos deLatinoamérica. Finalmente, se indica, como principal conclusión de la investigación, que las empresas que no se adapten a la era del Big Data y no consideren los beneficios del Data Science, se encuentran en una situación de desventaja, además, no podrán tener un crecimiento sostenible en el tiempo, ni un posicionamiento adecuado, por lo tanto, se espera que la tendencia por el uso de la ciencia de datos sea cada vez mayor. En base a ello, se propone que para futuras investigaciones se analice cuantitativamente el valor generado por la aplicación del data science para el caso de una empresa en un sector determinado.