Ingeniería Informática

Permanent URI for this collectionhttp://54.81.141.168/handle/123456789/9139

Browse

Search Results

Now showing 1 - 10 of 23
  • Item
    Diseño e implementación de un navegador de conceptos enlazados en el dominio de Ciencias de la computación
    (Pontificia Universidad Católica del Perú, 2019-02-13) León Shimabukuro, Alexis Enrique; Melgar Sasieta, Héctor Andrés
    En la actualidad, la World Wide Web es una de las fuentes principales de información, siendo un espacio que se encuentra en constante crecimiento, puesto que cada vez mas personas cuentan con acceso a internet. Sin embargo, esto genera múltiples problemas entre los que podemos mencionar como la duplicidad de información, que dificulta la búsqueda de información relevante a los usuarios, quienes utilizan herramientas como motores de búsqueda para esta tarea. Ante esta situación surgió la Web Semántica, extensión de la Web tradicional, en donde la información es comprensible tanto para las personas como para las máquinas. Para publicar información en este espacio existen un conjunto de prácticas conocido como Linked Data, que permiten que la información se estructure según su significado y relación entre los datos que la componen, lo que facilita la labor de búsqueda y permite el descubrimiento de nueva información, generando valor a usuarios como investigadores, que constantemente se encuentran en búsqueda de conocimientos. Toda la información en constante crecimiento contenida en la Web Semántica puede ser accedida simplemente mediante navegadores convencionales; sin embargo, esta se encuentra en su mayoría en formato RDF, por lo que el usuario común no podrá comprender su contenido. Para que la información pueda ser de utilidad, se necesitan conocimientos en conceptos como RDF y XML, lo que limita gran parte del potencial actual de la Web Semántica a los especialistas en dicha área. El presente proyecto implementa un navegador de Linked Data, mediante el cual los usuarios pueden consultar información en el dominio de las ciencias de la computación, dicha información es obtenida de la Web Semántica, permitiendo el descubrimiento de información relevante, contribuyendo así a la expansión de dicha tecnología, que busca unificar y estructurar toda la información contenida en la web. Para la elaboración del proyecto, se implementó un módulo de procesamiento de consultas, en donde el usuario ingresa una cadena de búsqueda, al igual que en un motor de búsqueda tradicional y mediante esta cadena se obtienen posibles propiedades, que son enviadas a manera de consultas en lenguaje SPARQL, a partir de cuyos resultados se construyen estructuras RDFs que muestran los conceptos y la información presentada en una interfaz gráfica para que el usuario pueda visualizarla y navegar a través de dichos conceptos, permitiendo el descubrimiento de información relevante.
  • Item
    Análisis de métodos y técnicas de limpieza de datos existentes y aplicación en un sistema CRM para una institución educativa limeña
    (Pontificia Universidad Católica del Perú, 2018-09-12) Sandoval Linares, Angel Gabriel; Melgar Sasieta, Héctor Andrés
    En la actualidad, las organizaciones emplean varios sistemas y varias fuentes de información para las actividades del día a día, y buscan tener toda esta información reunida e integrada en una única base de datos llamada data warehouse ya que permite fortalecer el trabajo del día a día, el análisis de datos y la toma de decisiones. Sin embargo, la información guardada debe de ser de buena calidad ya que una baja calidad de datos puede impactar severamente en el desempeño de la organización, la satisfacción del cliente, la toma de decisiones y reducir la habilidad de la organización de ejecutar correctamente sus planes estratégicos. En este contexto, aparece un problema crítico: la baja calidad de la información en los sistemas; y lo preocupante es que algunas empresas ignoran los impactos y consecuencias mencionados. Un sistema de información muy adquirido y usado por organizaciones Business-to- Consumer (B2C por su abreviatura en inglés) es el sistema de Gestión de Relación con el Cliente (Customer Relationship Management - CRM). Un sistema CRM es un sistema enfocado en la gestión de clientes. Los registros más importantes pertenecen a la entidad “clientes” y esta información es obtenida por las organizaciones a través de varios canales o mediante la compra de bases de datos de terceros. Finalmente, toda la información es almacenada en el data warehouse para ser consumida de allí para la toma de decisiones. Los problemas específicos para un sistema CRM son: registros duplicados de clientes, datos faltantes de un cliente como su teléfono o dirección, datos incorrectos, datos obsoletos que en algún momento fueron correctos y atributos con valores diferentes para un mismo cliente. Mantener estos registros limpios debe ser una actividad vital para la organización. Las instituciones educativas no son ajenas a esta herramienta de soporte CRM, y con el transcurso de los años, están apostando por adoptar sistemas CRM en las organizaciones (KaptureCRM, 2017). En este contexto, tener los datos de los estudiantes limpios es una tarea primordial para la organización. El desarrollo de este proyecto se enfoca en un análisis de los algoritmos, técnicas y métodos usados para la limpieza de datos, la implementación de procesos ETL (extracción, transformación y carga) que permitan la limpieza de cada fuente de datos, la integración de la información a una base de datos transaccional, la carga de la información de la base de datos transaccional a un data warehouse para su próxima explotación y, adicionalmente, el modelamiento de nuevos procesos de negocio para prevenir y mantener la correcta calidad de los datos en el sistema transaccional, para la institución educativa sobre la cual se realiza el proyecto.
  • Item
    Implementación de un software para búsqueda de publicaciones científicas en bases de datos estructuradas mediante datos enlazados
    (Pontificia Universidad Católica del Perú, 2018-07-10) Uribe Canchanya, Iván Renato; Melgar Sasieta, Héctor Andrés
    En la actualidad, la información es uno de los activos más importantes tanto en niveles personales, educativos y organizacionales. La información permite el desarrollo y el avance de los estados del conocimiento. Desde la aparición del Internet y su exponencial evolución, el acceso a la información se ha vuelto universal y su cantidad disponible sigue aumentando considerablemente. Para las organizaciones es muy valioso el resguardo y uso de la información ya que, de esta administración depende su capacidad para seguir creciendo y obteniendo valor dentro de sus respectivos campos de acción. Del mismo modo, para una persona el obtener información importante es adquirir conocimientos que serán relevantes para la consecución de sus objetivos planteados. En cualquiera de los ámbitos el uso de la información permite la formulación y la ejecución de los planes estratégicos. Sin embargo, el encontrar aquella información que realmente se necesita se ha vuelto una tarea cada vez más complicada. En el campo de la investigación científica la recopilación de fuentes de información representa el punto de partida. Trasladando esta necesidad al contexto peruano, se observa que la producción científica está en aumento y en un ritmo acorde al crecimiento de otras naciones. Sin embargo, actualmente resulta complicado para los investigadores el obtener la información relevante para iniciar sus investigaciones con la certeza de que no existen investigaciones previas o que abarquen el mismo campo de estudio. Para lograr una buena recopilación se debe navegar entre los distintos repositorios digitales existentes que son de libre acceso o incluso pagados. En tal sentido, existe una solución conocida como Datos Enlazados, un enfoque que no se contrapone a la web actual que permite el vínculo entre páginas web (documentos HTML), pero sí lo complementa ya que permite la vinculación de datos entre distintos contextos y fuentes de información. El presente trabajo de fin de carrera propone una alternativa de solución para la búsqueda integral y automatizada en distintos repositorios digitales que son de libre acceso y cuyas bases de datos están estructuradas mediante Datos Enlazados. Se implementó un método de búsqueda adaptativo en base a las ontologías que manejan los distintos repositorios digitales (datasets). De tal manera, se obtiene una ontología de dominio adaptable que permite la extracción de datos relevantes de cada repositorio, para su posterior reestructuración y su visualización. Para lograr la ontología dinámica se implementó un algoritmo adaptador que analiza el vocabulario ontológico del dataset e identifica las entidades relevantes para el dominio de investigaciones y publicaciones. Luego, se implementaron métodos de extracción con funciones en SPARQL que dependen de la ontología y finalmente, los datos relevantes son guardados en grafos RDF para luego ser serializados en documentos RDF/XML y Turtle. Se concluye que el proyecto ha sido exitoso en cuanto que el software permite realizar la búsqueda de publicaciones de distintos autores peruanos que tienen indexados sus documentos en repositorios digitales como DBLP o IEEE Library Project, contribuyendo de esta manera a la búsqueda integral de información.
  • Item
    Desarrollo de una herramienta para la anotación semántica automática de documentos pdf basado en ontologías
    (Pontificia Universidad Católica del Perú, 2017-08-10) Coronado Altamirano, Gustavo; Melgar Sasieta, Héctor Andrés
    Actualmente, Internet es una de las fuentes más accesibles y utilizadas para buscar información sobre determinado tema, a través de la cual las personas pueden conectarse a una gran colección de recursos, servicios y contenidos. En ese sentido, el uso de motores de búsqueda es indispensable para poder encontrar contenido específico y relevante para el usuario, es decir, información precisa y alineada con el tema de su interés. Sin embargo, los buscadores pueden presentar dificultades para brindar al usuario la información deseada. Estas dificultades se presentan por motivos tales como las características propias del lenguaje natural como la polisemia, sinonimia y ambigüedad; así, también, por el desconocimiento de los temas que son de interés para el usuario. Otra de las causas que dificultan la recuperación de información relevante es que la búsqueda de resultados se realiza de manera sintáctica, esto es, buscando en los documentos la coincidencia exacta de los términos ingresados en la cadena de búsqueda. Del mismo modo, otra razón importante es que los formatos e interfaces de contenido se presentan en formatos comprensibles solo por las personas y no por un computador. Ante esto, el presente proyecto propone una alternativa de solución de forma tal que los documentos contengan información adicional que describa los conceptos y entidades principales del contenido. Esta información adicional se añadirá de manera automática a los documentos mediante anotaciones semánticas en base a un dominio de conocimiento que sea de interés para el usuario. De esta manera, se pretende apoyar el concepto de Web semántica cuya propuesta es clasificar, estructurar y anotar los recursos con semántica explícita para que puedan ser procesados por sistemas inteligentes.
  • Item
    Implementación de un buscador semántico de documentos en el dominio de la lingüística
    (Pontificia Universidad Católica del Perú, 2017-08-03) Malpartida Valverde, Diego Andrés; Melgar Sasieta, Héctor Andrés
    La World Wide Web (WWW) ha mejorado considerablemente el acceso a la información digital. La búsqueda y navegación en la Web se han convertido en parte de nuestras vidas diarias, siendo los motores de búsquedas y herramientas de navegación Web un estándar que ha cambiado la forma en la que buscamos e interactuamos con la información. Sin embargo, la Web como la conocemos hoy está diseñada para que la información contenida en las páginas o documentos sea entendible por las personas y no por las computadoras. Es decir, las computadoras no poseen de una manera para procesar la semántica o significado de la información. Esto ocasiona que solo se puedan realizar búsquedas sintácticas de la información, en lugar de búsquedas semánticas. Las búsquedas sintácticas consisten en la recuperación de aquellos documentos cuyo contenido posee las palabras o frases ingresadas por el usuario en la consulta. Se basan en la similitud de cadenas de caracteres (las ingresadas por el usuario y las que contiene el documento). El problema con las búsquedas sintácticas es que se limitan a esta coincidencia de palabras y no consideran el significado de la información, lo que ha sido demostrado que genera imprecisión (mucha información irrelevante) en los resultados. En este contexto, en el Departamento de Humanidades de la universidad existe la necesidad de recuperar información de aproximadamente 2000 documentos lingüísticos para fines académicos. Una búsqueda convencional o sintáctica no sería una buena solución, ya que como se mencionó anteriormente retorna mucha información irrelevante. Entonces, se puede definir el problema central del proyecto como la dificultad para obtener información relevante de documentos en el dominio de la lingüística. Como alternativa de solución, el presente proyecto de fin de carrera implementa un buscador que emplee los conceptos y principios de la Web Semántica. Este tipo de buscador se basa en el análisis semántico de la consulta ingresada por el usuario y del contenido de los documentos, recuperando aquellos cuya representación semántica coincide con la de la consulta. A diferencia de la búsqueda sintáctica, este enfoque analiza el significado de las palabras o frases y no solo su representación sintáctica. El beneficio de las búsquedas semánticas es que permiten alcanzar una mayor precisión en los resultados obtenidos; es decir, brindan resultados de mayor relevancia para el usuario.
  • Item
    Publicación y consumo de información de atractivos turísticos y culturales locales, utilizando los principios y tecnologías de Linked Data
    (Pontificia Universidad Católica del Perú, 2017-07-15) Yesquen Lihim, Cristhian Roberto; Melgar Sasieta, Héctor Andrés
    En la actualidad, la Web se ha convertido en la plataforma social e interactiva más utilizada. Las personas ahora tienen la posibilidad de interactuar unos con otros y aportar mayor contenido que permita enriquecer la experiencia de navegar en Internet. Sin embargo, esto ha sido el causante de una serie de problemas relacionados a la gestión y organización de los recursos que son publicados en la Web. En Internet podemos encontrar una gran cantidad de contenido, pero muchas veces la información que encontramos trata sobre el mismo tema o elemento en particular, sobrecargando la Web con información ya existente. Muchas veces, estos recursos no están relacionados y, la forma en que son publicados imposibilita la existencia de alguna forma de conectarlos unos con otros, de manera que se pueda, por un lado, evitar la duplicidad de información, y, por otro lado, promover la reutilización de información. El presente proyecto se enfocará en el ámbito del turismo, en específico, en relación a la información publicada respecto a los atractivos turísticos y culturales presentes en el Perú. Existen gran cantidad de sitios Web, tanto nacionales como internacionales, en donde se puede buscar y obtener información y datos de interés de atractivos turísticos locales. Esta información puede ser exactamente igual o muy similar, con lo cual se incurre en una sobrecarga y duplicidad de información en la Web, o inclusive muy distinta, pero sin posibilidad de complementarse. Con el objetivo de poder reducir la sobrecarga de información en la Web, y aumentar las posibilidades de complementarse entre distintas fuentes, surge un conjunto de principios, buenas prácticas y tecnologías bajo el concepto de Linked Data o Datos Enlazados. Este conjunto de elementos describe un método de publicación de recursos en la Web, estructurado y llevado a cabo de tal manera que los datos e información puedan ser reutilizados por fuentes y ordenadores de orígenes distintos. De acuerdo a lo expuesto anteriormente, se plantea brindar una alternativa de solución al problema de la publicación de recursos en la Web, en específico en el dominio de atractivos turísticos y culturales del Perú. Para ello, se hará uso de los principios, buenas prácticas y tecnologías de Linked Data para la publicación y consumo de dichos recursos. En el presente proyecto se diseñará e implementará una estructura que permita publicar en la Web datos de interés relacionados a atractivos turísticos y culturales locales, siguiendo los lineamientos de Linked Data, y además de la construcción de una herramienta que permita consultar y obtener información de dichos atractivos.
  • Item
    Implementación de una plataforma informática avanzada que sirva de soporte a los procesos que intervienen en la gestión de equipos médicos en establecimientos de salud peruanos
    (Pontificia Universidad Católica del Perú, 2017-06-16) Miranda Dulanto, Luis Miguel; Takayama Nakasato, Kei Alonso; Melgar Sasieta, Héctor Andrés
    El modelo de la actual estructura de la gestión de los establecimientos de salud del país no tiene desarrollado el aspecto tecnológico. Debido a lo anterior, existe un riesgo de que las inversiones realizadas se pierdan debido a la poca capacidad de manejo tecnológico actual. La problemática afecta directamente a los pacientes debido a la baja efectividad clínica, aumento de la morbilidad y uso del presupuesto en áreas no críticas. Por lo anterior, se busca tener un método que permita cuantificar las pérdidas y sobrecostos que se generan por no tener un modelo organizacional que incluya la gestión de equipos médicos, una mejora en la calidad de los servicios (los cuales repercutirán positivamente en los pacientes) y una mejora en la disposición de residuos ambientales provenientes de los mantenimientos realizados. La gestión de tecnología en salud es un nuevo enfoque integral de gestión especializada basada en los fundamentos de ingeniería clínica, la gestión y la economía que sigue los lineamientos generales de organizaciones mundiales como la Organización Mundial de la Salud desde el 2009. Teniendo en cuenta lo anterior, se propone la implementación de una plataforma informática que permite dar soporte a la gestión de los equipos médicos en los establecimientos de salud en el país. Esta implementación se realizará en función a los procesos previamente diseñados por el equipo de bioingeniería de la PUCP pertenecientes al proyecto financiado por Innóvate Perú con código 209-FINCYT-IA- 2013, en base a los estándares y normas internacionales de la Gestión de las Tecnologías de la Salud de la OMS.
  • Item
    Implementación de sistema de información para la gestión de las tecnologías en salud en los establecimientos médicos
    (Pontificia Universidad Católica del Perú, 2017-03-09) Bernal Lovera, Daniel Arturo; Melgar Sasieta, Héctor Andrés
    La principal motivación del proyecto radica en que actualmente el Perú no cuenta con una adecuada Gestión de la Tecnología en la Salud (GTS). Esto genera un deficiente uso y una sobre estimación de los costos de mantenimiento de equipos médicos y de sus repuestos. Asimismo, hay una inadecuada gestión del uso de tecnología la cual genera que el tiempo de vida útil de los equipos médicos se reduzca, esto afecta directamente a los pacientes, pues muchos diagnósticos se basan en los resultados obtenidos de los equipos médicos, los cuales podrían estar sobre usados, sub usados o con averías, afectando negativamente la calidad de atención de los pacientes. Por ello, se propone como solución una herramienta que tome en cuenta puntos como: los procesos de planificación, adquisición, manejo de recursos en su ciclo de vida, y gestión de los RR.HH, tal que permita garantizar alta efectividad clínica, aumentar la eficiencia del uso de los recursos tecnológicos, el retomo de las inversiones, la reducción de eventos adversos y el control de los costos operativos en los establecimientos de salud.
  • Item
    Desarrollo de una herramienta para la práctica del curso de matemáticas en plataformas educativas virtuales utilizando reconocimiento de emociones
    (Pontificia Universidad Católica del Perú, 2016-07-07) Zúñiga Soto, Rosario Isabel; Melgar Sasieta, Héctor Andrés
    El Perú atraviesa una crisis en su sistema educativo, a pesar de estar cerca de lograr la universalización de la educación primaria, sector importante para el desarrollo escolar, los resultados muestran que los niños no aprenden como deberían. Para mejorar esta situación se necesitan aplicar nuevas técnicas que apoyen al desarrollo educacional sobretodo de los niños y niñas del nivel primario. En el ámbito tecnológico, existen nuevas herramientas que no están siendo utilizadas y que podrían ayudar a mejorar la educación en nuestro país. Una de estas herramientas son las plataformas educativas virtuales, conocidas también como e- Learning Systems. Si bien estas plataformas logran cubrir algunas expectativas de lo que debería ser un aula virtual, no toman en cuenta las experiencias, talentos e intereses de los alumnos. El presente proyecto de fin de carrera propone una alternativa de solución mediante una herramienta que posibilite el reconocimiento de emociones por medio de texto ingresado por el alumno, para descubrir el perfil que posee y poder responder afectivamente a sus necesidades. Para simular el ambiente pedagógico se crearon lecciones para practicar la materia de Matemáticas. De igual manera el trabajo se centra en la educación primaria como primer enfoque en el desarrollo.
  • Item
    Implementación de un sistema de información de logística para la gestión de insumos y productos en una empresa del rubro de panadería y pastelería
    (Pontificia Universidad Católica del Perú, 2015-10-26) Sone Yanagui, Elena Saori; Melgar Sasieta, Héctor Andrés
    Una de las alternativas de solución, actualmente, y que presenta grandes ventajas es el uso de un sistema de información, el cual constituye una herramienta clave para el crecimiento de una organización. Su uso ha ayudado a muchas organizaciones en sus labores diarias; empero, aun existen muchas que aun no lo implementan, desaprovechando los beneficios que podrían obtener de él; generándose, además, ciertas dificultades a ellos mismos por la ausencia de esta herramienta. Una de estas complicaciones es la que se produce cuando se desea obtener información actualizada sobre el stock existente de una empresa. Un caso representativo de este problema es el que se da en las empresas del rubro gastronómico, donde las empresas que cuentan con una alta demanda de sus productos y que no cuenta con un sistema de información presentan mayor dificultad en la administración y control que las empresas que poseen esta herramienta y hacen uso de ella. El presente proyecto se basó en el problema de obtener información actualizada del stock de los productos de una organización dedicada a la panadería y pastelería, la cual no cuenta, desde sus inicios, con un sistema de información para la administración de las actividades principales de la empresa. El problema se refleja, principalmente, en la dificultad constante respecto a la organización y recepción de información actualizada sobre el stock de insumos y productos, que al no encontrarse la información centralizada en un solo lugar, genera retrasos en los procesos de compra, venta y almacén. Por tanto, con el presente proyecto se brinda una alternativa de solución mediante la implementación de un sistema de información que le permita gestionar y controlar los insumos y productos de la empresa, con el fin de disponer de información actualizada de ellos con mayor rapidez y facilidad.