Facultad de Ciencias e Ingeniería

Permanent URI for this communityhttp://54.81.141.168/handle/123456789/9119

Browse

Search Results

Now showing 1 - 6 of 6
  • Item
    Desarrollo de una herramienta para la anotación semántica automática de documentos pdf basado en ontologías
    (Pontificia Universidad Católica del Perú, 2017-08-10) Coronado Altamirano, Gustavo; Melgar Sasieta, Héctor Andrés
    Actualmente, Internet es una de las fuentes más accesibles y utilizadas para buscar información sobre determinado tema, a través de la cual las personas pueden conectarse a una gran colección de recursos, servicios y contenidos. En ese sentido, el uso de motores de búsqueda es indispensable para poder encontrar contenido específico y relevante para el usuario, es decir, información precisa y alineada con el tema de su interés. Sin embargo, los buscadores pueden presentar dificultades para brindar al usuario la información deseada. Estas dificultades se presentan por motivos tales como las características propias del lenguaje natural como la polisemia, sinonimia y ambigüedad; así, también, por el desconocimiento de los temas que son de interés para el usuario. Otra de las causas que dificultan la recuperación de información relevante es que la búsqueda de resultados se realiza de manera sintáctica, esto es, buscando en los documentos la coincidencia exacta de los términos ingresados en la cadena de búsqueda. Del mismo modo, otra razón importante es que los formatos e interfaces de contenido se presentan en formatos comprensibles solo por las personas y no por un computador. Ante esto, el presente proyecto propone una alternativa de solución de forma tal que los documentos contengan información adicional que describa los conceptos y entidades principales del contenido. Esta información adicional se añadirá de manera automática a los documentos mediante anotaciones semánticas en base a un dominio de conocimiento que sea de interés para el usuario. De esta manera, se pretende apoyar el concepto de Web semántica cuya propuesta es clasificar, estructurar y anotar los recursos con semántica explícita para que puedan ser procesados por sistemas inteligentes.
  • Item
    Publicación y consumo de información de atractivos turísticos y culturales locales, utilizando los principios y tecnologías de Linked Data
    (Pontificia Universidad Católica del Perú, 2017-07-15) Yesquen Lihim, Cristhian Roberto; Melgar Sasieta, Héctor Andrés
    En la actualidad, la Web se ha convertido en la plataforma social e interactiva más utilizada. Las personas ahora tienen la posibilidad de interactuar unos con otros y aportar mayor contenido que permita enriquecer la experiencia de navegar en Internet. Sin embargo, esto ha sido el causante de una serie de problemas relacionados a la gestión y organización de los recursos que son publicados en la Web. En Internet podemos encontrar una gran cantidad de contenido, pero muchas veces la información que encontramos trata sobre el mismo tema o elemento en particular, sobrecargando la Web con información ya existente. Muchas veces, estos recursos no están relacionados y, la forma en que son publicados imposibilita la existencia de alguna forma de conectarlos unos con otros, de manera que se pueda, por un lado, evitar la duplicidad de información, y, por otro lado, promover la reutilización de información. El presente proyecto se enfocará en el ámbito del turismo, en específico, en relación a la información publicada respecto a los atractivos turísticos y culturales presentes en el Perú. Existen gran cantidad de sitios Web, tanto nacionales como internacionales, en donde se puede buscar y obtener información y datos de interés de atractivos turísticos locales. Esta información puede ser exactamente igual o muy similar, con lo cual se incurre en una sobrecarga y duplicidad de información en la Web, o inclusive muy distinta, pero sin posibilidad de complementarse. Con el objetivo de poder reducir la sobrecarga de información en la Web, y aumentar las posibilidades de complementarse entre distintas fuentes, surge un conjunto de principios, buenas prácticas y tecnologías bajo el concepto de Linked Data o Datos Enlazados. Este conjunto de elementos describe un método de publicación de recursos en la Web, estructurado y llevado a cabo de tal manera que los datos e información puedan ser reutilizados por fuentes y ordenadores de orígenes distintos. De acuerdo a lo expuesto anteriormente, se plantea brindar una alternativa de solución al problema de la publicación de recursos en la Web, en específico en el dominio de atractivos turísticos y culturales del Perú. Para ello, se hará uso de los principios, buenas prácticas y tecnologías de Linked Data para la publicación y consumo de dichos recursos. En el presente proyecto se diseñará e implementará una estructura que permita publicar en la Web datos de interés relacionados a atractivos turísticos y culturales locales, siguiendo los lineamientos de Linked Data, y además de la construcción de una herramienta que permita consultar y obtener información de dichos atractivos.
  • Item
    Recuperación de historias clínicas electrónicas a partir de un repositorio digital usando una arquitectura orientada a servicios
    (Pontificia Universidad Católica del Perú, 2015-10-13) Sánchez Reyna, Katty Sue; Melgar Sasieta, Héctor Andrés
    El presente proyecto de tesis tiene por objetivo implementar un servicio Web que permita el registro y la recuperación de las historias clínicas electrónicas (HCEs) a partir de un repositorio centralizado. Cabe resaltar que el presente proyecto considera los siguientes formatos médicos: Formato de Atención Integral (del niño, del adolescente, del adulto y del adulto mayor), Formato de Emergencia, Formato de Consulta Externa, Formato de Hospitalización y Ficha Familiar, Los resultados alcanzados para el logro del objetivo del proyecto son: el diseño de la arquitectura de software que tendrá el componente web, la elección de los mecanismos de seguridad que garanticen la privacidad y autenticación de los datos de las HCEs, y el servicio web implementado. Para definir el diseño de la arquitectura, se tomó en cuenta el estándar internacional de calidad de software ISO/IEC 9126 para determinar los atributos de calidad requeridos en la arquitectura, tales como: adecuación, tolerancia a fallos, capacidad para ser operado, entre otros. Asimismo, se determinaron los estilos y patrones de arquitectura a utilizar: orientado a objetos, orientado a servicios, arquitectura en N-capas, y patrón repositorio. La arquitectura de software definida se basa en el modelo “4+1” que considera 5 vistas: la vista lógica, la vista de implementación, la vista de procesos, la vista física y la vista de casos de uso. Luego de tener el diseño de la arquitectura, se eligieron los siguientes mecanismos de seguridad: pseudonimización que permite garantizar la privacidad de los datos de identificación del paciente, y firma digital con cifrado simétrico y asimétrico que aseguran la integridad y veracidad de la información almacenada en el repositorio. Además, se plantearon alternativas de métodos de seguridad para el control de acceso: seguridad del servicio web mediante certificados, restricción de acceso por IPs, y Tokens. Finalmente, una vez determinados la arquitectura y mecanismos de seguridad que tendrá el web service, se describe la forma en que se implementó dicho servicio web que permite registrar y recuperar las HCEs, y los procesos involucrados (registro de un médico, generación de llaves de seguridad, registro de un paciente, y registro y recuperación de un formato médico). La implementación del servicio web permite dar una alternativa de solución a los problemas generados por el registro en físico de las historias clínicas, tales como: ilegibilidad, deterioro, pérdida de los registros, y, principalmente, la imposibilidad de acceso a las historias clínicas completas de los pacientes. El acceso al servicio web implementado y al repositorio centralizado permite integrar y mantener actualizadas todas las HCEs de los pacientes. Cabe resaltar que para la realización del proyecto se ha tomado en cuenta el marco legal peruano. De esta forma los formatos médicos considerados en el alcance son los más relevantes y tomando como base la Resolución Ministerial N°776-2004. Del mismo modo, para elegir los mecanismos de seguridad, se ha considerado la Ley de Protección de Datos Personales. Los principales beneficios del proyecto de tesis son: ahorro de espacio físico al almacenar las historias de manera digital, se evita la duplicidad, deterioro y pérdida de los registros médicos, y, principalmente, se logra el acceso en simultáneo a las historias clínicas completas de los pacientes desde cualquier institución médica que tenga acceso al servicio web y, por ende, al repositorio centralizado. Finalmente, se puede decir que el presente proyecto puede servir de base para trabajos futuros, entre los cuales se puede destacar: la consideración de formatos médicos adicionales, la integración con el DNI electrónico cuando sea habilitado por RENIEC, y la implementación de un proyecto de inteligencia de negocios que permita la explotación de los datos e información registrada en el repositorio.
  • Item
    Modelo algorítmico para la clasificación de documentos de carácter judicial en lenguaje portugués según su contenido
    (Pontificia Universidad Católica del Perú, 2015-08-18) Pinto Valdiviezo, Luis Alejandro; Melgar Sasieta, Héctor Andrés
    En los últimos años la generación de información virtual ha aumentado considerablemente. Parte de esa información se encuentra almacenada en bases de datos de instituciones públicas y privadas. Sin embargo, no toda la información almacenada de forma electrónica tiene una estructura definida, tal es el caso de los documentos donde encontramos secuencias de palabras no estructuradas, los cuales según estudios representan el 80% de la información de las empresas. La tarea de clasificar automáticamente documentos tiene como motivo principal brindar una herramienta de mejora en la gestión de la información, la cual es considerada como condición indispensable para el éxito de cualquiera empresa. Ante esto, en el propósito del proyecto se propone la obtención de un modelo algorítmico para la clasificación automática de documentos de carácter judicial en lenguaje portugués según su contenido con el fin de automatizar las labores manuales involucradas en el proceso, y con ello disminuir los recursos implicados en la tarea de clasificación. La colección de documentos será brindada por una empresa en Brasil encargada de la clasificación manual de intimaciones a través de especialistas, llamados procuradores. Las intimaciones son documentos que son enviados desde los tribunales hacia las procuradurías durante un proceso de juicio.
  • Item
    Diseño de un modelo de recuperación de información usando expansión de consultas basadas en ontologías en el dominio de la ciencia de la computación
    (Pontificia Universidad Católica del Perú, 2014-11-25) Carranza Chávez, Bonnie Gabriela; Melgar Sasieta, Héctor Andrés
    A lo largo de los años, y particularmente a partir de la aparición del Internet, se ha venido dando un aumento en la cantidad de información disponible para ser consultada por las personas. Sin embargo, la aparición de los sistemas de recuperación de información ha contribuido a facilitar la búsqueda de información para los usuarios, disminuyendo los tiempos invertidos en dicha búsqueda, y hasta cierto punto, mejorando la relevancia de la información recuperada. Sin embargo, se ha identificado que aún persisten algunos elementos que dificultan la obtención de resultados relevantes tales como características propias del lenguaje natural como ambigüedad, desconocimiento del usuario respecto a qué puede ser relevante para él, entre otros. Ante esto, en el presente proyecto se propone una alternativa de solución de forma tal que los documentos recuperados sean en mayor medida relevantes. Esta recuperación se tratará bajo el enfoque específico de la expansión de consultas, proceso para el cual se emplearán modelos de conocimiento como lo son las ontologías.
  • Item
    Diseño de un modelo para la recuperación de documentos basado en ontologías en el dominio de la ingeniería informática
    (Pontificia Universidad Católica del Perú, 2014-11-25) Gómez Montoya, Héctor Erasmo; Melgar Sasieta, Héctor Andrés
    La selección de información relevante de documentos digitales es uno de los principales problemas para los estudiantes de pregrado de la especialidad de Ingeniería Informática. Para facilitar dicha tarea, es necesario un modelo que represente la relación entre las entidades en las que se define toda la información disponible. Por ello, se decidió llevar a cabo una revisión sistemática acerca de las posibles soluciones que representen dicho domino. Como resultado de la revisión realizada, se propone el uso de ontologías como estructura básica para la representación del conocimiento por su eficacia a la hora de realizar la recuperación. Además, se plantea utilizar un proceso de etiquetación semántica de documentos para relacionar cada documento digital con - al menos - una entidad de la ontología con la finalidad de poder realizar búsquedas mediante el uso de etiquetas y lenguaje natural. Se concluye que las ontologías son una estructura flexible y que soportan la recuperación de conocimiento en un dominio específico y que el modelo planteado cumple con las necesidades de búsqueda y etiquetación para los usuarios.