Tesis y Trabajos de Investigación PUCP
URI permanente para esta comunidadhttp://54.81.141.168/handle/123456789/6
El Repositorio Digital de Tesis y Trabajos de Investigación PUCP aporta al Repositorio Institucional con todos sus registros, organizados por grado: Doctorado, Maestría, Licenciatura y Bachillerato. Se actualiza permanentemente con las nuevas tesis y trabajos de investigación sustentados y autorizados, así como también con los que que fueron sustentados años atrás.
Ingresa a su web: Repositorio Digital de Tesis y Trabajos de Investigación PUCP
Explorar
2 resultados
Resultados de búsqueda
Ítem Texto completo enlazado Identificación y clasificación automática de repeticiones en estructuras de proteínas repetidas(Pontificia Universidad Católica del Perú, 2022-01-26) Muroya Tokushima, Luis Fernando; Hirsh Martinez, LaylaLas proteínas repetidas son proteínas no globulares caracterizadas por la presencia de repeticiones a nivel de secuencia y estructura. Pueden ser de 5 clases, cada una con un número variable de subclases. Estas proteínas son relevantes porque están relacionadas con una diversidad de enfermedades. Su correcta clasificación es parte fundamental para su estudio; sin embargo, la anotación manual de todas las estructuras de proteínas conocidas es una tarea que es logísticamente imposible completar. Por ello, la automatización de esta tarea es muy importante. En el presente trabajo, se desarrolló una herramienta para la identificación y clasificación de repeticiones de clase IV. Esta herramienta fue construida por el acoplamiento de dos módulos: uno de filtro y otro de clasificación. El primero fue construido reutilizando una red neuronal convolucional entrenada para la detección de simetrías rotacionales en la estructura de una proteína. Su uso estuvo fundamentado en el hecho que las repeticiones clase IV son de estructura cerrada, por lo que la presencia de simetrías rotacionales era altamente probable. Para el módulo de clasificación se transformó la información estructural en imágenes, por medio del cálculo y superposición de tres matrices. Estas imágenes fueron usadas para aplicar una técnica de transferencia de aprendizaje a una red Densenet, seleccionada luego de un análisis cualitativo y cuantitativo. Como resultado, el clasificador obtenido logró una exactitud de 89.8% sobre una muestra de 658 cadenas de proteínas. Los anteriores módulos fueron integrados en un servicio web construido sobre Flask. Se construyó una aplicación de una página (SPA) para hacer disponible dicho servicio en una forma amigable con el usuario. Dicha aplicación fue desplegada en la nube para su acceso.Ítem Texto completo enlazado Implementación de una herramienta de automatización para la simplificación de textos en español(Pontificia Universidad Católica del Perú, 2015-10-27) Muroya Tokushima, Luis Fernando; Alva Manchego, Fernando EmilioEl acceso a la información es un derecho reconocido en el artículo 19 de la Declaración Universal de los Derechos Humanos e implica, entre muchas cosas, que la información disponible a través de los medios escritos sea comprensible para todos. Sin embargo, en pleno siglo XXI, todavía existe una brecha insalvable entre la idealidad y la realidad: muchas personas no pueden entender los textos porque son muy complejos para ellos. Los motivos son muy diversos: una educación deficiente, alguna forma de discapacidad, factores exógenos, etc. Para que estas personas gocen de un verdadero acceso a la información, es necesario que la misma sea transformada y reescrita de forma comprensible para ellas, proceso conocido como simplificación textual. En vista que llevarla a cabo manualmente resulta costoso, en los últimos años se ha vuelto de interés automatizar este proceso. En el caso del español, un primer avance se logró con el proyecto Simplext (2009), durante el cual fue construida una herramienta de simplificación léxico-sintáctica con un enfoque primordialmente basado en reglas. En este trabajo se desarrolló una herramienta de simplificación que opera a nivel sintáctico y utiliza clasificadores como elementos de decisión para escoger las operaciones de simplificación sintáctica que deben ser aplicadas sobre un texto. Para construir esta herramienta, primero se anotó el corpus paralelo recopilado durante el proyecto Simplext con las operaciones de simplificación que se llevaron a cabo oración por oración. Asimismo, se entrenó clasificadores binarios y se llevó a cabo una experimentación numérica con la finalidad de definir cuál era el más adecuado para cada operación. Finalmente, se implementó una interfaz web que permite al usuario ingresar un texto y visualizar su versión simplificada. Luego de comparar el índice de perspicuidad (métrica de complejidad textual) de textos antes y después de pasar por la herramienta, se pudo concluir que la misma sí es capaz de simplificar textos, aunque no de una forma tan eficiente como un ser humano. Esta diferencia era esperada debido a que no se incluyó un módulo de simplificación léxica y porque un agente humano tiene experiencia y conocimiento que una máquina carece. En un trabajo futuro podría integrarse dicho módulo para mejorar el funcionamiento de la herramienta.