Extracción de información para la generación de reportes estructurados a partir de noticias peruanas relacionadas a crímenes

Bustamante Alvarez, Gina

dc.contributor.advisor	Oncevay Marcos, Félix Arturo	es_ES
dc.contributor.author	Bustamante Alvarez, Gina	es_ES
dc.date.accessioned	2019-09-13T01:43:27Z	es_ES
dc.date.available	2019-09-13T01:43:27Z	es_ES
dc.date.created	2019	es_ES
dc.date.issued	2019-09-12	es_ES
dc.identifier.uri	http://hdl.handle.net/20.500.12404/14983
dc.description.abstract	Actualmente, múltiples fuerzas policiales y agencias de inteligencia han decidido enfocar parte de sus esfuerzos en la recolección de todo tipo de información sobre crímenes. Esto con el objetivo de poder analizar los datos disponibles y utilizar los resultados de esta tarea para la mejora de procesos actuales, e incluso, para la prevención de ataques y delitos futuros. No obstante, debido a la velocidad con la que se generan datos e información en la última década, las técnicas de análisis tradicional han resultado en baja productividad y en un uso ineficiente de recursos. Es por esta razón, que desde el campo de la informática, y específicamente desde las ciencias de la computación, se vienen realizado múltiples intentos para ayudar a identificar y obtener la información más importante dentro de estos grandes volúmenes de datos. Hasta el momento los estudios previos realizados para este dominio, abarcan desde la predicción del lugar de un delito utilizando data numérica, hasta la identificación de nombres y entidades en descripciones textuales. En este contexto, este trabajo propone la creación de una herramienta de extracción de información para noticias relacionadas al dominio criminal peruano. Buscando identificar automáticamente culpables, víctimas y locaciones mediante los siguientes pasos: (1) Procesamiento y generación de un conjunto de datos en base a noticias criminales, (2) Implementación y validación de algoritmos de extracción e información, y (3) Elaboración de una interfaz de programación de aplicaciones para el consumo del modelo desarrollado. Los resultados obtenidos evidencian que el enfoque utilizado, basado en dependencias sintácticas y reconocimiento de entidades nombradas, es exitoso. Además, se espera que en el futuro se puedan mejorar los resultados obtenidos con técnicas de procesamiento de lenguaje natural para dominios con pocos recursos.	es_ES
dc.language.iso	spa	es_ES
dc.publisher	Pontificia Universidad Católica del Perú	es_ES
dc.rights	info:eu-repo/semantics/openAccess	es_ES
dc.rights.uri	http://creativecommons.org/licenses/by-nc/2.5/pe/	*
dc.subject	Interfaces de computadoras--Diseño y construcción	es_ES
dc.subject	Información--Almacenamiento y recuperación	es_ES
dc.subject	Algoritmos--Procesamiento de datos	es_ES
dc.subject	Análisis de datos	es_ES
dc.subject	Prevención del delito	es_ES
dc.title	Extracción de información para la generación de reportes estructurados a partir de noticias peruanas relacionadas a crímenes	es_ES
dc.type	info:eu-repo/semantics/bachelorThesis	es_ES
thesis.degree.name	Ingeniero Informático	es_ES
thesis.degree.level	Título Profesional	es_ES
thesis.degree.grantor	Pontificia Universidad Católica del Perú. Facultad de Ciencias e Ingeniería	es_ES
thesis.degree.discipline	Ingeniería Informática	es_ES
dc.type.other	Tesis de licenciatura
dc.subject.ocde	https://purl.org/pe-repo/ocde/ford#1.02.00	es_ES
dc.publisher.country	PE	es_ES
renati.advisor.dni	46440101
renati.advisor.orcid	https://orcid.org/0000-0001-7675-6208	es_ES
renati.discipline	612286	es_ES
renati.level	https://purl.org/pe-repo/renati/level#tituloProfesional	es_ES
renati.type	https://purl.org/pe-repo/renati/type#tesis	es_ES

Files in this item

Files	Size	Format	View
There are no files associated with this item.

This item appears in the following Collection(s)

Ingeniería Informática

Show simple item record

Except where otherwise noted, this item's license is described as info:eu-repo/semantics/openAccess