Implementación de una herramienta de automatización para la simplificación de textos en español

Muroya Tokushima, Luis Fernando

dc.contributor.advisor	Alva Manchego, Fernando Emilio	es_ES
dc.contributor.author	Muroya Tokushima, Luis Fernando	es_ES
dc.date.accessioned	2015-10-27T16:52:25Z	es_ES
dc.date.available	2015-10-27T16:52:25Z	es_ES
dc.date.created	2015	es_ES
dc.date.issued	2015-10-27	es_ES
dc.identifier.uri	http://hdl.handle.net/20.500.12404/6366
dc.description.abstract	El acceso a la información es un derecho reconocido en el artículo 19 de la Declaración Universal de los Derechos Humanos e implica, entre muchas cosas, que la información disponible a través de los medios escritos sea comprensible para todos. Sin embargo, en pleno siglo XXI, todavía existe una brecha insalvable entre la idealidad y la realidad: muchas personas no pueden entender los textos porque son muy complejos para ellos. Los motivos son muy diversos: una educación deficiente, alguna forma de discapacidad, factores exógenos, etc. Para que estas personas gocen de un verdadero acceso a la información, es necesario que la misma sea transformada y reescrita de forma comprensible para ellas, proceso conocido como simplificación textual. En vista que llevarla a cabo manualmente resulta costoso, en los últimos años se ha vuelto de interés automatizar este proceso. En el caso del español, un primer avance se logró con el proyecto Simplext (2009), durante el cual fue construida una herramienta de simplificación léxico-sintáctica con un enfoque primordialmente basado en reglas. En este trabajo se desarrolló una herramienta de simplificación que opera a nivel sintáctico y utiliza clasificadores como elementos de decisión para escoger las operaciones de simplificación sintáctica que deben ser aplicadas sobre un texto. Para construir esta herramienta, primero se anotó el corpus paralelo recopilado durante el proyecto Simplext con las operaciones de simplificación que se llevaron a cabo oración por oración. Asimismo, se entrenó clasificadores binarios y se llevó a cabo una experimentación numérica con la finalidad de definir cuál era el más adecuado para cada operación. Finalmente, se implementó una interfaz web que permite al usuario ingresar un texto y visualizar su versión simplificada. Luego de comparar el índice de perspicuidad (métrica de complejidad textual) de textos antes y después de pasar por la herramienta, se pudo concluir que la misma sí es capaz de simplificar textos, aunque no de una forma tan eficiente como un ser humano. Esta diferencia era esperada debido a que no se incluyó un módulo de simplificación léxica y porque un agente humano tiene experiencia y conocimiento que una máquina carece. En un trabajo futuro podría integrarse dicho módulo para mejorar el funcionamiento de la herramienta.	es_ES
dc.language.iso	spa	es_ES
dc.publisher	Pontificia Universidad Católica del Perú	es_ES
dc.rights	info:eu-repo/semantics/openAccess	es_ES
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/2.5/pe/	*
dc.subject	Editores de texto (Programas para computadoras)--Desarrollo	es_ES
dc.subject	Editores de texto (Programas para computadoras)--Español	es_ES
dc.title	Implementación de una herramienta de automatización para la simplificación de textos en español	es_ES
dc.type	info:eu-repo/semantics/bachelorThesis	es_ES
thesis.degree.name	Ingeniero Informático	es_ES
thesis.degree.level	Título Profesional	es_ES
thesis.degree.grantor	Pontificia Universidad Católica del Perú. Facultad de Ciencias e Ingeniería	es_ES
thesis.degree.discipline	Ingeniería Informática	es_ES
dc.type.other	Tesis de licenciatura
dc.subject.ocde	https://purl.org/pe-repo/ocde/ford#1.02.00	es_ES
dc.publisher.country	PE	es_ES
renati.discipline	612286	es_ES
renati.level	https://purl.org/pe-repo/renati/level#tituloProfesional	es_ES
renati.type	https://purl.org/pe-repo/renati/type#tesis	es_ES

Files in this item

Files	Size	Format	View
There are no files associated with this item.

This item appears in the following Collection(s)

Ingeniería Informática

Show simple item record

Except where otherwise noted, this item's license is described as info:eu-repo/semantics/openAccess