Herramienta de análisis y clasificación de complejidad de textos en español
Date
2015-06-04Author
Pérez Urcia, Walter
Quispesaravia Ildefonso, André Raúl
Metadata
Show full item recordAcceso a Texto completo
Abstract
La selección de textos es una de las responsabilidades principales de los profesores
dentro del planeamiento del orden de exposición a textos para sus alumnos. Debido a
la gran cantidad de textos disponibles y la diversidad de géneros y temas, esta tarea
demanda mucho tiempo y está ligada a aspectos subjetivos del evaluador. Esto es un
problema, sobre el cual proponemos una alternativa de automatización.
Se toma como proyecto la implementación de una herramienta de análisis y
clasificación de complejidad de tetos en español. Con ello se busca brindar una
alternativa automatizada al problema de escalabilidad en complejidad de textos. Esto
se refiere a la necesidad de tener un orden de textos evaluados por complejidad.
Para ello evaluamos la complejidad utilizando las métricas de Coh-Metrix adaptadas al
español. Este conjunto de métricas evalúa textos en inglés de acuerdo a los estudios
de coherencia y cohesión que los autores de Coh-Metrix desarrollaron.
En base a esta adatapación de Coh-Metrix se desarrolló un clasificador basado en
técnicas de aprenizaje de máquina y un conjunto de textos en español conformado por
fábulas y cuentos previamente clasificados. Finalmente estos componentes fueron
unidos en una herraamienta web para la accesibilidad pública de la herramienta
desarrollada.