A crowd-powered conversational assistant for the improvement of a neural machine translation system in native peruvian language

Gómez Montoya, Héctor Erasmo

A crowd-powered conversational assistant for the improvement of a neural machine translation system in native peruvian language

dc.contributor.advisor	Oncevay Marcos, Felix Arturo
dc.contributor.author	Gómez Montoya, Héctor Erasmo	es_ES
dc.date.accessioned	2019-09-14T01:48:16Z	es_ES
dc.date.available	2019-09-14T01:48:16Z
dc.date.available	2019-09-14T01:48:16Z	es_ES
dc.date.created	2019	es_ES
dc.date.issued	2019-09-13	es_ES
dc.description.abstract	Para las comunidades más pequeñas y nativas en un país, es muy difícil encontrar información que se encuentre en su idioma original, esto debido a que su lengua no tiene el alcance ni la cantidad suficiente de hablantes, para poder seguir siendo transmitida. A este tipo de lengua se le denomina minoritaria o de pocos recursos. Una de las principales formas en las que el gobierno incentiva el proceso de multilingüismo es proporcionando educación en el idioma nativo a su población, tal es el caso de los hablantes de Shipibo-Konibo que se encuentran dispersos a lo largo de la amazonía del Perú. Ellos cuentan con colegios donde se les imparten clases en su lengua nativa para los niveles de primaria y secundaria. Sin embargo, una necesidad con la que cuentan los pobladores es que la cantidad de material educativo completamente traducido a Shipibo-Konibo es reducida. Esto debido a que el proceso de traducción es muy costoso y poco confiable. El Grupo de investigación en Inteligencia Artificial de la PUCP (IA-PUCP, ex GRPIAA) ha desarrollado una plataforma que utiliza corpus paralelos la creación de un modelo estadístico de traducción automática para las lenguas Shipibo-Konibo y español. Este modelo sufre de ciertas limitantes, entre las cuales tenemos: la cantidad de recursos bibliográficos y material completamente traducido, esto debido a que al ser una lengua minoritaria o de pocos recursos carecen de facilidades para la generación de nuevos corpus. Por otro lado, se desea mejorar el modelo actual en parámetros de eficiencia y obtener mejores resultados en las traducciones. En este contexto nace la pregunta que motiva el presente trabajo: ¿de qué manera podemos incrementar el corpus paralelo de forma eficiente y confiable para la mejora del modelo actual de traducción automática? Por consiguiente, en el presente trabajo se propone desarrollar un agente conversacional que permita la generación de nuevos corpus paralelos entre Shipibo-Konibo y español que permitan mejorar un modelo de traducción automática neuronal en las lenguas ya mencionadas.	es_ES
dc.description.uri	Tesis	es_ES
dc.identifier.uri	http://hdl.handle.net/20.500.12404/14989
dc.language.iso	spa	es_ES
dc.publisher	Pontificia Universidad Católica del Perú	es_ES
dc.publisher.country	PE	es_ES
dc.rights	info:eu-repo/semantics/openAccess	es_ES
dc.rights.uri	http://creativecommons.org/licenses/by-nc-sa/2.5/pe/	*
dc.subject	Traductores--Programas para computadoras	es_ES
dc.subject	Traductores--Métodos estadísticos	es_ES
dc.subject	Traducción automática--Lenguas indígenas--Perú	es_ES
dc.subject	Traducción automática--Shipibo-Conibo	es_ES
dc.subject	Traducción automática--Español	es_ES
dc.subject.ocde	https://purl.org/pe-repo/ocde/ford#1.02.00	es_ES
dc.title	A crowd-powered conversational assistant for the improvement of a neural machine translation system in native peruvian language	es_ES
dc.type	info:eu-repo/semantics/masterThesis	es_ES
dc.type.other	Tesis de maestría
renati.advisor.dni	46440101
renati.discipline	611087	es_ES
renati.level	https://purl.org/pe-repo/renati/level#maestro	es_ES
renati.type	http://purl.org/pe-repo/renati/type#tesis	es_ES
thesis.degree.discipline	Informática con mención en Ciencias de la Computación	es_ES
thesis.degree.grantor	Pontificia Universidad Católica del Perú. Escuela de Posgrado	es_ES
thesis.degree.level	Maestría	es_ES
thesis.degree.name	Maestro en Informática con mención en Ciencias de la Computación	es_ES

Collections

Informática con mención en Ciencias de la Computación

A crowd-powered conversational assistant for the improvement of a neural machine translation system in native peruvian language

Files

Collections