Implementación de algoritmos para la identificación automática de lenguas originarias peruanas en un repositorio digital

Espichán Linares, Alexandra Mercedes

dc.contributor.advisor	Oncevay Marcos, Félix Arturo	es_ES
dc.contributor.author	Espichán Linares, Alexandra Mercedes	es_ES
dc.date.accessioned	2019-02-12T15:46:41Z	es_ES
dc.date.available	2019-02-12T15:46:41Z	es_ES
dc.date.created	2019	es_ES
dc.date.issued	2019-02-12	es_ES
dc.identifier.uri	http://hdl.handle.net/20.500.12404/13482
dc.description.abstract	Debido a la revitalización lingüística en el Perú a lo largo de los últimos años, existe un creciente interés por reforzar la educación bilingüe en el país y aumentar la investigación enfocada en sus lenguas nativas. Asimismo, hay que considerar que en el Perú actualmente alrededor de 4 millones de personas hablan alguna de las 47 lenguas nativas conservadas. Por tanto, hay una gran variedad de lenguas con las cuales trabajar, por lo que sería de utilidad contar con herramientas automáticas que permitan agilizar algunas tareas en el estudio e investigación de dichas lenguas. De este modo, y desde el punto de vista de la informática, una de las primeras y principales tareas lingüísticas que incorporan métodos computacionales es la identificación automática de lenguaje, la cual se refiere a determinar el lenguaje en el que está escrito un texto dado, el cual puede ser un documento, un párrafo o incluso una oración. Este además es un paso esencial en el procesamiento automático de los datos del mundo real, donde una multitud de lenguajes pueden estar presentes, ya que las técnicas de procesamiento del lenguaje natural típicamente presuponen que todos los documentos a ser procesados están escritos en un lenguaje dado. Por lo tanto, este trabajo se enfoca en tres pasos: (1) en construir desde cero un corpus anotado digital para 49 lenguas y dialectos indígenas peruanos, (2) en adaptarse a los enfoques de aprendizaje de máquina estándar y profundo para la identificación de lenguas, y (3) en comparar estadísticamente los resultados obtenidos. Los resultados obtenidos fueron prometedores, el modelo estándar superó al modelo de aprendizaje profundo tal como se esperaba, con una precisión promedio de 95.9%. En el futuro, se espera que se aproveche el corpus y el modelo para tareas más complejas.	es_ES
dc.language.iso	spa	es_ES
dc.publisher	Pontificia Universidad Católica del Perú	es_ES
dc.rights	info:eu-repo/semantics/openAccess	es_ES
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/2.5/pe/	*
dc.subject	Sistema de reconocimiento de patrones--Lingüística	es_ES
dc.subject	Lenguas índigenas--Perú	es_ES
dc.subject	Lingüística--Procesamiento de datos	es_ES
dc.subject	Lingüística computacional	es_ES
dc.title	Implementación de algoritmos para la identificación automática de lenguas originarias peruanas en un repositorio digital	es_ES
dc.type	info:eu-repo/semantics/bachelorThesis	es_ES
thesis.degree.name	Ingeniero Informático	es_ES
thesis.degree.level	Título Profesional	es_ES
thesis.degree.grantor	Pontificia Universidad Católica del Perú. Facultad de Ciencias e Ingeniería	es_ES
thesis.degree.discipline	Ingeniería Informática	es_ES
dc.type.other	Tesis de licenciatura
dc.subject.ocde	https://purl.org/pe-repo/ocde/ford#1.02.00	es_ES
dc.publisher.country	PE	es_ES
renati.advisor.dni	46440101
renati.advisor.orcid	https://orcid.org/0000-0001-7675-6208	es_ES
renati.discipline	612286	es_ES
renati.level	https://purl.org/pe-repo/renati/level#tituloProfesional	es_ES
renati.type	https://purl.org/pe-repo/renati/type#tesis	es_ES

Files in this item

Files	Size	Format	View
There are no files associated with this item.

This item appears in the following Collection(s)

Ingeniería Informática

Show simple item record

Except where otherwise noted, this item's license is described as info:eu-repo/semantics/openAccess