Corrector ortográfico neuronal para errores ortográficos multilingües adversarios para lenguas amazónicas peruanas

Cardoso Yllanes, Gerardo

Corrector ortográfico neuronal para errores ortográficos multilingües adversarios para lenguas amazónicas peruanas

Date

2022-11-09

Authors

Cardoso Yllanes, Gerardo

Publisher

Pontificia Universidad Católica del Perú

URI

http://hdl.handle.net/20.500.12404/23755

Abstract

Para combatir los ataques de ejemplos adversarios, se propuso implementar un modelo de reconocimiento de palabras y entrenarlo con oraciones creadas a través de diferentes técnicas de generación de data aumentada para cuatro lenguas amazónicas peruanas de pocos recursos: Shipibo-Konibo, Asháninka, Yanesha y Yine. Observamos que, para la gran mayoría de experimentos, el modelo propuesto logró corregir oraciones con palabras con errores ortográficos. Los modelos que fueron entrenados mediante oraciones creadas a través de los canales de errores de ambigüedad fonema-grafema y desnormalización; y, el modelo de ensamble, se desempeñaron mejor al momento de evaluarlos con los corpus creados por profesores de las lenguas. Finalmente, se implementó un prototipo del corrector ortográfico neuronal, en donde se encuentran todos los modelos entrenados en la presente investigación.

Keywords

Redes neuronales (Computación), Lingüística computacional, Lenguas indígenas--Perú

Collections

Informática con mención en Ciencias de la Computación

Creative Commons license

Except where otherwised noted, this item's license is described as info:eu-repo/semantics/openAccess

Full item page

Corrector ortográfico neuronal para errores ortográficos multilingües adversarios para lenguas amazónicas peruanas

Date

Authors

Journal Title

Journal ISSN

Volume Title

Publisher

URI

DOI

Acceso al texto completo solo para la Comunidad PUCP

Abstract

Description

Keywords

Citation

Collections

Endorsement

Review

Supplemented By

Referenced By

Creative Commons license