Corrección ortográfica de lenguas amazónicas usando redes neuronales secuencia a secuencia
dc.contributor.advisor | Oncevay Marcos, Félix Arturo | |
dc.contributor.author | Lara Avila, César Jesús | |
dc.date.accessioned | 2020-05-26T15:41:39Z | |
dc.date.available | 2020-05-26T15:41:39Z | |
dc.date.created | 2020 | |
dc.date.issued | 2020-05-26 | |
dc.description.abstract | De acuerdo a la Base de Datos Oficial de Pueblos Indígenas u Originarios (BDPI), el Perú cuenta con 55 pueblos indígenas, identificados hasta la fecha; que hablan al menos 47 lenguas originarias y que según el Documento Nacional de Lenguas Originarias del Perú están divididos en 19 familias lingüísticas, siendo las familias Pano y Arawak las que presentan una mayor cantidad de lenguas, ambas con 10 lenguas. En este trabajo, se plantea un modelo de corrección ortográfica utilizando modelos de redes neuronales profundas, a nivel de caracteres, en lenguas de las dos familias antes mencionadas: Shipibo-Konibo de la familia Pano y Yanesha, Yine y Ashaninka para la familia Arawak. Para ello se han realizamos experimentos en conjuntos de datos obtenidos de páginas como PerúEduca, incorporando errores ortográficas cometidos a nivel de caracteres, en modelos secuencia a secuencia (seq2seq) que han demostrado recientemente ser un marco exitoso para varias tareas de procesamiento de lenguaje natural, incluyendo el proceso de corrección ortográfica. | es_ES |
dc.description.uri | Tesis | es_ES |
dc.identifier.uri | http://hdl.handle.net/20.500.12404/16265 | |
dc.language.iso | spa | es_ES |
dc.publisher | Pontificia Universidad Católica del Perú | es_ES |
dc.publisher.country | PE | es_ES |
dc.rights | info:eu-repo/semantics/openAccess | es_ES |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-sa/2.5/pe/ | * |
dc.subject | Lingüística computacional | es_ES |
dc.subject | Lenguas indígenas--Perú | es_ES |
dc.subject | Redes neuronales | es_ES |
dc.subject | Ortografía | es_ES |
dc.subject.ocde | https://purl.org/pe-repo/ocde/ford#1.02.00 | es_ES |
dc.title | Corrección ortográfica de lenguas amazónicas usando redes neuronales secuencia a secuencia | es_ES |
dc.type | info:eu-repo/semantics/masterThesis | es_ES |
dc.type.other | Tesis de maestría | |
renati.advisor.dni | 46440101 | |
renati.discipline | 611087 | es_ES |
renati.level | https://purl.org/pe-repo/renati/level#maestro | es_ES |
renati.type | http://purl.org/pe-repo/renati/type#tesis | es_ES |
thesis.degree.discipline | Informática con mención en Ciencias de la Computación | es_ES |
thesis.degree.grantor | Pontificia Universidad Católica del Perú. Escuela de Posgrado | es_ES |
thesis.degree.level | Maestría | es_ES |
thesis.degree.name | Maestro en Informática con mención en Ciencias de la Computación | es_ES |