Clasificación de proteínas repetidas basado en su información estructural utilizando aprendizaje de máquina

Tenorio Ku, Luiggi Gianpiere

Clasificación de proteínas repetidas basado en su información estructural utilizando aprendizaje de máquina

Fecha

2021-02-12

Autores

Tenorio Ku, Luiggi Gianpiere

Editor

Pontificia Universidad Católica del Perú

URI

http://hdl.handle.net/20.500.12404/18199

Resumen

En los últimos años, las proteínas repetidas, las cuales son caracterizadas por poseer regiones que se repiten a lo largo de su estructura, han demostrado poseer un rol fundamental dentro de la naturaleza. Esta importancia se debe a sus propiedades funcionales que toman relevancia dentro de varios procesos biológicos como la salud, el desarrollo neuronal y la ingeniería de proteínas. Debido a ello, una tarea, dentro del área de estudio de estas proteínas, es la identificación y clasificación de estas, lo que permite identificar las propiedades funcionales que posee. Asimismo, en la actualidad, existen métodos complejos para la clasificación e identificación de proteínas repetidas a partir de su estructura, los cuales implican un uso intenso y costoso de recursos computacionales. Además, por la aparición de nuevos procesos experimentales, las proteínas recientemente descubiertas por año se incrementan de forma exponencial. En consecuencia, ello obliga que estos procesos realicen una gran cantidad ejecuciones y generen una gran cantidad de archivos que se traducen en grandes costos de procesamiento y almacenamiento. En este proyecto se busca implementar un modelo de aprendizaje de máquina con la capacidad de detectar la presencia de regiones repetidas dentro de una cadena proteica con el fin de que esta información sea útil para procesos más complejos como ReUPred para que eviten procesar grandes cantidades de datos irrelevantes. Dicho objetivo, implica la construcción de un proceso de transformación de datos necesaria para extraer las características estructurales de la cadena de proteína y formar la representación de datos a utilizar como entrada para el desarrollo, entrenamiento y validación del modelo. Adicionalmente, se plantea desplegar dicho modelo mediante un servicio web para que pueda ser utilizado por otros investigadores del área.

Palabras clave

Proteínas--Procesamiento de datos, Aprendizaje automático (Inteligencia artificial), Servicios Web

Colecciones

Ingeniería Informática

Ver todos los metadatos en formato Dublin Core

Clasificación de proteínas repetidas basado en su información estructural utilizando aprendizaje de máquina

Fecha

Autores

Título de la revista

ISSN de la revista

Título del volumen

Editor

DOI

URI

Resumen

Descripción

Palabras clave

Citación

Colecciones

item.page.endorsement

item.page.review

item.page.supplemented

item.page.referenced