Herramienta integrada para la curación de proteínas repetidas

dc.contributor.advisorHirsh Martinez, Layla
dc.contributor.authorBezerra Brandao Corrales, Manuel Alberto
dc.date.EmbargoEnd2024-02-05
dc.date.accessioned2023-07-20T22:01:43Z
dc.date.available2023-07-20T22:01:43Z
dc.date.created2023
dc.date.issued2023-07-20
dc.description.abstractA finales de los años 1990, se identificó un conjunto de proteínas caracterizadas por tener patrones repetidos en su secuencia, lo que produce una estructura tridimensional repetitiva (Marcotte et al., 1999). Se han clasificado al menos 14% de proteínas encontradas en la naturaleza como repetidas, y presentan un rol crítico en procesos biológicos como la comunicación celular y el reconocimiento molecular (Brunette et al., 2015; Marcotte et al., 1999). Existe un creciente interés en el estudio de las proteínas repetidas debido a sus pliegues estructurales estables, una alta conversación evolutiva y un amplio repertorio de funciones biológicas (Chakrabarty & Parekh, 2022). Además, se estima que una de cada tres proteínas humanas son consideradas repetidas (Jorda & Kajava, 2010). La identificación, clasificación y curación de regiones de repetición en proteínas es un proceso complejo que requiere del procesamiento manual de expertos, gran capacidad computacional y tiempo. Existen diversos avances recientes y relevantes que aplican modelos de aprendizaje automático para la predicción de estructura tridimensional de proteínas y la predicción de clasificación de proteínas repetidas. Este tipo de aplicaciones resultan útiles para este proceso de curación. No obstante, a pesar de que este tipo de software son de libre acceso y de código abierto, no se cuenta con un servicio integrado que contemple las herramientas y bases de datos que soporten la investigación en proteínas repetidas. Por estos motivos, en este proyecto de investigación de plantea, diseña y desarrolla un servicio web integrado para la curación de proteínas repetidas. Con este objetivo, se ha considerado la integración con la base de datos de estructuras terciarias del Protein Data Bank (PDB) y la base de datos de predicciones de estructuras tridimensionales AlphaFold. Asimismo, se ha utilizado un modelo de redes neuronales que permite predecir la probabilidad de clasificación en cada clase de proteína repetida. Finalmente, con esta predicción, se implementó una mejora al algoritmo ReUPred para volver más eficiente el proceso de identificación de regiones y unidades de repetición. Este servicio ha sido desplegado utilizando computación en la nube en la página bioinformática.org de la cual es parte el laboratorio de investigación en Bioinformática de la Pontificia Universidad Católica del Perú. Este servicio permite que los investigadores no requieran contar con alta capacidad de procesamiento computacional para el proceso de curación de proteínas repetidas e integra los resultados totales obtenidos.es_ES
dc.identifier.urihttp://hdl.handle.net/20.500.12404/25421
dc.language.isospaes_ES
dc.publisherPontificia Universidad Católica del Perúes_ES
dc.publisher.countryPEes_ES
dc.rightsinfo:eu-repo/semantics/openAccesses_ES
dc.rights.urihttp://creativecommons.org/licenses/by-nc/2.5/pe/*
dc.subjectProteinas--Clasificación automáticaes_ES
dc.subjectAlgoritmos computacionaleses_ES
dc.subjectBioinformáticaes_ES
dc.subject.ocdehttps://purl.org/pe-repo/ocde/ford#1.02.00es_ES
dc.titleHerramienta integrada para la curación de proteínas repetidases_ES
dc.typeinfo:eu-repo/semantics/masterThesises_ES
dc.type.otherTesis de maestría
renati.advisor.dni40329236
renati.advisor.orcidhttps://orcid.org/0000-0002-8215-6716es_ES
renati.author.dni73222296
renati.discipline611077es_ES
renati.jurorBeltran Castañon, Cesar Armandoes_ES
renati.jurorHirsh Martinez, Laylaes_ES
renati.jurorMelgar Sasieta, Hector Andreses_ES
renati.levelhttps://purl.org/pe-repo/renati/level#maestroes_ES
renati.typehttps://purl.org/pe-repo/renati/type#tesises_ES
thesis.degree.disciplineInformáticaes_ES
thesis.degree.grantorPontificia Universidad Católica del Perú. Escuela de Posgrado.es_ES
thesis.degree.levelMaestríaes_ES
thesis.degree.nameMaestro en Informáticaes_ES

Archivos

Colecciones