Tesis y Trabajos de Investigación PUCP

URI permanente para esta comunidadhttp://54.81.141.168/handle/123456789/6

El Repositorio Digital de Tesis y Trabajos de Investigación PUCP aporta al Repositorio Institucional con todos sus registros, organizados por grado: Doctorado, Maestría, Licenciatura y Bachillerato. Se actualiza permanentemente con las nuevas tesis y trabajos de investigación sustentados y autorizados, así como también con los que que fueron sustentados años atrás.
Ingresa a su web: Repositorio Digital de Tesis y Trabajos de Investigación PUCP

Explorar

Resultados de búsqueda

Mostrando 1 - 2 de 2
  • Ítem
    Herramienta integrada para la curación de proteínas repetidas
    (Pontificia Universidad Católica del Perú, 2023-07-20) Bezerra Brandao Corrales, Manuel Alberto; Hirsh Martinez, Layla
    A finales de los años 1990, se identificó un conjunto de proteínas caracterizadas por tener patrones repetidos en su secuencia, lo que produce una estructura tridimensional repetitiva (Marcotte et al., 1999). Se han clasificado al menos 14% de proteínas encontradas en la naturaleza como repetidas, y presentan un rol crítico en procesos biológicos como la comunicación celular y el reconocimiento molecular (Brunette et al., 2015; Marcotte et al., 1999). Existe un creciente interés en el estudio de las proteínas repetidas debido a sus pliegues estructurales estables, una alta conversación evolutiva y un amplio repertorio de funciones biológicas (Chakrabarty & Parekh, 2022). Además, se estima que una de cada tres proteínas humanas son consideradas repetidas (Jorda & Kajava, 2010). La identificación, clasificación y curación de regiones de repetición en proteínas es un proceso complejo que requiere del procesamiento manual de expertos, gran capacidad computacional y tiempo. Existen diversos avances recientes y relevantes que aplican modelos de aprendizaje automático para la predicción de estructura tridimensional de proteínas y la predicción de clasificación de proteínas repetidas. Este tipo de aplicaciones resultan útiles para este proceso de curación. No obstante, a pesar de que este tipo de software son de libre acceso y de código abierto, no se cuenta con un servicio integrado que contemple las herramientas y bases de datos que soporten la investigación en proteínas repetidas. Por estos motivos, en este proyecto de investigación de plantea, diseña y desarrolla un servicio web integrado para la curación de proteínas repetidas. Con este objetivo, se ha considerado la integración con la base de datos de estructuras terciarias del Protein Data Bank (PDB) y la base de datos de predicciones de estructuras tridimensionales AlphaFold. Asimismo, se ha utilizado un modelo de redes neuronales que permite predecir la probabilidad de clasificación en cada clase de proteína repetida. Finalmente, con esta predicción, se implementó una mejora al algoritmo ReUPred para volver más eficiente el proceso de identificación de regiones y unidades de repetición. Este servicio ha sido desplegado utilizando computación en la nube en la página bioinformática.org de la cual es parte el laboratorio de investigación en Bioinformática de la Pontificia Universidad Católica del Perú. Este servicio permite que los investigadores no requieran contar con alta capacidad de procesamiento computacional para el proceso de curación de proteínas repetidas e integra los resultados totales obtenidos.
  • Ítem
    Desarrollo de una herramienta para la predicción de estructuras terciarias de proteínas repetidas a partir de su estructura primaria
    (Pontificia Universidad Católica del Perú, 2023-02-06) Palomino Chahua, Solange Estrella; Hirsh Martinez, Layla
    La predicción de estructuras de proteínas es uno de los retos más importantes de la biología y la bioinformática (Lopes et al., 2019). Esta última es el campo de investigación que se apoya en la computación para analizar la información relacionada a las macromoléculas biológicas como las proteínas (Xiong, 2006). Las proteínas son moléculas esenciales compuestas por varios cientos o miles de aminoácidos configurados de forma secuencial, lo cual se conoce como estructura primaria (Xiong, 2006). Esta organización se va plegando espontáneamente hasta resultar en una conformación tridimensional diferente una de otra denominada como estructura terciaria, la cual es fundamental para determinar la función de la proteína y realizarla de forma exitosa (Xiong, 2006). Hay muchas razones por las cuales la predicción de estructuras proteicas sigue siendo una problemática vigente. Una de ellas es que, actualmente, es mucho más complicado obtener estructuras tridimensionales que secuencias de proteínas, por lo cual existe una brecha cuantitativa entre ellas, que crece exponencialmente (Deng et al., 2018). Además, la determinación de las estructuras tridimensionales sigue siendo una tarea que requiere muchos recursos económicos, computacionales y algunos no renovables, como el tiempo (Lopes et al., 2019). En adición, se ha evidenciado una significativa ausencia de criterios de usabilidad en el desarrollo de muchas herramientas informáticas relacionadas a la predicción de las proteínas (Paixão-Cortes et al., 2018). Esto conlleva al gasto innecesario de tiempo y esfuerzo de los usuarios que deben interactuar con interfaces difíciles de entender (Bolchini et al., 2009). Esta situación se replica en proteínas específicas como las proteínas repetidas, las cuales son grupos de familias de proteínas que tienen propiedades particulares como la existencia de unidades de repetición en su estructura (Hirsh et al., 2016). Estas proteínas son importantes dado que se sabe que se relacionan con muchas enfermedades humanas en su proceso de diagnóstico y porque dan pie al desarrollo de nueva medicina (Burley et al., 2021; Kajava & Steven, 2006). No obstante, debido a su complejidad, aún se requieren esfuerzos para estudiarlas en temas como la predicción de sus estructuras (MSCA & RISE, 2018). Por todo ello, este proyecto de tesis busca proponer el desarrollo de una herramienta dedicada a la predicción de estructuras terciarias de proteínas repetidas a partir de sus estructuras primarias, la cual deberá cumplir con lineamientos de usabilidad. Se espera responder a la problemática planteando una plataforma web que sea amigable para el usuario, que permita obtener resultados en tiempos aceptables y que utilice un algoritmo de predicción que aplique inteligencia artificial y sea eficaz respecto a la evaluación de alineamientos estructurales. En primera instancia, se evaluarán distintos algoritmos de predicción de proteínas en general, para luego seleccionar uno y adaptarlo a los requerimientos de los especialistas en proteínas repetidas. Con ello, se crearán servicios y rutinas de ejecución que permitirán predecir estructuras terciarias de proteínas a partir de diversos tipos de datos de entrada. Posteriormente, se construirá la interfaz gráfica de la herramienta, partiendo de la definición de estándares y el desarrollo de un prototipo de alta fidelidad. Finalmente, se integrarán ambos componentes para conformar la herramienta completa, la cual será valorada a través de diversas pruebas funcionales y una evaluación de usabilidad. Cabe mencionar que esta última se realizará utilizando una herramienta enfocada a la evaluación de herramientas bioinformáticas.