Desarrollo de una herramienta para la predicción de estructuras terciarias de proteínas repetidas a partir de su estructura primaria
Acceso a Texto completo
Abstract
La predicción de estructuras de proteínas es uno de los retos más importantes de la
biología y la bioinformática (Lopes et al., 2019). Esta última es el campo de investigación
que se apoya en la computación para analizar la información relacionada a las
macromoléculas biológicas como las proteínas (Xiong, 2006). Las proteínas son
moléculas esenciales compuestas por varios cientos o miles de aminoácidos
configurados de forma secuencial, lo cual se conoce como estructura primaria (Xiong,
2006). Esta organización se va plegando espontáneamente hasta resultar en una
conformación tridimensional diferente una de otra denominada como estructura
terciaria, la cual es fundamental para determinar la función de la proteína y realizarla de
forma exitosa (Xiong, 2006).
Hay muchas razones por las cuales la predicción de estructuras proteicas sigue siendo
una problemática vigente. Una de ellas es que, actualmente, es mucho más complicado
obtener estructuras tridimensionales que secuencias de proteínas, por lo cual existe una
brecha cuantitativa entre ellas, que crece exponencialmente (Deng et al., 2018).
Además, la determinación de las estructuras tridimensionales sigue siendo una tarea
que requiere muchos recursos económicos, computacionales y algunos no renovables,
como el tiempo (Lopes et al., 2019). En adición, se ha evidenciado una significativa
ausencia de criterios de usabilidad en el desarrollo de muchas herramientas informáticas
relacionadas a la predicción de las proteínas (Paixão-Cortes et al., 2018). Esto conlleva
al gasto innecesario de tiempo y esfuerzo de los usuarios que deben interactuar con
interfaces difíciles de entender (Bolchini et al., 2009).
Esta situación se replica en proteínas específicas como las proteínas repetidas, las
cuales son grupos de familias de proteínas que tienen propiedades particulares como la
existencia de unidades de repetición en su estructura (Hirsh et al., 2016). Estas
proteínas son importantes dado que se sabe que se relacionan con muchas
enfermedades humanas en su proceso de diagnóstico y porque dan pie al desarrollo de
nueva medicina (Burley et al., 2021; Kajava & Steven, 2006). No obstante, debido a su
complejidad, aún se requieren esfuerzos para estudiarlas en temas como la predicción
de sus estructuras (MSCA & RISE, 2018).
Por todo ello, este proyecto de tesis busca proponer el desarrollo de una herramienta
dedicada a la predicción de estructuras terciarias de proteínas repetidas a partir de sus
estructuras primarias, la cual deberá cumplir con lineamientos de usabilidad. Se espera responder a la problemática planteando una plataforma web que sea amigable para el
usuario, que permita obtener resultados en tiempos aceptables y que utilice un algoritmo
de predicción que aplique inteligencia artificial y sea eficaz respecto a la evaluación de
alineamientos estructurales.
En primera instancia, se evaluarán distintos algoritmos de predicción de proteínas en
general, para luego seleccionar uno y adaptarlo a los requerimientos de los especialistas
en proteínas repetidas. Con ello, se crearán servicios y rutinas de ejecución que
permitirán predecir estructuras terciarias de proteínas a partir de diversos tipos de datos
de entrada. Posteriormente, se construirá la interfaz gráfica de la herramienta, partiendo
de la definición de estándares y el desarrollo de un prototipo de alta fidelidad.
Finalmente, se integrarán ambos componentes para conformar la herramienta completa,
la cual será valorada a través de diversas pruebas funcionales y una evaluación de
usabilidad. Cabe mencionar que esta última se realizará utilizando una herramienta
enfocada a la evaluación de herramientas bioinformáticas.