Algoritmo bioinspirado Lobo Gris (Grey Wolf) para la optimización de índices en bases de datos relacionales
Acceso a Texto completo
Abstract
Dentro del mundo empresarial actual, los datos cobran una importancia crucial para el
desarrollo de una compañía, ya sea para análisis, seguimiento comercial, estrategias de
negocios, entre otros. Por lo que, su almacenamiento y extracción son una parte importante
para su uso. Las bases de datos sirven para almacenar esta información, para que luego
puedan ser consultadas. Estas pueden ser tanto relacionales como no relacionales, siendo la
primera en donde los datos que se almacenan están relacionados entre ellos. La información
se organiza mediante tablas, que incluyen columnas y filas, pudiendo obtener acceso a estos
datos de diferentes maneras (AWS, n.d.).
Para los administradores de base de datos (DBA) e investigadores la mejora del rendimiento
de las bases de datos ha sido un reto persistente a lo largo de los años. Este desafío está
fuertemente relacionado con la forma de organización lógica de los registros y,
especialmente, a la rapidez con la que se accede y procesa esos registros. En ese sentido,
los índices ejercen como un modo de acceso más rápido a la información. Siendo un caso de
ejemplo, cuando los datos son solicitados, el sistema de gestión de base de datos primero
verifica si existe un índice y su estructura, la cual está ordenada y contiene la dirección física
del dato, permitiendo así recuperar la información directamente en el disco duro, simplificando
el trabajo de búsqueda (Pedrozo & Vaz, 2014).
Si bien los índices sirven para acelerar la recuperación de los datos, uno mal diseñado
deteriora el rendimiento general. Esto se debe a los diferentes factores que influyen en su
creación, como lo son: El tipo de dato, la estructura de la tabla, el número de veces que se
buscó un campo específico, la frecuencia de ciertas consultas, la frecuencia de valores
distintos en una columna, la carga de trabajo, el número de operaciones de lectura y escritura,
entre otros (Naik, 2018).
En consecuencia, el propósito de este proyecto consiste en mejorar la eficiencia del tiempo
de respuesta en las consultas mediante el uso de índices, brindando la mejor opción para la
creación de estos, sobre las tablas dentro un sistema de gestión de bases de datos
relacionales (RDBMS). Para este proyecto se plantea utilizar un algoritmo metaheurístico
aplicado al problema de selección de índices (ISP), el cual consiste en, dado una base de
datos y un conjunto de consultas, seleccionar automáticamente un conjunto apropiado de
índices (Chaudhuri, Datar, and Narasayya 2004). Este problema es considerado un “NP-Hard
Problem”, la elección de utilizar un algoritmo metaheurístico, en combinación con la amplia
gama de variables que pueden influir, se revela como una opción óptima en comparación con
otros tipos de algoritmos.