The Deoxyribonucleic Acid Fragment Assembly Problem (DNA-FAP) consists in reconstruct a DNA chain from a set of fragments taken randomly. Several authors solved the DNA-FAP using different approaches. In general, although it was obtaining good results; the computational time associated is high. The Firefly Algorithm (FA) is a bioinspired model based on the behaviour of fireflies. Considering that FA is a population bioinspired algorithm is possible design a parallel model of itself on Graphics Processing. In this work, a FA especially development for its execution on GPU is presented in order to accelerate the computational process to solve the DNA-FAP. Through several experiments the efficiency of the algorithm and the quality of the results were demonstrated.Keywords: fragment assembly problem; firefly algorithm; graphics processing units; optimization; parallelism.
Ensamblado de fragmentos de ADN utilizando un novedoso algoritmo de luciérnaga en GPU
ResumenEl problema de ensamblado de fragmentos de cadenas de ácido desoxirribonucleico (Deoxyribonucleic Acid Fragment Assembly Problem, DNA-FAP) consiste en la reconstrucción de cadenas de ADN desde un conjunto de fragmentos tomados aleatoriamente. El DNA-FAP ha sido resuelto por diferentes autores utilizando distintos enfoques. Aunque se obtienen buenos resultados, el tiempo computacional asociado es alto. El algoritmo de luciérnaga (Firefly Algorithm, FA) es un modelo bioinspirado basado en el comportamiento de las luciérnagas. Al ser un algoritmo bioinspirado poblacional es posible generar un modelo paralelo del mismo sobre Unidades de Procesamiento Gráfico (Graphics Processing Units, GPU). En este trabajo un algoritmo de luciérnaga es diseñado especialmente para ser ejecutado sobre una arquitectura GPU de manera tal de acelerar el proceso computacional buscando resolver el DNA-FAP. A través de diferentes experimentos se demuestra la eficiencia computacional y la calidad de los resultados obtenidos.Palabras clave: ensamblado de fragmentos de ADN; algoritmo de luciérnaga; unidades de procesamiento gráfico; optimización; paralelismo.
IntroducciónLa necesidad de conocer y predecir mutaciones somáticas y realizar distintos estudios relacionados con el desarrollo de los seres vivos es un tópico de relevancia por su impacto en la medicina para detección y tratamiento de patologías, la investigación forense y el desarrollo de medicamentos. Entre los problemas relacionados con el genoma podemos encontrar el estudio del ensamblado de cadenas de ADN (Deoxyribonucleic Acid Fragment Assembly Problem, DNA-FAP), donde dado un conjunto de cientos o miles de How to cite: Vidal, P.J. and Olivera, A.C., Ensamblado de fragmentos de ADN utilizando un novedoso algoritmo de luciérnaga en GPU. DYNA, 85(204), pp. 108-116, March, 2018. fragmentos de ADN, que pueden contener errores, debemos encontrar la secuencia de ADN original a partir de las permutaciones de los fragmentos que mejor representen a dicha secuencia [17].Existen herramientas que automatizan el secuenciamien...