“…, en el que se incorporan versiones optimizadas del CG, principalmente centradas en la operación SpMV sobre las mismas arquitecturas. En concreto, para las arquitecturas multinúcleo se utilizaron los formatos CSR, BCSR y CSB [192,193,194,195,196], mientras que para las GPUs se utilizaron los formatos ELLPACK, ELLR_T y SELL-P [197,198,199,200,201], y también se incluyó el "fusionado de kernels CUDA". Además, en el estudio se utilizó aritmética de DP, aunque como complemento final, también se comprobó el uso de SP para la GPU (Kepler) y un procesador de propósito general (Intel Bridge).…”