Abstract:This paper presents two approaches using a Block Low-Rank (BLR) compression technique to reduce the memory footprint and/or the time-to-solution of the sparse supernodal solver PaStiX. This flat, non-hierarchical, compression method allows to take advantage of the low-rank property of the blocks appearing during the factorization of sparse linear systems, which come from the discretization of partial differential equations. The first approach, called Minimal Memory, illustrates the maximum memory gain that can be obtained with the BLR compression method, while the second approach, called Just-In-Time, mainly focuses on reducing the computational complexity and thus the time-to-solution. Singular Value Decomposition (SVD) and Rank-Revealing QR (RRQR), as compression kernels, are both compared in terms of factorization time, memory consumption, as well as numerical properties. Experiments on a single node with 24 threads and 128 GB of memory are performed to evaluate the potential of both strategies. On a set of matrices from real-life problems, we demonstrate a memory footprint reduction of up to 4 times using the Minimal Memory strategy and a computational time speedup of up to 3.5 times with the Just-In-Time strategy. Then, we study the impact of configuration parameters of the BLR solver that allowed us to solve a 3D laplacian of 36 million unknowns a single node, while the full-rank solver stopped at 8 million due to memory limitation.
Key-words:Sparse linear solver, block low-rank compression, PaStiX direct solver, multithreaded architectures * Inria Bordeaux -Sud-Ouest, Talence, France † University of Bordeaux, Talence, France ‡ CNRS (Labri UMR 5800), Talence, France § Mechanical Engineering Department, Stanford University, United States ¶ Bordeaux INP, Talence, France Un solveur supernodal creux utilisant une compression de rang faible par bloc: conception, étude de performance et analyse des résultats
Résumé :Ce papier présente deux approches utilisant les techniques de compression de rang faible par bloc (BLR) afin de réduire l'empreinte mémoire et/ou le temps de résolution du solveur superndal PaStiX. Cette technique de compression à plat, non hiérarchique, permet de tirer parti des propriétés de rang faible dans les blocs obtenus lors de la factorisation du système linéaire provenant par exemple de la discrétisation des équations différentielles partielles. La première approche, appelée Minimal Memory, montre le gain mémoire maximum qu'il est possible d'obtenir avec une compression BLR, alors que la seconde approche, appelée Just-InTime, se concentre principalement sur la réduction du temps de calcul pour la résolution du système. Dans cette étude, nous comparons, en termes de temps de calcul et de consommation mémoire, les noyaux de compression qui utilisent soit la technique de décomposition en valeurs propres singulières (SVD) soit la factorisation QR avec détermination du rang (RRQR). Nous avons réalisé les expériences sur un noeud composé de 24 coeurs avec 128 GB de mémoire sur une collec...