Soil pollution is an extensive global problem, and effective management depends on accurate characterization and mapping of the extent of soil contamination. The objectives of this study were to determine the accuracy of different sampling intensities and the optimal number of samples required to minimize remediation project costs. To determine the accuracy associated with different sampling intensities, a Monte Carlo simulation was conducted. A simulated contaminant plume was created based on inverse distance weighting, kriging, or multivariate adaptive regression splines. Different sampling intensities, with grid spacing ranging from approximately 10% to 50% of the site extent, were used to generate a plume map using random forest model with a Euclidean distance matrix as predictors. The relative error was then determined as part of a Monte Carlo simulation that ran 10 000 simulations for each grid intensity for a total of 90 000 simulations. The optimal number of samples was determined based on economic factors, and the error functions generated with the Monte Carlo simulations. Average error ranged from 57% for 25 data points to 5% for 2800 data points. The 90th percentile error ranged from 100% to 0.3% for the sample data point range. Based on these results, the optimal number of samples, depending on pricing, ranged from 31 samples for a 10 m 3 contaminant plume to 3475 samples for a 10 000 m 3 soil contaminant plume.Résumé : La pollution du sol est un problème largement répandu dans le monde et, pour bien le gérer, il faut la caractériser ainsi qu'en cartographier l'importance. Les auteurs voulaient établir l'exactitude des taux d'échantillonnage et le nombre optimal de prélèvements requis pour minimiser le coût des projets de restauration. En vue de déterminer la précision découlant des différents taux d'échantillonnage, ils ont procédé à une simulation de Monte Carlo. Dans cette optique, ils ont reproduit un panache de contaminants en recourant à une pondération selon l'inverse de la distance, au krigeage ou à une spline de régression adaptative à variables multiples. Des taux d'échantillonnage avec maillage variant d'environ 10 à 50 pour cent de la superficie du site ont permis de tracer une carte du panache à partir d'un modèle forestier aléatoire ayant comme variable explicative une matrice euclidienne de la distance. Ensuite, les auteurs ont calculé l'erreur relative au moyen d'une simulation de Monte Carlo comportant 10 000 simulations par maillage, pour un total de 90 000 simulations. Le nombre optimal d'échantillons a été déterminé d'après les paramètres économiques, tandis que les fonctions d'erreur ont été dérivées de la technique de simulation de Monte Carlo. L'erreur moyenne varie de 57 % pour 25 points de données à 5 % pour 2800 points de données. L'erreur du 90 e percentile varie de 100 à 0,3 % pour la plage de points de données indiquée. D'après ces résultats, compte tenu du prix, le nombre de prélèvements optimal varie de 31 échantillons pour un panache de contaminants de 10 m 3 de sol à 3...