Key-words:Artificial neural networks, random forests, native fish, species richness, Mediterranean rivers Machine learning (ML) techniques have become important to support decision making in management and conservation of freshwater aquatic ecosystems. Given the large number of ML techniques and to improve the understanding of ML utility in ecology, it is necessary to perform comparative studies of these techniques as a preparatory analysis for future model applications. The objectives of this study were (i) to compare the reliability and ecological relevance of two predictive models for fish richness, based on the techniques of artificial neural networks (ANN) and random forests (RF) and (ii) to evaluate the conformity in terms of selected important variables between the two modelling approaches. The effectiveness of the models were evaluated using three performance metrics: the determination coefficient (R 2 ), the mean squared error (MSE) and the adjusted determination coefficient (R 2 adj ) and both models were developed using a k-fold crossvalidation procedure. According to the results, both techniques had similar validation performance (R 2 = 68% for RF and R 2 = 66% for ANN). Although the two methods selected different subsets of input variables, both models demonstrated high ecological relevance for the conservation of native fish in the Mediterranean region. Moreover, this work shows how the use of different modelling methods can assist the critical analysis of predictions at a catchment scale.
RÉSUMÉUne comparaison des réseaux de neurones et des forêts aléatoires pour prédire la richesse en espèces de poissons indigènes dans les rivières méditerranéennes Les techniques d'apprentissage automatique (ML) sont devenues importantes pour aider à la décision dans la gestion et la conservation des écosystèmes aquatiques d'eau douce. Étant donné le grand nombre de techniques ML pour amélio-rer la compréhension de l'utilité des ML en écologie, il est nécessaire de réaliser des études comparatives de ces techniques comme analyse préparatoire pour des applications de modèles futurs. Les objectifs de cette étude étaient : (i) de comparer la fiabilité et la pertinence écologique de deux modèles prédictifs pour la richesse de poisson, basé sur les techniques de réseaux de neurones artificiels (ANN) et les forêts aléatoires (RF) et (ii) d'évaluer la conformité en termes de sélection des variables importantes entre les deux approches de modélisa-tion. L'efficacité des modèles a été évaluée au moyen de trois indicateurs de Article published by EDP Sciences E.J. Olaya-Marín et al.: Knowl. Managt. Aquatic Ecosyst. (2013) 409, 07 performance : le coefficient de détermination (R 2 ), l'erreur quadratique moyenne (MSE) et le coefficient de détermination ajusté (R 2 adj ) et les deux modèles ont été développés en utilisant une procédure de validation croisée k-fold. Selon les résul-tats, les deux techniques ont des performances de validation similaires (R 2 = 68 % pour RF et R 2 = 66 % pour ANN). Bien que les deux...