Random Forest est un algorithme de machine learning fiable utilisable pour de nombreuses tâches, notamment la régression et la classification. C'est une méthode d'ensemble : un modèle random forest est composé de nombreux petits arbres de décision, appelés estimateurs, chacun produisant un ensemble de prédictions distinct. Les estimations des estimateurs sont combinées par le modèle random forest pour obtenir une prédiction plus précise. Bien que légèrement moins performants pour la régression, les random forests excellent en classification. Grâce à leur conception d'ensemble, ils généralisent bien sur des données non vues, y compris avec des valeurs manquantes. Ils gèrent également efficacement de grands jeux de données à haute dimensionnalité et des types de features variés.
Qu'est-ce que les forêts aléatoires ?