Skip to main content
Piloterr

Qu'est-ce que Goutte ?

Goutte

Goutte est une bibliothèque PHP pour le crawling web et le screen scraping. Goutte propose une API performante pour le crawling web et l'extraction de données à partir de réponses HTML/XML. Avec Goutte, vous pouvez extraire des données directement depuis le web au sein de votre script PHP, plutôt que de dépendre de scripts Node.js ou Python pour ensuite les transmettre au front-end via PHP. Le transfert des données extraites vers le front-end ne ralentit pas significativement le chargement des pages et ne consomme pas beaucoup de RAM côté backend, car Goutte est une bibliothèque de scraping web légère. La bibliothèque Goutte propose des API pour le crawling web et l'extraction de données à partir de réponses HTML et XML. cURL est l'une des bibliothèques les plus populaires pour envoyer des requêtes HTTP depuis des pages web en PHP. HTTPful est un package PHP qui simplifie le format HTTP pour les développeurs.