Goutte é uma biblioteca PHP para web crawling e screen scraping. Goutte oferece uma ótima API para web crawling e extração de dados de respostas HTML/XML. A vida fica mais fácil com Goutte. Com Goutte, você pode fazer scraping de dados diretamente da web dentro do seu script PHP, em vez de depender de scripts em Node.js ou Python para isso e depois exibir no front-end passando-os para um script PHP. Passar dados raspados para o front-end não retarda drasticamente o carregamento da página e não consome muita RAM no back-end, pois Goutte é uma biblioteca leve e pequena para web scraping. A biblioteca Goutte oferece APIs para web crawling e scraping de dados de respostas HTML e XML. Uma das bibliotecas mais populares para enviar requisições HTTP de páginas da web usando PHP é o cURL. Um pacote PHP chamado HTTPful facilita o formato HTTP para os programadores.
O que é Goutte?