Saltar al contenido principal
Piloterr

¿Qué es Goutte?

Goutte

Goutte es una librería de PHP para web crawling y screen scraping. Goutte ofrece una excelente API para el rastreo web y la extracción de datos de respuestas HTML/XML. La vida es más fácil con Goutte. Con Goutte, puedes raspar datos directamente de la web dentro de tu script PHP en lugar de depender de scripts en Node.js o Python para hacerlo y luego mostrarlo en el front-end pasándolo a un script PHP. Pasar datos raspados al front-end no ralentiza drásticamente la carga de la página ni consume mucha RAM en el backend porque Goutte es una librería de web scraping pequeña y ligera. La librería Goutte ofrece APIs para el rastreo web y la extracción de datos de respuestas HTML y XML. Una de las librerías más populares para enviar solicitudes HTTP desde páginas web usando PHP es cURL. Un paquete de PHP llamado HTTPful facilita a los programadores la comprensión del formato HTTP.