Stacks de IA
Web scraping multi-agente con CrewAI y Piloterr
Proporcione a los agentes de CrewAI herramientas personalizadas que llamen a las API REST de Piloterr. Los equipos de investigación raspan, enriquecen y sintetizan datos web en vivo, sin granjas de navegadores ni scrapers frágiles.
- Herramientas personalizadas para cualquier endpoint de Piloterr
- Agentes basados en roles: investigador, analista, escritor
- JSON estructurado para salidas de agentes confiables
- Bypass de anti-bots para equipos de agentes en producción
De un vistazo
Herramientas
capacidades de agente
Equipos
equipos multi-agente
500
fuentes de datos
REST
API HTTP
Por qué conectar CrewAI
Equipos de investigación
Un agente investigador raspa datos mediante Piloterr, un agente analista procesa el JSON y un agente escritor produce el informe final.
Herramientas personalizadas
Defina funciones @tool que envuelvan llamadas HTTP a Piloterr; los agentes las invocan de forma autónoma durante las tareas.
Capa de datos confiable
Los agentes reciben JSON estructurado en lugar de analizar HTML, menos alucinaciones y mejores citas.
Escalabilidad con créditos
Pague por cada scrape exitoso. Las solicitudes fallidas no se cobran, lo cual es importante cuando los agentes reintentan.
Flujos de trabajo CrewAI + Piloterr
Patrones multi-agente para investigación de mercado, generación de leads e inteligencia competitiva.
Equipo de investigación de mercado
Raspa SERP, noticias y páginas de competidores, sintetiza en un documento informativo.
Equipo de enriquecimiento de leads
Búsqueda de dominio → datos de la empresa → perfil de LinkedIn → lead calificado.
Equipo de monitoreo
El equipo programado verifica páginas de precios y alerta cuando se detectan cambios.
Equipo de due diligence
Scrapeo multi-fuente para investigación de inversiones o alianzas.
Por qué los equipos necesitan herramientas de Piloterr
| Enfoque | Solución propia | Piloterr |
|---|---|---|
| Navegación web de agentes | Poco confiable en sitios protegidos | API de scraping gestionada |
| Herramientas de scraper DIY | Se rompen con cambios de diseño | Esquemas JSON estables |
| Herramientas de navegador sin cabeza | Ejecución lenta del equipo | Respuestas estructuradas rápidas |
| Eficiencia de tokens | HTML crudo en contexto | Campos JSON compactos |
Conecte CrewAI en cuatro pasos
Paso 1
Instale CrewAI
pip install crewai requests
Paso 2
Obtenga su clave API
Configure PILOTERR_API_KEY en su entorno.
Obtenga su clave APIPaso 3
Defina herramientas de scraping
Cree funciones @tool que llamen a los endpoints de Piloterr y devuelvan JSON.
Paso 4
Asigne herramientas a los agentes
Agregue herramientas a las definiciones de agentes y componga un equipo con tareas y proceso.
Recetas de flujos de trabajo
Equipo de inteligencia competitiva
El investigador raspa sitios de competidores, el analista compara precios y el escritor produce un informe semanal.
Equipo de puntuación de leads
Herramientas de enriquecimiento recopilan datos de la empresa + LinkedIn, el agente puntuador clasifica los leads.
Equipo de due diligence
Scrapeo multi-fuente para investigación de objetivos de M&A con fuentes citadas.
Equipo de inteligencia de mercado semanal
Un programador inicia un equipo que raspa noticias, competidores y cambios de precios en un informe semanal del lunes.
Cuándo elegir CrewAI vs LangChain
Escenario
Flujos de trabajo multi-agente basados en roles
Recomendación: CrewAI
Escenario
Agente único con herramientas
Recomendación: LangChain
Escenario
Pipelines de indexación RAG
Recomendación: LlamaIndex
Escenario
ETL en producción a escala
Recomendación: Python SDK
Ejemplo de herramienta y equipo de CrewAI
Un equipo de investigación que busca en Google News mediante Piloterr.
import os
import requests
from crewai.tools import tool
PILOTERR_KEY = os.environ["PILOTERR_API_KEY"]
BASE = "https://api.piloterr.com/v2"
@tool("Buscar en Google News")
def search_news(query: str) -> str:
"""Buscar en Google News y devolver títulos de artículos, fuentes y fragmentos."""
response = requests.post(
f"{BASE}/google/news",
headers={"x-api-key": PILOTERR_KEY, "Content-Type": "application/json"},
json={"query": query, "location": "Paris, FR", "page": 1},
timeout=60,
)
response.raise_for_status()
results = response.json().get("organic_results", [])
return "\n".join(
f"- {r.get('title')} ({r.get('source')}): {r.get('snippet')}"
for r in results[:10]
)Ver también
Precios transparentes en créditos
Paga solo por solicitudes exitosas. Empieza con +500 créditos, luego escala con planes desde $49/mes.
Premium
$49/mes
18,000 créditos
Premium+
$99/mes
40,000 créditos
Startup
$249/mes
110,000 créditos
¿Listo para empezar?
Tu API de web scraping está a un clic. Comienza con +500 créditos, sin infraestructura que configurar, sin proxies que gestionar y sin necesidad de tarjeta de crédito.
- +500 créditos
- Sin tarjeta de crédito
- Todos los endpoints incluidos