Saltar al contenido principal
Piloterr
CrewAI logo

Stacks de IA

Web scraping multi-agente con CrewAI y Piloterr

Proporcione a los agentes de CrewAI herramientas personalizadas que llamen a las API REST de Piloterr. Los equipos de investigación raspan, enriquecen y sintetizan datos web en vivo, sin granjas de navegadores ni scrapers frágiles.

  • Herramientas personalizadas para cualquier endpoint de Piloterr
  • Agentes basados en roles: investigador, analista, escritor
  • JSON estructurado para salidas de agentes confiables
  • Bypass de anti-bots para equipos de agentes en producción

De un vistazo

Herramientas

capacidades de agente

Equipos

equipos multi-agente

500

fuentes de datos

REST

API HTTP

Por qué conectar CrewAI

  • Equipos de investigación

    Un agente investigador raspa datos mediante Piloterr, un agente analista procesa el JSON y un agente escritor produce el informe final.

  • Herramientas personalizadas

    Defina funciones @tool que envuelvan llamadas HTTP a Piloterr; los agentes las invocan de forma autónoma durante las tareas.

  • Capa de datos confiable

    Los agentes reciben JSON estructurado en lugar de analizar HTML, menos alucinaciones y mejores citas.

  • Escalabilidad con créditos

    Pague por cada scrape exitoso. Las solicitudes fallidas no se cobran, lo cual es importante cuando los agentes reintentan.

Flujos de trabajo CrewAI + Piloterr

Patrones multi-agente para investigación de mercado, generación de leads e inteligencia competitiva.

  • Equipo de investigación de mercado

    Raspa SERP, noticias y páginas de competidores, sintetiza en un documento informativo.

  • Equipo de enriquecimiento de leads

    Búsqueda de dominio → datos de la empresa → perfil de LinkedIn → lead calificado.

  • Equipo de monitoreo

    El equipo programado verifica páginas de precios y alerta cuando se detectan cambios.

  • Equipo de due diligence

    Scrapeo multi-fuente para investigación de inversiones o alianzas.

Por qué los equipos necesitan herramientas de Piloterr

EnfoqueSolución propiaPiloterr
Navegación web de agentesPoco confiable en sitios protegidosAPI de scraping gestionada
Herramientas de scraper DIYSe rompen con cambios de diseñoEsquemas JSON estables
Herramientas de navegador sin cabezaEjecución lenta del equipoRespuestas estructuradas rápidas
Eficiencia de tokensHTML crudo en contextoCampos JSON compactos

Conecte CrewAI en cuatro pasos

  1. Paso 1

    Instale CrewAI

    pip install crewai requests

  2. Paso 2

    Obtenga su clave API

    Configure PILOTERR_API_KEY en su entorno.

    Obtenga su clave API
  3. Paso 3

    Defina herramientas de scraping

    Cree funciones @tool que llamen a los endpoints de Piloterr y devuelvan JSON.

  4. Paso 4

    Asigne herramientas a los agentes

    Agregue herramientas a las definiciones de agentes y componga un equipo con tareas y proceso.

Recetas de flujos de trabajo

  • Equipo de inteligencia competitiva

    El investigador raspa sitios de competidores, el analista compara precios y el escritor produce un informe semanal.

  • Equipo de puntuación de leads

    Herramientas de enriquecimiento recopilan datos de la empresa + LinkedIn, el agente puntuador clasifica los leads.

  • Equipo de due diligence

    Scrapeo multi-fuente para investigación de objetivos de M&A con fuentes citadas.

  • Equipo de inteligencia de mercado semanal

    Un programador inicia un equipo que raspa noticias, competidores y cambios de precios en un informe semanal del lunes.

Cuándo elegir CrewAI vs LangChain

  • Escenario

    Flujos de trabajo multi-agente basados en roles

    Recomendación: CrewAI

  • Escenario

    Agente único con herramientas

    Recomendación: LangChain

  • Escenario

    Pipelines de indexación RAG

    Recomendación: LlamaIndex

  • Escenario

    ETL en producción a escala

    Recomendación: Python SDK

Ejemplo de herramienta y equipo de CrewAI

Un equipo de investigación que busca en Google News mediante Piloterr.

Python
import os
import requests
from crewai.tools import tool

PILOTERR_KEY = os.environ["PILOTERR_API_KEY"]
BASE = "https://api.piloterr.com/v2"

@tool("Buscar en Google News")
def search_news(query: str) -> str:
    """Buscar en Google News y devolver títulos de artículos, fuentes y fragmentos."""
    response = requests.post(
        f"{BASE}/google/news",
        headers={"x-api-key": PILOTERR_KEY, "Content-Type": "application/json"},
        json={"query": query, "location": "Paris, FR", "page": 1},
        timeout=60,
    )
    response.raise_for_status()
    results = response.json().get("organic_results", [])
    return "\n".join(
        f"- {r.get('title')} ({r.get('source')}): {r.get('snippet')}"
        for r in results[:10]
    )

Precios transparentes en créditos

Paga solo por solicitudes exitosas. Empieza con +500 créditos, luego escala con planes desde $49/mes.

Premium

$49/mes

18,000 créditos

Premium+

$99/mes

40,000 créditos

Startup

$249/mes

110,000 créditos

¿Listo para empezar?

Tu API de web scraping está a un clic. Comienza con +500 créditos, sin infraestructura que configurar, sin proxies que gestionar y sin necesidad de tarjeta de crédito.

  • +500 créditos
  • Sin tarjeta de crédito
  • Todos los endpoints incluidos