Saltar al contenido principal
Piloterr
LangChain logo

Pilas de IA

Datos web en tiempo real para LangChain con Piloterr

Crea herramientas y recuperadores de LangChain que llamen a las API REST de Piloterr. Alimenta a los agentes con JSON estructurado y fresco desde sitios protegidos, sin mantener granjas de navegadores ni pools de proxies.

  • Herramientas personalizadas que envuelven cualquier endpoint de Piloterr
  • JSON estructurado ideal para el razonamiento de agentes
  • Llamadas HTTP compatibles con SDK de Python y JavaScript
  • Bypass de anti-bots para pipelines de RAG y agentes

De un vistazo

Herramientas

acciones de agentes

JSON

salida estructurada

500

fuentes de datos

REST

API HTTP

Por qué conectar LangChain

  • Herramientas para agentes

    Envuelve endpoints de Piloterr como herramientas de LangChain para que los agentes puedan scrapear, enriquecer y recuperar datos web en tiempo real bajo demanda.

  • Pipelines de RAG

    Obtén Markdown o JSON limpio de objetivos difíciles y divídelo en almacenes vectoriales sin parsear HTML crudo.

  • Sin mantenimiento de navegadores

    Los agentes llaman a Piloterr en lugar de iniciar Playwright o Puppeteer; el anti-bot se gestiona del lado del servidor.

  • Costos predecibles

    Facturación basada en créditos por solicitud exitosa; pronostica el gasto a medida que crece el volumen de llamadas del agente.

Casos de uso de LangChain + Piloterr

Desde agentes de investigación hasta sistemas RAG en producción.

  • Agentes de investigación

    Los agentes scrapean SERP, noticias y datos de empresas para responder preguntas con fuentes actualizadas.

  • Cadenas de enriquecimiento

    Cadenas secuenciales que enriquecen leads con datos de LinkedIn, empresas y dominios.

  • Ingestión en vectores

    Carga contenido estructurado de páginas en Pinecone, Weaviate o pgvector.

  • Agentes multiherramienta

    Combina herramientas de scraping, extracción y búsqueda en un único ejecutor de agentes.

Por qué los agentes necesitan Piloterr en lugar de fetch sin procesar

EnfoqueSolución propiaPiloterr
solicitudes / fetchBloqueado en sitios protegidosTasa de éxito del 94%+ en objetivos con WAF
Herramienta PlaywrightLento, costoso, frágilNavegador gestionado + JSON
Parseo de HTMLEl agente desperdicia tokens en marcadoCampos JSON estructurados
Carga operativaRotación de proxies, granjas de CAPTCHAIntegración única con API

Conecta LangChain en cuatro pasos

  1. Paso 1

    Instala LangChain

    pip install langchain langchain-openai requests

  2. Paso 2

    Obtén tu clave API

    Copia x-api-key desde el panel de Piloterr.

    Obtén tu clave API
  3. Paso 3

    Crea una herramienta personalizada

    Envuelve una llamada HTTP a Piloterr en una función @tool (langchain.tools).

  4. Paso 4

    Ejecuta el agente

    Usa create_agent con tu modelo y herramientas; el LLM decide cuándo scrapear.

Recetas de flujos de trabajo

  • Agente de investigación con SERP en tiempo real

    El agente busca en Google, lee los resultados mediante Piloterr y sintetiza una respuesta con citas.

  • Cadena de enriquecimiento de leads

    Cadena secuencial: dominio → información de empresa → perfil de LinkedIn → JSON listo para CRM.

  • RAG sobre páginas de competidores

    Scrapea páginas de precios de competidores, divide el JSON, incrusta en un almacén vectorial para preguntas y respuestas.

  • Bot de soporte con documentación en vivo

    El agente scrapea las páginas de tu centro de ayuda bajo demanda y responde preguntas de clientes con citas actualizadas.

Cuándo usar LangChain + Piloterr

  • Escenario

    Los agentes de LLM necesitan datos web en tiempo real

    Recomendación: Herramientas de LangChain

  • Escenario

    Pipelines ETL por lotes

    Recomendación: SDK de Python directamente

  • Escenario

    Orquestación sin código

    Recomendación: n8n o Make

  • Escenario

    Sistemas multiagente

    Recomendación: CrewAI

Ejemplo de herramienta para LangChain

Una herramienta mínima que scrapea Google News mediante Piloterr.

Python
import os
import requests
from langchain.tools import tool

PILOTERR_KEY = os.environ["PILOTERR_API_KEY"]
BASE = "https://api.piloterr.com/v2"

@tool
def search_google_news(query: str, location: str = "Paris, FR") -> dict:
    """Busca en Google News artículos recientes que coincidan con una consulta."""
    response = requests.post(
        f"{BASE}/google/news",
        headers={"x-api-key": PILOTERR_KEY, "Content-Type": "application/json"},
        json={"query": query, "location": location, "page": 1},
        timeout=60,
    )
    response.raise_for_status()
    return response.json()

Precios transparentes en créditos

Paga solo por solicitudes exitosas. Empieza con +500 créditos, luego escala con planes desde $49/mes.

Premium

$49/mes

18,000 créditos

Premium+

$99/mes

40,000 créditos

Startup

$249/mes

110,000 créditos

¿Listo para empezar?

Tu API de web scraping está a un clic. Comienza con +500 créditos, sin infraestructura que configurar, sin proxies que gestionar y sin necesidad de tarjeta de crédito.

  • +500 créditos
  • Sin tarjeta de crédito
  • Todos los endpoints incluidos