Pilas de IA
Datos web en tiempo real para LangChain con Piloterr
Crea herramientas y recuperadores de LangChain que llamen a las API REST de Piloterr. Alimenta a los agentes con JSON estructurado y fresco desde sitios protegidos, sin mantener granjas de navegadores ni pools de proxies.
- Herramientas personalizadas que envuelven cualquier endpoint de Piloterr
- JSON estructurado ideal para el razonamiento de agentes
- Llamadas HTTP compatibles con SDK de Python y JavaScript
- Bypass de anti-bots para pipelines de RAG y agentes
De un vistazo
Herramientas
acciones de agentes
JSON
salida estructurada
500
fuentes de datos
REST
API HTTP
Por qué conectar LangChain
Herramientas para agentes
Envuelve endpoints de Piloterr como herramientas de LangChain para que los agentes puedan scrapear, enriquecer y recuperar datos web en tiempo real bajo demanda.
Pipelines de RAG
Obtén Markdown o JSON limpio de objetivos difíciles y divídelo en almacenes vectoriales sin parsear HTML crudo.
Sin mantenimiento de navegadores
Los agentes llaman a Piloterr en lugar de iniciar Playwright o Puppeteer; el anti-bot se gestiona del lado del servidor.
Costos predecibles
Facturación basada en créditos por solicitud exitosa; pronostica el gasto a medida que crece el volumen de llamadas del agente.
Casos de uso de LangChain + Piloterr
Desde agentes de investigación hasta sistemas RAG en producción.
Agentes de investigación
Los agentes scrapean SERP, noticias y datos de empresas para responder preguntas con fuentes actualizadas.
Cadenas de enriquecimiento
Cadenas secuenciales que enriquecen leads con datos de LinkedIn, empresas y dominios.
Ingestión en vectores
Carga contenido estructurado de páginas en Pinecone, Weaviate o pgvector.
Agentes multiherramienta
Combina herramientas de scraping, extracción y búsqueda en un único ejecutor de agentes.
Por qué los agentes necesitan Piloterr en lugar de fetch sin procesar
| Enfoque | Solución propia | Piloterr |
|---|---|---|
| solicitudes / fetch | Bloqueado en sitios protegidos | Tasa de éxito del 94%+ en objetivos con WAF |
| Herramienta Playwright | Lento, costoso, frágil | Navegador gestionado + JSON |
| Parseo de HTML | El agente desperdicia tokens en marcado | Campos JSON estructurados |
| Carga operativa | Rotación de proxies, granjas de CAPTCHA | Integración única con API |
Conecta LangChain en cuatro pasos
Paso 1
Instala LangChain
pip install langchain langchain-openai requests
Paso 2
Obtén tu clave API
Copia x-api-key desde el panel de Piloterr.
Obtén tu clave APIPaso 3
Crea una herramienta personalizada
Envuelve una llamada HTTP a Piloterr en una función @tool (langchain.tools).
Paso 4
Ejecuta el agente
Usa create_agent con tu modelo y herramientas; el LLM decide cuándo scrapear.
Recetas de flujos de trabajo
Agente de investigación con SERP en tiempo real
El agente busca en Google, lee los resultados mediante Piloterr y sintetiza una respuesta con citas.
Cadena de enriquecimiento de leads
Cadena secuencial: dominio → información de empresa → perfil de LinkedIn → JSON listo para CRM.
RAG sobre páginas de competidores
Scrapea páginas de precios de competidores, divide el JSON, incrusta en un almacén vectorial para preguntas y respuestas.
Bot de soporte con documentación en vivo
El agente scrapea las páginas de tu centro de ayuda bajo demanda y responde preguntas de clientes con citas actualizadas.
Cuándo usar LangChain + Piloterr
Escenario
Los agentes de LLM necesitan datos web en tiempo real
Recomendación: Herramientas de LangChain
Escenario
Pipelines ETL por lotes
Recomendación: SDK de Python directamente
Escenario
Orquestación sin código
Recomendación: n8n o Make
Escenario
Sistemas multiagente
Recomendación: CrewAI
Ejemplo de herramienta para LangChain
Una herramienta mínima que scrapea Google News mediante Piloterr.
import os
import requests
from langchain.tools import tool
PILOTERR_KEY = os.environ["PILOTERR_API_KEY"]
BASE = "https://api.piloterr.com/v2"
@tool
def search_google_news(query: str, location: str = "Paris, FR") -> dict:
"""Busca en Google News artículos recientes que coincidan con una consulta."""
response = requests.post(
f"{BASE}/google/news",
headers={"x-api-key": PILOTERR_KEY, "Content-Type": "application/json"},
json={"query": query, "location": location, "page": 1},
timeout=60,
)
response.raise_for_status()
return response.json()Ver también
Precios transparentes en créditos
Paga solo por solicitudes exitosas. Empieza con +500 créditos, luego escala con planes desde $49/mes.
Premium
$49/mes
18,000 créditos
Premium+
$99/mes
40,000 créditos
Startup
$249/mes
110,000 créditos
¿Listo para empezar?
Tu API de web scraping está a un clic. Comienza con +500 créditos, sin infraestructura que configurar, sin proxies que gestionar y sin necesidad de tarjeta de crédito.
- +500 créditos
- Sin tarjeta de crédito
- Todos los endpoints incluidos