Ir para o conteúdo principal
Piloterr
LangChain logo

Stacks de IA

Dados da web em tempo real para LangChain com Piloterr

Crie ferramentas e retrievers do LangChain que chamam as APIs REST do Piloterr. Alimente agentes com JSON estruturado e atualizado de sites protegidos, sem precisar manter farms de navegadores ou pools de proxies.

  • Ferramentas personalizadas envolvendo qualquer endpoint do Piloterr
  • JSON estruturado ideal para raciocínio de agentes
  • Chamadas HTTP compatíveis com SDKs em Python e JavaScript
  • Bypass de anti-bots para pipelines de RAG e agentes

Visão geral

Ferramentas

ações de agente

JSON

saída estruturada

500

fontes de dados

REST

API HTTP

Por que conectar LangChain

  • Ferramentas para agentes

    Envolva endpoints do Piloterr como ferramentas do LangChain para que agentes possam raspar, enriquecer e recuperar dados da web em tempo real sob demanda.

  • Pipelines de RAG

    Obtenha Markdown ou JSON limpo de alvos difíceis e divida em vetores para armazenamento sem precisar analisar HTML bruto.

  • Sem manutenção de navegadores

    Agentes chamam o Piloterr em vez de iniciar Playwright ou Puppeteer, o anti-bot é tratado no lado do servidor.

  • Custos previsíveis

    Faturamento baseado em créditos por solicitação bem-sucedida, projete gastos conforme o volume de chamadas do agente cresce.

Casos de uso: LangChain + Piloterr

De agentes de pesquisa a sistemas de RAG em produção.

  • Agentes de pesquisa

    Agentes raspam dados de SERP, notícias e empresas para responder perguntas com fontes atualizadas.

  • Cadeias de enriquecimento

    Cadeias sequenciais que enriquecem leads com dados do LinkedIn, empresas e domínios.

  • Ingestão em vetores

    Carregue conteúdo estruturado de páginas em Pinecone, Weaviate ou pgvector.

  • Agentes multi-ferramentas

    Combine ferramentas de raspagem, extração e busca em um único executor de agente.

Por que agentes precisam do Piloterr em vez de fetch bruto

AbordagemSolução própriaPiloterr
requests / fetchBloqueado em sites protegidosTaxa de sucesso de 94%+ em alvos com WAF
Ferramenta PlaywrightLento, caro, frágilNavegador gerenciado + JSON
Análise de HTMLAgente desperdiça tokens com marcaçãoCampos JSON estruturados
Carga operacionalRotação de proxies, farms de CAPTCHAIntegração única com API

Conecte o LangChain em quatro passos

  1. Passo 1

    Instale o LangChain

    pip install langchain langchain-openai requests

  2. Passo 2

    Obtenha sua chave de API

    Copie a x-api-key do painel do Piloterr.

    Obtenha sua chave de API
  3. Passo 3

    Crie uma ferramenta personalizada

    Envolva uma chamada HTTP do Piloterr em uma função @tool (langchain.tools).

  4. Passo 4

    Execute o agente

    Use create_agent com seu modelo e ferramentas, o LLM decide quando raspar.

Receitas de fluxo de trabalho

  • Agente de pesquisa com SERP ao vivo

    O agente pesquisa no Google, lê os resultados via Piloterr e sintetiza uma resposta com citações.

  • Cadeia de enriquecimento de leads

    Cadeia sequencial: domínio → informações da empresa → perfil do LinkedIn → JSON pronto para CRM.

  • RAG sobre páginas de concorrentes

    Raspe páginas de preços de concorrentes, divida o JSON, incorpore em um armazenamento vetorial para perguntas e respostas.

  • Bot de suporte com documentação ao vivo

    O agente raspa as páginas do seu centro de ajuda sob demanda e responde às perguntas dos clientes com citações atualizadas.

Quando usar LangChain + Piloterr

  • Cenário

    Agentes de LLM precisam de dados da web em tempo real

    Recomendação: Ferramentas do LangChain

  • Cenário

    Pipelines ETL em lote

    Recomendação: SDK Python diretamente

  • Cenário

    Orquestração sem código

    Recomendação: n8n ou Make

  • Cenário

    Sistemas multi-agentes

    Recomendação: CrewAI

Exemplo de ferramenta para LangChain

Uma ferramenta mínima que raspa o Google Notícias via Piloterr.

Python
import os
import requests
from langchain.tools import tool

PILOTERR_KEY = os.environ["PILOTERR_API_KEY"]
BASE = "https://api.piloterr.com/v2"

@tool
def search_google_news(query: str, location: str = "Paris, FR") -> dict:
    """Pesquise no Google Notícias por artigos recentes que correspondam a uma consulta."""
    response = requests.post(
        f"{BASE}/google/news",
        headers={"x-api-key": PILOTERR_KEY, "Content-Type": "application/json"},
        json={"query": query, "location": location, "page": 1},
        timeout=60,
    )
    response.raise_for_status()
    return response.json()

Preços transparentes por crédito

Pague apenas por requisições bem-sucedidas. Comece com +500 créditos, depois escale com planos a partir de $49/mês.

Premium

$49/mês

18,000 créditos

Premium+

$99/mês

40,000 créditos

Startup

$249/mês

110,000 créditos

Pronto para começar?

Sua API de web scraping está a um clique. Comece com +500 créditos, sem infraestrutura para configurar, sem proxies para gerenciar e sem cartão de crédito necessário.

  • +500 créditos
  • Sem cartão de crédito
  • Todos os endpoints incluídos