Stacks de IA
Dados da web em tempo real para LangChain com Piloterr
Crie ferramentas e retrievers do LangChain que chamam as APIs REST do Piloterr. Alimente agentes com JSON estruturado e atualizado de sites protegidos, sem precisar manter farms de navegadores ou pools de proxies.
- Ferramentas personalizadas envolvendo qualquer endpoint do Piloterr
- JSON estruturado ideal para raciocínio de agentes
- Chamadas HTTP compatíveis com SDKs em Python e JavaScript
- Bypass de anti-bots para pipelines de RAG e agentes
Visão geral
Ferramentas
ações de agente
JSON
saída estruturada
500
fontes de dados
REST
API HTTP
Por que conectar LangChain
Ferramentas para agentes
Envolva endpoints do Piloterr como ferramentas do LangChain para que agentes possam raspar, enriquecer e recuperar dados da web em tempo real sob demanda.
Pipelines de RAG
Obtenha Markdown ou JSON limpo de alvos difíceis e divida em vetores para armazenamento sem precisar analisar HTML bruto.
Sem manutenção de navegadores
Agentes chamam o Piloterr em vez de iniciar Playwright ou Puppeteer, o anti-bot é tratado no lado do servidor.
Custos previsíveis
Faturamento baseado em créditos por solicitação bem-sucedida, projete gastos conforme o volume de chamadas do agente cresce.
Casos de uso: LangChain + Piloterr
De agentes de pesquisa a sistemas de RAG em produção.
Agentes de pesquisa
Agentes raspam dados de SERP, notícias e empresas para responder perguntas com fontes atualizadas.
Cadeias de enriquecimento
Cadeias sequenciais que enriquecem leads com dados do LinkedIn, empresas e domínios.
Ingestão em vetores
Carregue conteúdo estruturado de páginas em Pinecone, Weaviate ou pgvector.
Agentes multi-ferramentas
Combine ferramentas de raspagem, extração e busca em um único executor de agente.
Por que agentes precisam do Piloterr em vez de fetch bruto
| Abordagem | Solução própria | Piloterr |
|---|---|---|
| requests / fetch | Bloqueado em sites protegidos | Taxa de sucesso de 94%+ em alvos com WAF |
| Ferramenta Playwright | Lento, caro, frágil | Navegador gerenciado + JSON |
| Análise de HTML | Agente desperdiça tokens com marcação | Campos JSON estruturados |
| Carga operacional | Rotação de proxies, farms de CAPTCHA | Integração única com API |
Conecte o LangChain em quatro passos
Passo 1
Instale o LangChain
pip install langchain langchain-openai requests
Passo 2
Obtenha sua chave de API
Copie a x-api-key do painel do Piloterr.
Obtenha sua chave de APIPasso 3
Crie uma ferramenta personalizada
Envolva uma chamada HTTP do Piloterr em uma função @tool (langchain.tools).
Passo 4
Execute o agente
Use create_agent com seu modelo e ferramentas, o LLM decide quando raspar.
Receitas de fluxo de trabalho
Agente de pesquisa com SERP ao vivo
O agente pesquisa no Google, lê os resultados via Piloterr e sintetiza uma resposta com citações.
Cadeia de enriquecimento de leads
Cadeia sequencial: domínio → informações da empresa → perfil do LinkedIn → JSON pronto para CRM.
RAG sobre páginas de concorrentes
Raspe páginas de preços de concorrentes, divida o JSON, incorpore em um armazenamento vetorial para perguntas e respostas.
Bot de suporte com documentação ao vivo
O agente raspa as páginas do seu centro de ajuda sob demanda e responde às perguntas dos clientes com citações atualizadas.
Quando usar LangChain + Piloterr
Cenário
Agentes de LLM precisam de dados da web em tempo real
Recomendação: Ferramentas do LangChain
Cenário
Pipelines ETL em lote
Recomendação: SDK Python diretamente
Cenário
Orquestração sem código
Recomendação: n8n ou Make
Cenário
Sistemas multi-agentes
Recomendação: CrewAI
Exemplo de ferramenta para LangChain
Uma ferramenta mínima que raspa o Google Notícias via Piloterr.
import os
import requests
from langchain.tools import tool
PILOTERR_KEY = os.environ["PILOTERR_API_KEY"]
BASE = "https://api.piloterr.com/v2"
@tool
def search_google_news(query: str, location: str = "Paris, FR") -> dict:
"""Pesquise no Google Notícias por artigos recentes que correspondam a uma consulta."""
response = requests.post(
f"{BASE}/google/news",
headers={"x-api-key": PILOTERR_KEY, "Content-Type": "application/json"},
json={"query": query, "location": location, "page": 1},
timeout=60,
)
response.raise_for_status()
return response.json()Veja também
Preços transparentes por crédito
Pague apenas por requisições bem-sucedidas. Comece com +500 créditos, depois escale com planos a partir de $49/mês.
Premium
$49/mês
18,000 créditos
Premium+
$99/mês
40,000 créditos
Startup
$249/mês
110,000 créditos
Pronto para começar?
Sua API de web scraping está a um clique. Comece com +500 créditos, sem infraestrutura para configurar, sem proxies para gerenciar e sem cartão de crédito necessário.
- +500 créditos
- Sem cartão de crédito
- Todos os endpoints incluídos