Stacks IA
Données web en direct pour LangChain avec Piloterr
Construisez des outils et retrievers LangChain qui appellent les API REST Piloterr. Alimentez vos agents avec du JSON structuré et frais depuis des sites protégés, sans maintenir de fermes de navigateurs ni de pools de proxies.
- Outils personnalisés encapsulant n'importe quel endpoint Piloterr
- JSON structuré idéal pour le raisonnement des agents
- Appels HTTP compatibles SDK Python et JavaScript
- Contournement anti-bot pour les pipelines RAG et agents
En bref
Outils
actions agent
JSON
sortie structurée
400+
sources de données
REST
API HTTP
Pourquoi connecter LangChain
Outils pour agents
Encapsulez les endpoints Piloterr en outils LangChain pour que les agents puissent scraper, enrichir et récupérer des données web en direct à la demande.
Pipelines RAG
Récupérez du Markdown ou JSON propre depuis des cibles difficiles et découpez en stores vectoriels sans parser du HTML brut.
Sans maintenance de navigateur
Les agents appellent Piloterr au lieu de lancer Playwright ou Puppeteer, anti-bot géré côté serveur.
Coûts prévisibles
Facturation au crédit par requête réussie, prévoyez les dépenses à mesure que le volume d'appels agent augmente.
Cas d'usage LangChain + Piloterr
Des agents de recherche aux systèmes RAG en production.
Agents de recherche
Les agents scrapent SERP, actualités et données entreprise pour répondre avec des sources fraîches.
Chaînes d'enrichissement
Chaînes séquentielles qui enrichissent les leads avec LinkedIn, entreprise et données de domaine.
Ingestion vectorielle
Chargez du contenu de page structuré dans Pinecone, Weaviate ou pgvector.
Agents multi-outils
Combinez scrape, extraction et recherche dans un seul exécuteur d'agent.
Pourquoi les agents ont besoin de Piloterr plutôt que d'un fetch brut
| Approche | Solution maison | Piloterr |
|---|---|---|
| requests / fetch | Bloqué sur les sites protégés | Taux de passage 94 %+ sur cibles WAF |
| Outil Playwright | Lent, coûteux, fragile | Navigateur géré + JSON |
| Parsing HTML | L'agent gaspille des tokens sur le markup | Champs JSON structurés |
| Charge ops | Rotation de proxies, fermes CAPTCHA | Une seule intégration API |
Connecter LangChain en quatre étapes
Étape 1
Installez LangChain
pip install langchain langchain-openai requests
Étape 2
Obtenez votre clé API
Copiez x-api-key depuis le tableau de bord Piloterr.
Obtenez votre clé APIÉtape 3
Créez un outil personnalisé
Encapsulez un appel HTTP Piloterr dans une fonction @tool (langchain.tools).
Étape 4
Lancez l'agent
Utilisez create_agent avec votre modèle et vos outils, le LLM décide quand scraper.
Exemples de workflows
Agent de recherche avec SERP en direct
L'agent recherche sur Google, lit les résultats via Piloterr et synthétise une réponse avec citations.
Chaîne d'enrichissement de leads
Chaîne séquentielle : domaine → infos entreprise → profil LinkedIn → JSON prêt pour CRM.
RAG sur les pages concurrents
Scrapez les pages tarifaires des concurrents, découpez le JSON, intégrez dans un store vectoriel pour Q&R.
Bot support avec docs en direct
L'agent scrape vos pages d'aide à la demande et répond aux clients avec des citations à jour.
Quand utiliser LangChain + Piloterr
Scénario
Les agents LLM ont besoin de données web en direct
Recommandation: Outils LangChain
Scénario
Pipelines ETL par lots
Recommandation: SDK Python directement
Scénario
Orchestration no-code
Recommandation: n8n ou Make
Scénario
Systèmes multi-agents
Recommandation: CrewAI
Exemple d'outil LangChain
Un outil minimal qui scrape Google News via Piloterr.
import os
import requests
from langchain.tools import tool
PILOTERR_KEY = os.environ["PILOTERR_API_KEY"]
BASE = "https://api.piloterr.com/v2"
@tool
def search_google_news(query: str, location: str = "Paris, FR") -> dict:
"""Rechercher des articles récents sur Google News correspondant à une requête."""
response = requests.post(
f"{BASE}/google/news",
headers={"x-api-key": PILOTERR_KEY, "Content-Type": "application/json"},
json={"query": query, "location": location, "page": 1},
timeout=60,
)
response.raise_for_status()
return response.json()Voir aussi
Tarification transparente en crédits
Payez uniquement les requêtes réussies. Commencez avec +500 crédits, puis évoluez avec des forfaits à partir de 49 $/mois.
Premium
$49/mois
18,000 crédits
Premium+
$99/mois
40,000 crédits
Startup
$249/mois
110,000 crédits