Skip to main content
Piloterr
LangChain logo

Stacks IA

Données web en direct pour LangChain avec Piloterr

Construisez des outils et retrievers LangChain qui appellent les API REST Piloterr. Alimentez vos agents avec du JSON structuré et frais depuis des sites protégés, sans maintenir de fermes de navigateurs ni de pools de proxies.

  • Outils personnalisés encapsulant n'importe quel endpoint Piloterr
  • JSON structuré idéal pour le raisonnement des agents
  • Appels HTTP compatibles SDK Python et JavaScript
  • Contournement anti-bot pour les pipelines RAG et agents

En bref

Outils

actions agent

JSON

sortie structurée

400+

sources de données

REST

API HTTP

Pourquoi connecter LangChain

  • Outils pour agents

    Encapsulez les endpoints Piloterr en outils LangChain pour que les agents puissent scraper, enrichir et récupérer des données web en direct à la demande.

  • Pipelines RAG

    Récupérez du Markdown ou JSON propre depuis des cibles difficiles et découpez en stores vectoriels sans parser du HTML brut.

  • Sans maintenance de navigateur

    Les agents appellent Piloterr au lieu de lancer Playwright ou Puppeteer, anti-bot géré côté serveur.

  • Coûts prévisibles

    Facturation au crédit par requête réussie, prévoyez les dépenses à mesure que le volume d'appels agent augmente.

Cas d'usage LangChain + Piloterr

Des agents de recherche aux systèmes RAG en production.

  • Agents de recherche

    Les agents scrapent SERP, actualités et données entreprise pour répondre avec des sources fraîches.

  • Chaînes d'enrichissement

    Chaînes séquentielles qui enrichissent les leads avec LinkedIn, entreprise et données de domaine.

  • Ingestion vectorielle

    Chargez du contenu de page structuré dans Pinecone, Weaviate ou pgvector.

  • Agents multi-outils

    Combinez scrape, extraction et recherche dans un seul exécuteur d'agent.

Pourquoi les agents ont besoin de Piloterr plutôt que d'un fetch brut

ApprocheSolution maisonPiloterr
requests / fetchBloqué sur les sites protégésTaux de passage 94 %+ sur cibles WAF
Outil PlaywrightLent, coûteux, fragileNavigateur géré + JSON
Parsing HTMLL'agent gaspille des tokens sur le markupChamps JSON structurés
Charge opsRotation de proxies, fermes CAPTCHAUne seule intégration API

Connecter LangChain en quatre étapes

  1. Étape 1

    Installez LangChain

    pip install langchain langchain-openai requests

  2. Étape 2

    Obtenez votre clé API

    Copiez x-api-key depuis le tableau de bord Piloterr.

    Obtenez votre clé API
  3. Étape 3

    Créez un outil personnalisé

    Encapsulez un appel HTTP Piloterr dans une fonction @tool (langchain.tools).

  4. Étape 4

    Lancez l'agent

    Utilisez create_agent avec votre modèle et vos outils, le LLM décide quand scraper.

Exemples de workflows

  • Agent de recherche avec SERP en direct

    L'agent recherche sur Google, lit les résultats via Piloterr et synthétise une réponse avec citations.

  • Chaîne d'enrichissement de leads

    Chaîne séquentielle : domaine → infos entreprise → profil LinkedIn → JSON prêt pour CRM.

  • RAG sur les pages concurrents

    Scrapez les pages tarifaires des concurrents, découpez le JSON, intégrez dans un store vectoriel pour Q&R.

  • Bot support avec docs en direct

    L'agent scrape vos pages d'aide à la demande et répond aux clients avec des citations à jour.

Quand utiliser LangChain + Piloterr

  • Scénario

    Les agents LLM ont besoin de données web en direct

    Recommandation: Outils LangChain

  • Scénario

    Pipelines ETL par lots

    Recommandation: SDK Python directement

  • Scénario

    Orchestration no-code

    Recommandation: n8n ou Make

  • Scénario

    Systèmes multi-agents

    Recommandation: CrewAI

Exemple d'outil LangChain

Un outil minimal qui scrape Google News via Piloterr.

Python
import os
import requests
from langchain.tools import tool

PILOTERR_KEY = os.environ["PILOTERR_API_KEY"]
BASE = "https://api.piloterr.com/v2"

@tool
def search_google_news(query: str, location: str = "Paris, FR") -> dict:
    """Rechercher des articles récents sur Google News correspondant à une requête."""
    response = requests.post(
        f"{BASE}/google/news",
        headers={"x-api-key": PILOTERR_KEY, "Content-Type": "application/json"},
        json={"query": query, "location": location, "page": 1},
        timeout=60,
    )
    response.raise_for_status()
    return response.json()

Tarification transparente en crédits

Payez uniquement les requêtes réussies. Commencez avec +500 crédits, puis évoluez avec des forfaits à partir de 49 $/mois.

Premium

$49/mois

18,000 crédits

Premium+

$99/mois

40,000 crédits

Startup

$249/mois

110,000 crédits

Prêt à commencer ?

Votre API de scraping web est à un clic. Commencez avec +500 crédits, sans infrastructure à gérer, sans proxies à configurer, et sans carte bancaire.

Commencer gratuitement (+500 crédits)