Skip to main content
Piloterr

Parseur scraping

Teste des sélecteurs CSS, extrait liens, meta tags, JSON-LD et tableaux depuis du HTML, et nettoie des listes d'URL pour pipelines de scraping.

4 correspondances

  • #1h1

    Widget Pro

    <h1>Widget Pro</h1>
  • #2p

    $49.99

    class
    price
    data-testid
    price
    <p class="price" data-testid="price">$49.99</p>
  • #3a

    View product

    href
    /products/widget
    <a href="/products/widget">View product</a>
  • #4a

    Reviews

    href
    https://acme.com/reviews
    <a href="https://acme.com/reviews">Reviews</a>

Collez du HTML depuis une page ou une réponse API, puis testez des sélecteurs CSS avant de les intégrer dans un scraper. Extrayez des données structurées (liens, titres, meta tags, JSON-LD, tableaux) ou normalisez des listes d'URL en supprimant paramètres de tracking et doublons.

Tout s'exécute dans votre navigateur, pas de fetch distant, aucune donnée envoyée à un serveur.

Outils associés