Zum Hauptinhalt springen
Piloterr
Zurück zum Blog
24. Juni 2026

Verständnis der Latenzmetriken p50, p75, p90, p95 und p99

Die durchschnittliche Latenz verbirgt die langsamen Scrapes. In einem nächtlichen Job mit 10.000 Produkt-URLs können die meisten Aufrufe in 1–2 Sekunden abgeschlossen sein, während einige nach einem CAPTCHA-Retry bei 20 Sekunden hängen bleiben. Der Mittelwert sieht immer noch gut aus; Ihre Deadline jedoch nicht.

Perzentile (p50, p75, p90, p95, p99) zeigen, wie die Antwortzeiten verteilt sind. Sie beantworten die Frage: "Wie lange haben mindestens X% der Scrapes gedauert?"

Verfolgen Sie diese bei Ihren Zielen mit Scraper APIs. Vergleichen Sie Crawler vs. Rendering vs. WebUnlocker-Modi, bevor Sie eine Website verantwortlich machen.

Was jedes Perzentil bedeutet

pN = N% der Anfragen wurden in dieser Zeit oder schneller abgeschlossen.

PerzentilBedeutung
p50Median: Die Hälfte der Scrapes war so schnell oder schneller.
p753 von 4 Scrapes wurden innerhalb dieses Zeitfensters abgeschlossen.
p909 von 10.
p9519 von 20.
p9999 von 100, der langsame Ausreißer, der Batch-Jobs zum Scheitern bringt.

Scraping-Beispiele

Derselbe Preisüberwachungsjob, verschiedene Seiten:

PerzentilBeispielLatenz
p50Statische Produktseite, Crawler-Modus0,8 s
p75Kategorieauflistung mit Paginierung1,5 s
p90React-Produktdetailseite, Rendering wartet auf Preisselektor3 s
p95Jobbörsenauflistung nach einem 403-Retry + Proxy-Rotation6 s
p99Marktplatz hinter DataDome, WebUnlocker + CAPTCHA18 s

p50 = 0,8 s, aber p99 = 18 s ist beim Scraping normal. Der Median zeigt Ihnen die Kosten pro Seite; der Ausreißer zeigt Ihnen, ob der Job rechtzeitig abgeschlossen wird.

Warum der Durchschnitt lügt

1.000 Scrapes: 900 × 1 s, 90 × 8 s (CAPTCHA-Retry), 10 × 45 s (Timeout). Mittelwert ≈ 3 s, aber 10% warteten 8 s+. Perzentile machen diese Lücke sofort sichtbar.

Was Sie in der Produktion beobachten sollten

Unterteilen Sie die Latenz nach Domain, HTTP-Status und Scrape-Modus (1 / 2 / 3 Credits). Zeichnen Sie p50 und p99 gemeinsam auf: Wenn p50 flach ist, aber p99 steigt, haben Sie wahrscheinlich neue Anti-Bot-Regeln oder defekte Selektoren getroffen, nicht eine globale Verlangsamung.

Batch-Jobs: Setzen Sie Timeouts auf p95, SLAs auf p99. Beispiel-SLA: "p95 ≤ 5 s über 24 h, nur erfolgreiche Scrapes."

Erkenntnisse

  • p50 = typische Scrape-Kosten; p99 = warum der nächtliche Job sein Zeitfenster verpasst hat.
  • Spitzen im langsamen Bereich entstehen durch Retries, JS-Rendering, Anti-Bot-Maßnahmen und kalte Proxy-Sitzungen, selten aber teuer.
  • Beheben Sie den Median mit Crawler; beheben Sie den langsamen Bereich mit WebUnlocker oder engeren Domain-Obergrenzen.

Weitere Artikel

Anleitungen und Neuigkeiten zu Web Scraping, Proxys und Datenextraktion.

News

Cloudflare arbeitet mit Chrome, Firefox und Edge an PACT – einem datenschutzfreundlichen Anti-Bot-Protokoll

Cloudflare schließt sich Mozilla, Google, Microsoft und Shopify an, um PACT (Private Access Control Tokens) zu entwickeln – einen Standard zur Authentifizierung von menschlichem und autorisiertem Agenten-Traffic ohne CAPTCHAs oder invasive Tracking-Methoden.

Josselin Liebe
Josselin Liebe
Lesen
News

Die neue Piloterr-Website ist da

{{brandName}}.com wurde von Grund auf neu aufgebaut: klarere Produktseiten, 500 dokumentierte API-Endpoints, kostenlose Entwicklertools, französische Lokalisierung und eine Roadmap für ein zweites eigenes Rechenzentrum.

Josselin Liebe
Josselin Liebe
Lesen
News

Website Scraping: Crawler vs Rendering vs WebUnlocker

Piloterr Website Crawler vs Rendering vs WebUnlocker: Erfahren Sie, wann HTTP- Request-Scraping mit Fingerprinting, vollständiges JS-Browser-Rendering oder der Anti-Bot-WebUnlocker (Cloudflare, DataDome, PerimeterX, Akamai) für 100 % Erfolg auf genehmigten Domains sinnvoll ist.

Josselin Liebe
Josselin Liebe
Lesen

Bereit loszulegen?

Ihre Web-Scraping-API ist nur einen Klick entfernt. Starten Sie mit +500 Credits, ohne Infrastruktur einrichten zu müssen, ohne Proxys zu verwalten und ohne Kreditkarte.

  • +500 Credits
  • Keine Kreditkarte erforderlich
  • Alle Endpunkte enthalten