Zum Hauptinhalt springen
Piloterr
Zurück zum Blog
10. Juli 2025

Wie man einen Unternehmensmitarbeiter-Datensatz erstellt

Daten sind zu einem der wertvollsten Vermögenswerte für jedes Unternehmen geworden. Zuverlässige und gut strukturierte Informationen über ein Unternehmen oder seine Wettbewerber können einen erheblichen strategischen Vorteil bieten. In diesem Tutorial werden wir untersuchen, wie man die Präzision von Google Dorks mit den Automatisierungsfähigkeiten der Piloterr APIs kombiniert, um öffentliche LinkedIn-Profil-Daten zu sammeln. Das Endergebnis wird ein strukturierter .json-Datensatz sein, der für die Analyse bereit ist.

Beginnen Sie mit der LinkedIn Company API oder erkunden Sie LinkedIn-Scraping-Endpunkte.

Anwendungsfall

Erstellen Sie eine Liste von Mitarbeitern eines bestimmten Unternehmens, um einen Datensatz für HR-Zwecke, Rekrutierungsbemühungen oder Analysen der Organisationsstruktur zu erstellen.

Wie funktioniert das?

  1. Verwenden Sie Google Dorks, um indizierte LinkedIn-Profillinks abzurufen
  2. Automatisieren Sie die Suche mit der Piloterr Google Search API
  3. Extrahieren Sie öffentliche Daten von LinkedIn-Profilen mit der Piloterr LinkedIn Profile API
  4. Führen Sie alle Informationen in einen sauberen Datensatz zusammen
Schema des Workflows mit Excalidraw
Schema des Workflows mit Excalidraw

Dieses Tutorial ist in zwei eigenständige Abschnitte unterteilt, die Sie in beliebiger Reihenfolge befolgen können:

  • Schritt-für-Schritt-Anleitung: Wie man Google Dorks und Piloterr APIs verwendet.
  • Vollständige Projektdurchführung: Klonen Sie das Repository und führen Sie das vollständige Skript aus.

Schritt-für-Schritt: Wie man Google Dorks und Piloterr APIs verwendet

In diesem Kapitel lernen wir, wie man Google Dork mit der Piloterr API und LinkedIn-Profil-Scraping verbindet, Schritt für Schritt.

Was ist ein Google Dork und warum ist er mächtig?

Google Dorks sind erweiterte Suchoperatoren, die helfen, Suchergebnisse zu filtern.

Google indiziert bereits Milliarden von Seiten, wir können dies nutzen, indem wir intelligente Abfragen erstellen.

Erstellen Sie einen Dork, um öffentliche LinkedIn-Profile im Zusammenhang mit Apple Inc. aufzulisten

Um einen Google Dork zu testen und auszuführen, benötigen wir lediglich eine Google-Suchleiste.

Beginnen wir mit der folgenden Beispielsyntax, um öffentliche LinkedIn-Profile im Zusammenhang mit „Apple Inc.“ aufzulisten:

Die Suche:

Google-Dork-Suche für Apple Inc. LinkedIn-Profile

Wir erhalten eine Liste von Personen, die „Apple“ in ihrem LinkedIn-Profil haben.

Es ist kein Zauber, lassen Sie uns die Syntax aufschlüsseln, um zu verstehen, was passiert:

Aufschlüsselung der Google-Dork-Syntax für die LinkedIn-Profilsuche

Suche nach LinkedIn-Profilen mit der Google Search API

Einrichten der Piloterr API-Anfrage:

Sobald Ihr Dork bereit ist, besteht der nächste Schritt darin, die Suche zu automatisieren.

Um die Anfrage abzuschließen:

  • Fügen Sie den Google Dork in das Feld „query“ ein
  • Fügen Sie Ihren API-Schlüssel im „x-api-key“-Header hinzu
  • Setzen Sie Anfrageparameter (z. B. verwenden Sie page = 1, um die erste Seite abzurufen)

Parameter setzen:

Anfrage ausführen und Ergebnis ausgeben:

Herzlichen Glückwunsch, wir haben unsere ersten Daten:

Erste Antwort der Piloterr Google Search API

Die Suchergebnisse mit Profil-Links sind im Schlüssel „organic_result“ gespeichert.

💡 Tipps: Weitere Parameter hier erkunden: Piloterr Google Search API-Dokumentation

Die Google Search API gibt mehrere Schlüssel zurück, wie pagination, search_parameters, search_information und organic_results.

Wir sind jedoch nur an den Profil-Links interessiert, die unter organic_results gefunden werden.

Speichern wir den ersten Link in profile_url, indem wir auf results[0]['link'] zugreifen.

Senden Sie dann diesen Link an die Piloterr LinkedIn Profile API mit dem Abfrageparameter.

Parameter der Anfrage setzen

Anfrage stellen und Ergebnisse ausgeben:

Führen Sie die Anfrage aus und geben Sie das Ergebnis aus, und das war's! Sie haben jetzt öffentliche Daten von einem echten LinkedIn-Profil:

Piloterr LinkedIn Profile API-Antwort mit öffentlichen Profildaten

💡 Tipps: Vollständige API-Referenz hier: Piloterr LinkedIn API-Dokumentation

Projekt klonen und das vollständige Skript ausführen

Projekt erhalten

Repository klonen

GitHub-Repository-Seite für das LinkedIn-Mitarbeiter-Scraper-Projekt

Abhängigkeiten einrichten:

Terminal mit pip-Installation der Python-Abhängigkeiten

Ihren API-Schlüssel einrichten

Kopieren Sie die Beispiel-Anmeldedatei, indem Sie den folgenden Befehl ausführen:

Terminalbefehl zum Kopieren der Beispiel-Credentials-Datei

Bearbeiten Sie 'credential.py' und fügen Sie Ihren API-Schlüssel ein (falls Sie keinen API-Schlüssel haben, müssen Sie sich bei Piloterr registrieren):

Bearbeiten von credential.py zum Einfügen des Piloterr-API-Schlüssels

Wählen Sie Ihr Zielunternehmen und setzen Sie Limits für die Ergebnisse

Unternehmen:

Das Standard-Zielunternehmen ist in main.py auf Apple Inc. eingestellt. Sie können es nach Belieben ändern:

Festlegen des Zielunternehmens in main.py

Limit für Google-Ergebnisse:

Die Google-Suche kann mehrere Ergebnisseiten zurückgeben. Passen Sie den Suchbereich und die Links an, um Ressourcen und Zeit zu optimieren:

Anpassen der Google-Suchergebnis-Seitenlimits in main.py

Pipeline ausführen:

Dies wird:

  • Eine Google Dork-Suche für das angegebene Unternehmen durchführen
  • LinkedIn-Profil-Details abrufen
  • Diese in output/linkedin_profile_dataset.json exportieren
Pipeline-Ausgabe beim Export von LinkedIn-Profilen in eine JSON-Datei

Einzelnes Profil zum Debuggen testen (optional)

Test() ist eine spezielle Funktion in main.py, die entwickelt wurde, um den Workflow Schritt für Schritt zu testen und zu debuggen.

Um den Test auszuführen, verwenden Sie einfach:

Jetzt sind Sie bereit, die Extraktion öffentlicher LinkedIn-Mitarbeiterdaten mit einem sauberen und wiederverwendbaren Skript zu automatisieren.

Weitere Artikel

Anleitungen und Neuigkeiten zu Web Scraping, Proxys und Datenextraktion.

Web Scraping

Migration von NetNut: Was tun nach der Netzwerkabschaltung?

Google hat gemeinsam mit dem FBI und Lumen gegen das NetNut/Popa-Proxy-Netzwerk vorgegangen. Wie Sie Ihren Scraping-Stack neu aufbauen, ohne Proxys selbst verwalten zu müssen.

Josselin Liebe
Josselin Liebe
Lesen
Web Scraping

17,99 € in Frankreich, 29,99 € in Deutschland: Preisüberwachung nach Land

Gleiche ERP-Referenz, unterschiedliche Preise je nach Land: Aktionen, Währungen und Sortimente variieren von Shop zu Shop. Datenmodell, API-Beispiele und ein Python-Skript für zuverlässige Preisüberwachung.

Josselin Liebe
Josselin Liebe
Lesen
Web Scraping

Beste Leboncoin-Scraper 2026

Piloterr vs. Apify vs. lobstr.io für Leboncoin-Scraping im Jahr 2026. Preise, Endpunkte und Produktdaten, verifiziert aus offiziellen Quellen am 29. Juni 2026 – einschließlich der rechtlichen Grauzone zwischen öffentlichem und authentifiziertem Scraping.

Josselin Liebe
Josselin Liebe
Lesen

Bereit loszulegen?

Ihre Web-Scraping-API ist nur einen Klick entfernt. Starten Sie mit +500 Credits, ohne Infrastruktur einrichten zu müssen, ohne Proxys zu verwalten und ohne Kreditkarte.

  • +500 Credits
  • Keine Kreditkarte erforderlich
  • Alle Endpunkte enthalten