Glossaire

Glossaire du scraping web

Glossaire de 320 termes et concepts du scraping web.

Agrégation de données
Akamai Technologies
Algorithmes de modélisation prédictive
Analyse
Analyse de données
Analyse de données lagrangiennes
Analyse de logs
Analyse de malware
Analyse de sentiment
Analyse de séries temporelles
Analyse du trafic de données
Analyse dynamique
Analyse en composantes principales (ACP)
Analyse forensique des données
Analyse heuristique
Analyse multidimensionnelle
Analyse statistique
Analyse syntaxique de données
Analytique de données
Analytique descriptive
Analytique diagnostique
Anonymisation des données
Apache Hadoop
Apache Nutch
Apache Spark
Apify
Apprentissage automatique
Apprentissage fédéré
Apprentissage incrémental
Apprentissage non supervisé
Apprentissage par renforcement
Apprentissage supervisé
Architecture de l'information
Architecture microservices
Archivage de données
Assurance qualité des données
Balises HTML
Bases de données graphe
Bases de données NoSQL
Beautiful Soup
Big data
Cadres juridiques et réglementaires
Calcul en mémoire
Calcul haute performance
CAPTCHA
CasperJS
Catalogage de données
Cheerio
Chiffrement au niveau des champs
Chiffrement de données
Chiffrement homomorphe
Classificateur naïf bayésien
Classification de texte
Cloudflare
Clustering
Clustering K-means
Code binaire
Collecte de métadonnées
Compréhension du langage naturel (NLU)
Compression de données
Conception de bases de données
Confidentialité des données
Confidentialité différentielle
Conservation des données
Conteneurisation
Conversion de format de fichier
Correctifs logiciels
Crawler4j
Création de tableaux de bord
Culture data
Curation de données
DataDome
Débogage
Décompilation
Découverte de connaissances
Découverte de données
Dédoublonnage de données
Deep learning
Dépôts de brevets
Désassemblage
Détection d'anomalies
Détection de violation du droit d'auteur
Données IoT
Données liées
Données machine
Élaboration de la stratégie de données
Empreinte JA4
Empreinte navigateur
Empreinte numérique des données
Empreinte TLS
En-têtes HTTP
Enrichissement de données
Entreposage de données
Entrepôts de données thématiques
Épuration de données
Équilibrage de charge
Éthique des données
ETL (Extract, Transform, Load)
Exploration de données
Exploration de règles d'association
Export de données
Extract, Load, Transform (ELT)
Extraction de caractéristiques
Extraction de données
Fédération de données
Forensique numérique
Forêts aléatoires
Format de données hiérarchique
Format de données JSON
Fusion de données
Gestion de centre de données
Gestion des données d'entreprise
Gestion des données de référence
Gestion des droits numériques
Gestion des identités et des accès
Gestion des métadonnées
Gestion du cycle de vie des données
Goutte
Gouvernance des données
Gouvernance opérationnelle des données
Gradient boosting
HtmlAgilityPack
Imperva
Indexation de bases de données
Indexation et recherche
Indicateurs clés de performance
Informatique en nuage
Informatique en périphérie
Ingénierie des caractéristiques
Ingénierie inverse du firmware
Ingénierie inverse matérielle
Intégration de données
Intégration de données legacy
Intelligence artificielle (IA)
Jsoup
L'analyse quantitative
L'analyse statique
L'ingénierie inverse
La chaîne de valeur des données
La conception d'infrastructure scalable
La découverte de vulnérabilités
La prévention de la piraterie logicielle
La protection des marques
La réponse aux incidents de sécurité
La résolution de CAPTCHA
La scalabilité
La threat intelligence
Lacs de données
Le cracking logiciel
Le processus d'ingénierie inverse
Le rendu JavaScript
Le scraping
Le scraping web
Le serverless computing
Le stream processing
Le throttling
Le traitement de données en temps réel
Le vulnerability scanning
Le web crawling
Les bases de données SQL
Les cadres de gestion des risques
Les certifications et normes de sécurité
Les conditions d'utilisation et politiques de confidentialité
Les défis de l'ingénierie inverse
Les données structurées
Les licences logicielles
Les outils d'ingénierie inverse
Les proxies
Les systèmes de recommandation
Les systèmes de stockage scalable
Les techniques d'ingénierie inverse
Licences de logiciels open source
Lignage de données
MapReduce
Mashup de données
Mechanize
Migration de données
Modèles de données hybrides
Modélisation de données
Modélisation dimensionnelle
Modélisation prédictive
Modélisation thématique
Narration des données
Navigation headless
Nettoyage de données
Nokogiri
Normalisation des données
Obfuscation de code
Obfuscation des données
Optimisation des performances
Orchestration des données
PerimeterX
Plateformes de science des données
Prévention de la perte de données
Prise de décision fondée sur les données
Profilage des données
Protection de la propriété intellectuelle
Provenance des données
Proxy 4G
Proxy datacenter
Proxy résidentiel
Puppeteer
Puppeteer Extra
PyQuery
Qu'est-ce que la sémantique des données
Qu'est-ce que les analyses d'impact sur la protection des données
Qu'est-ce que les arbres de décision
Qu'est-ce que les bibliothèques de visualisation de données
Qu'est-ce que les niveaux de maturité des données
Qu'est-ce que les notifications de retrait DMCA
Qu'est-ce que les opérations de données (DataOps)
Qu'est-ce que les outils de visualisation de données
Qu'est-ce que les pipelines de données
Qu'est-ce que les plans de reprise après sinistre
Qu'est-ce que les registres de données
Qu'est-ce que les services de transformation de données
Qu'est-ce que les standards de données
Qu'est-ce que les symboles de débogage
Qu'est-ce que les systèmes d'aide à la décision
Qu'est-ce que les systèmes de fichiers distribués
Qu'est-ce que les systèmes distribués
Quelles sont les bibliothèques d'extraction de données
Quelles sont les conditions d'utilisation d'une API
Quelles sont les exigences de conformité
Quelles sont les mesures anti-piratage
Quelles sont les techniques anti-scraping
Quels sont les accords contractuels
Quels sont les cadres de prise de décision fondée sur les données
Quels sont les comités de gouvernance des données
Quels sont les contrôles d'accès aux données
Quels sont les fournisseurs de services cloud
Quels sont les fournisseurs de stockage cloud
Quels sont les outils d'exploration de données
Quels sont les plans de réponse aux violations de données
Quels sont les sélecteurs CSS
Raffinement des données
ReCaptcha
Recherche d'information
Réconciliation des données
Reconnaissance d'entités nommées (NER)
Reconnaissance d'images
Reconnaissance de motifs
Récupération des données
Réduction de dimensionnalité
Réduction des données
Réglementations sur la protection de la vie privée
Réplication des données
Reporting automatisé
Reporting des données
Requests
Réseaux de neurones
Résilience des données
Résolution d'entités
Réutilisation de code en logiciel
Reverse engineering de code
Robots.txt
Rotation d'IP
Sauvegarde et reprise de données
Science des données
Scraping éthique
Scraping via API
Scraping web en tant que service
Scrapy
Sécurité des données
Sécurité réseau
Selenium
Sérialisation des données
Shape Security
ShieldSquare
Simhash
Simple HTML DOM
SOCKS5
Solutions cloud hybride
Sous-ensemble de données
Staging des données
Steward de données
Stockage de documents
Stockage des données
Streaming de données
Structuration des données
Sublyna
Support Vector Machines (SVM)
Synchronisation des données
Systèmes de détection d'intrusion
Systèmes haute disponibilité
Taxonomie des données
Tests d'intrusion
Théorie de l'information
Traçage des données
Traitement du langage naturel
Traitement par lots
Transformation des données
Transmutation des données
Un audit de code
Un bot de scraping web
Un CAPTCHA audio
Un CAPTCHA gamifié
Un CAPTCHA honeypot
Un CAPTCHA image
Un CAPTCHA mathématique
Un CAPTCHA puzzle
Un CAPTCHA réseaux sociaux
Un CAPTCHA texte
Un CAPTCHA token
Un graphe de connaissances
Un modèle de données logique
Un parseur HTML
Un sitemap
Un User-Agent
Un VPN
Un WAF (Web Application Firewall)
Une expression régulière (Regex)
Une Web API
Utilisation des données
Validation des données
Veille.io
Virtualisation des données
Vision par ordinateur
Visualisation des données
XPath

Prêt à commencer ?

Votre API de scraping web est à un clic. Commencez avec +500 crédits, sans infrastructure à gérer, sans proxies à configurer, et sans carte bancaire.

Commencer gratuitement (+500 crédits)