Glossaire
Glossaire du scraping web
Glossaire de 320 termes et concepts du scraping web.
- Agrégation de données
- Akamai Technologies
- Algorithmes de modélisation prédictive
- Analyse
- Analyse de données
- Analyse de données lagrangiennes
- Analyse de logs
- Analyse de malware
- Analyse de sentiment
- Analyse de séries temporelles
- Analyse du trafic de données
- Analyse dynamique
- Analyse en composantes principales (ACP)
- Analyse forensique des données
- Analyse heuristique
- Analyse multidimensionnelle
- Analyse statistique
- Analyse syntaxique de données
- Analytique de données
- Analytique descriptive
- Analytique diagnostique
- Anonymisation des données
- Apache Hadoop
- Apache Nutch
- Apache Spark
- Apify
- Apprentissage automatique
- Apprentissage fédéré
- Apprentissage incrémental
- Apprentissage non supervisé
- Apprentissage par renforcement
- Apprentissage supervisé
- Architecture de l'information
- Architecture microservices
- Archivage de données
- Assurance qualité des données
- Balises HTML
- Bases de données graphe
- Bases de données NoSQL
- Beautiful Soup
- Big data
- Cadres juridiques et réglementaires
- Calcul en mémoire
- Calcul haute performance
- CAPTCHA
- CasperJS
- Catalogage de données
- Cheerio
- Chiffrement au niveau des champs
- Chiffrement de données
- Chiffrement homomorphe
- Classificateur naïf bayésien
- Classification de texte
- Cloudflare
- Clustering
- Clustering K-means
- Code binaire
- Collecte de métadonnées
- Compréhension du langage naturel (NLU)
- Compression de données
- Conception de bases de données
- Confidentialité des données
- Confidentialité différentielle
- Conservation des données
- Conteneurisation
- Conversion de format de fichier
- Correctifs logiciels
- Crawler4j
- Création de tableaux de bord
- Culture data
- Curation de données
- DataDome
- Débogage
- Décompilation
- Découverte de connaissances
- Découverte de données
- Dédoublonnage de données
- Deep learning
- Dépôts de brevets
- Désassemblage
- Détection d'anomalies
- Détection de violation du droit d'auteur
- Données IoT
- Données liées
- Données machine
- Élaboration de la stratégie de données
- Empreinte JA4
- Empreinte navigateur
- Empreinte numérique des données
- Empreinte TLS
- En-têtes HTTP
- Enrichissement de données
- Entreposage de données
- Entrepôts de données thématiques
- Épuration de données
- Équilibrage de charge
- Éthique des données
- ETL (Extract, Transform, Load)
- Exploration de données
- Exploration de règles d'association
- Export de données
- Extract, Load, Transform (ELT)
- Extraction de caractéristiques
- Extraction de données
- Fédération de données
- Forensique numérique
- Forêts aléatoires
- Format de données hiérarchique
- Format de données JSON
- Fusion de données
- Gestion de centre de données
- Gestion des données d'entreprise
- Gestion des données de référence
- Gestion des droits numériques
- Gestion des identités et des accès
- Gestion des métadonnées
- Gestion du cycle de vie des données
- Goutte
- Gouvernance des données
- Gouvernance opérationnelle des données
- Gradient boosting
- HtmlAgilityPack
- Imperva
- Indexation de bases de données
- Indexation et recherche
- Indicateurs clés de performance
- Informatique en nuage
- Informatique en périphérie
- Ingénierie des caractéristiques
- Ingénierie inverse du firmware
- Ingénierie inverse matérielle
- Intégration de données
- Intégration de données legacy
- Intelligence artificielle (IA)
- Jsoup
- L'analyse quantitative
- L'analyse statique
- L'ingénierie inverse
- La chaîne de valeur des données
- La conception d'infrastructure scalable
- La découverte de vulnérabilités
- La prévention de la piraterie logicielle
- La protection des marques
- La réponse aux incidents de sécurité
- La résolution de CAPTCHA
- La scalabilité
- La threat intelligence
- Lacs de données
- Le cracking logiciel
- Le processus d'ingénierie inverse
- Le rendu JavaScript
- Le scraping
- Le scraping web
- Le serverless computing
- Le stream processing
- Le throttling
- Le traitement de données en temps réel
- Le vulnerability scanning
- Le web crawling
- Les bases de données SQL
- Les cadres de gestion des risques
- Les certifications et normes de sécurité
- Les conditions d'utilisation et politiques de confidentialité
- Les défis de l'ingénierie inverse
- Les données structurées
- Les licences logicielles
- Les outils d'ingénierie inverse
- Les proxies
- Les systèmes de recommandation
- Les systèmes de stockage scalable
- Les techniques d'ingénierie inverse
- Licences de logiciels open source
- Lignage de données
- MapReduce
- Mashup de données
- Mechanize
- Migration de données
- Modèles de données hybrides
- Modélisation de données
- Modélisation dimensionnelle
- Modélisation prédictive
- Modélisation thématique
- Narration des données
- Navigation headless
- Nettoyage de données
- Nokogiri
- Normalisation des données
- Obfuscation de code
- Obfuscation des données
- Optimisation des performances
- Orchestration des données
- PerimeterX
- Plateformes de science des données
- Prévention de la perte de données
- Prise de décision fondée sur les données
- Profilage des données
- Protection de la propriété intellectuelle
- Provenance des données
- Proxy 4G
- Proxy datacenter
- Proxy résidentiel
- Puppeteer
- Puppeteer Extra
- PyQuery
- Qu'est-ce que la sémantique des données
- Qu'est-ce que les analyses d'impact sur la protection des données
- Qu'est-ce que les arbres de décision
- Qu'est-ce que les bibliothèques de visualisation de données
- Qu'est-ce que les niveaux de maturité des données
- Qu'est-ce que les notifications de retrait DMCA
- Qu'est-ce que les opérations de données (DataOps)
- Qu'est-ce que les outils de visualisation de données
- Qu'est-ce que les pipelines de données
- Qu'est-ce que les plans de reprise après sinistre
- Qu'est-ce que les registres de données
- Qu'est-ce que les services de transformation de données
- Qu'est-ce que les standards de données
- Qu'est-ce que les symboles de débogage
- Qu'est-ce que les systèmes d'aide à la décision
- Qu'est-ce que les systèmes de fichiers distribués
- Qu'est-ce que les systèmes distribués
- Quelles sont les bibliothèques d'extraction de données
- Quelles sont les conditions d'utilisation d'une API
- Quelles sont les exigences de conformité
- Quelles sont les mesures anti-piratage
- Quelles sont les techniques anti-scraping
- Quels sont les accords contractuels
- Quels sont les cadres de prise de décision fondée sur les données
- Quels sont les comités de gouvernance des données
- Quels sont les contrôles d'accès aux données
- Quels sont les fournisseurs de services cloud
- Quels sont les fournisseurs de stockage cloud
- Quels sont les outils d'exploration de données
- Quels sont les plans de réponse aux violations de données
- Quels sont les sélecteurs CSS
- Raffinement des données
- ReCaptcha
- Recherche d'information
- Réconciliation des données
- Reconnaissance d'entités nommées (NER)
- Reconnaissance d'images
- Reconnaissance de motifs
- Récupération des données
- Réduction de dimensionnalité
- Réduction des données
- Réglementations sur la protection de la vie privée
- Réplication des données
- Reporting automatisé
- Reporting des données
- Requests
- Réseaux de neurones
- Résilience des données
- Résolution d'entités
- Réutilisation de code en logiciel
- Reverse engineering de code
- Robots.txt
- Rotation d'IP
- Sauvegarde et reprise de données
- Science des données
- Scraping éthique
- Scraping via API
- Scraping web en tant que service
- Scrapy
- Sécurité des données
- Sécurité réseau
- Selenium
- Sérialisation des données
- Shape Security
- ShieldSquare
- Simhash
- Simple HTML DOM
- SOCKS5
- Solutions cloud hybride
- Sous-ensemble de données
- Staging des données
- Steward de données
- Stockage de documents
- Stockage des données
- Streaming de données
- Structuration des données
- Sublyna
- Support Vector Machines (SVM)
- Synchronisation des données
- Systèmes de détection d'intrusion
- Systèmes haute disponibilité
- Taxonomie des données
- Tests d'intrusion
- Théorie de l'information
- Traçage des données
- Traitement du langage naturel
- Traitement par lots
- Transformation des données
- Transmutation des données
- Un audit de code
- Un bot de scraping web
- Un CAPTCHA audio
- Un CAPTCHA gamifié
- Un CAPTCHA honeypot
- Un CAPTCHA image
- Un CAPTCHA mathématique
- Un CAPTCHA puzzle
- Un CAPTCHA réseaux sociaux
- Un CAPTCHA texte
- Un CAPTCHA token
- Un graphe de connaissances
- Un modèle de données logique
- Un parseur HTML
- Un sitemap
- Un User-Agent
- Un VPN
- Un WAF (Web Application Firewall)
- Une expression régulière (Regex)
- Une Web API
- Utilisation des données
- Validation des données
- Veille.io
- Virtualisation des données
- Vision par ordinateur
- Visualisation des données
- XPath