Diccionario

Diccionario de Web Scraping

Glosario de 320 términos y conceptos de web scraping.

¿Cuáles son las técnicas de ingeniería inversa?
¿Cuáles son los desafíos de la ingeniería inversa?
¿Qué es Cloudflare?
¿Qué es la semántica de datos?
¿Qué es una auditoría de código?
¿Qué son las bases de datos de grafos?
¿Qué son las Bases de Datos NoSQL?
¿Qué son las bases de datos SQL?
¿Qué son las bibliotecas de extracción de datos?
¿Qué son las certificaciones y estándares de seguridad?
¿Qué son las etiquetas HTML?
¿Qué son las evaluaciones de impacto en la privacidad de datos?
¿Qué son las herramientas de exploración de datos?
¿Qué son las herramientas de ingeniería inversa?
¿Qué son las herramientas de visualización de datos?
¿Qué son las librerías de visualización de datos?
¿Qué son las Máquinas de Vectores de Soporte (SVM)?
¿Qué son las medidas antipiratería?
¿Qué son las notificaciones de retirada DMCA?
¿Qué son las Operaciones de Datos (DataOps)?
¿Qué son las plataformas de data science?
¿Qué son las Redes Neuronales?
¿Qué son las regulaciones de privacidad?
¿Qué son las solicitudes de patentes?
¿Qué son las soluciones de nube híbrida?
¿Qué son las técnicas anti-scraping?
¿Qué son las tuberías de datos?
¿Qué son los acuerdos contractuales?
¿Qué son los Algoritmos de Modelado Predictivo?
¿Qué son los Árboles de Decisión
¿Qué son los comités de gobernanza de datos?
¿Qué son los controles de acceso a datos?
¿Qué son los data lakes?
¿Qué son los data marts?
¿Qué son los encabezados HTTP?
¿Qué son los estándares de datos?
¿Qué son los KPIs?
¿Qué son los marcos de gestión de riesgos?
¿Qué son los marcos de toma de decisiones basadas en datos?
¿Qué son los marcos legales y regulatorios?
¿Qué son los modelos de datos híbridos?
¿Qué son los Niveles de Preparación de Datos?
¿Qué son los planes de recuperación ante desastres?
¿Qué son los planes de respuesta a brechas de datos?
¿Qué son los proveedores de almacenamiento en la nube?
¿Qué son los proveedores de servicios en la nube?
¿Qué son los proxies?
¿Qué son los Random Forests?
¿Qué son los registros de datos?
¿Qué son los requisitos de cumplimiento?
¿Qué son los selectores CSS?
¿Qué son los servicios de transformación de datos?
¿Qué son los símbolos de depuración?
¿Qué son los sistemas de almacenamiento escalables?
¿Qué son los sistemas de alta disponibilidad?
¿Qué son los sistemas de archivos distribuidos?
¿Qué son los sistemas de detección de intrusos?
¿Qué son los sistemas de recomendación?
¿Qué son los sistemas de soporte a la decisión
¿Qué son los sistemas distribuidos?
¿Qué son los términos de servicio de una API?
¿Qué son los términos de uso y las políticas de privacidad?
¿Quién es un data steward?
Agregación de datos
Agrupamiento K-means
Akamai Technologies
Alfabetización de datos
Almacenamiento de datos
Almacenamiento de documentos
Análisis
Análisis cuantitativo
Análisis de Componentes Principales (PCA)
Análisis de datos
Análisis de datos lagrangiano
Análisis de logs
Análisis de malware
Análisis de Sentimiento
Análisis de Series Temporales
Análisis de tráfico de datos
Análisis descriptivo
Análisis diagnóstico
Análisis dinámico
Análisis Estadístico
Análisis estático
Análisis forense de datos
Análisis heurístico
Análisis multidimensional
Analítica de datos
Anonimización de datos
Apache Hadoop
Apache Nutch
Apache Spark
Apify
Aprendizaje federado
Aprendizaje incremental
Aprendizaje No Supervisado
Aprendizaje por Refuerzo
Aprendizaje Supervisado
Archivado de datos
Arquitectura de la información
Arquitectura de microservicios
Aseguramiento de la calidad de datos
Balanceo de carga
Beautiful Soup
Big data
CAPTCHA
CasperJS
Catalogación de datos
Cheerio
Ciencia de datos
Cifrado a nivel de campo
Cifrado de datos
Clasificación de Texto
Clustering
Código binario
Combinación de datos
Comprensión del Lenguaje Natural (NLU)
Compresión de datos
Computación de alto rendimiento
Computación en la nube
Computación en memoria
Computación serverless
Contenerización
Conversión de formato de archivo
Copia de seguridad y recuperación de datos
Craqueo de software
Crawler4j
Creación de dashboards
Curación de datos
Data Parsing
Data warehousing
DataDome
Datos de IoT
Datos de máquina
Datos enlazados
Datos estructurados
Deduplicación de datos
Deep Learning
Depuración
Depuración de datos
Desarrollo de estrategia de datos
Descompilación
Descubrimiento de conocimiento
Descubrimiento de datos
Descubrimiento de vulnerabilidades
Desensamblado
Detección de Anomalías
Detección de infracción de derechos de autor
Diseño de bases de datos
Diseño de infraestructura escalable
Edge computing
El proceso de ingeniería inversa
Encriptación homomórfica
Enriquecimiento de Datos
Escalabilidad
Escaneo de vulnerabilidades
Estructuración de datos
Ética de datos
ETL (Extract, Transform, Load)
Exportación de datos
Extracción de características
Extracción de datos
Extract, Load, Transform (ELT)
Feature Engineering
Federación de datos
Fingerprinting del navegador
Fingerprinting en datos
Formato de datos jerárquico
Formato de datos JSON
Generación automatizada de informes
Gestión de centros de datos
Gestión de datos (data stewardship)
Gestión de datos empresariales
Gestión de datos maestros
Gestión de derechos digitales
Gestión de identidad y acceso
Gestión de metadatos
Gestión del ciclo de vida de los datos
Gobernanza de datos
Goutte
Gradient Boosting
HtmlAgilityPack
Huella JA4
Huella TLS
Imperva
Indexación de bases de datos
Indexación y búsqueda
Informática forense
Informes de datos
Ingeniería inversa
Ingeniería inversa de código
Ingeniería inversa de firmware
Ingeniería inversa de hardware
Integración de datos
Integración de datos heredados
Inteligencia artificial (IA)
Jsoup
La cadena de valor de los datos
Licenciamiento de software
Licencias de software de código abierto
Limitación de velocidad
Limpieza de datos
Linaje de datos
Machine learning
MapReduce
Mechanize
Migración de datos
Minería de datos
Minería de Reglas de Asociación
Modelado de datos
Modelado de Temas
Modelado dimensional
Modelado predictivo
Naive Bayes
Narrativa de datos
Navegación Headless
Nokogiri
Normalización de datos
Ofuscación de código
Ofuscación de datos
Optimización del rendimiento
Orquestación de datos
Parches en software
Perfilado de datos
PerimeterX
Preparación de datos
Prevención de pérdida de datos
Prevención de piratería de software
Privacidad de datos
Privacidad diferencial
Procedencia de datos
Procesamiento de datos en tiempo real
Procesamiento de flujos
Procesamiento de lenguaje natural
Procesamiento por lotes
Protección de la propiedad intelectual
Protección de marcas
Proxy 4G
Proxy de Datacenter
Proxy Residencial
Pruebas de penetración
Puppeteer
Puppeteer Extra
PyQuery
ReCaptcha
Recolección de metadatos
Reconciliación de datos
Reconocimiento de Entidades Nombradas (NER)
Reconocimiento de imágenes
Reconocimiento de patrones
Recuperación de datos
Recuperación de información
Reducción de datos
Reducción de Dimensionalidad
Refinamiento de datos
Renderizado de JavaScript
Replicación de datos
Requests
Resiliencia de datos
Resolución de CAPTCHA
Resolución de entidades
Respuesta a incidentes de seguridad
Retención de datos
Reutilización de código en software
Robots.txt
Rotación de IP
Scraping
Scraping de API
Scraping ético
Scrapy
Seguridad de datos
Seguridad de red
Selenium
Serialización de datos
Shape Security
ShieldSquare
Simhash
Simple HTML DOM
Sincronización de datos
SOCKS5
Subconjunto de datos
Sublyna
Taxonomía de datos
Teoría de la información
Threat intelligence
Toma de decisiones basada en datos
Transformación de datos
Transmisión de datos
Transmutación de datos
Trazabilidad de datos
Un analizador HTML
Un bot de web scraping
Un CAPTCHA de Audio
Un Captcha de imagen
Un CAPTCHA de Redes Sociales
Un Captcha de Rompecabezas
Un CAPTCHA de Texto
Un CAPTCHA Gamificado
Un CAPTCHA Honeypot
Un Captcha Matemático
Un data mashup
Un Firewall de Aplicaciones Web
Un grafo de conocimiento
Un modelo lógico de datos
Un sitemap
Un Token CAPTCHA
Un User-Agent
Una API Web
Una expresión regular (Regex)
Una VPN
Utilización de datos
Validación de Datos
Veille.io
Virtualización de datos
Visión por Computadora
Visualización de datos
Web crawling
Web scraping
Web Scraping como Servicio
XPath

¿Listo para empezar?

Tu API de web scraping está a un clic. Comienza con +500 créditos, sin infraestructura que configurar, sin proxies que gestionar y sin necesidad de tarjeta de crédito.

+500 créditos
Sin tarjeta de crédito
Todos los endpoints incluidos

Empieza gratis (+500 créditos)Habla con un experto en datos