Dicionário
Dicionário de Web Scraping
Glossário com 320 termos e conceitos de web scraping.
- A cadeia de valor dos dados
- Agregação de dados
- Agrupamento K-means
- Akamai Technologies
- Análise
- Análise de Componentes Principais (PCA)
- Análise de dados
- Análise de Dados
- Análise de dados Lagrangiana
- Análise de logs
- Análise de malware
- Análise de Sentimento
- Análise de Séries Temporais
- Análise de tráfego de dados
- Análise descritiva
- Análise diagnóstica
- Análise dinâmica
- Análise Estática
- Análise Estatística
- Análise forense de dados
- Análise heurística
- Análise multidimensional
- Análise quantitativa
- Analítica de dados
- Anonimização de dados
- Apache Hadoop
- Apache Nutch
- Apache Spark
- API Scraping
- Apify
- Aprendizado de máquina
- Aprendizado federado
- Aprendizado incremental
- Aprendizado Não Supervisionado
- Aprendizado por Reforço
- Aprendizado Supervisionado
- Armazenamento de dados
- Armazenamento de dados
- Armazenamento de documentos
- Arquitetura da informação
- Arquitetura de microsserviços
- Arquivamento de dados
- Atualização de software
- Backup e recuperação de dados
- Balanceamento de carga
- Beautiful Soup
- Big data
- CAPTCHA
- CAPTCHA de Redes Sociais
- CAPTCHA gamificado
- Captcha Matemático
- CasperJS
- Catalogação de dados
- Cheerio
- Classificação de Texto
- Cloudflare?
- Clusterização
- Código binário
- Coleta de metadados
- Compreensão de Linguagem Natural (NLU)
- Compressão de dados
- Computação de alto desempenho
- Computação em memória
- Computação em nuvem
- Computação Serverless
- Containerização
- Conversão de formato de arquivo
- Cracking de Software
- Crawler4j
- Criação de painéis
- Criptografia de dados
- Criptografia em nível de campo
- Criptografia homomórfica
- Curadoria de dados
- Dados de IoT
- Dados de máquina
- Dados estruturados
- Dados vinculados
- Data science
- DataDome
- Deep Learning
- Depuração
- Descoberta de conhecimento
- Descoberta de dados
- Descoberta de vulnerabilidades
- Descompilação
- Desduplicação de dados
- Desenvolvimento de estratégia de dados
- Design de banco de dados
- Design de infraestrutura escalável
- Desmontagem
- Detecção de Anomalias
- Detecção de violação de direitos autorais
- Edge computing
- Engenharia reversa
- Engenharia reversa de código
- Engenharia reversa de firmware
- Engenharia reversa de hardware
- Enriquecimento de Dados
- Escalabilidade
- Estruturação de dados
- Ética de dados
- ETL (Extract, Transform, Load)
- Exportação de dados
- Extração de dados
- Extração de features
- Extrair, Carregar, Transformar (ELT)
- Feature Engineering
- Federação de dados
- Fingerprinting em dados
- Forense digital
- Formato de dados hierárquico
- Formato de dados JSON
- Garantia de qualidade de dados
- Gerenciamento de data center
- Gestão de dados (data stewardship)
- Gestão de dados corporativos
- Gestão de dados mestres
- Gestão de direitos digitais
- Gestão de identidade e acesso
- Gestão de metadados
- Gestão do ciclo de vida dos dados
- Goutte
- Governança de dados
- Gradient Boosting
- HtmlAgilityPack
- Imperva
- Impressão digital do navegador
- Impressão digital JA4
- Impressão Digital TLS
- Indexação de banco de dados
- Indexação e busca
- Integração de dados
- Integração de dados legados
- Inteligência artificial (IA)
- Inteligência de ameaças
- Jsoup
- Letramento de dados
- Licenciamento de Software
- Licenciamento de software de código aberto
- Limitação de taxa
- Limpeza de dados
- Limpeza de dados
- Linhagem de dados
- MapReduce
- Mechanize
- Migração de dados
- Mineração de dados
- Mineração de Regras de Associação
- Mistura de dados
- Modelagem de dados
- Modelagem de Tópicos
- Modelagem dimensional
- Modelagem preditiva
- Naive Bayes
- Narrativa de dados (data storytelling)
- Navegação Headless
- Nokogiri
- Normalização de dados
- Notificações de remoção DMCA
- O processo de engenharia reversa
- O que é um data steward
- O que são acordos contratuais
- O que são Algoritmos de Modelagem Preditiva
- O que são Árvores de Decisão
- O que são avaliações de impacto na privacidade de dados
- O que são bancos de dados em grafo
- O que são Bancos de Dados NoSQL
- O que são bancos de dados SQL
- O que são Bibliotecas de Extração de Dados
- O que são bibliotecas de visualização de dados
- O que são Cabeçalhos HTTP
- O que são certificações e padrões de segurança
- O que são comitês de governança de dados
- O que são controles de acesso a dados
- O que são data lakes
- O que são data marts
- O que são Data Operations (DataOps)
- O que são ferramentas de exploração de dados
- O que são ferramentas de visualização de dados
- O que são frameworks de tomada de decisão baseada em dados
- O que são KPIs
- O que são medidas antipirataria
- O que são modelos de dados híbridos
- O que são Níveis de Prontidão de Dados
- O que são padrões de dados
- O que são pedidos de patente
- O que são pipelines de dados
- O que são planos de resposta a violações de dados
- O que são plataformas de data science
- O que são provedores de armazenamento em nuvem
- O que são provedores de serviços em nuvem
- O que são proxies
- O que são Random Forests
- O que são Redes Neurais
- O que são registros de dados
- O que são regulamentações de privacidade
- O que são requisitos de conformidade
- O que são seletores CSS
- O que são semânticas de dados
- O que são serviços de transformação de dados
- O que são símbolos de depuração
- O que são sistemas de alta disponibilidade
- O que são sistemas de armazenamento escaláveis
- O que são Sistemas de Recomendação
- O que são sistemas de suporte à decisão
- O que são soluções de nuvem híbrida
- O que são Support Vector Machines (SVM)
- O que são tags HTML
- O que são técnicas antiscraping
- O que são termos de serviço de API
- O que são termos de uso e políticas de privacidade
- Ofuscação de código
- Ofuscação de dados
- Orquestração de dados
- Otimização de desempenho
- Perfilamento de dados
- PerimeterX
- Planos de recuperação de desastres
- Preparação de dados
- Prevenção à Pirataria de Software
- Prevenção contra perda de dados
- Privacidade de dados
- Privacidade diferencial
- Processamento de dados em tempo real
- Processamento de Fluxo
- Processamento de linguagem natural
- Processamento em lote
- Proteção de marca
- Proteção de propriedade intelectual
- Proveniência de dados
- Proxy 4G
- Proxy de Datacenter
- Proxy Residencial
- Puppeteer
- Puppeteer Extra
- PyQuery
- Quais são as ferramentas de engenharia reversa
- Quais são as técnicas de engenharia reversa
- Quais são os desafios da engenharia reversa
- Quais são os frameworks de gestão de risco
- Quais são os frameworks legais e regulatórios
- Rastreamento de dados
- ReCaptcha
- Reconciliação de dados
- Reconhecimento de Entidades Nomeadas (NER)
- Reconhecimento de Imagem
- Reconhecimento de padrões
- Recuperação de dados
- Recuperação de informação
- Redução de dados
- Redução de Dimensionalidade
- Refinamento de dados
- Relatórios automatizados
- Relatórios de dados
- Renderização de JavaScript
- Replicação de dados
- Requests
- Resiliência de dados
- Resolução de CAPTCHA
- Resolução de entidades
- Resposta a incidentes de segurança
- Retenção de dados
- Reutilização de código em software
- Robots.txt
- Rotação de IP
- Scraping
- Scraping ético
- Scrapy
- Segurança de dados
- Segurança de rede
- Selenium
- Serialização de dados
- Shape Security
- ShieldSquare
- Simhash
- Simple HTML DOM
- Sincronização de dados
- Sistemas de arquivos distribuídos
- Sistemas de detecção de intrusão
- Sistemas distribuídos
- Sitemap
- SOCKS5
- Subconjunto de dados (data subsetting)
- Sublyna
- Taxonomia de dados
- Teoria da informação
- Teste de penetração
- Tomada de decisão baseada em dados
- Transformação de dados
- Transmissão de dados (data streaming)
- Transmutação de dados
- Um bot de web scraping
- Um CAPTCHA de Áudio
- Um CAPTCHA de imagem
- Um Captcha de Quebra-Cabeça
- Um Captcha de Texto
- Um Captcha de Token
- Um data mashup
- Um grafo de conhecimento
- Um Honeypot Captcha
- Um modelo lógico de dados
- Um parser HTML
- Um User-Agent
- Um Web Application Firewall
- Uma auditoria de código?
- Uma expressão regular (Regex)
- Uma VPN
- Uma Web API
- Utilização de dados
- Validação de Dados
- Varredura de vulnerabilidades
- Veille.io
- Virtualização de dados
- Visão Computacional
- Visualização de dados
- Web crawling
- Web scraping
- Web Scraping como Serviço
- XPath
Pronto para começar?
Sua API de web scraping está a um clique. Comece com +500 créditos, sem infraestrutura para configurar, sem proxies para gerenciar e sem cartão de crédito necessário.
- +500 créditos
- Sem cartão de crédito
- Todos os endpoints incluídos