Raspar dados de salários ajuda as empresas a se manterem competitivas ao entender os benchmarks de remuneração em diferentes setores. Também capacita os candidatos a emprego a tomar decisões de carreira informadas com base em insights salariais do mundo real. Comparably é um recurso valioso para transparência salarial, fornecendo insights sobre remuneração em diferentes empresas e departamentos. No entanto, extrair esses dados programaticamente pode ser desafiador devido ao carregamento de conteúdo dinâmico e medidas anti-bot.
Renderize páginas dinâmicas de salários com a Website Rendering API: veja também navegador headless.
Neste tutorial, mostraremos como raspar dados de salários do Comparably usando Python e a poderosa Website Rendering API da Piloterr.
Por que usar a Piloterr para Raspar o Comparably?
O Comparably usa Angular e carrega conteúdo dinamicamente, tornando os métodos tradicionais de raspagem ineficazes. A API de renderização de navegador da Piloterr resolve isso:
- Renderiza JavaScript : Executa completamente o aplicativo Angular
- Contorna proteções : Lida com Cloudflare e outras medidas anti-bot
- Instruções do navegador : Permite rolar para acionar conteúdo carregado lentamente
- Condições de espera : Garante que o conteúdo esteja totalmente carregado antes da extração
Pré-requisitos
Antes de começar, você precisará:
E uma chave de API da Piloterr - cadastre-se em Piloterr
Passo 1: Obter o HTML renderizado
Primeiro, vamos usar a Piloterr para obter o HTML totalmente renderizado de uma página de empresa:
Isso instrui o navegador a rolar até o final da página ao longo de uma duração de 15 segundos, com uma pausa de 2 segundos depois. Isso garante que todo o conteúdo dinâmico - especialmente seções carregadas ao rolar, como dados de salários no Comparably - seja totalmente renderizado antes de capturar a página.
Passo 2: Script completo de raspagem
Aqui está o script completo que une tudo:
Exemplo de Saída
Quando você executar este script, obterá dados estruturados como:
Esta abordagem oferece acesso confiável aos dados de salários do Comparably, tornando-a perfeita para pesquisa de remuneração, análise de mercado ou construção de ferramentas de comparação salarial.