Saltar al contenido principal
Piloterr
Volver al blog
21 de noviembre de 2023

¿Cómo convertir una URL de empresa de LinkedIn en una URL de sitio web?

En el ámbito de los negocios y el networking profesional, LinkedIn juega un papel crucial. A menudo, existe la necesidad de extraer información más detallada de un perfil de LinkedIn, especialmente para empresas. Aquí es donde entra en juego la API de Piloterr, ofreciendo una forma fluida de transformar URLs de LinkedIn en datos completos de sitios web.

Usa la LinkedIn Company API o explora el catálogo completo de LinkedIn Scraping API.

1. Crea tu cuenta

  • Regístrate en piloterr.com
  • Crea tu suscripción
  • Crea y copia tu clave API

2. Selecciona el escenario

  • Escenario 1: URL de Empresa de LinkedIn Conocida: Cuando tienes la URL de LinkedIn de la empresa, el proceso es sencillo. Usa una solicitud GET a la API de Piloterr.
  • Escenario 2: URL de Empresa de LinkedIn Desconocida: En casos donde no tienes la URL de LinkedIn, aún puedes encontrar la información necesaria utilizando un proceso de dos pasos.

Recuerda reemplazar PILOTERR_API_KEY con tu clave API real. El script asume que las respuestas de la API de Piloterr están en un formato específico, por lo que podría requerir ajustes basados en la estructura real de la respuesta de la API.

Escenario con URL de Empresa de LinkedIn Conocida

  1. Copia el código
  2. Crea un nuevo archivo get_website_linkedin.py
  3. Reemplaza el token de la API con el tuyo
  4. Reemplaza LINKEDIN_URL por tu URL
  5. Ejecuta el script con py get_website_linkedin.py
Python
import requests

PILOTERR_API_KEY = 'YOUR-TOKEN-API-REPLACE-ME'
LINKEDIN_URL = 'https://linkedin.com/company/airbusgroup'

def get_linkedin_info(known_url: str):
    api_url = f"https://piloterr.com/api/v2/linkedin/company/info"
    headers={
        "x-api-key": PILOTERR_API_KEY
    }
    params={
        "query": known_url
    }
    response = requests.get(
        url=api_url,
        headers=headers,
        params=params
    )
    if response.status_code == 200:
        return response.json()
    else:
        return "Error: No se pudo obtener los datos"

# Solicitud
req = get_linkedin_info(known_url=LINKEDIN_URL)

print("Sitio web: " + req["website"])

Resultado

Sitio web: http://www.airbus.com

Escenario con URL de Empresa de LinkedIn Desconocida

Para mejorar el script añadiendo una solicitud de búsqueda en Google para situaciones donde la URL de LinkedIn es desconocida, podemos introducir una nueva función que consulte la Página de Resultados del Motor de Búsqueda (SERP) de Google para encontrar la URL de LinkedIn.

  1. Copia el código
  2. Crea un nuevo archivo get_website_linkedin_company_name.py
  3. Reemplaza el token de la API con el tuyo
  4. Reemplaza COMPANY por el nombre de la empresa
  5. Ejecuta el script con py get_website_linkedin_company_name.py
Python
import requests

PILOTERR_API_KEY = 'YOUR-TOKEN-API-REPLACE-ME'
COMPANY = 'Piloterr'

def get_linkedin_info(known_url: str):
    api_url = "https://piloterr.com/api/v2/linkedin/company/info"
    headers = {
        "x-api-key": PILOTERR_API_KEY
    }
    params = {
        "query": known_url
    }
    response = requests.get(
        url=api_url,
        headers=headers,
        params=params
    )
    if response.status_code == 200:
        return response.json()
    else:
        return "Error: No se pudo obtener los datos"

def get_linkedin_url_from_google(query: str):
    google_api_url = "https://piloterr.com/api/v2/google/search"
    headers = {
        "x-api-key": PILOTERR_API_KEY
    }
    data = {
        "query": query
    }
    response = requests.post(
        url=google_api_url,
        headers=headers,
        json=data
    )

    if response.status_code == 200:
        search_results = response.json()['organic_results']
        # Extraer URL de LinkedIn de los resultados de búsqueda
        for result in search_results:
            if 'linkedin.com/company/' in result['link']:
                return result['link']
        return "URL de LinkedIn no encontrada en los resultados de búsqueda"
    else:
        return "Error: No se pudo realizar la búsqueda"

# Ejemplo de uso
search_query = f"site:linkedin.com/company {COMPANY}"
linkedin_url = get_linkedin_url_from_google(search_query)

if "linkedin.com/company/" in linkedin_url:
    req = get_linkedin_info(linkedin_url)
    if "website" in req:
        print("Sitio web: " + req["website"])
    else:
        print("Error: Información de LinkedIn no recuperada")
else:
    print("Empresa no encontrada")

Resultado

Sitio web: [piloterr.com](/)

Si deseas hacer lo mismo para perfiles de LinkedIn, echa un vistazo a nuestro artículo sobre cómo convertir un nombre y apellido en una URL de LinkedIn.

Más para leer

Guías y noticias sobre web scraping, proxies y extracción de datos.

Noticias

Comprendiendo las métricas de latencia p50, p75, p90, p95 y p99

Los percentiles de latencia explican qué tan rápido funcionan realmente tu API o pipeline de scraping para la mayoría de las solicitudes y para la cola lenta. Aprende qué significan p50 a p99, por qué los promedios engañan y cómo establecer SLA realistas.

Josselin Liebe
Josselin Liebe
Leer
Noticias

Cloudflare se une a Chrome, Firefox y Edge en PACT, un protocolo anti-bots centrado en la privacidad

Cloudflare se une a Mozilla, Google, Microsoft y Shopify para desarrollar PACT (Private Access Control Tokens), un estándar diseñado para autenticar tráfico humano y de agentes autorizados sin CAPTCHAs ni seguimiento invasivo.

Josselin Liebe
Josselin Liebe
Leer
Noticias

Presentamos el nuevo sitio web de Piloterr

{{brandName}}.com ha sido reconstruido desde cero: páginas de producto más claras, 500 endpoints de API documentados, herramientas gratuitas para desarrolladores, localización al francés y una hoja de ruta hacia un segundo centro de datos propio.

Josselin Liebe
Josselin Liebe
Leer

¿Listo para empezar?

Tu API de web scraping está a un clic. Comienza con +500 créditos, sin infraestructura que configurar, sin proxies que gestionar y sin necesidad de tarjeta de crédito.

  • +500 créditos
  • Sin tarjeta de crédito
  • Todos los endpoints incluidos