Benchmark

Migliori scraper di LinkedIn: Bright Data, Apify & PhantomBuster

con

aggiornato il 10 giu. 2026

Abbiamo confrontato i migliori strumenti scraper di LinkedIn utilizzando 9.000 richieste su post, profili e offerte di lavoro. Questa guida copre due aree principali:

Confronto dei migliori scraper di dati LinkedIn in base a tasso di successo, velocità e prezzi
Tutorial Python per estrarre post, profili, aziende e offerte di lavoro da LinkedIn.

Fornitore

Focus

Bright Data

Soluzione API dedicata su larga scala e a basso costo

Apify

Gamma leader di mercato di API di scraping (approccio guidato dalla comunità)

Linked Helper

App desktop per utenti individuali

Apify vs. Bright Data: Confronto API scraper LinkedIn 2026

Apify eccelle negli scraper pronti all'uso che gestiscono la logica per te.
Bright Data è adatto agli sviluppatori che necessitano di un robusto browser di scraping o proxy residenziali per costruire la propria infrastruttura di scraping LinkedIn personalizzata su larga scala.

Scraper LinkedIn	Tipo	Scopo	Prezzo di partenza/mese	Prova gratuita
Bright Data	Basato su proxy	Piattaforma di raccolta dati	1,5 $ / 1K richieste	20 chiamate gratuite API
Apify	Basato su cookie Basato su proxy	Piattaforma di raccolta dati	30 $	3 giorni
Nimbleway	Basato su proxy	Piattaforma di raccolta dati	150 $	7 giorni
Dripify	Basato su proxy	Piattaforma di automazione LinkedIn	39 $	7 giorni
Linked Helper	Basato su proxy	Piattaforma di automazione LinkedIn	15 $	14 giorni
PhantomBuster	Basato su cookie	Piattaforma di automazione LinkedIn	69 €	14 giorni
Snov.io	Estensione browser	Piattaforma di automazione LinkedIn	39 $	50 crediti, 100 destinatari email
FindThatLead	Estensione browser	Piattaforma di automazione LinkedIn	49 €	50 crediti

Risultati del benchmark di scraping LinkedIn

Questo grafico confronta i tassi di successo giornalieri delle API scraper LinkedIn basati su test eseguiti ogni 15 minuti:

Estrazione di email verificate: strumenti e metodi di scraper email LinkedIn

1. Scraper LinkedIn basati su proxy

I scraper LinkedIn basati su proxy utilizzano la propria infrastruttura di proxy, inclusi indirizzi IP e server, per estrarre dati LinkedIn su larga scala. Queste API inviano richieste attraverso una rete proxy gestita.

Questo è l'approccio giusto per lo scraping LinkedIn ad alto volume e affidabile perché:

Veloce: Dato che lo scraper si basa su più profili durante l'estrazione dei dati, può operare più velocemente
Affidabile: Se il sito web target banna un profilo o un indirizzo IP, il provider passa a un altro per continuare le operazioni.
Sicuro: La persona che ordina lo scraping non deve utilizzare il proprio account, quindi non c'è rischio che il tuo profilo venga bannato.

Bright Data

Bright Data fornisce una API dedicata LinkedIn Web Scraper progettata per l'estrazione di dati strutturati dalle pagine pubbliche di LinkedIn. La suite API include Profiles API, Post API e Company API, ciascuna ottimizzata per accuratezza e conformità. La piattaforma offre anche dataset LinkedIn adattati a casi d'uso specifici di LinkedIn.

Caratteristiche:

Scoperta: Puoi ottenere dati da LinkedIn utilizzando una parola chiave specifica, come nome e cognome, filtri di data o località del lavoro.
Scraping in tempo reale: Consente agli utenti di ottenere le informazioni più aggiornate disponibili su LinkedIn.
Supporto proxy integrato: Le API LinkedIn includono supporto proxy integrato.

Ottieni dati LinkedIn su larga scala, 25% di sconto con il codice API25

Visita il sito web

Apify

Apify offre una gamma di Actor pre-costruiti su misura per lo scraping web su LinkedIn. I popolari strumenti di scraping LinkedIn includono Job Scraper, Sales Navigator Scraper, Company Scraper, Profile Scraper, Post Scraper e Ads Scraper.

Caratteristiche:

Actor personalizzabili (Scraper web pre-costruiti): Un marketplace di scraper LinkedIn costruiti da sviluppatori della comunità, ciascuno adattabile a esigenze specifiche di scraping.
Automazione: Collega più Actor o integra con strumenti esterni tramite API. Ogni Actor supporta connessioni al server MCP, consentendo agli utenti di gestire e comunicare con vari Actor di scraping.

Prova lo scraper LinkedIn di Apify (3 giorni gratuiti)

Visita il sito web

Proxycurl

Proxycurl è una API di scraping LinkedIn orientata agli sviluppatori che fornisce dati strutturati per profili, aziende, offerte di lavoro e dipendenti. A differenza degli strumenti di automazione del browser, Proxycurl utilizza una API REST per restituire dati JSON freschi e normalizzati pronti per l'analisi.

Caratteristiche:

Endpoint dedicati per Profilo LinkedIn, Azienda, Dipendente e Lavoro.
Pricing basato sull'utilizzo per una raccolta dati flessibile e scalabile.
Offre opzioni di dati in tempo reale e memorizzati nella cache per il controllo dei costi.

Nimble

ScraperAPI è un proxy gestito e un'infrastruttura di scraping web che include supporto dedicato per l'estrazione di dati LinkedIn. Invece di fornire un dataset LinkedIn pre-costruito, gestisce il processo di scraping, inclusa la rotazione IP, la risoluzione CAPTCHA e la gestione degli header.

Caratteristiche

Supporto richieste concorrenti: scala migliaia di richieste al minuto.
Modelli specifici per LinkedIn per profili, aziende e pagine di lavoro.

Dripify

Dripify è uno strumento di automazione LinkedIn che aiuta i professionisti delle vendite ad automatizzare le attività sulla piattaforma. Forniscono uno scraper LinkedIn che consente agli utenti di accedere ai dati lead di LinkedIn ed esportarli in un file CSV.

Caratteristiche:

Indirizzo IP locale: Fornisce un indirizzo IP unico dalla regione locale dell'utente, consentendo agli utenti di accedere ai siti web come se si trovassero in diverse aree geografiche.
Simulazione comportamento umano: Imita le azioni di un vero utente quando interagisce con LinkedIn. Aggiunge ritardi temporali casuali tra le richieste e simula i clic dell'utente su link o pulsanti per aiutarti ad apparire più come un utente genuino.

Linked Helper

Linked Helper è una piattaforma di automazione LinkedIn basata su desktop che include anche funzionalità di scraping LinkedIn. Lo strumento non richiede proxy di default, ma consente agli utenti di impostare manualmente i proxy per account LinkedIn.

Caratteristiche:

Connessione automatica ai profili: Visita i profili LinkedIn e invia messaggi personalizzati.
Scraping dati: Offre un estrattore dati per raccogliere dati dai profili LinkedIn e da Sales Navigator. Puoi ottenere i dati raccolti in formato CSV.
CRM integrato: Tutti i contatti sono archiviati in un CRM integrato all'interno di Linked Helper. Se utilizzi un CRM esterno, puoi inviare dati a questi CRM.

Gli strumenti basati su cookie utilizzano il cookie del tuo browser per estrarre dati. ¹. Sono utilizzati per la raccolta dati a basso volume e non critica, specialmente se gli utenti sono già clienti di questi strumenti di automazione e non sosterranno costi aggiuntivi.

Questi strumenti di automazione devono "agire" sul tuo per eseguire attività sui social network:

Quando sei connesso a LinkedIn, il sito web imposta un cookie di sessione nel tuo browser (che è unico per la tua sessione).
Devi passare questo cookie allo scraper LinkedIn.
Poi, lo scraper sfrutta il tuo cookie di sessione dalla rete sociale per inviare richieste di connessione e raccogliere dati. Puoi automatizzare attività personalizzate su LinkedIn, come inviare richieste di connessione e mettere like ai post.

Questo approccio è:

Lento: Dato che emula il comportamento umano, lo scraping è più lento rispetto agli strumenti che utilizzano la propria infrastruttura. Non sono adatti per attività di estrazione dati su larga scala.
Rischioso: Se LinkedIn rileva attività sospette, potresti affrontare restrizioni temporanee o un divieto permanente da LinkedIn.

Phantombuster

PhantomBuster offre uno scraper di profilo LinkedIn e uno scraper aziendale per estrarre dati pubblici dalla piattaforma.

Caratteristiche:

Dati LinkedIn aggiornati: Puoi impostare lo strumento di scraping LinkedIn per avviarlo ripetutamente per estrarre dati quotidianamente.
Estensione Firefox e Chrome: L'estrattore dati LinkedIn è disponibile come estensione.
Basato su cloud: Esegue sui server remoti, consentendo agli utenti di estrarre dati da LinkedIn senza utilizzare risorse locali.

3. Scraper LinkedIn con estensione browser

Gli strumenti con estensione browser funzionano direttamente all'interno del browser. Possono essere attivati mentre navighi su LinkedIn. Questi strumenti sono ideali per compiti di scraping più piccoli. Il rischio di utilizzare scraper con estensione browser dipende dal browser. Se il browser si aggiorna o cambia, gli strumenti di estensione possono rompersi.

Snov.io

Snov.io è una piattaforma di coinvolgimento delle vendite con estensione Chrome che fornisce soluzioni in tutto il ciclo di outreach. Snov.io's LinkedIn Email Finder estrae meccanicamente gli indirizzi email da un profilo LinkedIn o dalla pagina dei risultati di ricerca.

È vitale notare che Snov.io non è uno strumento di scraping LinkedIn dedicato; può estrarre solo indirizzi email. Puoi raccogliere email in blocco dalle pagine di ricerca Persone di LinkedIn e dai risultati di ricerca Sales Navigator di LinkedIn.

I fornitori di automazione LinkedIn come PhantomBuster, Linked Helper e Dripify forniscono script pre-costruiti. Se la tua organizzazione richiede automazione LinkedIn ma manca di una soluzione email, Snov.io potrebbe essere sufficiente. Il piano gratuito (50 crediti) è generoso.

Caratteristiche:

Email Finder: Scopre indirizzi email basati su nome, azienda e input di dominio. Snov.io offre anche estensioni Chrome per la generazione di lead ("clicca e raccogli"). Puoi estrarre email da LinkedIn e motori di ricerca Google.
Email Verifier: Offre un strumento di verifica email a 7 livelli, verificando gli indirizzi con il 98% di accuratezza. Tieni presente che la verifica consuma crediti, un credito per verifica.

findthatlead

FindThatLead è una piattaforma cloud-based B2B di generazione lead e verifica email. La piattaforma offre un'estensione Chrome che consente agli utenti di estrarre indirizzi email dai profili LinkedIn e dai siti web. Non è una soluzione gratuita e richiede crediti dal tuo account FindThatLead.

Caratteristiche:

Email Finder & Verifier: Puoi ricevere email da LinkedIn e altri siti web che includono informazioni aggiuntive, come il tuo nome, indirizzo email e titolo lavorativo.
Email Sender & Drip Campaigns: Email Sender è uno strumento gratuito che ti consente di personalizzare i messaggi per ogni destinatario.

Prezzi:

Prezzo di partenza (mese): 49 $ (2000 crediti email)
Prova: 50 crediti email, inclusa l'estensione Chrome.

Evaboot

Evaboot è uno strumento di automazione basato su Chrome che esporta dati lead direttamente da LinkedIn Sales Navigator. Invece di eseguire lo scraping tramite proxy, sfrutta la tua sessione Sales Navigator per raccogliere e pulire i dati lead visibili. Ma non è adatto per lo scraping su larga scala o la pianificazione automatizzata.

Caratteristiche

Integrazione nativa Sales Navigator: Estrae nomi, titoli lavorativi, nomi aziendali, settori e località dai risultati di ricerca Sales Navigator.
Pulizia dati: Rimuove automaticamente duplicati, link rotti e profili incompleti.

Prezzi:

Inizia da 49 $/mese con una prova gratuita di 7 giorni.
Offre opzioni di pagamento per esportazione per piccoli team.

Guida per sviluppatori Python: scraper LinkedIn via selenium & API

Impara come eseguire lo scraping LinkedIn utilizzando Python e la Bright Data API. Questo tutorial dimostra come estrarre programmaticamente post, profili, offerte di lavoro e dati aziendali da LinkedIn.

Ogni esempio segue lo stesso schema: invii l'URL LinkedIn target alla Bright Data's LinkedIn Scraper API e ricevi dati strutturati (JSON o CSV) in cambio.

Prerequisiti

Hai solo bisogno di alcune fasi di configurazione per iniziare:

Python 3.x è installato sul tuo sistema
requests library (pip install requests)
Bright Data account con il dataset LinkedIn abilitato

Come eseguire lo scraping dei post LinkedIn

Passaggio 1: Attiva il lavoro di scraping

Invia un URL di post LinkedIn all'endpoint Bright Data API per avviare il processo di scraping. Lo stesso schema si applica allo scraping di profili, offerte di lavoro e aziende più avanti in questa guida.

1import requests
2import json
3import os
4
5# Hidden secrets read from environment variables
6url = os.environ.get("BRIGHTDATA_TRIGGER_ENDPOINT", "BRIGHT_DATA_TRIGGER_ENDPOINT")
7API_KEY = os.environ.get("BRIGHTDATA_API_KEY", "YOUR_API_KEY_HERE")
8DATASET_ID = os.environ.get("BRIGHTDATA_DATASET_ID", "YOUR_DATASET_ID")
9
10headers = {
11    "Authorization": "Bearer " + API_KEY,
12    "Content-Type": "application/json",
13}
14
15params = {
16    "dataset_id": DATASET_ID,
17    "include_errors": "true",
18}
19
20linkedin_urls = [
21    "https://www.linkedin.com/posts/example-post-1",
22    "https://www.linkedin.com_posts/example-post-2",
23    "https://www.linkedin.com/posts/example-post-3",
24]
25
26data = [{"url": url} for url in linkedin_urls]
27
28response = requests.post(url, headers=headers, params=params, json=data)
29
30try:
31    result = response.json()
32    print(json.dumps(result, indent=4))
33except json.JSONDecodeError:
34    print("Could not get valid JSON response:", response.text)

Questo script Python invia una richiesta POST alla Bright Data LinkedIn Scraper API per avviare il lavoro di scraping. Ci autenticiamo utilizzando la nostra API key e specifichiamo l'ID dataset. "

Ogni URL di post LinkedIn viene passato come oggetto JSON e inviato alla API, che gestisce la rotazione proxy, la risoluzione CAPTCHA e la convalida delle richieste in background. La API restituisce un ID snapshot univoco, che utilizzerai in seguito per recuperare i dati LinkedIn estratti.

Passaggio 2: Recupera i dati estratti

Utilizza l'ID snapshot restituito dal lavoro di attivazione. I segreti e gli endpoint vengono letti solo dalle variabili d'ambiente.

1# retrieve_snapshot.py
2import requests
3import time
4import json
5import os
6
7snapshot_id = os.environ.get("BRIGHTDATA_SNAPSHOT_ID", "YOUR_SNAPSHOT_ID")
8url = f"{os.environ.get('BRIGHTDATA_SNAPSHOT_ENDPOINT', 'BRIGHT_DATA_SNAPSHOT_ENDPOINT')}/{snapshot_id}"
9headers = {
10    "Authorization": "Bearer " + os.environ.get("BRIGHTDATA_API_KEY", "YOUR_API_KEY_HERE")
11}
12
13while True:
14    response = requests.get(url, headers=headers)
15    raw_text = response.text.strip()
16
17    try:
18        data = json.loads(raw_text)
19    except json.JSONDecodeError:
20        print("Multiple JSON objects detected. Processing line by line...")
21        for line in raw_text.splitlines():
22            try:
23                item = json.loads(line)
24                post_text = item.get("post_text", "[Not available]")
25                num_likes = item.get("num_likes", "[Not available]")
26                num_comments = item.get("num_comments", "[Not available]")
27
28                print("Post Text:", post_text)
29                print("Likes:", num_likes)
30                print("Comments:", num_comments)
31                print("-" * 40)
32            except Exception as e:
33                print("Skipped invalid line:", e)
34        break
35
36    status = data.get("status")
37
38    if status == "building":
39        print("Data is being processed... Waiting.")
40        time.sleep(5)
41        continue
42    elif status == "done":
43        print("Data is ready!")
44        for item in data.get("items", []):
45            print("Post Text:", item.get("post_text", "[Not available]"))
46            print("Likes:", item.get("num_likes", "[Not available]"))
47            print("Comments:", item.get("num_comments", "[Not available]"))
48            print("-" * 40)
49        break
50    else:
51        print("Unexpected status:", status)
52        break

Questo script recupera i dati LinkedIn estratti utilizzando l'ID snapshot restituito dal lavoro di attivazione. Interroga la Bright Data API per verificare lo stato del lavoro fino al completamento del processo di scraping.

La risposta API può essere un singolo oggetto JSON (con stato) o più oggetti JSON in formato NDJSON. Per le risposte NDJSON, analizza ogni riga ed estrai i record dei post; per le risposte JSON singole, controlla il campo stato: se è "building", attendi qualche secondo e riprova fino a quando non diventa "done". Una volta completato, puoi estrarre e visualizzare i dati strutturati del post LinkedIn.

Come eseguire lo scraping delle offerte di lavoro LinkedIn con Python

Impara come eseguire lo scraping degli annunci di lavoro LinkedIn utilizzando Python e la LinkedIn Scraper API. Puoi estrarre dati di lavoro strutturati, inclusi titoli, aziende, località, date di pubblicazione e descrizioni del lavoro, direttamente dagli URL delle offerte di lavoro LinkedIn.

Questo approccio è ideale per costruire bacheche di lavoro, analisi del reclutamento o strumenti di ricerca salariale.

Passaggio 1: Attiva il lavoro di scraping

Lo script sottostante invia una richiesta POST alla Bright Data's API per avviare un'attività di scraping delle offerte di lavoro LinkedIn. Ogni URL di lavoro viene passato al dataset LinkedIn_jobs, che gestisce automaticamente la rotazione proxy e la protezione anti-bot di LinkedIn.

1# trigger_jobs.py
2import requests
3import json
4import os
5
6# Hidden secrets read from environment variables
7url = os.environ.get("BRIGHTDATA_TRIGGER_ENDPOINT", "BRIGHT_DATA_TRIGGER_ENDPOINT")
8API_KEY = os.environ.get("BRIGHTDATA_API_KEY", "YOUR_API_KEY_HERE")
9DATASET_ID = os.environ.get("BRIGHTDATA_DATASET_ID", "YOUR_DATASET_ID")
10
11headers = {
12    "Authorization": "Bearer " + API_KEY,
13    "Content-Type": "application/json",
14}
15
16params = {
17    "dataset_id": DATASET_ID,
18    "include_errors": "true",
19    "type": "discover_new",
20    "discover_by": "keyword",
21}
22
23data = [
24    {
25        "location": "New York",
26        "keyword": "software engineer",
27        "country": "US",
28        "job_type": "Full-time",
29        "remote": "Hybrid",
30        "company": "",
31        "location_radius": ""
32    },
33    {
34        "location": "New York",
35        "keyword": "data analyst",
36        "country": "US",
37        "job_type": "Full-time",
38        "remote": "Remote",
39        "company": "",
40        "location_radius": ""
41    },
42]
43
44response = requests.post(url, headers=headers, params=params, json=data)
45result = response.json()
46print(f"Snapshot ID: {result['snapshot_id']}")

Questo script avvia il processo di scraping delle offerte di lavoro LinkedIn inviando una richiesta POST alla Bright Data API. Ci autenticiamo utilizzando la nostra API key e specifichiamo l'ID dataset LinkedIn Jobs.

I criteri di ricerca definiscono quali ruoli estrarre. Ad esempio, ingegneri software in posizioni ibride o analisti dati in ruoli remoti in tutta New York.

La API restituisce un ID snapshot che può essere utilizzato per recuperare i risultati una volta completato lo scraping. Poiché tutte le attività di scraping vengono eseguite sull'infrastruttura cloud di Bright Data, il processo continua anche se chiudi lo script Python.

Passaggio 2: Attendi e recupera i risultati

Attendi 5-10 minuti per il completamento dello scraping, quindi utilizza questo script per recuperare i dati:

1# retrieve_jobs.py
2import requests
3import json
4import os
5
6snapshot_id = os.environ.get("BRIGHTDATA_SNAPSHOT_ID", "YOUR_SNAPSHOT_ID")
7
8url = f"{os.environ.get('BRIGHTDATA_SNAPSHOT_ENDPOINT', 'BRIGHT_DATA_SNAPSHOT_ENDPOINT')}/{snapshot_id}?format=json"
9headers = {
10    "Authorization": "Bearer " + os.environ.get("BRIGHTDATA_API_KEY", "YOUR_API_KEY_HERE")
11}
12
13response = requests.get(url, headers=headers)
14
15if response.status_code == 200:
16    lines = response.text.strip().splitlines()
17    first_line = json.loads(lines[0])
18
19    print(f"✓ Total jobs found: {len(first_line)}\n")
20    print("First 10 job listings:\n")
21    print("="*80)
22
23    for idx, job in enumerate(first_line[:10], 1):
24        if isinstance(job, dict):
25            print(f"\n[{idx}]")
26            print(f" Position: {job.get('job_title', 'N/A')}")
27            print(f" Company:  {job.get('company_name', 'N/A')}")
28            print(f" Location: {job.get('job_location', 'N/A')}")
29            print(f" Job Type: {job.get('job_employment_type', 'N/A')}")
30            print(f" Seniority: {job.get('job_seniority_level', 'N/A')}")
31            print(f" Link:     {job.get('url', 'N/A')}")
32            print("-"*80)
33
34    print(f"\n✓ First 10 displayed (total {len(first_line)} records available)")
35else:
36    print(f"Error: {response.status_code}")

Una volta completato il processo di scraping delle offerte di lavoro LinkedIn, recuperiamo i dati strutturati utilizzando l'ID snapshot restituito dal lavoro di attivazione. La risposta è tipicamente in formato NDJSON, dove ogni riga rappresenta un annuncio di lavoro separato.

Analizziamo ogni voce ed estraiamo informazioni chiave, inclusi titolo del lavoro, nome dell'azienda, località, tipo di impiego e data di pubblicazione. Per le risposte JSON singole, lo script controlla il campo stato e attende fino a quando non è uguale a "done", assicurandosi che tutti i dati delle offerte di lavoro LinkedIn siano completamente elaborati. Lo script utilizza anche .get() con valori predefiniti per gestire elegantemente eventuali campi mancanti.

Come eseguire lo scraping delle pagine profilo LinkedIn

Potresti voler eseguire lo scraping dei profili LinkedIn per diversi casi d'uso legittimi. Ad esempio, analizzare i dipendenti di un'azienda specifica, arricchire un database di reclutamento o elaborare un elenco di URL di profili LinkedIn raccolti da un evento di networking.

Passaggio 1: Attiva il lavoro di scraping

1# trigger_profiles.py
2import requests
3import json
4import os
5
6# Hidden secrets read from environment variables
7api_url = os.environ.get("BRIGHTDATA_TRIGGER_ENDPOINT", "BRIGHT_DATA_TRIGGER_ENDPOINT")
8API_KEY = os.environ.get("BRIGHTDATA_API_KEY", "YOUR_API_KEY_HERE")
9DATASET_ID = os.environ.get("BRIGHTDATA_DATASET_ID", "YOUR_DATASET_ID")
10
11headers = {
12    "Authorization": "Bearer " + API_KEY,
13    "Content-Type": "application/json",
14}
15
16params = {
17    "dataset_id": DATASET_ID,  # Get this from your Bright Data dashboard
18    "include_errors": "true",
19}
20
21profile_urls = [
22    "https://www.linkedin.com/in/example-profile-1/",
23    "https://www.linkedin.com/in/example-profile-2/",
24    "https://www.linkedin.com/in/example-profile-3/"
25]
26
27data = [{"url": profile_url} for profile_url in profile_urls]
28
29response = requests.post(api_url, headers=headers, params=params, json=data)
30
31try:
32    result = response.json()
33    print(json.dumps(result, indent=4))
34except json.JSONDecodeError:
35    print("Could not get valid JSON response:")
36    print(response.text)

Questo script invia una richiesta POST alla Bright Data's API per avviare lo scraping dei profili LinkedIn specificati. Ci autenticiamo con il nostro API token e forniamo l'ID dataset (disponibile nella tua dashboard Bright Data sotto il dataset LinkedIn People).

Gli URL dei profili sono formattati come oggetti dizionario e inviati alla API, che li elabora e restituisce un ID snapshot per recuperare i dati in seguito. Il blocco try-except gestisce la risposta e visualizza l'ID snapshot o eventuali errori.

Passaggio 2: Recupera i dati del profilo LinkedIn estratti

Utilizza l'ID snapshot restituito nel Passaggio 1 per interrogare la LinkedIn Scraper API fino al completamento del lavoro, quindi analizza la risposta.

1import requests
2import time
3import json
4
5snapshot_id = "YOUR_SNAPSHOT_ID"
6url = f"BRIGHT_DATA_SNAPSHOT_ENDPOINT/{snapshot_id}"
7
8headers = {
9    "Authorization": "Bearer YOUR_API_KEY_HERE"
10}
11
12while True:
13    response = requests.get(url, headers=headers)
14    raw_text = response.text.strip()
15
16    print(f"Status Code: {response.status_code}\n")
17
18    if response.status_code != 200:
19        print("Error:", raw_text)
20        break
21
22    try:
23        data = json.loads(raw_text)
24    except json.JSONDecodeError:
25        print("Processing JSONL format (multiple JSON objects)...\n")
26
27        for line in raw_text.splitlines():
28            line = line.strip()
29            if not line:
30                continue
31
32            try:
33                item = json.loads(line)
34
35                profile_id = item.get("id", "[Not available]")
36                name = item.get("name", "[Not available]")
37                country_code = item.get("country_code", "[Not available]")
38                about = item.get("about", "[Not available]")
39                experience = item.get("experience", []) or []
40                current_company = item.get("current_company", {}) or {}
41
42                print("=" * 60)
43                print(f"ID: {profile_id}")
44                print(f"Name: {name}")
45                print(f"Country Code: {country_code}")
46
47                if about and about != "[Not available]":
48                    print(f"About: {about[:150]}..." if len(about) > 150 else f"About: {about}")
49                else:
50                    print("About: [Not available]")
51
52                if current_company:
53                    company_name = current_company.get("name", "[Not available]")
54                    company_title = current_company.get("title", "[Not available]")
55                    print(f"Current Company: {company_name}")
56                    if company_title != "[Not available]":
57                        print(f" Title: {company_title}")
58
59                print(f"Total Experience: {len(experience)} positions")
60
61                if experience and len(experience) > 0:
62                    print("\nExperience:")
63                    for idx, exp in enumerate(experience[:3], 1):
64                        exp_title = exp.get("title", "N/A")
65                        exp_company = exp.get("company_name", "N/A")
66                        print(f" {idx}. {exp_title} at {exp_company}")
67
68            except json.JSONDecodeError as e:
69                print(f"JSON parse error: {e}")
70            except Exception as e:
71                print(f"Error processing line: {e}")
72
73        print("\n" + "=" * 60)
74        print("All profiles processed successfully!")
75        break
76
77    status = data.get("status")
78
79    if status in ["building", "running"]:
80        print(f"Status: {status} - Waiting 5 seconds...")
81        time.sleep(5)
82        continue
83
84    elif status in ["ready", "done"]:
85        print("Data is ready! Processing items...\n")
86
87        for item in data.get("items", []):
88            profile_id = item.get("id", "[Not available]")
89            name = item.get("name", "[Not available]")
90            country_code = item.get("country_code", "[Not available]")
91            about = item.get("about", "[Not available]")
92            experience = item.get("experience", []) or []
93            current_company = item.get("current_company", {}) or {}
94
95            print("=" * 60)
96            print(f"ID: {profile_id}")
97            print(f"Name: {name}")
98            print(f"Country Code: {country_code}")
99            print(f"About: {about[:100]}..." if about != "[Not available]" else "About: [Not available]")
100            print(f"Current Company: {current_company.get('name', '[Not available]')}")
101            print(f"Total Experience: {len(experience)} positions")
102
103        break
104
105    else:
106        print(f"Unexpected status: {status}")
107        break

La API può restituire NDJSON (un oggetto JSON per riga) o un singolo oggetto JSON con un campo stato. Il tuo script gestisce entrambi: controlla lo stato ("building", "running", "ready", "done"), attende quando necessario e stampa i dati strutturati del profilo LinkedIn una volta disponibili.

Come eseguire lo scraping dei dati aziendali LinkedIn

Puoi utilizzare uno scraper aziendale LinkedIn per estrarre dati aziendali pubblici, inclusi nomi, settori, dimensioni, località e numero di dipendenti. Se non hai già gli URL aziendali, puoi generarli utilizzando una query Google Search API come site:linkedin.com/company/ [industry or keyword].

Passaggio 1: Attiva il lavoro di scraping

1# trigger_companies.py
2import requests
3import json
4import os
5
6# Hidden secrets read from environment variables
7url = os.environ.get("BRIGHTDATA_TRIGGER_ENDPOINT", "BRIGHT_DATA_TRIGGER_ENDPOINT")
8API_KEY = os.environ.get("BRIGHTDATA_API_KEY", "YOUR_API_KEY_HERE")
9DATASET_ID = os.environ.get("BRIGHTDATA_DATASET_ID", "YOUR_DATASET_ID")
10
11headers = {
12    "Authorization": "Bearer " + API_KEY,
13    "Content-Type": "application/json",
14}
15
16params = {
17    "dataset_id": DATASET_ID,  # Get this from your Bright Data dashboard
18    "include_errors": "true",
19}
20
21company_urls = [
22    "https://www.linkedin.com/company/example-company-1",
23    "https://www.linkedin.com/company/example-company-2",
24    "https://www.linkedin.com/company/example-company-3",
25]
26
27data = [{"url": company_url} for company_url in company_urls]
28
29response = requests.post(url, headers=headers, params=params, json=data)
30
31print("Status Code:", response.status_code)
32print("\nResponse:")
33
34try:
35    result = response.json()
36    print(json.dumps(result, indent=4))
37except json.JSONDecodeError:
38    print("Could not get valid JSON response:")
39    print(response.text)

Ci autenticiamo utilizzando il nostro API token e includiamo l'ID dataset dalla dashboard Bright Data. Gli URL aziendali LinkedIn vengono convertiti nel formato JSON richiesto e inviati alla API per l'elaborazione.

Una volta accettata la richiesta, la API restituisce un ID snapshot che utilizzeremo in seguito per recuperare i dati aziendali estratti. Una gestione di base degli errori assicura che lo script visualizzi l'ID snapshot o registri eventuali problemi di richiesta per il debug.

Passaggio 2: Recupera i dati estratti

Una volta attivato il lavoro di scraping, utilizza l'ID snapshot per verificare lo stato e recuperare i dati.

1# retrieve_companies.py
2import requests
3import time
4import json
5import os
6
7snapshot_id = os.environ.get("BRIGHTDATA_SNAPSHOT_ID", "YOUR_SNAPSHOT_ID")
8url = f"{os.environ.get('BRIGHTDATA_SNAPSHOT_ENDPOINT', 'BRIGHT_DATA_SNAPSHOT_ENDPOINT')}/{snapshot_id}"
9headers = {
10    "Authorization": "Bearer " + os.environ.get("BRIGHTDATA_API_KEY", "YOUR_API_KEY_HERE")
11}
12
13while True:
14    response = requests.get(url, headers=headers)
15    raw_text = response.text.strip()
16
17    print(f"Status Code: {response.status_code}\n")
18
19    if response.status_code != 200:
20        print("Error:", raw_text)
21        break
22
23    try:
24        data = json.loads(raw_text)
25    except json.JSONDecodeError:
26        print("Processing JSONL format (multiple JSON objects)...\n")
27
28        for line in raw_text.splitlines():
29            line = line.strip()
30            if not line:
31                continue
32
33            try:
34                item = json.loads(line)
35
36                company_id = item.get("id", "[Not available]")
37                name = item.get("name", "[Not available]")
38                website = item.get("website", "[Not available]")
39                country_code = item.get("country_code", "[Not available]")
40                company_size = item.get("company_size", "[Not available]")
41                employees_in_linkedin = item.get("employees_in_linkedin", "[Not available]")
42                followers = item.get("followers", "[Not available]")
43                about = item.get("about", "[Not available]")
44                specialties = item.get("specialties", "[Not available]")
45                organization_type = item.get("organization_type", "[Not available]")
46
47                print("=" * 60)
48                print(f"ID: {company_id}")
49                print(f"Name: {name}")
50                print(f"Website: {website}")
51                print(f"Country: {country_code}")
52                print(f"Company Size: {company_size}")
53                print(f"Employees on LinkedIn: {employees_in_linkedin}")
54                print(f"Followers: {followers}")
55                print(f"Organization Type: {organization_type}")
56                if specialties and specialties != "[Not available]":
57                    print(f"Specialties: {specialties}")
58                if about and about != "[Not available]":
59                    print(f"About: {about[:150]}..." if len(about) > 150 else f"About: {about}")
60
61            except json.JSONDecodeError as e:
62                print(f"⚠ JSON parse error: {e}")
63            except Exception as e:
64                print(f"⚠ Error processing line: {e}")
65
66        print("\n" + "=" * 60)
67        print("✓ All companies processed successfully!")
68        break
69
70    status = data.get("status")
71
72    if status in ["building", "running"]:
73        print(f"Status: {status} - Waiting 5 seconds...")
74        time.sleep(5)
75        continue
76    elif status in ["ready", "done"]:
77        print("Data is ready! Processing items...\n")
78        for item in data.get("items", []):
79            company_id = item.get("id", "[Not available]")
80            name = item.get("name", "[Not available]")
81            website = item.get("website", "[Not available]")
82            country_code = item.get("country_code", "[Not available]")
83            company_size = item.get("company_size", "[Not available]")
84            employees_in_linkedin = item.get("employees_in_linkedin", "[Not available]")
85            followers = item.get("followers", "[Not available]")
86            about = item.get("about", "[Not available]")
87            specialties = item.get("specialties", "[Not available]")
88            organization_type = item.get("organization_type", "[Not available]")
89
90            print("=" * 60)
91            print(f"ID: {company_id}")
92            print(f"Name: {name}")
93            print(f"Website: {website}")
94            print(f"Country: {country_code}")
95            print(f"Company Size: {company_size}")
96            print(f"Employees on LinkedIn: {employees_in_linkedin}")
97            print(f"Followers: {followers}")
98            print(f"Organization Type: {organization_type}")
99            print(f"About: {about[:100]}..." if about != "[Not available]" else "About: [Not available]")
100
101        break
102    else:
103        print(f"Unexpected status: {status}")
104        break

Questo script recupera i dati aziendali estratti utilizzando l'ID snapshot dal passaggio precedente. Interroga continuamente la API e supporta più formati di risposta.

Innanzitutto, convalida il codice di stato HTTP per rilevare eventuali errori. Quindi prova ad analizzare la risposta, che può arrivare in due formati: JSONL (oggetti JSON delimitati da nuove righe) o un oggetto JSON standard con informazioni sullo stato.

Lascia che il nostro team automatizzi uno dei tuoi processi aziendali con agenti IA, gratuitamente.

Automatizza un processo

Lo scraping LinkedIn è legale nel 2026?

L'IAB IA Accountability for Publishers Act ha inasprito le normative. Ora, piattaforme come LinkedIn possono intraprendere azioni legali contro chiunque ignori le regole no-crawling nei file robots.txt quando raccoglie dati per l'addestramento IA o per uso su larga scala.

Lo scraping pubblico non è considerato "hacking", ma ora comporta seri rischi legali se viola le regole robots.txt o viene utilizzato per profilazione invasiva.

I Termini di servizio di LinkedIn vietano l'accesso automatizzato alla propria piattaforma senza autorizzazione.²
Tuttavia, la raccolta di informazioni pubblicamente disponibili dalle pagine LinkedIn (non dietro un login) può essere permessa in alcune giurisdizioni.

Metodologia del benchmark scraper LinkedIn

Il benchmark invia periodicamente richieste a profili LinkedIn e pagine aziendali predefiniti per misurare la coerenza e la latenza del recupero dei dati. Vengono richieste un totale di 100 URL di profili e 100 URL aziendali a intervalli fissi, e i risultati vengono aggregati quotidianamente.

Le richieste vengono eseguite ogni 15 minuti con un timeout di 60 secondi per garantire un campionamento regolare minimizzando al contempo il rate limiting da LinkedIn.

Una richiesta è considerata riuscita se la risposta include campi specifici di LinkedIn come "linkedin_id", "headline", "company_name" o "industry". Il successo viene convalidato in due passaggi:

Prima scansionando questi identificatori,
E poi ricontrollando per contenuti parzialmente formattati se non viene trovata una corrispondenza diretta. Questo doppio processo riduce i falsi negativi causati da lievi cambiamenti di layout o formattazione.

Nel nostro benchmark, abbiamo utilizzato le seguenti API dedicate, progettate specificamente per estrarre dati da LinkedIn. Per saperne di più, consulta la metodologia del benchmark delle API di scraping.

Tipo di pagina	Bright Data	Apify
Post LinkedIn	LinkedIn posts-collect by URL	supreme_coder/linkedin-post*
Profilo LinkedIn	LinkedIn people-collect by URL	dev_fusion/Linkedin-Profile-Scraper

* è elencato per riferimento, ma non è stato utilizzato nel nostro benchmark di scraping LinkedIn.

Non perderti i nostri benchmark e approfondimenti basati sui dati. Il pulsante apre Google; selezionare AIMultiple conferma che desideri vedere AIMultiple più spesso nei risultati di ricerca di Google.

Aggiungi come fonte preferita

FAQ

Uno scraper LinkedIn è uno strumento o uno script che estrae automaticamente informazioni pubblicamente disponibili dai profili LinkedIn, dai post di lavoro o dalle pagine aziendali. Questi strumenti sono progettati per eseguire il crawling dei dati LinkedIn come nomi, titoli, nomi aziendali e località, tipicamente tramite API o script automatizzati.

Puoi estrarre solo dati visibili pubblicamente come nomi di profilo, nomi aziendali, titoli lavorativi, settori e testo dei post. Evita di raccogliere informazioni private o sensibili (ad esempio email o numeri di telefono) e segui sempre i termini di servizio di LinkedIn e le linee guida etiche per lo scraping web.

Cita questo benchmark

Scegli il formato adatto a dove pubblicherai. Incollare la versione con link nel tuo CMS preserva il backlink.

Sedat Dogan and Gulbahar Karatas (2026) - "Migliori scraper di LinkedIn: Bright Data, Apify & PhantomBuster". Pubblicato online su AIMultiple.com. Consultato il 10 Giugno 2026, da: https://aimultiple.com/linkedin-scrapers [Risorsa online]

Dogan, S., & Karatas, G. (2026, 10 Giugno). Migliori scraper di LinkedIn: Bright Data, Apify & PhantomBuster. AIMultiple. https://aimultiple.com/linkedin-scrapers

@misc{dogan2026,
  author = {Dogan, Sedat and Karatas, Gulbahar},
  title  = {{Migliori scraper di LinkedIn: Bright Data, Apify & PhantomBuster}},
  year   = {2026},
  month  = jun,
  howpublished    = {\url{https://aimultiple.com/linkedin-scrapers}},
  note   = {AIMultiple. Consultato il 10 Giugno 2026}
}

Collegamenti di riferimento

User Agreement | LinkedIn

Sedat Dogan

CTO

Segui

Sedat è un leader nel settore della tecnologia e della sicurezza informatica, con esperienza nello sviluppo software, nella raccolta di dati web e nella sicurezza informatica. Sedat: - Ha 20 anni di esperienza come hacker etico e guru dello sviluppo, con una vasta competenza nei linguaggi di programmazione e nelle architetture server. - È consulente di dirigenti di alto livello e membri del consiglio di amministrazione di aziende con operazioni tecnologiche ad alto traffico e di importanza critica, come le infrastrutture di pagamento. - Possiede una solida competenza commerciale oltre alla sua competenza tecnica.

Visualizza il profilo completo

Ricercato da