IA Hardware per l'intelligenza artificiale

DGX Spark vs Mac Studio e Halo: benchmark e alternative

aggiornato il Apr 13, 2026

DGX Spark di Apple è entrato nel mercato dell'IA desktop nel 2025 al prezzo di 4.699 dollari, posizionandosi come un "supercomputer IA desktop". È dotato di 128 GB di memoria unificata e promette prestazioni IA in FP4 pari a un petaflop in un case delle dimensioni di un Mac Mini.
Consulta i risultati del benchmark su valore e prestazioni rispetto alle alternative:

Prestazioni GPT-OSS 120B

Loading Chart

Confrontando i sistemi sul modello GPT-OSS 120B (formato MXFP4), particolarmente esigente, le differenze di prestazioni sono risultate evidenti. ¹ ²

Approfondimenti intersistemici di GPT-OSS 120B

Elaborazione rapida : DGX Spark e 3×RTX 3090 sono quasi identici (1.723 contro 1.642 token/sec), con DGX Spark leggermente in vantaggio grazie all'efficienza FP4. Strix Halo è significativamente più lento, con 340 token/sec, nonostante capacità FP4 simili.
Generazione di token : la configurazione con 3 RTX 3090 domina con 124 token/sec, oltre 3 volte più veloce dei 38,55 token/sec di DGX Spark. Ciò conferma che la larghezza di banda della memoria LPDDR5X (273 GB/s) rappresenta il collo di bottiglia rispetto alla larghezza di banda aggregata GDDR6X.
Vantaggio in termini di capacità di memoria : la memoria unificata da 128 GB di DGX Spark consente di eseguire modelli che andrebbero in crash su GPU da 24 GB. Una singola RTX 3090 non è in grado di eseguire modelli da 120 B senza trasferire i dati alla RAM di sistema, che è più lenta.

Fonte: LMSYS Org ³ , Substack ⁴

Il grafico dimostra che:

DGX Spark supera le prestazioni di Mac Mini M4 Pro in tutte le dimensioni del modello.
Per i modelli più piccoli (GPT-OSS 20B, LLaMA 3.1 8B), il divario è maggiore (circa il 30% più veloce).
Per i modelli più grandi (Gemma-3 27B), le prestazioni convergono man mano che entrambi i sistemi diventano limitati dalla memoria.
Entrambi i sistemi rimangono utilizzabili anche con modelli a 27B parametri

Analisi del rapporto prezzo-prestazioni

I prezzi sono aggiornati ad aprile 2026. Il 27 febbraio 2026, DGX Spark Founders Edition ha aumentato il prezzo consigliato al pubblico da 3.999 a 4.699 dollari, citando problemi di approvvigionamento di memoria. ⁵

Benchmark di inferenza DGX Spark

risultati di llama.cpp

I primi benchmark effettuati dallo sviluppatore di llama.cpp, Georgi Gerganov, forniscono metriche di base sulle prestazioni. I test hanno misurato l'elaborazione immediata (la velocità con cui il modello acquisisce l'input) e la generazione di token (velocità di risposta):

Fonte: Hardware-Corner.net ⁶

Lo schema è chiaro: DGX Spark eccelle nell'elaborazione dei prompt (limitata dalla potenza di calcolo) ma ha difficoltà nella generazione dei token (limitata dalla memoria).

Test di performance Ollama

I benchmark ufficiali di Ollama, utilizzando la versione firmware 580.95.05 e Ollama v0.12.6, hanno testato diversi modelli in condizioni standardizzate:

Fonte: Blog di Ollama ⁷

Nota : i modelli gpt-oss di OpenAI testati da Ollama utilizzano il formato ufficiale MXFP4 con BF16 negli strati di attenzione, non la versione quantizzata q8_0.

L'aggiornamento software di NVIDIA per il CES 2026 (6-9 gennaio 2026) ha fornito miglioramenti delle prestazioni fino a 2,5 volte su carichi di lavoro selezionati rispetto alla baseline di lancio di ottobre 2025, ottenuti tramite ottimizzazioni TensorRT-LLM, quantizzazione NVFP4 e decodifica speculativa Eagle3. I miglioramenti sono specifici per carico di lavoro: il throughput di Qwen-235B è più che raddoppiato con NVFP4 + Eagle3, la generazione di token GPT-OSS 20B raggiunge 49,7 tok/s dopo l'aggiornamento su Ollama e i carichi di lavoro di generazione video hanno visto un'accelerazione di 8 volte. ⁸ ⁹

DGX Spark: Specifiche tecniche

Fonte: NVIDIA ¹⁰

Quando è preferibile DGX Spark?

Accesso all'ecosistema CUDA

DGX Spark si distingue negli scenari in cui la compatibilità software e l'efficienza di specifici flussi di lavoro sono più importanti della semplice velocità di generazione dei token. Per gli sviluppatori abituati ai processori Apple Silicon, il passaggio a Spark attenua le difficoltà legate al " divario CUDA ", poiché molte librerie e tutorial standard del settore presuppongono ancora un ambiente CUDA. ¹¹

Spark fornisce accesso nativo all'ecosistema NVIDIA, inclusi i container Docker e i playbook ufficiali, consentendo agli utenti di eseguire configurazioni complesse come pipeline di fine-tuning o flussi di lavoro agentici che si basano sullo stack NVIDIA standard.

Flusso di lavoro dal desktop al data center

Questo dispositivo colma efficacemente il divario tra la prototipazione locale e l'implementazione nei data center. Presentato come un "supercomputer AI personale", consente ai ricercatori di sviluppare e testare modelli su un'unità desktop che condivide la stessa architettura software (driver, toolkit CUDA e strumenti di gestione) dei cluster cloud su vasta scala. ¹²

Questa coerenza risolve i problemi di compatibilità con l'ambiente locale durante la migrazione dei carichi di lavoro verso implementazioni H100 di grandi dimensioni .

Inoltre, specifici benchmark evidenziano la competenza del sistema nella messa a punto e nell'elaborazione batch ad alta velocità; nei test, il sistema ha raggiunto circa 924 token al secondo con Llama 3.1 8B (FP4) e 483 token al secondo con Qwen3 Coder 30B (FP8), dimostrando la sua utilità per attività di sviluppo rigorose che vanno oltre la semplice inferenza di chat. ¹³

Configurazioni ibride con Mac Studio

Le innovative combinazioni hardware rivelano anche vantaggi specifici per Spark. Sebbene abbia difficoltà con la larghezza di banda della memoria per la decodifica rispetto all'hardware Apple, le sue prestazioni di "pre-riempimento", che richiedono un'elevata potenza di calcolo, sono nettamente superiori.

Collegando in rete un DGX Spark a un Mac Studio M3 Ultra, gli sviluppatori possono sfruttare Spark per l'elaborazione immediata e il Mac per la generazione dei token. Questa configurazione ibrida "disaggregata" raggiunge un'accelerazione complessiva di 2,8 volte rispetto all'esecuzione dei modelli sul solo Mac Studio. ¹⁴

To get up to date on enterprise AI and software, follow us:

Cem Dilmegani

Principal Analyst

Segui

Alternative da considerare a DGX Spark

AMD Strix Halo (Framework desktop) per rapporto qualità-prezzo

Per gli utenti attenti al budget, il Framework Desktop con Ryzen AI Max 385 (Strix Halo) offre il miglior rapporto prezzo-prestazioni tra i sistemi con memoria unificata. A 2.348 dollari, costa circa la metà del DGX Spark, pur offrendo la stessa configurazione di memoria unificata da 128 GB e una larghezza di banda di memoria comparabile (~273 GB/s). ¹⁵

Le prestazioni di generazione dei token sono sorprendentemente competitive: 34,13 tok/s contro i 38,55 tok/s di DGX Spark sul modello 120B. Tuttavia, l'elaborazione dei prompt rivela il divario, dove l'architettura Blackwell di DGX Spark domina con 1.723 tok/s rispetto ai 339,87 tok/s di Strix Halo. Ciò significa che Strix Halo elabora contesti di grandi dimensioni circa 5 volte più lentamente, sebbene la velocità di generazione rimanga pressoché identica una volta avviata l'elaborazione.

Il compromesso sta nella maturità del software. Strix Halo si basa sullo stack ROCm di AMD invece che su CUDA, che sta migliorando rapidamente ma manca ancora della profondità dell'ecosistema e dell'ambiente di sviluppo AI preconfigurato che DGX Spark offre fin da subito.

AMD Mini-PC Ryzen AI Halo

Al CES 2026, AMD ha annunciato la piattaforma di riferimento Ryzen AI Halo Mini-PC, posizionata esplicitamente in concorrenza con NVIDIA DGX Spark. Utilizza lo stesso chip Ryzen AI Max+ 395 di Framework Desktop, ma lo integra con una NPU XDNA 2 dedicata da 50 TOPS, supporto nativo per Windows e Linux e ROCm 7.2.2 al lancio con supporto immediato per GPT-OSS, FLUX.2 e SDXL. La potenza di calcolo AI combinata è valutata a 126 TOPS. ¹⁶

La memoria è di 128 GB LPDDR5x-8533 a 273 GB/s, corrispondente esattamente alla larghezza di banda di DGX Spark. AMD afferma che la piattaforma può eseguire localmente modelli di intelligenza artificiale fino a 200 miliardi di parametri, sebbene le prestazioni reali a tale scala siano limitate dalla larghezza di banda. La stessa larghezza di banda di memoria di 273 GB/s che rappresenta il collo di bottiglia per la generazione di token DGX Spark, rappresenterà un collo di bottiglia anche per Ryzen AI Halo con lo stesso carico di lavoro.

I partner OEM commercializzeranno la piattaforma di riferimento nel secondo trimestre del 2026, con Framework Desktop come partner hardware confermato. Il prezzo non è ancora stato annunciato. Il chip Ryzen AI Max+ 395 attualmente presente nel Framework Desktop ha un prezzo di 2.348 dollari per la configurazione da 128 GB, il che fornisce un'aspettativa ragionevole per la gamma di prezzi al dettaglio della nuova piattaforma una volta che sarà disponibile per gli acquirenti.

Lisa Su, CEO di Ryzen AI Halo, ha presentato l'annuncio come parte dell'"era del calcolo su scala yotta". Ryzen AI Halo è la prima risposta a livello di prodotto di Ryzen alla categoria DGX Spark, differenziata principalmente dalla NPU dedicata, dal supporto nativo per Windows e da ROCm al posto di CUDA.

Mac Studio M3 Ultra per l'inferenza ad alta velocità

Se la larghezza di banda della memoria e la velocità di generazione dei token sono i parametri principali, il Mac Studio M3 Ultra rimane un'opzione superiore. Con 512 GB di memoria unificata disponibili a 819 GB/s, il Mac Studio offre circa tre volte la larghezza di banda della configurazione LPDDR5X da 273 GB/s dello Spark. ¹⁷

Questo vantaggio in termini di larghezza di banda si traduce in velocità di decodifica più elevate per modelli linguistici di grandi dimensioni, rendendo Mac Studio estremamente efficace per attività che richiedono un'intensa attività di inferenza, dove il tempo di generazione della risposta è fondamentale.

Configurazioni multi-GPU fai-da-te per massime prestazioni pure.

Per massimizzare la velocità di elaborazione, indipendentemente dalla complessità, una configurazione con 3 RTX 3090 offre prestazioni ineguagliabili da qualsiasi sistema di memoria unificata. Con 72 GB di VRAM aggregata e una larghezza di banda di memoria totale di circa 936 GB/s, questa configurazione raggiunge 124 token/s sui modelli da 120 byte, oltre 3 volte più veloce dei 38,55 token/s di DGX Spark. ¹⁸

I compromessi sono sostanziali. Questo approccio richiede una notevole competenza tecnica per l'installazione e la configurazione, consuma 1.050 W rispetto ai 210 W di DGX Spark, richiede un ingombro fisico maggiore e non offre alcuno stack software preconfigurato. Per gli utenti che privilegiano la praticità d'uso rispetto alle prestazioni pure, DGX Spark rimane la soluzione più semplice.

Limitazioni di DGX Spark

Dichiarazioni di rendimento contro realtà

Il valore pubblicizzato di "1 petaflop" si basa sulla precisione sparsa FP4, il che inizialmente ha sollevato dubbi sulla sua applicabilità nel mondo reale. Abbiamo effettuato un benchmark della quantizzazione FP4/INT4 e abbiamo scoperto che mantiene il 98% dell'accuratezza del modello, offrendo al contempo un throughput 2,7 volte superiore rispetto a BF16. Tuttavia, il calo del 2% nell'accuratezza potrebbe essere significativo per attività critiche in termini di precisione, come la generazione di codice o il ragionamento matematico, dove piccoli errori si accumulano rapidamente.

Questo divario prestazionale può risultare stridente, soprattutto considerando il prezzo, in particolare quando le CPU server più vecchie o i cluster GPU fai-da-te economici possono superare Spark in specifici benchmark di inferenza a causa del collo di bottiglia della larghezza di banda della memoria di Spark.

Problemi relativi al software e all'assistenza

Anche la sostenibilità a lungo termine e le problematiche software rappresentano ostacoli significativi. Il sistema operativo DGX OS attualmente garantisce solo due anni di supporto, un periodo breve per hardware aziendale, e il dispositivo ha mostrato una tendenza al thermal throttling, che può causare riavvii durante periodi di utilizzo prolungati. ¹⁹

Inoltre, sebbene il sistema supporti CUDA, l'architettura ARM64 sottostante causa problemi di compatibilità imprevisti; gli sviluppatori potrebbero riscontrare la mancanza o la difficoltà di configurazione di specifici binari precompilati per librerie come PyTorch rispetto agli ambienti x86 standard.

volatilità dei prezzi

Il 27 febbraio 2026, DGX Spark ha aumentato il prezzo di listino da 3.999 a 4.699 dollari, con un incremento del 18%. L'aumento è stato giustificato da problemi di approvvigionamento della memoria LPDDR5X da 128 GB. La cronologia completa dei prezzi mostra un aumento del 56,7% dall'annuncio al CES 2025 (2.999 dollari) al prezzo di listino di febbraio 2026 (4.699 dollari), con un prezzo di spedizione intermedio di 3.999 dollari quando le unità hanno iniziato ad arrivare nell'ottobre 2025. ²⁰

Ai fini della pianificazione degli acquisti, l'andamento dei prezzi è fondamentale. Un team che aveva preventivato DGX Spark al prezzo annunciato al CES 2025 ora paga il 56,7% in più per unità, e NVIDIA non si è impegnata a ridurre il prezzo una volta che la fornitura di memoria si sarà normalizzata. Gli acquirenti che richiedono più unità per un laboratorio o un gruppo di ricerca potrebbero riscontrare ulteriori variazioni di prezzo finché la situazione globale della fornitura di memoria rimarrà critica.

Fonti e metodologia di riferimento

Questa analisi sintetizza i dati di riferimento provenienti da molteplici fonti indipendenti:

Hardware-Corner.net ²¹ : Benchmark llama.cpp di Allan Witt che confrontano DGX Spark, AMD Strix Halo e sistemi multi-GPU.
Blog ufficiale di Ollama ²² : Test di prestazione standardizzati utilizzando Ollama v0.12.6 con firmware 580.95.05.
IntuitionLabs.ai ²³ : Analisi completa con benchmark SGLang e Ollam su diverse piattaforme.
Forum Level1Techs ²⁴ : Recensione pratica di Wendell incentrata sull'ecosistema del software e sui casi d'uso pratici.
Segnale65 ²⁵ : Analisi preliminare sulla coerenza del flusso di lavoro dal desktop al data center e sull'usabilità fin dal primo giorno.
Simon Willison ²⁶ : Prospettiva degli sviluppatori sull'accesso all'ecosistema CUDA e sulle sfide di compatibilità con ARM64.
EXO Labs ²⁷ : Test di inferenza disaggregata ibrida DGX Spark + Mac Studio con misurazioni di accelerazione 2,8x.
Jeff Geerling ²⁸ : Confronto tra Dell GB10, analisi del thermal throttling e limitazioni del supporto del sistema operativo DGX.
Bandardere ²⁹ : Analisi indipendente delle prestazioni che confronta le dichiarazioni di marketing di 1 PFLOP con le misurazioni reali di 480 TFLOPS.
StorageReview ³⁰ : Benchmark di fine-tuning e inferenza batch (924 tok/s Llama 3.1 8B, 483 tok/s Qwen3 30B).

Tutti i benchmark utilizzano modelli disponibili pubblicamente con condizioni di test coerenti, ove possibile.

Conclusione

Gli utenti devono considerare DGX Spark non come un campione di prestazioni pure, ma come un kit di sviluppo accessibile e standardizzato, progettato per abbassare le barriere d'ingresso alla ricerca seria nel campo dell'intelligenza artificiale.

Il suo valore risiede nell'esperienza "day one" impeccabile; a differenza delle configurazioni fai-da-te che richiedono giorni di risoluzione dei problemi dei driver, Spark arriva con un ecosistema software maturo, una documentazione completa e playbook preconfigurati che consentono una produttività immediata. L'aumento di prezzo di febbraio 2026 non inverte questo posizionamento, ma restringe il campo delle argomentazioni sull'accessibilità, soprattutto considerando che la piattaforma AMD Ryzen AI Halo Mini-PC verrà lanciata nel secondo trimestre del 2026 con lo stesso chip Ryzen AI Max+ 395 che Framework Desktop attualmente offre a 2.348 dollari per una configurazione da 128 GB.

Offre una piattaforma stabile e supportata per i ricercatori che necessitano di convalidare i flussi di lavoro in locale prima di estenderli, fungendo di fatto da una porzione funzionale di un data center che può essere utilizzata su una scrivania.

Per approfondire

Collegamenti di riferimento

First Nvidia DGX Spark LLM Benchmarks Are In: Does It Beat Strix Halo

Hadrware Corner

NVIDIA DGX Spark Review: Pros, Cons & Performance Benchmarks | IntuitionLabs

IntuitionLabs

NVIDIA DGX Spark In-Depth Review: A New Standard for Local AI Inference - LMSYS Blog | LMSYS Org

Sebastian Raschka, PhD (@rasbt): "Saw that DGX Spark vs Mac Mini M4 Pro benchmark plot making the rounds (via LMSYS, https://lmsys.org/blog/2025-10-13-nvidia-dgx-spark/). Thought I’d share a few notes as someone who actually uses a Mac Mini M4 Pro an

Nvidia DGX Spark gets $700 price hike as memory shortages bite — Founders Edition price jumps 18% to $4,699, up from $3,999 | Tom's Hardware

Tom's Hardware

First Nvidia DGX Spark LLM Benchmarks Are In: Does It Beat Strix Halo

Hadrware Corner

NVIDIA DGX Spark performance · Ollama Blog

NVIDIA DGX Spark Review: Pros, Cons & Performance Benchmarks | IntuitionLabs

IntuitionLabs

NVIDIA Boosts DGX Spark Performance And Pushes New Developer Tools at CES 2026 | HotHardware

HotHardware

10.

Personal AI Supercomputer Powered by Blackwell | NVIDIA DGX Spark

11.

NVIDIA DGX Spark: great hardware, early days for the ecosystem

12.

NVIDIA DGX Spark First Look: A Personal AI Supercomputer on Your Desk - Signal65

Signal65

13.

NVIDIA DGX Spark Review: The AI Appliance Bringing Datacenter Capabilities to Desktops - StorageReview.com

StorageReview.com

14.

Combining NVIDIA DGX Spark + Apple Mac Studio for 4x Faster LLM Inference with EXO 1.0 | EXO

15.

First Nvidia DGX Spark LLM Benchmarks Are In: Does It Beat Strix Halo

Hadrware Corner

16.

AMD Ryzen AI Halo Mini PC Launches Q2 2026 with ROCm

TheOutpost.ai

17.

Combining NVIDIA DGX Spark + Apple Mac Studio for 4x Faster LLM Inference with EXO 1.0 | EXO

18.

First Nvidia DGX Spark LLM Benchmarks Are In: Does It Beat Strix Halo

Hadrware Corner

19.

Dell's version of the DGX Spark fixes pain points - Jeff Geerling

20.

2/23/2026 Price Change Announcement - Announcements - NVIDIA Developer Forums

21.

First Nvidia DGX Spark LLM Benchmarks Are In: Does It Beat Strix Halo

Hadrware Corner

22.

NVIDIA DGX Spark performance · Ollama Blog

23.

NVIDIA DGX Spark Review: Pros, Cons & Performance Benchmarks | IntuitionLabs

IntuitionLabs

24.

NVIDIA's DGX Spark Review and First Impressions - L1 Articles & Video-related - Level1Techs Forums

25.

NVIDIA DGX Spark First Look: A Personal AI Supercomputer on Your Desk - Signal65

Signal65

26.

NVIDIA DGX Spark: great hardware, early days for the ecosystem

27.

Combining NVIDIA DGX Spark + Apple Mac Studio for 4x Faster LLM Inference with EXO 1.0 | EXO

28.

Dell's version of the DGX Spark fixes pain points - Jeff Geerling

29.

DGX Spark’s Dirty Secret: NVIDIA’s 1 PFLOPS AI Box Delivers Half That - Banandre

30.

NVIDIA DGX Spark Review: The AI Appliance Bringing Datacenter Capabilities to Desktops - StorageReview.com

StorageReview.com

Cem Dilmegani

Analista principale

Segui

Cem è analista principale presso AIMultiple dal 2017. AIMultiple fornisce informazioni a centinaia di migliaia di aziende (secondo SimilarWeb), tra cui il 55% delle aziende Fortune 500, ogni mese. Il lavoro di Cem è stato citato da importanti pubblicazioni globali come Business Insider, Forbes, Washington Post, società globali come Deloitte e HPE, ONG come il World Economic Forum e organizzazioni sovranazionali come la Commissione Europea. È possibile consultare l'elenco di altre aziende e risorse autorevoli che hanno citato AIMultiple. Nel corso della sua carriera, Cem ha lavorato come consulente tecnologico, responsabile acquisti tecnologici e imprenditore nel settore tecnologico. Ha fornito consulenza alle aziende sulle loro decisioni tecnologiche presso McKinsey & Company e Altman Solon per oltre un decennio. Ha anche pubblicato un report di McKinsey sulla digitalizzazione. Ha guidato la strategia tecnologica e gli acquisti di un'azienda di telecomunicazioni, riportando direttamente al CEO. Ha inoltre guidato la crescita commerciale dell'azienda deep tech Hypatos, che ha raggiunto un fatturato annuo ricorrente a 7 cifre e una valutazione a 9 cifre partendo da zero in soli 2 anni. Il lavoro di Cem in Hypatos è stato oggetto di articoli su importanti pubblicazioni tecnologiche come TechCrunch e Business Insider. Cem partecipa regolarmente come relatore a conferenze internazionali di settore. Si è laureato in ingegneria informatica presso l'Università di Bogazici e ha conseguito un MBA presso la Columbia Business School.

Visualizza il profilo completo