IA

Esplora approfondimenti pratici, ricerche e benchmark sull'intelligenza artificiale, tra cui l'IA generativa, i modelli linguistici di grandi dimensioni, RAG, i framework di governance, le pratiche MLOps e l'hardware per l'IA. Acquisisci una comprensione degli strumenti chiave, delle strategie di implementazione e dei casi d'uso aziendali che stanno plasmando il panorama dell'IA.

Esplora :categoria

Programmazione AI Fondamenti di intelligenza artificiale Hardware per l'intelligenza artificiale Modelli di intelligenza artificiale Produttività dell'IA L'intelligenza artificiale nell'industria Automazione dei dati Applicazioni GenAI STRACCIO

Benchmark dei modelli tabulari: prestazioni su 19 set di dati

AI ModelsMag 22

Abbiamo effettuato un benchmark di 7 modelli di apprendimento tabulare ampiamente utilizzati su 19 dataset reali, comprendenti circa 260.000 campioni e oltre 250 caratteristiche totali, con dimensioni dei dataset che variano da 435 a quasi 49.000 righe.

Per saperne di più

LLMMag 22

Valutazione di modelli linguistici su larga scala nel: oltre 10 metriche e metodi

La valutazione dei modelli linguistici di grandi dimensioni (ovvero la valutazione dei modelli linguistici di grandi dimensioni, LLM) è la valutazione multidimensionale di tali modelli. Una valutazione efficace è fondamentale per la selezione e l'ottimizzazione degli LLM. Le aziende hanno a disposizione una vasta gamma di modelli di base e relative varianti tra cui scegliere, ma il raggiungimento del successo è incerto senza una misurazione precisa delle prestazioni.

LLMMag 22

Il panorama della valutazione LLM con i framework

La valutazione di LLM richiede strumenti che valutino il ragionamento multi-turno, le prestazioni di produzione e l'utilizzo degli strumenti. Abbiamo trascorso 2 giorni a esaminare i framework di valutazione di LLM più diffusi che forniscono metriche strutturate, log e tracce per identificare come e quando un modello si discosta dal comportamento previsto.

LLMMag 22

Leggi di scala LLM: analisi da parte di ricercatori di intelligenza artificiale

I modelli linguistici di grandi dimensioni prevedono il token successivo in base a schemi appresi dai dati testuali. Il termine leggi di scala LLM si riferisce a regolarità empiriche che collegano le prestazioni del modello alla quantità di calcolo, dati di addestramento e parametri del modello utilizzati durante l'addestramento.

LLMMag 22

Oltre 50 casi d'uso di ChatGPT con esempi concreti.

ChatGPT ha raggiunto 900 milioni di utenti attivi settimanali all'inizio del 2026, circa il 10% della popolazione mondiale. Entro la metà del 2025, OpenAI ha raggiunto 10 miliardi di dollari di entrate ricorrenti annuali. Ma cosa ne fanno questi 900 milioni di persone? OpenAI e l'economista di Harvard David Deming hanno analizzato 1,5 milioni di conversazioni per scoprirlo.

LLMMag 21

Confronto tra 9 modelli linguistici di grandi dimensioni nel settore sanitario

Abbiamo effettuato un benchmark di 9 LLM utilizzando il dataset MedQA, un benchmark per esami clinici di livello universitario derivato da domande USMLE. Ogni modello ha risposto agli stessi scenari clinici a risposta multipla utilizzando un prompt standardizzato, consentendo un confronto diretto dell'accuratezza. Abbiamo anche registrato la latenza per domanda dividendo il tempo di esecuzione totale per il numero di elementi MedQA completati.

AI HardwareMag 20

Indice dei prezzi di noleggio delle GPU cloud

Le tariffe on-demand per le GPU cloud di ultima generazione (B200, B300, MI300X, RTX 5090) sono praticamente raddoppiate nell'ultimo anno, mentre le schede mainstream (H100, H200, A100) hanno mantenuto prezzi pressoché invariati. Compiliamo mensilmente l'indice GPU da 58 provider e 17 modelli di GPU, coprendo le fasce di prezzo on-demand, spot e con abbonamento annuale.

RAGMag 20

Modelli di embedding multimodali: Apple vs Meta vs OpenAI

I modelli di embedding multimodale eccellono nell'identificazione degli oggetti ma faticano a gestire le relazioni. I modelli attuali hanno difficoltà a distinguere "telefono su una mappa" da "mappa su un telefono". Abbiamo eseguito un benchmark su 7 modelli leader su MS-COCO e Winoground per misurare questa specifica limitazione. Per garantire un confronto equo, abbiamo valutato ogni modello in condizioni identiche utilizzando l'hardware NVIDIA A40 e una precisione bfloat16.

AI HardwareMag 20

DGX Spark vs Mac Studio e Halo: benchmark e alternative

DGX Spark di NVIDIA è entrato nel mercato dell'IA desktop nel 2025 a $ 4.699, posizionandosi come un "supercomputer IA desktop". È dotato di 128 GB di memoria unificata e promette un petaflop di prestazioni IA FP4 in un case delle dimensioni di un Mac Mini.

AI HardwareMag 20

I 25+ migliori produttori di chip per intelligenza artificiale: NVIDIA e i suoi concorrenti

In base alla nostra esperienza con il benchmark GPU cloud di AIMultiple, eseguito con 10 diversi modelli di GPU in 4 diversi scenari, queste sono le migliori aziende produttrici di hardware AI per carichi di lavoro dei data center. Segui i link per scoprire le motivazioni alla base di ogni selezione: Oltre 25 produttori di chip AI per categoria *I modelli selezionati si basano sugli ultimi annunci.

AI HardwareMag 20

GPU cloud per il deep learning: disponibilità e prezzo/prestazioni

Se non hai preferenze sul modello di GPU, individua la GPU cloud più conveniente in base al nostro benchmark di 10 modelli di GPU in scenari di generazione e ottimizzazione di immagini e testo. Prezzo della GPU cloud per throughput. Due modelli di prezzo comuni per le GPU sono le istanze "on-demand" e "spot".

...5 6 7 8 9...