What are other companies in the AI chip ecosystem?

Chips and the equipment that builds them are the most complex machines ever built by humans. Though there are many companies in the semiconductor ecosystem, we focused on chip designers like NVIDIA in this article.Most chip designers outsource chip manufacturing to foundries like TSMC. Foundries use lithography equipment produced by companies like ASML to manufacture these chips. The ecosystem is supported by providers like Arm and Synopsys that supply IP and design tools.

Why is AI hardware so important?

As seen above, an increasing number of parameters, dataset size, and compute led generative AI models to become more accurate. To build better deep learning models and power generative AI applications, organizations require increased computing power and memory bandwidth.Powerful general-purpose chips (such as CPUs) cannot support highly parallelized deep learning models. Therefore, AI chips (e.g., GPUs) that enable parallel computing capabilities are increasingly in demand.Hyperscalers are responding to this by designing their own chips, a process that takes years. The rest need to follow one of these routes to build their own AI models: Rent capacity from cloud GPU providers or buy hardware from the top AI chip vendors listed in this article.AI hardware is also called neural processing units (NPUs), AI accelerators, or deep learning processors (DLPs).

IA Matériel d'IA

Les 25 principaux fabricants de puces IA : NVIDIA et ses concurrents

Cem Dilmegani

mis à jour le Mai 15, 2026

Consultez notre normes éthiques

D'après notre expérience avec le benchmark GPU cloud d'AIMultiple, réalisé sur 10 modèles de GPU différents dans 4 scénarios distincts, voici les principaux fournisseurs de matériel IA pour les charges de travail des centres de données. Cliquez sur les liens pour découvrir les raisons de chaque sélection :

Plus de 25 fabricants de puces IA par catégorie

*Les modèles sélectionnés sont basés sur les dernières annonces.

**ACCEL a été développé par des scientifiques chinois en collaboration avec Alibaba et la société chinoise Semiconductor Manufacturing International Corporation (SMIC). ¹

Le classement s'effectue par catégorie. Les fournisseurs sont classés selon leur part de marché estimée au sein des trois premières catégories (principal producteur, cloud public, cloud IA public), car les chiffres de vente ou l'utilisation du cloud peuvent être estimés. Les fournisseurs des trois dernières catégories (startup IA, producteur émergent, autres producteurs) sont classés par ordre alphabétique.

5 fournisseurs de puces d'IA mobiles

*Les chips les plus populaires et les plus récentes sont sélectionnées.

5 puces d'IA périphériques

La demande croissante de traitement à faible latence a stimulé l'innovation dans le domaine des puces d'IA embarquées. Les processeurs de ces puces sont conçus pour effectuer des calculs d'IA localement sur les appareils, sans avoir recours à des solutions basées sur le cloud.

*Il s'agit des valeurs maximales indiquées par les fournisseurs. TOPS signifie téra-opérations par seconde.

Comprendre les architectures des puces d'IA : GPU vs ASIC

Les puces d'IA ne se valent pas toutes. Bien que les fournisseurs mentionnés ci-dessus soient en concurrence sur le même marché, ils utilisent des architectures de puces fondamentalement différentes :

Les GPU (processeurs graphiques) sont des processeurs à usage général capables de gérer l'entraînement et l'inférence pour une large gamme de charges de travail en IA. Les références NVIDIA et AMD dominent cette catégorie.
Les ASIC (circuits intégrés spécifiques à une application) sont conçus sur mesure pour des tâches spécifiques. Certains prennent en charge à la fois l'entraînement et l'inférence (TPU Google, AWS Trainium), tandis que d'autres ne prennent en charge que l'inférence (Groq LPU, AWS Inferentia).

Point clé :

Tous les ASIC ne sont pas uniquement dédiés à l'inférence. Google TPU, AWS Trainium, Cerebras et SambaNova prennent en charge à la fois l'entraînement et l'inférence, tandis que Groq LPU et AWS Inferentia se concentrent exclusivement sur l'inférence.

Cette distinction est importante pour les acheteurs : les GPU offrent une flexibilité pour différentes charges de travail d’IA, tandis que les ASIC offrent de meilleures performances par watt mais sont plus difficiles à reprogrammer lorsque les architectures des modèles changent.

Selon TrendForce ² après les taux de croissance des livraisons de serveurs d’IA, les livraisons d’ASIC personnalisés des fournisseurs de cloud devraient augmenter de 44,6 % en 2026, tandis que celles des GPU devraient croître de 16,1 %. Cela témoigne d’une évolution du paysage matériel de l’IA, les hyperscalers investissant de plus en plus dans leurs propres puces.

Quels sont les principaux fabricants de puces d'IA ?

1. NVIDIA

La société NVIDIA conçoit des processeurs graphiques (GPU) pour le secteur du jeu vidéo depuis les années 1990. NVIDIA est un fabricant de puces sans usine qui sous-traite la majeure partie de sa production à TSMC . Ses principales activités sont les suivantes :

Solutions d'IA de bureau

DGX Spark (anciennement Project Digits) est un supercalculateur d'IA de bureau destiné aux ingénieurs en IA et aux data scientists :

Le coût devrait avoisiner les 3 000 $.
Il a à peu près la même taille qu'un Mac mini et est alimenté par le NVIDIA GB10 Grace Blackwell Superchip avec 128 Go de mémoire.
Capable de gérer l'inférence LLM et le réglage fin pour des modèles comportant jusqu'à 200 milliards de paramètres, en tirant parti de NVLink-C2C pour une communication CPU+GPU à haute vitesse.

Solutions pour centres de données

L'entreprise fabrique des puces d'IA basées sur ses architectures Ampere, Hopper et, plus récemment, Blackwell. Grâce à l'essor de l' IA générative , NVIDIA a enregistré d'excellents résultats ces dernières années, atteignant une valorisation d'un billion de dollars et consolidant sa position de leader sur les marchés des GPU et du matériel d'IA. Le graphique ci-dessous illustre la croissance du chiffre d'affaires de NVIDIA dans ce segment au fil des ans et son importance croissante en tant que principale source de revenus de l'entreprise.

Les puces NVIDIA sont conçues pour résoudre les problèmes des entreprises dans divers secteurs. Les puces DGX™ A100 et H100 ont été des puces d'IA phares et performantes de Nvidia, conçues pour l'entraînement et l'inférence de l'IA dans les centres de données. ³ NVIDIA ont donné suite à ces demandes avec

Puces H200, B300 et GB300
Les serveurs HGX, tels que les HGX H200 et HGX B300, intègrent 8 de ces puces.
Les séries NVL et GB200 SuperPod combinent encore plus de puces en grands groupes. ⁴

GPU dans le cloud

Grâce à la force de son offre de centres de données, NVIDIA détient presque un monopole sur le marché de l'IA dans le cloud, la plupart des acteurs du cloud ne proposant que des GPU NVIDIA comme GPU dans le cloud.

NVIDIA a également lancé son offre DGX Cloud , fournissant une infrastructure GPU cloud directement aux entreprises, en contournant les fournisseurs de cloud.

GPU pour les graphismes

La Xbox utilise un chipset co-développé par NVIDIA et Microsoft. Les GPU de NVIDIA destinés aux utilisateurs finaux incluent la série GeForce.

Développements récents

DGX Cloud Lepton

Annoncée le 19 mai 2025 lors du Computex, la plateforme DGX Cloud Lepton de NVIDIA est un marché qui met en relation les développeurs d'IA avec les fournisseurs de cloud GPU de NVIDIA, notamment CoreWeave, Lambda et Crusoe. Elle permet un accès flexible aux ressources GPU pour l'entraînement et l'inférence des modèles d'IA, en s'affranchissant des dépendances vis-à-vis des fournisseurs de cloud traditionnels. Ceci renforce la stratégie cloud de NVIDIA, axée sur les entreprises. ⁵

NVIDIA Dynamo

Dynamo, annoncé lors de la GTC 2025, est un nouveau framework d'inférence open source conçu pour le déploiement à haut débit et faible latence de modèles d'IA générative dans des environnements distribués. Il permet d'accélérer le traitement des requêtes jusqu'à 30 fois sur Blackwell, comme illustré ci-dessous. Compatible avec des outils populaires tels que PyTorch et TensorRT-LLM, ce framework exploite des innovations comme la désagrégation des étapes d'inférence et la planification dynamique des GPU pour optimiser les performances et réduire les coûts. Disponible sur GitHub pour les développeurs et inclus dans les microservices NIM pour les solutions d'entreprise, Dynamo facilite le déploiement d'IA générative de manière évolutive et économique, des systèmes mono-GPU aux systèmes multi-GPU. ⁶

Figure 1. NVIDIA Dynamo accélère considérablement les performances des modèles d'IA. Plus précisément, il offre un gain de vitesse de 30x pour le modèle DeepSeek-R1 671B sur la plateforme NVIDIA GB200 NVL72. Il double également les performances du modèle Llama 70B lors de l'utilisation de GPU Hopper. ⁷

Serveurs RTX PRO et usine d'IA d'entreprise NVIDIA

Annoncés en mai 2025 lors du Computex, les serveurs RTX PRO, équipés de GPU RTX PRO 6000 Blackwell Server Edition, sont conçus pour les environnements d'IA d'entreprise. Ils offrent une accélération universelle pour les applications d'IA, de conception, d'ingénierie et de gestion, prenant en charge des charges de travail telles que l'inférence IA multimodale, l'IA physique et les jumeaux numériques sur la plateforme Omniverse.

La conception validée de l'usine d'IA d'entreprise (réf. 991259_1943), intégrant des serveurs RTX PRO, l'Ethernet Spectrum-X (réf. 991259_1943), des DPU BlueField (réf. 991259_1943) et le logiciel d'IA d'entreprise (réf. 991259_1943), permet à des partenaires comme Cadence, Foxconn et Lilly de déployer une infrastructure d'IA sur site. Cette initiative accélère la transition du secteur informatique, un marché de mille milliards de dollars, vers des usines d'IA accélérées par GPU. ⁸

DeepSeek

La publication de la version R1 de DeepSeek a démontré que des modèles de pointe pouvaient être entraînés avec un nombre relativement restreint de GPU. Ceci a entraîné une baisse du cours de l'action de NVIDIA. Bien que cela ne constitue pas un conseil en investissement, cette situation peut être positive pour NVIDIA, car plus la puissance de calcul est utile, plus son utilisation devrait se généraliser (paradoxe de Jevons). ⁹ ).

Cependant, étant donné que les performances des systèmes GPU s'améliorent plusieurs fois par an grâce aux progrès réalisés dans la conception des puces et l'interconnexion, il serait judicieux pour les acheteurs de ne pas acheter au-delà de leurs besoins annuels, car cela peut conduire à posséder des systèmes obsolètes.

Droits de douane et restrictions à l'exportation

L'entreprise NVIDIA est désormais autorisée à exporter des processeurs d'IA avancés vers le marché chinois, ce qui marque un changement par rapport aux exigences précédentes qui n'imposaient la vente que de versions moins performantes. Cependant, ces exportations se heurtent à de nouveaux obstacles logistiques et financiers : les puces fabriquées à Taïwan doivent désormais transiter par les États-Unis pour des tests effectués par un organisme tiers, ce qui entraîne l'imposition d'un nouveau droit de douane de 25 % au titre de la sécurité nationale.

Malgré le rétablissement de l'accès aux composants haut de gamme, les coûts supplémentaires et la complexité de la chaîne d'approvisionnement continuent d'inciter le gouvernement chinois et l'industrie des semi-conducteurs à développer des alternatives locales compétitives. Bien que les puces chinoises soient actuellement moins performantes que la technologie la plus récente de NVIDIA, ces barrières commerciales garantissent que le développement national demeure une priorité stratégique, ce qui pourrait remettre en cause la domination du marché de NVIDIA à l'avenir. ¹⁰

Inférence sur la concurrence sur le marché

Alors que NVIDIA domine le marché de l'« entraînement » de l'IA, la concurrence s'intensifie dans le domaine de l'« inférence », c'est-à-dire le déploiement de modèles d'IA pour des tâches concrètes. Des entreprises comme AMD et de nombreuses start-ups, dont Untether AI et Groq, développent des puces visant à fournir des solutions d'inférence plus économiques, en privilégiant notamment une faible consommation d'énergie.

Les nouvelles techniques d'IA de « raisonnement » exigent une puissance de calcul accrue. NVIDIA estime que le raisonnement favorisera son architecture à long terme et prévoit que le marché de l'inférence finira par surpasser celui de l'entraînement, même si sa part de marché est plus faible. ¹¹

2. AMD

AMD est un fabricant de puces sans usine proposant des produits CPU, GPU et accélérateurs d'IA.

Nvidia a lancé le MI300 pour les charges de travail d'entraînement d'IA en juin 2023 et est en concurrence avec le MI300 pour les parts de marché. De nombreuses startups, instituts de recherche, entreprises et géants de la technologie ont adopté le matériel Nvidia en 2023, car ce dernier est devenu difficile à obtenir en raison de la demande croissante, notamment avec l'essor de l'IA générative déclenché par le lancement de ChatGPT . ¹² ¹³ ¹⁴

En 2025, AMD a annoncé l'acquisition d'une équipe talentueuse d'ingénieurs en matériel et logiciel d'IA provenant d'Untether AI, développeur de puces d'inférence d'IA écoénergétiques pour les fournisseurs de services en périphérie et les centres de données d'entreprise. Cette acquisition renforce les capacités de AMD en matière de compilation d'IA, de développement de noyaux et de conception de puces, consolidant ainsi sa position sur le marché de l'inférence. Par ailleurs, AMD a acquis la startup de compilation Brium afin d'optimiser les performances d'IA sur ses GPU Instinct pour centres de données, destinés aux applications d'entreprise. ¹⁵

AMD lancera la série MI350 pour remplacer la MI300 et concurrencer la H200 de NVIDIA. AMD affirme que la MI325X, une autre puce récente, offre des performances d'inférence de pointe. ¹⁶

AMD travaille également avec des sociétés d'apprentissage automatique comme Hugging Face pour permettre aux data scientists d'utiliser leur matériel plus efficacement. ¹⁷

L'écosystème logiciel est crucial, car les performances matérielles dépendent fortement de l'optimisation logicielle. Par exemple, AMD et NVIDIA ont publiquement divergé au sujet de l'évaluation comparative des performances des processeurs H100 et MI300. Le désaccord portait sur le choix du package et du type de calcul en virgule flottante. D'après les derniers tests, il semblerait que le MI300 soit aussi performant, voire plus performant, que le H100 pour l'inférence sur un LLM de 70 octets. ¹⁸

Logiciel

Alors que le matériel AMD rattrape son retard sur NVIDIA, son logiciel reste à la traîne en termes d'ergonomie. Si CUDA fonctionne immédiatement pour la plupart des tâches, le logiciel AMD nécessite une configuration importante. ¹⁹

Écosystème

Comme NVIDIA, AMD investit de manière sélective dans les utilisateurs de ses solutions pour stimuler l'adoption de son matériel. ²⁰

3. Intel

Intel est un acteur majeur du marché des processeurs et bénéficie d'une longue expérience dans le développement des semi-conducteurs. Contrairement à NVIDIA et AMD, Intel utilise sa propre fonderie pour fabriquer ses puces.

Gaudi3 est le dernier processeur accélérateur d'IA de Intel. ²¹ Cependant, les prévisions de ventes de Intel pour Gaudi3 étaient d'environ 500 millions de dollars pour 2024, ce qui est nettement inférieur aux milliards que AMD prévoit de gagner en 2024.

Intel rencontre des problèmes de gouvernance, comme en témoigne le départ de son PDG, Pat Gelsinger, en décembre 2024. Une part importante des membres du conseil d'administration de Intel manque d'expérience dans la direction opérationnelle d'une entreprise de semi-conducteurs. ²² Suite au départ de son PDG, la stratégie de Intel sur les marchés de l'IA et de la fonderie reste floue.

Quels fournisseurs de cloud public produisent des puces d'IA ?

4. AWS

AWS produit des puces Tranium pour l'entraînement des modèles et des puces Inferentia pour l'inférence. Bien qu'AWS soit le leader du marché du cloud public, l'entreprise a commencé à développer ses propres puces après 1876.

Des centaines de milliers de puces Tranium2 sont utilisées pour former le cluster du projet Rainier, qui alimente les modèles du développeur LLM Anthropic.

5. Google Plateforme Cloud

La puce Cloud TPU (réf. 991259_1876) est un accélérateur d'apprentissage automatique conçu spécifiquement pour les produits Cloud TPU tels que Traduction, Photos, Recherche, Assistant et Gmail. Elle est également accessible via le Cloud. Cloud TPU a annoncé ses TPU en 2016. ²³ La dernière version de Trillium TPU est la 6e génération. ²⁴

Google a introduit Ironwood. Cette dernière génération est spécialement conçue pour les « modèles de pensée » complexes comme les LLM et les MoE, offrant un traitement parallèle massif (4 614 TFLOPS par puce) et une évolutivité jusqu'à 42,5 exaflops dans des modules de 9 216 puces. ²⁵

Ironwood offre des améliorations significatives par rapport à Trillium, notamment une efficacité énergétique deux fois supérieure, une capacité de mémoire à large bande passante six fois plus importante (192 Go/puce), une bande passante HBM 4,5 fois plus élevée (7,2 To/s/puce) et une vitesse d'interconnexion inter-puces 1,5 fois plus rapide (1,2 Tbit/s). Il intègre également un SparseCore amélioré pour les intégrations de grande taille. Ironwood produit également l'Edge TPU, beaucoup plus compact, pour répondre à différents besoins et est conçu pour être déployé sur des appareils périphériques tels que les smartphones et les objets connectés.

6. Alibaba

Alibaba produit des puces telles que la Hangangug 800 pour l'inférence. Cependant, certaines organisations nord-américaines, européennes et australiennes (notamment dans le secteur de la défense) pourraient préférer ne pas utiliser Alibaba Cloud pour des raisons géopolitiques.

7. IBM

IBM a annoncé sa dernière puce d'apprentissage profond, l'unité d'intelligence artificielle (AIU), en 2022. ²⁶ IBM envisage d'utiliser ces puces pour alimenter sa plateforme d'IA générative Watsonx. ²⁷

L'unité d'intelligence artificielle (AIU) IBM s'appuie sur le processeur Telum IBM, qui alimente les capacités de traitement de l'IA des serveurs mainframe Z IBM. À son lancement, la détection de la fraude figurait parmi les cas d'utilisation mis en avant pour les processeurs Telum. ²⁸

Le projet IBM a également démontré que la fusion du calcul et de la mémoire pouvait engendrer des gains d'efficacité. Ces gains ont été mis en évidence dans le prototype de processeur du Pôle Nord. ²⁹

8. Huawei

Le HiSilicon Ascend 910C de Huawei fait partie de la famille de puces Ascend 910 introduite en 2019.

En raison des sanctions, les laboratoires d'IA en Chine ne peuvent pas acheter les puces les plus récentes et les plus performantes auprès de sociétés américaines comme NVIDIA ou AMD. Par conséquent, ils expérimentent avec l'Ascend 910C.

Le cloud de Huawei héberge des modèles DeepSeek, et un chercheur de DeepSeek affirme qu'il peut atteindre 60 % des performances d'inférence de NVIDIA H100. ³⁰

Quels fournisseurs de services d'IA dans le cloud produisent leurs propres puces ?

Ces fournisseurs ne proposent pas de clouds publics aux capacités aussi complètes que les hyperscalers. Ils offrent des services cloud limités, généralement axés sur l'inférence IA. Nous avons pu souscrire à ces services sans avoir à contacter leurs équipes commerciales.

9. Groq

Groq a été fondée par d'anciens employés de [nom de l'entreprise manquante]. La société représente les LPU, un nouveau modèle d'architecture de puces d'IA, qui vise à simplifier l'adoption de ses systèmes par les entreprises. La startup a déjà levé environ 350 millions de dollars et produit ses premiers modèles, tels que le processeur GroqChip™ et l'accélérateur GroqCard™.

L'entreprise se concentre sur l'inférence LLM et a publié des benchmarks pour Llama-2 70B. ³¹

Groq a récemment obtenu un important engagement d'investissement de 1,5 milliard de dollars de la part de l'Arabie saoudite afin d'étendre la distribution de ses puces d'IA avancées dans le pays. Cet investissement servira à agrandir le centre de données existant de Groq à Dammam, en Arabie saoudite, construit en partenariat avec Aramco Digital. ³²

Au premier trimestre 2024, la société a annoncé que 70 000 développeurs s’étaient inscrits sur sa plateforme cloud et avaient créé 19 000 nouvelles applications. ³³

Le 1er mars 2022, Groq a acquis Maxeler, qui propose des solutions de calcul haute performance (HPC) pour les services financiers. ³⁴

10. SambaNova Systèmes

SambaNova Systems a été fondée en 2017 pour développer des systèmes matériels et logiciels haute performance et haute précision destinés aux charges de travail d'IA générative à haut volume. L'entreprise a levé plus de 1,5 milliard de dollars de fonds, dont 350 millions de dollars lors d'un tour de table de série E en février 2026. ³⁵

En février 2026, SambaNova a dévoilé la puce SN50, sa toute dernière unité de données reconfigurable (RDU), revendiquant une vitesse maximale cinq fois supérieure à celle des puces concurrentes et un coût total de possession trois fois inférieur à celui des GPU pour les charges de travail d'IA agentielle. La SN50 offre une puissance de calcul cinq fois supérieure par accélérateur et une bande passante réseau quatre fois supérieure à celle de la génération précédente, la SN40L, et prend en charge une architecture mémoire à trois niveaux pour des modèles comportant plus de 10 000 milliards de paramètres et plus de 10 millions de longueurs de contexte de jetons. ³⁶

SoftBank Corp. sera le premier client à déployer le SN50 au sein de ses centres de données d'IA de nouvelle génération au Japon.

SambaNova a également annoncé une collaboration stratégique pluriannuelle prévue avec Intel pour fournir des solutions d'inférence d'IA, combinant les systèmes de SambaNova avec les processeurs Xeon de Intel, les GPU de Intel et le réseau de Intel pour alimenter une infrastructure d'inférence évolutive comme alternative aux solutions centrées sur le GPU.

Il est important de noter que SambaNova Systems propose également sa plateforme en location aux entreprises via SambaCloud. Cette approche de plateforme d'IA en tant que service facilite l'adoption de leurs systèmes et encourage la réutilisation du matériel dans une optique d'économie circulaire. ³⁷

To get up to date on enterprise AI and software, follow us:

Cem Dilmegani

Principal Analyst

Suivre

Quelles sont les principales startups spécialisées dans les puces d'IA ?

Nous souhaitons également vous présenter quelques start-ups du secteur des puces d'IA dont nous entendrons probablement parler plus souvent dans un avenir proche. Bien que ces entreprises soient de création récente, elles ont déjà levé des millions de dollars.

11. Cerebras

Cerebras a été fondée en 2015 et est le seul grand fabricant de puces à se concentrer sur les puces à l'échelle de la plaquette. Les puces à l'échelle de la ³⁸ présentent des avantages en matière de parallélisme par rapport aux GPU, grâce à leur bande passante mémoire plus élevée. Cependant, la conception et la fabrication de telles puces constituent une technologie émergente.

Les puces Cerebras comprennent :

WSE-1 avec 1,2 billion de transistors et 400 000 cœurs de traitement.
Le WSE-2, doté de 2 600 milliards de transistors et de 850 000 cœurs, a été annoncé en avril 2021. Il exploite le procédé de gravure 7 nm de TSMC.
Le WSE-3, doté de 4 billions de transistors et de 900 000 cœurs d'IA, a été annoncé en mars 2024. Il exploite le procédé 5 nm de TSMC. ³⁹

Le système de Celebra est utilisé par des entreprises pharmaceutiques telles qu'AstraZeneca et GlaxoSmithKline, ainsi que par des laboratoires de recherche qui l'utilisent pour leurs simulations. Il cible également les fabricants de modèles de simulation à grande échelle (LLM), car ses puces permettent de réduire les coûts d'inférence pour les modèles de pointe.

Cerebras propose également ses puces sur son cloud aux entreprises.

12. d-Matrix

Le projet d-Matrix propose une approche novatrice, abandonnant l'architecture traditionnelle de von Neumann au profit du calcul en mémoire. Bien que cette approche puisse potentiellement résoudre le problème de la goulot d'étranglement entre la mémoire et le calcul, elle reste nouvelle et non encore éprouvée. ⁴⁰

13. Rébellions

Une start-up basée en Corée a levé 124 millions de dollars en 2024 et se concentre sur l'inférence LLM. ⁴¹

Rebellions a fusionné avec une autre entreprise coréenne de conception de semi-conducteurs, SAPEON, et a atteint une valorisation de licorne en 2024. ⁴²

En juillet 2025, Rebellions a obtenu un investissement du géant technologique Samsung dans le cadre d'une levée de fonds visant jusqu'à 200 millions de dollars, en prévision de son introduction en bourse. Depuis sa création en 2020, l'entreprise a levé 220 millions de dollars et collabore avec Samsung pour commercialiser sa puce de deuxième génération, Rebel-Quad (composée de quatre puces Rebel AI), prévue plus tard en 2025, en tirant parti du procédé de fabrication 4 nanomètres de Samsung. ⁴³

14. Tenstorrent

Le dernier processeur Blackhole Tensix de Tenstorrent offre une performance de 664 TFLOPS (BLOCKFP8), associée à 32 Go de mémoire GDDR6 et une bande passante mémoire de 512 Go/s.

La carte P150a est proposée à 1 399 $ et dispose de quatre ports QSFP-DD 800G pour une configuration multi-cartes. Le modèle d'entrée de gamme P100a est disponible à partir de 999 $. ⁴⁴

Tenstorrent propose une suite logicielle entièrement open source. L'entreprise a levé 700 millions de dollars auprès d'investisseurs, dont Jeff Bezos, en décembre 2024, pour une valorisation de plus de 2,6 milliards de dollars. ⁴⁵

15. Positron

Fondée en 2023, Positron se consacre exclusivement à l'inférence de modèles de type transformeur. L'entreprise privilégie une approche ASIC, concevant du matériel dédié et optimisé spécifiquement pour les architectures de type transformeur plutôt que pour le calcul GPU à usage général.

Produits :

Atlas (disponible dès maintenant) : Serveur d'inférence par transformateurs doté de 8 accélérateurs de transformateurs Positron Archer et de 256 Go de mémoire HBM. Le constructeur annonce des performances par watt supérieures à 4 et des performances par dollar supérieures à 3 par rapport aux systèmes Hopper (référence 991259_1943), mesurées sur Llama 3.1 8B avec une puissance de calcul BF16. ⁴⁶
Titan (disponible en 2027) : Un système de nouvelle génération doté de plus de 8 To de mémoire, alimenté par 4 puces personnalisées Asimov, conçu pour prendre en charge jusqu'à 16 billions de modèles de paramètres et plus de 10 millions de fenêtres de contexte de jetons dans un format 4U refroidi par air. ⁴⁷
Asimov (disponible en 2027) : Puce de silicium d’accélération d’inférence personnalisée avec plus de 2 To de mémoire par puce.

Positron a levé plus de 230 millions de dollars lors d'un tour de table de série B début 2026 auprès d'investisseurs tels que QIA, Arm Holdings, Arena et Jump Trading. ⁴⁸

Atlas est actuellement utilisé par des entreprises des secteurs des réseaux, des jeux vidéo, de la modération de contenu, des CDN et du Token-as-a-Service. Positron affirme que son système Atlas a démontré une latence de bout en bout trois fois inférieure pour les charges de travail d'inférence de trading par rapport aux systèmes H100 comparables, tout en consommant un tiers de l'énergie.

Les puces de Positron sont conçues, fabriquées et assemblées aux États-Unis.

16. _gravé

Leur approche sacrifie la flexibilité à l'efficacité en intégrant l'architecture du transformateur directement dans leurs puces.

L'équipe affirme

Sohu a conçu le premier circuit intégré spécifique (ASIC) pour transformateur au monde.
Ces 8 puces Sohu peuvent générer plus de 500 000 jetons par seconde. C'est un ordre de grandeur supérieur à ce que peuvent produire 8 puces B200 (NVIDIA).

Actuellement, ces données sont basées sur les mesures internes de l'équipe. Les équipes d'AIMultiple n'ont pas encore trouvé de points de référence ni de références clients. Nous nous interrogeons sur :

Que se passe-t-il lorsque le modèle devient obsolète ? Les utilisateurs doivent-ils acheter une nouvelle puce, ou l’ancienne puce peut-elle être reconfigurée avec le modèle suivant ?
Comment ont-ils réalisé leur test de performance ? Quelle quantification et quel modèle ont été utilisés ?

Nous mettrons cet article à jour dès que l'équipe _etched publiera plus de détails. Il sera intéressant de voir si la gravure de modèles sur puce sera viable, compte tenu de la sortie de nouveaux modèles tous les quelques mois.

17. Taalas

Taalas a été fondée début 2023 et adopte l'approche la plus extrême en matière de spécialisation des puces d'IA : intégrer directement des modèles individuels dans du silicium personnalisé, produisant ce que l'entreprise appelle des « modèles hardcore ». ⁴⁹ L’entreprise affirme pouvoir transformer n’importe quel modèle d’IA jamais vu auparavant en silicium personnalisé en deux mois.

L'architecture de Taalas unifie le stockage et le calcul sur une seule puce avec une densité équivalente à celle de la DRAM, éliminant ainsi le besoin de mémoire HBM, d'encapsulation avancée, d'empilement 3D, de refroidissement liquide ou d'E/S à haut débit. L'entreprise décrit cela comme une simplification radicale de la pile matérielle.

Produits :

HC1 (disponible dès maintenant) : Démonstrateur technologique intégrant Llama 3.1 8B, gravé en 6 nm par TSMC et doté de 53 milliards de transistors. Taalas annonce un débit de 17 000 jetons par seconde et par utilisateur, soit près de 10 fois plus rapide que les solutions actuelles, pour un coût de fabrication 20 fois inférieur et une consommation énergétique 10 fois moindre dans un serveur de 2,5 kW refroidi par air. Cependant, ce modèle utilise une quantification personnalisée agressive sur 3 et 6 bits, ce qui entraîne une dégradation des performances par rapport aux GPU de référence. ⁵⁰
HC2 (prévu) : Une plateforme de deuxième génération avec une densité plus élevée, une exécution plus rapide et des formats à virgule flottante standard de 4 bits pour remédier aux limitations de quantification de HC1.

Taalas a levé plus de 200 millions de dollars, mais affirme n'avoir dépensé que 30 millions de dollars pour commercialiser son premier produit avec une équipe de 24 personnes.

18. Extropique

Extropic a levé 14 millions de dollars fin 2023 pour exploiter la thermodynamique dans le domaine du calcul. L'entreprise n'a pas encore commercialisé de puce.

19. Vaire

Vaire est une start-up britannique pionnière en informatique réversible, une approche innovante visant à créer des puces à consommation d'énergie quasi nulle. Contrairement à l'informatique traditionnelle, où l'énergie est dissipée sous forme de chaleur, l'informatique réversible recycle une part importante de l'énergie pour les calculs suivants.

Vaire a présenté une puce de test capable de récupérer 50 % de son énergie, démontrant ainsi le potentiel de cette technologie pour réduire la consommation d'énergie des charges de travail d'IA et contourner les limitations physiques, ou barrière thermique, qui constituent un défi pour la fabrication moderne des semi-conducteurs. ⁵¹

20. Fractile

Fractile est une startup britannique spécialisée dans les puces d'inférence IA qui est sortie de l'ombre en juillet 2024 avec un financement de 15 millions de dollars pour défier NVIDIA sur l'inférence de modèles de pointe. ⁵²

L'entreprise conçoit des processeurs qui entrelacent physiquement la mémoire et le calcul sur une même puce, ce qui, selon elle, résout le problème de la faible latence et du débit élevés simultanés que les GPU ne peuvent satisfaire pour l'inférence de modèles de pointe. Fractile affirme que sa conception permet d'exécuter des modèles de pointe jusqu'à 25 fois plus rapidement et à un dixième du coût des solutions existantes, avec pour objectif de traiter des milliers de jetons par seconde pour des milliers d'utilisateurs simultanés.

Fractile a son siège social à Londres, son ingénierie matérielle à Bristol, et a été présenté par le Financial Times en mars 2025 comme faisant partie d'une vague de startups axées sur l'inférence qui remettent en cause la domination de NVIDIA. ⁵³

Quels sont les futurs fabricants de matériel d'IA ?

Bien que ces solutions matérielles d'IA soient prometteuses, il existe actuellement peu de points de repère concernant leur efficacité, car elles sont nouvelles sur le marché.

21. Pomme

Le projet ACDC d'Apple serait axé sur la conception de puces pour l'inférence par intelligence artificielle. ⁵⁴ Apple est déjà un important concepteur de puces avec ses semi-conducteurs conçus en interne et utilisés dans les iPhones, les iPads et les MacBooks.

22. Meta

Meta Training and Inference Accelerator (MTIA) est une famille de processeurs pour les charges de travail d'IA telles que l'entraînement des modèles LLaMa de Meta.

Le dernier modèle MTIA, Next Gen MTIA, est basé sur la technologie TSMC 5 nm et promet des performances trois fois supérieures à celles du MTIA v1. Le MTIA sera installé dans des racks pouvant contenir jusqu'à 72 accélérateurs. ⁵⁵

MTIA est actuellement réservé à un usage interne par Meta. Cependant, si Meta lançait à l'avenir une offred'IA générative d'entreprise basée sur LLaMa, ces puces pourraient alimenter cette offre.

23. Microsoft Azure

Lors de Hot Chips 2024, Microsoft a dévoilé Maia 100, son premier accélérateur d'IA personnalisé conçu pour optimiser les charges de travail d'IA à grande échelle en Azure grâce à une co-optimisation matérielle et logicielle. Basé sur le procédé N5 de TSMC avec une technologie de mémoire et d'interconnexion avancée, Maia 100 cible un débit élevé et divers formats de données, offrant aux développeurs une grande flexibilité grâce à son SDK pour un déploiement rapide des modèles PyTorch et Triton. Cependant, la puce d'IA de nouvelle génération de Microsoft, nom de code Braga, subit des retards de 2025 à 2026 en raison de modifications de conception, de contraintes de personnel et d'un fort taux de rotation du personnel, ce qui pourrait entraîner un retard en termes d'efficacité énergétique par rapport à la puce Blackwell de Nvidia.

24. OpenAI

OpenAI finalise la conception de sa première puce d'IA avec Broadcom et TSMC, en utilisant la technologie 3 nanomètres de TSMC. L'équipe dirigeante de OpenAI possède une expérience en conception de TPU acquise chez Google, et vise une production en série de sa puce en 2026. ⁵⁶

Quels sont les autres fabricants de puces IA ?

25. Graphcore

Graphcore est une société britannique fondée en 2016. Elle a annoncé que sa puce phare d'IA s'appelait IPU-POD256. Graphcore a déjà levé environ 700 millions de dollars.

L'entreprise a noué des partenariats stratégiques avec des sociétés de stockage de données telles que DDN, Pure Storage et Vast Data. Ses puces d'IA sont utilisées par des instituts de recherche comme l'Oxford-Man Institute of Quantitative Finance, l'Université de Bristol et l'Université de Californie à Berkeley.

La viabilité à long terme de l'entreprise était menacée car elle perdait environ 200 millions de dollars par an. ⁵⁷ Graphcore a été acquis par SoftBank pour plus de 600 millions de dollars en octobre 2024. ⁵⁸

26. Mythique

Fondée en 2012, Mythic se spécialise dans l'IA en périphérie. Mythic adopte une approche non conventionnelle, basée sur une architecture de calcul analogique, visant à fournir une informatique d'IA en périphérie écoénergétique.

Elle a développé des produits tels que le M1076 AMP et la carte-clé MM1076, et a déjà levé environ 165 millions de dollars de fonds. ⁵⁹

Mythic a licencié la majeure partie de son personnel et restructuré son activité lors de sa levée de fonds de mars 2023. ⁶⁰

27. Speedata

Fondée en 2019 à Tel Aviv, Speedata développe une unité de traitement analytique (APU) conçue pour accélérer l'analyse des données massives et les charges de travail d'IA. Cette APU cible les charges de travail Apache Spark, avec pour objectif la prise en charge d'autres plateformes majeures d'analyse de données.

Speedata a levé 44 millions de dollars lors d'un tour de table de série B en juin 2025, mené par Walden Catalyst Ventures, 83North et d'autres investisseurs, portant son financement total à 114 millions de dollars. L'entreprise affirme que son APU surpasse les processeurs et GPU à usage général en remplaçant des racks de serveurs par une seule puce, offrant ainsi des performances et une efficacité énergétique supérieures pour le traitement des données. ⁶¹

28. Axelera IA

Fondée en juillet 2021 à Eindhoven, aux Pays-Bas, Axelera AI est spécialisée dans les technologies d'accélération matérielle pour l'IA, notamment pour la vision par ordinateur et l'IA générative. L'entreprise développe Titania, un chiplet d'inférence IA basé sur son architecture D-IMC (Digital In-Memory Computing), conçu pour accélérer les charges de travail d'IA du périphérique au cloud.

Axelera AI a obtenu un financement de 61,6 millions d'euros auprès de l'entreprise commune EuroHPC (JU) et des États membres dans le cadre du projet DARE en mars 2025, après une première levée de fonds de série B de 68 millions de dollars. Ce financement porte son total à plus de 200 millions de dollars en trois ans. Axelera AI ambitionne de déployer Titania d'ici 2028 afin de répondre à la demande croissante de solutions d'IA performantes, économiques et durables, en mettant l'accent sur sa capacité à améliorer le débit et l'efficacité par rapport aux solutions cloud traditionnelles. ⁶²

Les partenaires fondeurs et le rôle de TSMC

En tant que premier fondeur mondial spécialisé, TSMC fabrique des semi-conducteurs à partir des conceptions de ses clients plutôt que de créer ses propres puces, ce qui la distingue d'entreprises comme Samsung Foundry et Samsung Foundry Services. Bien que Samsung Foundry et Samsung Foundry Services soient des concurrents dans ce domaine, TSMC conserve une avance technologique.

Ses technologies de pointe en matière de processus, notamment ses nœuds pionniers de 5 nm et 3 nm, offrent la combinaison essentielle de performances et d'efficacité énergétique requise pour les applications d'IA de pointe, comme le montrent ses partenariats de fabrication avec les concepteurs de puces d'IA énumérés ci-dessous :

Plans d'expansion

TSMC recherche des investisseurs parmi Nvidia, Broadcom et Nvidia pour créer une coentreprise chargée de gérer la division fonderie de Nvidia. Ces investisseurs conserveraient le contrôle opérationnel, mais détiendraient moins de 50 % du capital. Cette initiative, soutenue par l'administration Trump, fait suite à l'annonce par TSMC d'un investissement important aux États-Unis et vise à relancer Nvidia et à renforcer la production de puces américaine. L'accord se heurte à des difficultés liées aux différences de procédés, mais s'appuie sur les atouts de TSMC en tant que fonderie de premier plan. ⁶³ ⁶⁴

Quels sont les fabricants de puces d'IA en Chine ?

En raison des sanctions américaines empêchant de nombreuses entreprises chinoises d'acquérir les puces d'IA les plus avancées de AMD et NVIDIA, les acheteurs chinois ont augmenté leurs achats auprès des producteurs locaux.

Outre Huawei et Alibaba, mentionnés ci-dessus, voici les principaux producteurs de puces d'IA en Chine :

Cambricon se concentre sur le matériel d'IA et prévoit un chiffre d'affaires d'environ 150 millions de dollars pour son dernier exercice. ⁶⁵
Baidu utilise des puces Kunlun dans son cloud et conçoit actuellement la puce de troisième génération. La Kunlun 2 était comparable à la puce A100 (référence 991259_1943).
Biren , fondée par des anciens élèves de NVIDIA, produit des puces GPU BR106 et BR110.
Moore Threads produit les GPU MTT S2000.

FAQ

Les puces et les équipements qui permettent leur fabrication constituent les machines les plus complexes jamais conçues par l'homme. Bien que l'écosystème des semi-conducteurs comprenne de nombreuses entreprises, nous nous sommes concentrés dans cet article sur des concepteurs de puces comme NVIDIA.
La plupart des concepteurs de puces sous-traitent leur fabrication à des fonderies comme TSMC. Ces fonderies utilisent des équipements de lithographie produits par des entreprises telles qu'ASML pour fabriquer ces puces. L'écosystème est soutenu par des fournisseurs comme Arm et Synopsys qui proposent des propriétés intellectuelles et des outils de conception.

Comme indiqué précédemment, l'augmentation du nombre de paramètres, de la taille des ensembles de données et de la puissance de calcul a permis d'améliorer la précision des modèles d'IA générative. Pour concevoir de meilleurs modèles d'apprentissage profond et optimiser les applications d'IA générative, les organisations ont besoin d'une puissance de calcul et d'une bande passante mémoire accrues.
Les puces généralistes puissantes (comme les processeurs) ne peuvent pas prendre en charge les modèles d'apprentissage profond hautement parallélisés. Par conséquent, les puces d'IA (par exemple, les GPU) qui permettent des capacités de calcul parallèle sont de plus en plus demandées.
Les géants du cloud réagissent en concevant leurs propres puces, un processus qui prend des années. Les autres acteurs doivent emprunter l'une de ces voies pour développer leurs propres modèles d'IA : louer de la capacité auprès de fournisseurs de GPU cloud ou acheter du matériel auprès des principaux fabricants de puces d'IA mentionnés dans cet article.
Le matériel d'IA est également appelé unités de traitement neuronal (NPU), accélérateurs d'IA ou processeurs d'apprentissage profond (DLP).

Pour en savoir plus

Pour des comparaisons pratiques des performances des puces présentées dans cet article, consultez nos benchmarks :

Benchmark multi-GPU : Comment les B200, H200, H100 de NVIDIA et le MI300X de AMD évoluent sur des configurations à 1, 2, 4 et 8 GPU pour l'inférence LLM, avec une analyse du débit, de la latence et du coût par jeton.
Benchmark de concurrence GPU : Comment les B200, H200, H100 de NVIDIA et le MI300X de AMD gèrent 1 à 512 requêtes simultanées, y compris le débit du système, la vitesse par requête, la latence de bout en bout et les jetons par dollar à chaque niveau de concurrence.

Références

Liens de référence

Good News For Alibaba - ACCEL Chip Outshines Nvidia's AI Chips, China Claims - Alibaba Gr Hldgs (NYSE:BAB - Benzinga

Benzinga

ASIC Set to Outpace GPU? NVIDIA’s Scale-Up and Beyond | TrendForce

TrendForce

NVIDIA Corporation - Financial Reports

DGX Platform: Built for Enterprise AI | NVIDIA

DGX GB200: AI Infrastructure for State-of-the-Art AI Models | NVIDIA

Nvidia Pushes Further Into Cloud With GPU Marketplace - WSJ

The Wall Street Journal

NVIDIA Dynamo, A Low-Latency Distributed Inference Framework for Scaling Reasoning AI Models | NVIDIA Technical Blog

NVIDIA Developer

NVIDIA Dynamo, A Low-Latency Distributed Inference Framework for Scaling Reasoning AI Models | NVIDIA Technical Blog

NVIDIA Developer

NVIDIA RTX PRO Servers Speed Trillion-Dollar Enterprise IT Industry Transition to AI Factories | NVIDIA Newsroom

10.

Jevons paradox - Wikipedia

Contributors to Wikimedia projects

11.

Trump imposes 25% tariff on Nvidia AI chips and others, citing national security | Nvidia | The Guardian

The Guardian

12.

Nvidia CEO to defend AI dominance as competition intensifies | Reuters

Reuters

13.

Announcing AI2 OLMo, an Open Language Model Made by Scientists, for Scientists | by Ai2 | Ai2 Blog | Medium

Ai2 Blog

14.

Training LLMs at Scale with AMD MI250 GPUs | Databricks Blog

15.

Training 221B Parameter Korean LLM on 1,200 AMD MI250 GPU Cluster – Moreh

16.

Exclusive: AMD Acquires Team Behind AI Chip Startup Untether AI

17.

AMD Delivers Leadership AI Performance with AMD Instinct MI325X Accelerators :: Advanced Micro Devices, Inc. (AMD)

18.

AMD + 🤗: Large Language Models Out-of-the-Box Acceleration with AMD GPU

Hugging Face

19.

Achieving Top Inference Performance with the NVIDIA H100 Tensor Core GPU and NVIDIA TensorRT-LLM | NVIDIA Technical Blog

NVIDIA Developer

20.

MI300X vs H100 vs H200 Benchmark Part 1: Training - CUDA Moat Still Alive

SemiAnalysis

21.

Exclusive | AMD Invests in Drug-Discovery Company Absci in Push to Sell AI Chips - WSJ

The Wall Street Journal

22.

Intel Breaks Down Proprietary Walls to Bring Choice to Enterprise GenAI Market - Intel Newsroom

Intel Corporation

23.

The Death of Intel: When Boards Fail - by Doug O'Laughlin

Fabricated Knowledge

24.

Google supercharges machine learning tasks with TPU custom chip | Google Cloud Blog

Google Cloud

25.

Introducing Trillium, sixth-generation TPUs | Google Cloud Blog

Google Cloud

26.

Ironwood: The first Google TPU for the age of inference

Google

27.

IBM’s new AIU artificial intelligence chip - IBM Research

IBM

28.

Can an in-house AI chip save IBM's cost of operating WatsonX?

TechHQ

29.

Telum Processor: IBM’s newest chip - IBM Research

IBM

30.

‘Mind-blowing’ IBM chip speeds up AI

Nature Publishing Group UK

31.

Tech war: China’s chip firms embrace DeepSeek in AI self-sufficiency drive | South China Morning Post

South China Morning Post

32.

Groq Sets New Large Language Model Performance Record of 300 Tokens per Second per User on Meta AI Foundational LLM, Llama-2 70B

Cision PR Newswire

33.

AI chip startup Groq secures $1.5 billion commitment from Saudi Arabia | Reuters

Reuters

34.

Real-time AI Inference Demand Accelerates on GroqCloud | Groq is fast, low cost inference.

35.

Groq Acquires Dataflow Systems Pioneer Maxeler Technologies

Cision PR Newswire

36.

SambaNova Unveils Fastest Chip for Agentic AI, Collaborates with Intel, and Raises $350M+

SambaNova

37.

Introducing the SN50 RDU: Purpose-Built for Agentic Inference

SambaNova

38.

SambaCloud | Full-Stack AI Platform for Large Open-Source Models

39.

Cerebras Systems - Wikipedia

Contributors to Wikimedia projects

40.

Cerebras Systems Unveils World’s Fastest AI Chip with Whopping 4 Trillion Transistors - Cerebras

41.

https://www.d-matrix.ai/wp-content/uploads/2023/09/d-Matrix-WhitePaper-Approved-w-cover.pdf

42.

Korean AI chipmaker Rebellions Closes $124M Series B Fundraise - Rebellions

Rebellions

43.

Rebellions and SAPEON Korea Sign Definitive Merger Agreement - Rebellions

Rebellions

44.

Samsung backs AI chip startup Rebellions ahead of IPO

CNBC

45.

https://tenstorrent.com/hardware/cards

46.

Jeff Bezos Is Betting on AI Chip Startup Tenstorrent to Take on Nvidia (NVDA) - Bloomberg

The path to ubiquitous AI | Taalas

51.

Products | Taalas

52.

A startup working on 'reversible computing' chip for AI says initial tests show a 50% energy savings | Fortune

Fortune

53.

https://www.fractile.ai/news/startup-with-radical-concept-for-ai-chips-emerges-from-stealth

54.

https://www.fractile.ai/news/how-inference-is-driving-competition-to-nvidias-ai-chip-dominance

55.

Exclusive | Apple Is Developing AI Chips for Data Centers, Seeking Edge in Arms Race - WSJ

The Wall Street Journal

56.

Our next generation Meta Training and Inference Accelerator

57.

Exclusive: OpenAI set to finalize first custom chip design this year | Reuters

Reuters

58.

GRAPHCORE LIMITED filing history - Find and update company information - GOV.UK

59.

Graphcore joins SoftBank Group to build next generation of AI compute

Graphcore

60.

Mythic company information, funding & investors | Dealroom.co

61.

AI chip startup Mythic rises from the ashes with $13M, new CEO | TechCrunch

TechCrunch

62.

Speedata, a chip startup competing with Nvidia, raises a $44M Series B | TechCrunch

TechCrunch

63.

Eindhoven-based Axelera AI secures €61.6M grant

Silicon Canals Editorial Team

64.

TSMC shares open lower following announcement of $100 billion investment in US | Reuters

Reuters

65.

Exclusive: TSMC pitched Intel foundry JV to Nvidia, AMD and Broadcom, sources say | Reuters

Reuters

Cem Dilmegani

Analyste principal

Suivre

Cem est analyste principal chez AIMultiple depuis 2017. AIMultiple informe chaque mois des centaines de milliers d'entreprises (selon similarWeb), dont 55 % des entreprises du classement Fortune 500. Les travaux de Cem ont été cités par des publications internationales de premier plan telles que Business Insider, Forbes et le Washington Post, ainsi que par des entreprises mondiales comme Deloitte et HPE, des ONG comme le Forum économique mondial et des organisations supranationales comme la Commission européenne. Vous trouverez d'autres entreprises et ressources réputées ayant fait référence à AIMultiple. Tout au long de sa carrière, Cem a exercé les fonctions de consultant, d'acheteur et d'entrepreneur dans le secteur des technologies. Il a conseillé des entreprises sur leurs décisions technologiques chez McKinsey & Company et Altman Solon pendant plus de dix ans. Il a également publié un rapport McKinsey sur la numérisation. Il a dirigé la stratégie technologique et les achats d'un opérateur télécom, sous la responsabilité directe du PDG. Il a également piloté la croissance commerciale de la société de deep tech Hypatos, qui a atteint un chiffre d'affaires annuel récurrent à sept chiffres et une valorisation à neuf chiffres en seulement deux ans. Les travaux de Cem chez Hypatos ont été présentés dans des publications technologiques de référence telles que TechCrunch et Business Insider. Cem intervient régulièrement lors de conférences internationales sur les technologies. Diplômé en génie informatique de l'université de Bogazici, il est également titulaire d'un MBA de la Columbia Business School.

Voir le profil complet

Commentaires 2

Partagez vos idées

Votre adresse courriel ne sera pas publiée. Tous les champs sont obligatoires.

Dave

Aug 29, 2022 at 05:49

You forgot to include Tesla with their DOJO supercomputer. From the ground-up, the supercomputer was specifically designed for machine learning and image recognition - which means that every component was designed for it including, but not limited to, PCI board design, CPU, RAM, cooling, power, scalable hardware design and software. If I'm not mistaken, the AI is also the second most widely tested and used in the "wild", just below that of Google due to Google using it in their Search.

Cem Dilmegani

Sep 06, 2022 at 13:52

Thank you for your feedback, Dave! Here we are only covering companies that sell the chips that they produce. Therefore, companies like Tesla that build supercomputers for their own use or companies that embed chips in their products are out of our scope.

thayyil

Mar 19, 2022 at 11:48

surprised that brainchip (akida) missing in this report. any reasons?

Cem Dilmegani

Nov 18, 2022 at 07:36

All included companies here raised $100+M. Last time we collected the data, that wasn't the case for akida. Why don't you reach out to us at info@aimultiple.com and let's discuss why it should be included. Thank you!

Les 25 principaux fabricants de puces IA : NVIDIA et ses concurrents

Plus de 25 fabricants de puces IA par catégorie

5 fournisseurs de puces d'IA mobiles

5 puces d'IA périphériques

Comprendre les architectures des puces d'IA : GPU vs ASIC

Quels sont les principaux fabricants de puces d'IA ?

1. NVIDIA

Solutions d'IA de bureau

Solutions pour centres de données

GPU dans le cloud

GPU pour les graphismes

Développements récents

DGX Cloud Lepton

NVIDIA Dynamo

Serveurs RTX PRO et usine d'IA d'entreprise NVIDIA

DeepSeek

Droits de douane et restrictions à l'exportation

Inférence sur la concurrence sur le marché

2. AMD

Logiciel

Écosystème

3. Intel

Quels fournisseurs de cloud public produisent des puces d'IA ?

4. AWS

5. Google Plateforme Cloud

6. Alibaba

7. IBM

8. Huawei

Quels fournisseurs de services d'IA dans le cloud produisent leurs propres puces ?

9. Groq

10. SambaNova Systèmes

Quelles sont les principales startups spécialisées dans les puces d'IA ?

11. Cerebras

12. d-Matrix

13. Rébellions

14. Tenstorrent

15. Positron

16. _gravé

17. Taalas

18. Extropique

19. Vaire

20. Fractile

Quels sont les futurs fabricants de matériel d'IA ?

21. Pomme

22. Meta

23. Microsoft Azure

24. OpenAI

Quels sont les autres fabricants de puces IA ?

25. Graphcore

26. Mythique

27. Speedata

28. Axelera IA

Les partenaires fondeurs et le rôle de TSMC

Plans d'expansion

Quels sont les fabricants de puces d'IA en Chine ?

FAQ

Quelles sont les autres entreprises de l'écosystème des puces d'IA ?

Pourquoi le matériel d'IA est-il si important ?

Pour en savoir plus

Références

Liens de référence

Commentaires 2

Partagez vos idées

À lire ensuite

Les 15 principaux fabricants de puces d'IA embarquées et leurs cas d'utilisation en 2026

Créateurs d'agents IA à faible ou sans code : n8n, make, Zapier

Les 7 couches de la pile d'IA agentique in 2026

Benchmark des créateurs de vidéos IA pour le commerce électronique : Veo 3 contre Sora 2

Créateur de présentations IA : Gamma contre Google diapositives

IA reproductible : pourquoi c'est important et comment l'améliorer