Las tarifas bajo demanda para las GPU en la nube de última generación (B200, B300, MI300X, RTX 5090) prácticamente se duplicaron durante el último año, mientras que las tarjetas convencionales (H100, H200, A100) mantuvieron precios estables. Recopilamos mensualmente el índice de GPU a partir de 58 proveedores y 17 modelos de GPU, que abarcan los niveles bajo demanda, spot y de reserva anual.
Tendencias de precios por generación de GPU
El gráfico muestra el precio medio mensual publicado en tres rangos de fechas de lanzamiento. Dividimos 17 modelos de GPU en tres categorías según su fecha de lanzamiento:
La mayor parte del aumento provino de las listas B200 y B300, que se expandieron de proveedores de neocloud a listas de precios de hiperescaladores. Estas listas de hiperescaladores suelen ser entre dos y tres veces más caras, lo que eleva la mediana de la categoría a medida que se incorporan al conjunto de datos.
Las GPU modernas subieron un 25% aproximadamente, pero este cambio es principalmente estadístico. Cloud añadió su variante A3z Mega H100 a la lista estándar A3, elevando la mediana del grupo H100 de aproximadamente 2 dólares a aproximadamente 3 dólares. Por otro lado, la tendencia de Neocloud H100 fue a la baja. Analizaremos esto en la siguiente sección.
Las GPU heredadas cayeron de 1,78 $ a 0,97 $ durante ese período, debido a que la generación V100 perdió a sus proveedores de hiperescaladores de gama alta a medida que las empresas retiran este modelo. Solo quedan uno o dos proveedores por tarjeta heredada en nuestro conjunto de datos: AWS ofrece la K80 a 0,90 $, la P40 en Vast.ai a 0,11 $, y el resto son casos excepcionales similares con una sola oferta.
El mercado de contratos se comportó de manera diferente: los compromisos H100 a un año mostraron una tendencia al alza durante el mismo período, mientras que la mediana de nuestros contratos H100 bajo demanda se mantuvo prácticamente estable. Esto evidencia una creciente diferencia entre los precios de los contratos mensuales y los contratos anuales.
Consulte nuestra metodología de índice de GPU para obtener información sobre cómo se calcula esto.
Tendencias de precios por modelo de GPU
La tabla que aparece a continuación muestra las ocho GPU modernas.
GPU modernas (H100, A100, L4 y similares)
H100 está listado por 36 proveedores. La mediana de la cohorte disminuyó de más de 7 USD/GPU-hora a principios de 2024 a menos de 3 USD/GPU-hora en 2026. Los listados Azure ND y Google Cloud A3 Mega elevan el extremo superior de la distribución.
El precio de H200 en la gama baja es considerablemente inferior al del resto de proveedores. El precio de RunPod para H200 es una fracción de la mediana del grupo, mientras que el precio del siguiente proveedor disponible es varias veces superior. Esto hace que la mediana y el rango dependan de si el producto de menor precio tiene disponibilidad confirmada y una configuración comparable.
Los precios de A100 se agrupan dentro de un rango estrecho de neocloud, con algunos listados de inferencia sin servidor que elevan el límite superior. Compare las tarifas sin servidor por separado de las tarifas horarias de GPU de IaaS.
L40S, RTX 4090, A10G, T4 y L4 cubren el nivel de inferencia. Sus cargas de trabajo se superponen, incluyendo inferencia, generación y ajuste fino por lotes de menos de 100 mil millones de datos, lo que hace que la comparación de precios sea relevante. El estrecho margen de A10G refleja que, en nuestra lista, se trata prácticamente de una SKU exclusiva de AWS.
Últimas GPU lanzadas (B200, B300, MI300X, RTX 5090)
B200 mediana $5.50, rango $3.75 (Packet AI) a $14.24 (AWS). B300 mediana $7.50, rango $6.10 (Nebius) a $17.80 (AWS). MI300X mediana $2.72, rango $0.50 (RunPod) a $7.86 (Azure). RTX 5090 mediana $0.67, rango $0.27 (Salad) a $0.72 (Novita).
La distribución es similar a la de los precios anteriores de H100: los precios de los nuevos aceleradores en Hyperscaler son aproximadamente tres veces superiores a los de los aceleradores neocloud de menor precio durante su disponibilidad inicial. El precio del MI300X está por debajo del límite inferior de H100 en RunPod y TensorWave, pero las cargas de trabajo basadas en ROCm pueden requerir validación para aplicaciones que dependen de CUDA.
GPU antiguas (V100, P100, K80, M60, P40)
La V100 sigue apareciendo en 16 proveedores (mediana de ~$0.97), la P100 en 5 (mediana de ~$1.46), la K80 solo en AWS ($0.90) y la P40 solo en Vast.ai (~$0.11). Los modelos heredados siguen disponibles en un número limitado de proveedores. Es posible que los proveedores de hiperescaladores sigan ofreciendo estas GPU para clientes con restricciones de compatibilidad, cumplimiento normativo o migración, mientras que muchos proveedores de neocloud ya no las ofrecen. Para nuevas implementaciones, estas tarjetas parecen menos relevantes a menos que la carga de trabajo dependa específicamente de hardware, controladores o entornos de software heredados.
Tendencias de precios por proveedor
Para la misma GPU, los precios publicados por los proveedores de hiperescala suelen ser entre 3 y 6 veces más altos que los precios más bajos de Neocloud en el conjunto de datos. La profundidad del catálogo varía según el proveedor, la GPU, la región y el tipo de facturación.
Suministro y disponibilidad
La oferta varía más que los precios anunciados. El gráfico a continuación muestra el porcentaje de cada GPU que reporta existencias confirmadas hoy, ordenado de menor a mayor disponibilidad.
B300 se sitúa en un 6% confirmado; el 94% restante está listado, pero los proveedores aún no garantizan el chip. MI300X y L40S se ubican en un 35-36%, más estrecho que el nivel principal. H100, H200, A100 y B200 se agrupan cerca del 41-51%, donde aproximadamente la mitad del catálogo es stock confirmado y la otra mitad depende del aprovisionamiento. RTX 4090 y RTX 5090 alcanzan el 86%, lo que refleja una mayor oferta de tarjetas para consumidores y una menor demanda empresarial por tarjeta.
Si su proyecto depende de un chip específico de última generación, tenga en cuenta el plazo de entrega, además del presupuesto. La proporción de la lista de espera se mantiene prácticamente en cero porque la mayoría de los listados no confirmados se registran como "stock desconocido", no como "lista de espera": los proveedores informan sobre el estado del stock, no sobre la posición en la cola.
Elegir una GPU y un proveedor
La elección de la GPU está determinada por tres factores: carga de trabajo, duración y región. La tarificación por disponibilidad (off-off) frente a la tarificación bajo demanda se basa en estos tres factores.
Por carga de trabajo
Por duración
En menos de una semana: Neocloud bajo demanda al precio mínimo del spread.
Varias semanas: Solicite un presupuesto (los proveedores de servicios en la nube suelen aplicar descuentos del 15 al 30 % para compromisos de 4 a 12 semanas; los proveedores de servicios en la nube a gran escala ofrecen niveles reservados de 1 año).
Contratos plurianuales: negocie directamente con los proveedores, ya que las tarifas publicadas bajo demanda no incluyen los descuentos por plazo fijo.
Ahorros en reservas
El descuento reservado de 1 año suele ser de entre el 9 % y el 32 % sobre la tarifa publicada bajo demanda, con mayores ahorros en AMD MI300X y en el nivel de inferencia L40S, donde los proveedores compiten más intensamente por la capacidad comprometida.
Los planes H100 y H200 ofrecen descuentos modestos de entre un dígito y dos dígitos bajos; su mercado bajo demanda ya es lo suficientemente competitivo como para que los proveedores no sacrifiquen mucho margen por los compromisos. El plan B200 ofrece un descuento del -20%, el MI300X del -32% y el L40S del -29%. El gráfico muestra la mediana entre proveedores para ambos niveles de facturación; las cotizaciones de cada proveedor pueden ser más bajas para plazos plurianuales que no se reflejan aquí.
Alquiler puntual frente a alquiler bajo demanda
El gráfico de seguimiento de descuentos al contado muestra el descuento medio entre el descuento al contado y el descuento bajo demanda por categoría. En los últimos seis meses, los ahorros modernos son de aproximadamente el 50 %, los de las tarjetas lanzadas recientemente de aproximadamente el 48 %, y los de tarjetas antiguas de aproximadamente el 77 % (los datos de las tarjetas antiguas son más variables de lo que parecen; pocos proveedores siguen publicando las tasas al contado para estas tarjetas).
Si tu carga de trabajo tolera interrupciones de 5 a 15 minutos, el acceso a datos instantáneos es la principal herramienta para reducir costos. Activa el menú desplegable de facturación en el gráfico superior para comparar la tarifa de datos instantáneos con la tarifa bajo demanda de cualquier proveedor de tu lista.
Metodología del índice de GPU
El índice abarca los precios de alquiler por hora de GPU en la nube, disponibles para los niveles bajo demanda, spot y de reserva anual (cuando los proveedores los publican). No incluye contratos plurianuales, tarifas negociadas por empresas, combinaciones de spot y planes de ahorro, ni el coste total de propiedad.
Nuestros datos consisten en instantáneas mensuales de 23 meses (de julio de 2024 a mayo de 2026), filtradas para mostrar 17 modelos de GPU seleccionados de 58 proveedores. Cada instantánea informa, para cada celda (proveedor, GPU, tipo de facturación, mes), la tarifa horaria por GPU mínima, máxima, media y mediana, además del número de ofertas asociadas a esas cifras.
Cómo se calcula cada gráfico
Utilizamos la mediana de medianas en todo el proceso: tanto los proveedores como las GPU introducen el número principal con el mismo peso, de modo que un proveedor con 38 entradas no eclipsa a un recién llegado con 5 entradas.
Resumen del mercado (tres líneas de categorías):
El menú desplegable de facturación vuelve a ejecutar los pasos 2 y 3 para el nivel seleccionado (bajo demanda, puntual o con reserva). Una cuarta opción, "Promedio", muestra la media aritmética de las medianas de los tres niveles por categoría y por mes, restringida a los meses en los que los tres niveles tienen datos.
Explorador de proveedores y facturación:
Para el proveedor y el plan de facturación que seleccione, cada línea muestra la mediana mensual de una GPU a lo largo del tiempo. No se aplica ninguna agregación entre proveedores: cada punto mensual representa simplemente el precio medio de las GPU y el plan de facturación de ese proveedor. La línea finaliza cuando la oferta desaparece del catálogo.
GPU modernas una al lado de la otra:
Los pasos 1 y 2 son los mismos que en el resumen del mercado, pero se limitan a los precios bajo demanda. Cada línea representa la mediana mensual entre proveedores para una GPU. No se realiza agregación entre GPU. Ocho series.
Rastreador de descuentos puntuales:
Esto compara cada precio spot con su equivalente bajo demanda del mismo proveedor, la misma GPU y el mismo mes, de modo que el descuento refleja el diferencial real que vería un comprador de ese proveedor, y no una diferencia debida al ruido del mercado.
Resumen de disponibilidad:
Solo instantáneas, sin agregación temporal. Las acciones que aparecen como desconocidas, en lista de espera o no disponibles se incluyen en el denominador, pero no se muestran por separado en el gráfico, ya que la señal que permite al comprador tomar medidas es la acción cuya disponibilidad está confirmada.
Ahorros en la reserva:
Preguntas frecuentes
Publicamos mensualmente una vista actualizada de la mediana. Las cifras reflejan los datos hasta el mes anterior.
La GPU es la misma; el paquete no. Los proveedores de hiperescala incluyen en sus precios el cumplimiento normativo (HIPAA, SOC 2, FedRAMP), acuerdos de nivel de servicio (SLA) empresariales, integración de identidad y redes, y soporte 24/7. Las neonubes ofrecen acceso a servidores físicos o máquinas virtuales con orquestación gestionada opcional. Si no necesita el paquete, el precio de una neonube es la referencia adecuada.
Sí, si su carga de trabajo admite puntos de control y tolera interrupciones de 5 a 15 minutos. El descuento actual en las GPU spot ronda el 50 % en los últimos seis meses, y el ahorro se acumula durante el entrenamiento de varios días. Las GPU spot no son la opción adecuada para inferencias sensibles a la latencia, servicios de réplica única sin conmutación por error o ejecuciones de evaluación que requieren una comparación precisa del tiempo real.
El menú desplegable de facturación del gráfico de tendencias de precios por proveedor permite alternar entre los niveles de demanda, spot y reserva anual, siempre que los proveedores publiquen dichas tarifas. Los contratos plurianuales y los descuentos negociados para empresas no están incluidos. Para obtenerlos, solicite un presupuesto directamente al proveedor.
Lecturas adicionales
- Prueba de rendimiento multi-GPU: B200 vs H200 vs H100 vs MI300X
- Los 30 principales proveedores de GPU en la nube y sus GPU
- Prueba de rendimiento de concurrencia de GPU
- Los 25 principales fabricantes de chips de IA: NVIDIA y sus competidores
Cita esta investigación
Elige el formato que se ajuste al lugar donde vas a publicar. Pegar la versión con enlace en tu CMS conserva el enlace de retroceso.
@misc{sar2026,
author = {Sarı, Ekrem},
title = {{Índice de precios de alquiler de GPU en la nube}},
year = {2026},
month = may,
howpublished = {\url{https://aimultiple.com/gpu-index}},
note = {AIMultiple. Retrieved Mayo 20, 2026}
}
Sé el primero en comentar
Tu dirección de correo electrónico no será publicada. Todos los campos son obligatorios.