Servicios
Contáctanos

Índice de precios de alquiler de GPU en la nube

Ekrem Sarı
Ekrem Sarı
actualizado el 17 de jun. de 2026

Las tarifas bajo demanda para las GPU de última generación en la nube (B200, B300, MI300X, RTX 5090) se duplicaron aproximadamente en el último año, mientras que las tarjetas principales (H100, H200, A100) mantuvieron un rango estrecho. Compilamos el índice de GPU mensualmente a partir de 58 proveedores y 17 modelos de GPU, cubriendo niveles bajo demanda, spot y reservados por 1 año.

Tendencias de precios por generación de GPU

Loading Chart

El gráfico muestra el precio mediano mensual publicado en tres grupos por fecha de lanzamiento. Dividimos 17 modelos de GPU en tres categorías según su fecha de lanzamiento:

La mayor parte del aumento provino de listados de B200 y B300 que se expandieron desde proveedores neocloud hasta hojas de precios de hyperscalers. Estos listados de hyperscalers suelen ser 2-3 veces más altos, elevando la mediana de la categoría a medida que ingresan al conjunto de datos.

Las GPU modernas subieron ~25%, pero el movimiento es en gran parte estadístico. Google Cloud agregó su variante A3z Mega H100 al listado estándar-A3, elevando la mediana de la cohorte H100 de ~$2 a ~$3. En el fondo, la tendencia de H100 en neocloud bajó. Señalamos esto en la siguiente sección.

Las GPU de legado bajaron de $1.78 a $0.97 durante el período, impulsadas por la cohorte V100 perdiendo sus anclajes de hyperscaler de gama alta a medida que las empresas retiran el SKU. Solo uno o dos proveedores por tarjeta de legado permanecen en nuestro conjunto de datos: AWS lista K80 a $0.90, P40 se sitúa en Vast.ai a $0.11, y el resto son casos de borde de listado único similares.

El mercado de contratos se movió de manera diferente: los compromisos de H100 por 1 año tendieron al alza durante el mismo período, mientras que nuestra mediana de H100 bajo demanda fue aproximadamente plana. Esto muestra una diferencia creciente entre los precios comprometidos mes a mes y por 1 año.

Consulte nuestra GPU metodología del índice para ver cómo se calcula.

Tendencias de precios por modelo de GPU

El gráfico a continuación cubre 10 GPUs: 5 Modernas, 4 Últimas lanzadas y la V100 como referencia de legado.

GPUs Modernas (H100, H200, A100, L40S, RTX 4090)

H100 es listada por 37 proveedores, la más amplia de cualquier acelerador actual. La mediana de la cohorte es ahora alrededor de $2.95/GPU-hora, bajando de más de $7 a principios de 2024. Thunder Compute, Vast.ai y RunPod se sitúan en la parte inferior del rango; Microsoft Azure y Google Cloud llevan la cola superior más allá de $10. La fila de Google Cloud es en sí misma una mezcla de tres SKUs (a3-highgpu, a3-megagpu, a3-edgegpu) agrupados bajo una etiqueta nvidia-h100, lo que eleva su mediana de cohorte.

El rango de H200 va de $2.29 (Theta EdgeCloud) a $13.78 (Microsoft Azure), con una mediana de cohorte alrededor de $3.39. El piso depende de si trata los listados de nivel comunitario o de compartir instancias como comparables a la capacidad dedicada. Una vez que se dejan de lado, la mediana de trabajo se sitúa en el rango de $3-4.

A100 mantiene un rango neocloud estrecho alrededor de $1.62, con uno o dos valores atípicos de inferencia sin servidor (Replicate a $5.04) elevando la cola alta. Trate las tarifas sin servidor por separado al comparar proveedores de IaaS.

L40S se ha estabilizado alrededor de $1.55 de mediana, con AWS a $7.58 estableciendo el techo. RTX 4090 es la tarjeta de clase de entrenamiento más barata en el índice con $0.44 de mediana, con Salad a $0.18 y Beam a $1.61 enmarcando el rango. Ambas apuntan a inferencia sub-100B y ajuste fino por lotes, donde a menudo sustituyen a A100 a una fracción del precio.

GPUs Últimas lanzadas (B200, B300, MI300X, RTX 5090)

B200 mediana $5.24, rango $3.75 (Packet AI) a $14.24 (AWS). B300 mediana $6.99, rango $6.10 (Nebius) a $18.00 (Oracle). MI300X mediana $1.99, rango $1.99 (RunPod) a $7.86 (Azure). RTX 5090 mediana $0.69, rango $0.27 (Salad) a $1.34 (Vast.ai).

El patrón se repite de la curva anterior de H100: los hyperscalers llevan nuevos aceleradores a 3-5 veces los pisos de neocloud durante el primer año. B300 es la única línea en el gráfico que aún tiende al alza, ya que listados adicionales de hyperscalers siguen elevando la mediana. MI300X es el outlier de oferta; RunPod y TensorWave la precian por debajo del piso de H100, pero funciona con ROCm y no todos los trabajos de CUDA se portan limpiamente.

Referencia de legado (V100)

V100 es la única tarjeta de legado en el gráfico, incluida como una línea de referencia de generación 2017. La mediana de la cohorte bajó de $1.84 a mediados de 2024 a alrededor de $0.97 hoy en 18 proveedores. Los hyperscalers mantienen SKUs de V100 para clientes de cumplimiento que ejecutan cargas de trabajo inmutables; los neoclouds las han abandonado en su mayoría.

Tendencias de precios por proveedor

Para la misma GPU, los precios publicados de hyperscaler suelen ser 3-6 veces más altos que los listados de neocloud más bajos en el conjunto de datos. La profundidad del catálogo varía según el proveedor, la GPU, la región y el tipo de facturación.

Suministro y disponibilidad

El suministro varía más ampliamente que los precios principales. El gráfico a continuación muestra la proporción de listados de cada GPU que reportan stock confirmado hoy, ordenados desde el más escaso hasta el más disponible.

B300 se sitúa en 6% confirmado; el 94% restante está listado pero los proveedores aún no prometen el chip. MI300X y L40S llegan al 35-36%, más estrecho que el nivel principal. H100, H200, A100 y B200 se agrupan cerca del 41-51%, donde aproximadamente la mitad del catálogo es stock confirmado y la mitad depende del aprovisionamiento. RTX 4090 y RTX 5090 alcanzan el 86%, reflejando un suministro más profundo de tarjetas de consumo y una menor demanda empresarial por tarjeta.

Si su proyecto depende de un chip de última generación específico, planifique el tiempo de preparación de la adquisición además del presupuesto. La proporción de lista de espera se mantiene cerca de cero porque la mayoría de los listados no confirmados se rastrean como "stock desconocido", no como "lista de espera": los proveedores reportan el estado del stock, no la posición en la cola.

Elegir una GPU y un proveedor

La elección de GPU está moldeada por tres ejes: carga de trabajo, duración y región. Los precios de spot vs. bajo demanda se superponen a los tres.

Por carga de trabajo

Por duración

Menos de una semana: Neocloud bajo demanda en el piso del rango.

Múltiples semanas: Solicite una cotización (los neoclouds suelen descontar 15-30% por compromisos de 4-12 semanas; los hyperscalers ofrecen niveles reservados por 1 año).

Múltiples años: negocie directamente con los proveedores, ya que las tarifas publicadas bajo demanda no capturan descuentos por término comprometido.

Ahorros por reserva

El descuento reservado por 1 año suele ser del 9-32% menos la tarifa bajo demanda publicada, con ahorros más pronunciados en AMD MI300X y L40S de nivel de inferencia, donde los proveedores compiten más fuerte por capacidad comprometida.

H100 y H200 ven descuentos modestos de un dígito a bajos dos dígitos; su mercado bajo demanda ya es lo suficientemente competitivo como para que los proveedores no sacrifiquen mucho margen por compromisos. Reservas de B200 a -20%, MI300X a -32%, L40S a -29%. El gráfico muestra la mediana entre proveedores para ambos niveles de facturación; las cotizaciones individuales de proveedores pueden ser más profundas para términos de múltiples años no reflejados aquí.

Spot vs bajo demanda

El gráfico de seguimiento de descuentos de spot muestra el descuento mediano de spot vs. bajo demanda por categoría. En los últimos seis meses, moderno ahorra ~50%, últimas lanzadas ~48%, legado ~77% (Legado es más ruidoso de lo que parece; pocos proveedores aún publican tarifas de spot para estas tarjetas).

Si su carga de trabajo tolera interrupciones de 5-15 minutos, spot es la palanca de costos más grande disponible. Active el menú desplegable de facturación en el gráfico explorador en la parte superior para ver la tarifa de spot lado a lado con bajo demanda para cualquier proveedor en su lista corta.

No te pierdas nuestros análisis comparativos e insights basados en datos. El botón abre Google; seleccionar AIMultiple confirma que deseas ver AIMultiple con más frecuencia en los resultados de búsqueda de Google.
GoogleAñadir como fuente preferida

GPU metodología del índice

El índice cubre precios de alquiler de GPU en la nube publicados por hora en niveles bajo demanda, spot y reservados por 1 año (donde los proveedores los listan públicamente). No cubre contratos de múltiples años, tarifas negociadas por empresas, combinaciones de spot más planes de ahorro, o costo total de propiedad.

Nuestros datos son muestras mensuales durante 23 meses (julio de 2024 a mayo de 2026), filtrados a 17 modelos de GPU curados en 58 proveedores. Cada muestra reporta, para cada celda (proveedor, GPU, tipo de facturación, mes), el mínimo, máximo, media y mediana de la tarifa por GPU por hora, más la cantidad de ofertas detrás de esos números.

Los precios de H100, A100, H200, B200, B300 y V100 son medianas tomadas a través de varias versiones físicas de la tarjeta (PCIe, SXM o interconexión NVL; para A100 y V100, también 40/80 GB o 16/32 GB VRAM) que los proveedores listan bajo un nombre.

Cómo se calcula cada gráfico

Usamos mediana de medianas en todo: los proveedores y las GPUs entran en el número principal con igual peso, por lo que un proveedor de 38 listados no ahoga a un recién llegado de 5 listados.

Resumen del mercado (tres líneas de categoría):

El menú desplegable de facturación vuelve a ejecutar los pasos 2-3 contra el nivel seleccionado (bajo demanda, spot o reserva). Una cuarta opción "Promedio" grafica la media aritmética de las medianas de tres niveles por categoría por mes, restringida a meses donde los tres niveles tienen datos.

Explorador de proveedor × facturación:

Para el proveedor y nivel de facturación que seleccione, cada línea traza la mediana mensual de una GPU a lo largo del tiempo. No se aplica agregación entre proveedores: el punto de cada mes es simplemente el precio mediano entre los listados de ese proveedor para esa GPU y ese nivel de facturación. La línea termina donde la oferta desaparece del catálogo.

GPUs Modernas lado a lado:

Mismos pasos 1-2 que el resumen del mercado, limitado solo a precios bajo demanda. Cada línea es la mediana mensual entre proveedores para una GPU. Sin agregación entre GPU. Ocho series.

Seguimiento de descuento de spot:

Esto empareja cada precio de spot con su contraparte bajo demanda del mismo proveedor, misma GPU, mismo mes, por lo que el descuento refleja el rango real que vería un comprador en ese proveedor, no una diferencia de ruido entre mercados.

Instantánea de disponibilidad:

Solo instantánea, sin agregación de tiempo. Los listados reportados como stock desconocido, lista de espera o no disponibles aún se cuentan en el denominador pero no se dibujan por separado en el gráfico, ya que la señal accionable para el comprador es la proporción confirmada-disponible.

Ahorros por reserva:

Preguntas frecuentes

Publicamos una vista mensual renovada cada mes. Los números reflejan datos hasta el mes anterior.

La GPU es la misma; el paquete no lo es. Los hyperscalers incluyen en el precio el cumplimiento (HIPAA, SOC 2, FedRAMP), SLA empresariales, integración de identidad y redes, y soporte 24/7. Los neoclouds precian metal desnudo o acceso a VM con orquestación gestionada opcional. Si no necesita el paquete, el precio de Neocloud es la comparación correcta.

Sí, si su carga de trabajo guarda puntos de control y tolera interrupciones de 5-15 minutos. El descuento de spot de GPU modernas se sitúa cerca del 50% en los últimos seis meses, y los ahorros se acumulan durante el entrenamiento de múltiples días. Spot es la opción incorrecta para inferencia sensible a la latencia, servicios de réplica única sin conmutación por error, o ejecuciones de evaluación que necesitan una comparación limpia de tiempo de reloj.

El menú desplegable de facturación del gráfico de tendencias de precios por proveedor cambia entre niveles bajo demanda, spot y reservados por 1 año dondequiera que los proveedores publiquen esas tarifas. Los contratos de múltiples años y los descuentos negociados por empresas no están incluidos. Solicite una cotización directamente al proveedor para esos.

Lectura adicional

Cita esta investigación

Elige el formato que se ajuste al lugar donde vas a publicar. Pegar la versión con enlace en tu CMS conserva el enlace de retroceso.

Ekrem Sarı (2026) - "Índice de precios de alquiler de GPU en la nube". Publicado en línea en AIMultiple.com. Recuperado el Junio 17, 2026, de: https://aimultiple.com/gpu-index [Recurso en línea]

Sarı, E. (2026, Junio 17). Índice de precios de alquiler de GPU en la nube. AIMultiple. https://aimultiple.com/gpu-index

@misc{sar2026,
  author = {Sarı, Ekrem},
  title  = {{Índice de precios de alquiler de GPU en la nube}},
  year   = {2026},
  month  = jun,
  howpublished    = {\url{https://aimultiple.com/gpu-index}},
  note   = {AIMultiple. Retrieved Junio 17, 2026}
}
Ekrem Sarı
Ekrem Sarı
Investigador de IA
Ekrem es investigador de IA en AIMultiple, donde se centra en la automatización inteligente, las GPU, los agentes de IA y los marcos de trabajo RAG.
Ver perfil completo

Sé el primero en comentar

Tu dirección de correo electrónico no será publicada. Todos los campos son obligatorios. Los comentarios se dejan en su idioma original.

0/450