Comparación de Funciones

Índice de precios de alquiler de GPU en la nube

actualizado el 6 de jul. de 2026

Las tarifas bajo demanda para los GPUs en la nube de última generación (B200, B300, MI300X, RTX 5090) se duplicaron aproximadamente durante el último año, mientras que las tarjetas convencionales (H100, H200, A100) mantuvieron una banda ajustada. Recopilamos el índice mensual de GPU de 63 proveedores y 17 modelos de GPU, abarcando los niveles bajo demanda, spot y reservado a 1 año.

Tendencias de precios por generación de GPU

Billing type

Loading Chart

El gráfico muestra el precio mediano mensual publicado en tres grupos según la fecha de lanzamiento. Dividimos 17 modelos de GPU en tres categorías por fecha de lanzamiento:

Categoría	GPUs	Rol
Último lanzamiento (2024 y posterior)	B200, B300, MI300X, RTX 5090	Cohorte de última generación
Moderno (2020 a 2023)	H100, H200, A100, L40S, RTX 4090, A10G, T4, L4	Ejecutores de cargas de trabajo convencionales
Legado (anterior a 2020)	V100, P100, K80, M60, P40	Aún alquilables, mayormente en neoclouds de nivel comunitario

La mayor parte del aumento provino de la expansión de los listados de B200 y B300, que pasaron de los proveedores neocloud a las hojas de precios de los hiperescaladores. Estos listados de hiperescalador suelen ser 2x–3x más altos, lo que eleva la mediana de la categoría a medida que ingresan al conjunto de datos.

Los GPUs modernos subieron ~25% pero el movimiento es en gran parte estadístico. Google Cloud añadió su variante A3z Mega H100 al listado estándar A3, elevando la mediana del cohorte H100 de ~$2 a ~$3. Debajo de eso, el H100 en neoclouds tendió a la baja. Marcamos esto en la siguiente sección.

Los GPUs heredados cayeron de $1,78 a $0,99 durante la ventana de observación, impulsados porque el cohorte V100 perdió sus anclajes de alto costo en hiperescaladores a medida que las empresas retiran ese SKU. Quedan uno o dos proveedores por tarjeta heredada en nuestro conjunto de datos: AWS lista K80 a $0,90, P40 está en Vast.ai a $0,11, y el resto son casos aislados similares de un solo listado.

El mercado de contratos se movió de manera diferente: los compromisos a 1 año de H100 tendieron al alza durante la misma ventana, mientras que nuestra mediana bajo demanda de H100 se mantuvo aproximadamente plana. Esto muestra una diferencia creciente entre los precios mes a mes y los precios con compromiso a 1 año.

Consulte nuestra metodología del índice de GPU para conocer cómo se calcula esto.

Tendencias de precios por modelo de GPU

El gráfico siguiente cubre 10 GPUs: 5 Modernos, 4 de último lanzamiento y el V100 como referencia Legado.

GPUs modernos (H100, H200, A100, L40S, RTX 4090)

IONOS cubre este nivel desde la UE: T4, A10 y RTX PRO 6000 Blackwell bajo demanda, más servidores dedicados H100 y H200 a una tarifa fija de $3.990/mes con residencia de datos en la UE.

H100 está listado por 46 proveedores, la mayor cobertura de cualquier acelerador actual. La mediana del cohorte ronda ahora los $2,99/hora de GPU, por debajo de los más de $7 de principios de 2024. Thunder Compute, Vast.ai y RunPod se sitúan en el extremo inferior de la dispersión; Microsoft Azure y Google Cloud llevan la cola superior más allá de los $10. La fila de Google Cloud es en sí misma una mezcla de tres SKU (a3-highgpu, a3-megagpu, a3-edgegpu) agrupados bajo una sola etiqueta nvidia-h100, lo que eleva la mediana de su cohorte.

El rango del H200 va de $2,30 (FluidStack) a $13,78 (Microsoft Azure), con una mediana del cohorte en torno a $4,00. El mínimo depende de si se tratan los listados de nivel comunitario o de instancia compartida como comparables a la capacidad dedicada. Una vez descartados esos, la mediana operativa se sitúa en la banda de $3–4.

El A100 mantiene una banda ajustada en neoclouds alrededor de $1,79, con uno o dos valores atípicos de inferencia sin servidor (Replicate a $5,04) que elevan la cola alta. Trate las tarifas sin servidor por separado cuando compare proveedores IaaS.

El L40S se ha asentado en una mediana de aproximadamente $1,56, con AWS a $7,58 marcando el techo. La RTX 4090 es la tarjeta de clase entrenamiento más barata del índice, con una mediana de $0,52, con Salad a $0,18 y Beam a $1,61 delimitando la dispersión. Ambas apuntan a inferencia sub-100B y ajuste fino por lotes, donde a menudo sustituyen al A100 por una fracción del precio.

GPUs de último lanzamiento (B200, B300, MI300X, RTX 5090)

B200 mediana $6,11, rango $3,44 (Vast.ai) a $16,11 (Google Cloud). B300 mediana $7,92, rango $5,44 (Vast.ai) a $18,00 (Oracle Cloud). MI300X mediana $2,72, rango $1,99 (DigitalOcean) a $7,86 (Microsoft Azure). RTX 5090 mediana $0,66, rango $0,27 (Salad) a $2,00 (Vast.ai).

Se repite el patrón de la curva anterior del H100: los hiperescaladores ofrecen los nuevos aceleradores a 3–5x los mínimos de los neoclouds durante el primer año. El B300 sigue al alza en el gráfico, ya que los nuevos listados de hiperescaladores siguen elevando la mediana. El MI300X es el valor atípico en la oferta; se lista por debajo del mínimo del H100 en DigitalOcean y TensorWave, pero se ejecuta sobre ROCm y no toda carga de trabajo CUDA se migra sin problemas.

Referencia Legado (V100)

La V100, la tarjeta Legado del gráfico, se incluye como línea de referencia de la generación 2017. La mediana del cohorte cayó de $1,84 a mediados de 2024 a alrededor de $0,99 hoy en 17 proveedores. Los hiperescaladores mantienen los SKU V100 para clientes de cumplimiento normativo que ejecutan cargas de trabajo inmodificables; los neoclouds en su mayoría los han descartado.

Tendencias de precios por proveedor

Para la misma GPU, los precios publicados por los hiperescaladores suelen ser 3x–6x más altos que los listados más bajos de neoclouds en el conjunto de datos. La profundidad del catálogo varía según el proveedor, la GPU, la región y el tipo de facturación.

Oferta y disponibilidad

La oferta varía más ampliamente que los precios de referencia. El gráfico siguiente muestra la proporción de los listados de cada GPU que informan stock confirmado hoy, ordenados desde el más escaso al más disponible.

MI300X y L40S son los más escasos con un 44%, seguidos de B200 y B300 con 52–54%. H100, A100 y H200 se agrupan cerca del 63–70%, donde aproximadamente dos tercios del catálogo tienen stock confirmado y el resto depende del aprovisionamiento. RTX 4090 y RTX 5090 alcanzan el 93–97%, reflejando una oferta más profunda de tarjetas de consumo y una menor demanda empresarial por tarjeta individual.

article.automate_process_description

article.automate_process_button

Elección de GPU y proveedor

La elección de GPU está determinada por tres ejes: carga de trabajo, duración y región. La tarificación spot vs. bajo demanda se superpone a los tres.

Por carga de trabajo

Carga de trabajo	GPU recomendada	Nivel de proveedor	Por qué
Inferencia de LLM, modelos de 7–13B	L4, L40S	Neocloud	Menos de $2/h, optimizado para inferencia
Inferencia de LLM, 30–70B	A100 80GB, H100	Neocloud	La VRAM encaja, H100 para SLA de latencia ajustado
Inferencia de LLM, 70B+ limitada por memoria	H200, MI300X	Neocloud	141–192 GB HBM permite un KV-cache mayor
Ajuste fino de 7–13B	A100, H100	Neocloud	Rentable, ampliamente disponible
Entrenamiento de modelos grandes desde cero	H100, B200 multi-nodo	Hiperescalador o neocloud grande	HBM multi-GPU e interconexión rápida
Experimentación, prototipado	T4, A10G, L4, RTX 4090	Neocloud de nivel comunitario	Barato por hora, rápido de poner en marcha
Producción regulada (HIPAA/SOC2/FedRAMP)	Cualquiera de los anteriores	Hiperescalador	Certificaciones de cumplimiento normativo

Por duración

Menos de una semana: Neocloud bajo demanda al mínimo de la dispersión.

Varias semanas: Solicite una cotización (los neoclouds suelen ofrecer un descuento del 15–30% para compromisos de 4–12 semanas; los hiperescaladores ofrecen niveles reservados a 1 año).

Varios años: negocie directamente con los proveedores, ya que las tarifas bajo demanda publicadas no reflejan los descuentos por plazo comprometido.

Ahorro en reservas

El descuento de la reserva a 1 año suele oscilar entre el 16 y el 39% sobre la tarifa bajo demanda publicada, con los mayores ahorros en B200, AMD MI300X y la tarjeta L40S orientada a inferencia, donde los proveedores compiten más por la capacidad comprometida.

H100 y H200 ven descuentos modestos, de un solo dígito a bajo diez por ciento; su mercado bajo demanda es lo suficientemente competitivo como para que los proveedores no sacrifiquen margen en compromisos. B200 reserva a -39% de descuento, MI300X a -31%, L40S a -30%. El gráfico muestra la mediana entre todos los proveedores para ambos niveles de facturación; las cotizaciones individuales pueden ser más profundas para plazos multianuales que no se reflejan aquí.

Spot frente a bajo demanda

El gráfico del descuento de spot muestra la mediana del descuento spot vs. bajo demanda por categoría. Durante los últimos seis meses, los modernos ahorran ~50%, los de último lanzamiento ~49% y los heredados ~75% (los heredados son más ruidosos de lo que parece; pocos proveedores publican aún tarifas spot para estas tarjetas).

Si su carga de trabajo tolera interrupciones de 5 a 15 minutos, spot es la palanca de coste más importante disponible. Cambie el desplegable de facturación en el gráfico explorador de la parte superior para ver la tarifa spot junto a la bajo demanda para cualquier proveedor de su lista.

Metodología del índice de GPU

El índice cubre los precios publicados por hora de alquiler de GPU en la nube en los niveles bajo demanda, spot y reservado a 1 año (donde los proveedores los publican). No cubre contratos multianuales, tarifas negociadas para empresas, combinaciones de spot y planes de ahorro, ni el coste total de propiedad.

Nuestros datos son capturas mensuales a lo largo de 24 meses (julio de 2024 a junio de 2026), filtradas a 17 modelos de GPU seleccionados entre 63 proveedores. Cada captura reporta, para cada celda (proveedor, GPU, tipo de facturación, mes), la tarifa horaria por GPU mínima, máxima, media y mediana, más el número de ofertas detrás de esas cifras.

Las medianas de H100, A100, H200, B200, B300 y V100 se calculan a partir de varias versiones físicas de la tarjeta (PCIe, SXM o interconexión NVL; para A100 y V100, también 40/80 GB o 16/32 GB VRAM) que los proveedores listan bajo un mismo nombre.

Cómo se calcula cada gráfico

Utilizamos mediana de medianas en todo: los proveedores y las GPUs entran en la cifra principal con igual peso, de modo que un proveedor con 38 listados no diluye a uno nuevo con 5.

Resumen del mercado (tres líneas de categoría):

1Step 1  For each provider + GPU + billing tier + month, take the median price.
2Step 2  Take the median across providers, leaving one value per GPU + billing tier + month.
3Step 3  Take the median across GPUs in the same category, leaving one value per category + billing tier + month.

El desplegable de facturación vuelve a ejecutar los pasos 2–3 contra el nivel seleccionado (bajo demanda, spot o reserva). Una cuarta opción “Promedio” traza la media aritmética de las tres medianas de nivel por categoría y mes, restringida a los meses en que los tres niveles tienen datos.

Explorador de proveedor × facturación:

Para el proveedor y el nivel de facturación que seleccione, cada línea traza la mediana mensual de una GPU a lo largo del tiempo. No se aplica agregación entre proveedores: el punto de cada mes es el precio mediano entre los listados de ese proveedor para esa GPU y ese nivel de facturación. La línea termina cuando la oferta desaparece del catálogo.

GPUs modernos lado a lado:

Mismos pasos 1–2 que el resumen del mercado, limitado a tarifas bajo demanda. Cada línea es la mediana mensual entre proveedores para una GPU. Sin agregación entre GPUs. Ocho series.

Seguimiento del descuento spot:

1Step 1  Keep the provider + GPU + month cells where both an on-demand and a spot price exist.
2Step 2  Per cell, compute: discount % = (on-demand − spot) / on-demand × 100.
3Step 3  Per GPU per month, take the median discount across providers.
4Step 4  Per category per month, take the median discount across GPUs.

Esto empareja cada precio spot con su contraparte del mismo proveedor, misma GPU y mismo mes en bajo demanda, de modo que el descuento refleje la dispersión real que vería un comprador en ese proveedor, no una diferencia de ruido entre mercados.

Instantánea de disponibilidad:

1Step 1  Take the current snapshot of listings, one row per provider + SKU + billing tier.
2Step 2  Per GPU, compute: % available = confirmed listings / total listings × 100.
3Step 3  Sort GPUs ascending by % available, so tightest supply appears leftmost.

Solo instantánea, sin agregación temporal. Los listados reportados como stock desconocido, lista de espera o no disponibles se cuentan en el denominador pero no se dibujan por separado en el gráfico, ya que la señal accionable para el comprador es la proporción confirmada-disponible.

Ahorro en reserva:

1Step 1  Filter the latest weekly snapshot to on-demand and reservation listings.
2Step 2  Per GPU per tier, take the median of cross-provider monthly medians.
3Step 3  Pair the two tiers per GPU and render as grouped bars.

No te pierdas nuestros análisis comparativos e insights basados en datos. El botón abre Google; seleccionar AIMultiple confirma que deseas ver AIMultiple con más frecuencia en los resultados de búsqueda de Google.

Añadir como fuente preferida

Preguntas frecuentes

Publicamos una vista mediana mensual actualizada cada mes. Las cifras reflejan los datos hasta el mes anterior.

La GPU es la misma; el paquete no. Los hiperescaladores incluyen en el precio el cumplimiento normativo (HIPAA, SOC 2, FedRAMP), SLAs empresariales, integración de identidad y redes, y soporte 24/7. Los neoclouds proporcionan acceso a bare metal o VM con orquestación gestionada opcional. Si no necesita el paquete completo, el precio de neocloud es la comparación adecuada.

Sí, si su carga de trabajo realiza puntos de control y tolera interrupciones de 5 a 15 minutos. El descuento spot en GPUs modernos ronda el 50% en los últimos seis meses, y el ahorro se acumula en entrenamientos de varios días. Spot es la elección incorrecta para inferencia sensible a la latencia, servicios de una sola réplica sin conmutación por error, o ejecuciones de evaluación que necesitan una comparación limpia de tiempo de reloj.

El desplegable de facturación en el gráfico de tendencias de precios por proveedor alterna entre bajo demanda, spot y niveles reservados a 1 año, donde los proveedores publican esas tarifas. Los contratos multianuales y los descuentos negociados para empresas no están incluidos. Solicite una cotización directamente al proveedor para esos casos.

Lectura adicional

Cita esta investigación

Elige el formato que se ajuste al lugar donde vas a publicar. Pegar la versión con enlace en tu CMS conserva el enlace de retroceso.

Ekrem Sarı (2026) - "Índice de precios de alquiler de GPU en la nube". Publicado en línea en AIMultiple.com. Recuperado el 6 de Julio de 2026, de: https://aimultiple.com/gpu-index [Recurso en línea]

Sarı, E. (2026, 6 de Julio). Índice de precios de alquiler de GPU en la nube. AIMultiple. https://aimultiple.com/gpu-index

@misc{sar2026,
  author = {Sarı, Ekrem},
  title  = {{Índice de precios de alquiler de GPU en la nube}},
  year   = {2026},
  month  = jul,
  howpublished    = {\url{https://aimultiple.com/gpu-index}},
  note   = {AIMultiple. Recuperado el 6 de Julio de 2026}
}

Ekrem Sarı

Investigador de IA

Ekrem es investigador de IA en AIMultiple, donde se centra en la automatización inteligente, las GPU, los agentes de IA y los marcos de trabajo RAG.

Ver perfil completo