Modelos de GPU

Última actualización: Jul 2026

Rango

Modelo

Disp.

VRAM

Cost

NVIDIA

Liberado: 2024

B200 SXM

1st

Categoría

$2.14

Verda

1st

Categoría

$2.14

Verda

Rendimiento de referencia

Rango

Categoría

Actuación

11th

Inferencia de imágenes (eficiencia)

24k token/$

1st

Inferencia de imágenes (Rendimiento)

110 token/s

11th

Ajuste fino de imagen (eficiencia)

25k image/$

1st

Ajuste fino de imágenes (rendimiento)

114 image/s

10th

Inferencia de texto (Eficiencia)

7M token/$

1st

Inferencia de texto (Rendimiento)

33k token/s

10th

Optimización del texto (Eficiencia)

4M image/$

1st

Ajuste fino del texto (rendimiento)

18k image/s

Especificaciones técnicas

Blackwell

Arquitectura

192 GB

Memoria

8.20 TB/s

Ancho de banda

1,000 W

TDP

75 TFLOPS

Rendimiento FP32

2,250 TFLOPS

Rendimiento del BF16

Precios de los proveedores por región

Proveedor

/ Región

Precio por hora

Verda

/ North Europe

$2.14 (x1 GPU)

Nebius

/ West Europe

$3.95 (x1 GPU)

Vast AI

/ North America

$4.38 (x1 GPU)

Hyperstack

/ West Europe

$5.10 (x1 GPU)

Runpod

/ North America

$5.49 (x1 GPU)

Koyeb

/ West Europe

$5.50 (x1 GPU)

Lambda

/ North America

$6.99 (x1 GPU)

Vultr

/ North America

$25.60 (x8 GPUs)

Google Cloud

/ North America

$32.61 (x8 GPUs)

CoreWeave

/ North America

$34.87 (x8 GPUs)

Cirrascale

/ North America

$48.61 (x8 GPUs)

Oracle Cloud

/ North America

$112.00 (x8 GPUs)

Amazon Web Services

/ North America

$113.93 (x8 GPUs)

FAQ

Esta página te ayuda a comparar las especificaciones técnicas y los precios de los distintos modelos. Para obtener una visión general del mercado basada en la relación rendimiento-precio, puedes consultar nuestra completa comparativa de GPU en la nube , que compara diferentes proveedores y modelos de precios para diversas cargas de trabajo de IA.

Una instancia de GPU en la nube, tema central de esta página, consiste en alquilar un servidor virtual con una GPU dedicada por horas. Esto proporciona acceso continuo al hardware, lo que resulta ideal para tareas de larga duración como el entrenamiento de modelos o cargas de trabajo predecibles. Puede consultar una comparación más amplia de proveedores en nuestra comparativa principal de GPU en la nube .

Una GPU sin servidor es un modelo diferente en el que solo se paga por segundo, por el tiempo real de ejecución del código, sin necesidad de gestionar ningún servidor. Esto resulta muy rentable para tareas con tráfico variable, como las API de inferencia. Si este modelo se ajusta a sus necesidades, puede comparar proveedores en nuestra herramienta de evaluación comparativa de GPU sin servidor .

Si bien NVIDIA es actualmente el líder del mercado, empresas como AMD e Intel son fuertes competidores, y proveedores de servicios en la nube como AWS y Google también fabrican sus propios chips personalizados. Puede obtener más información sobre los principales fabricantes de chips de IA y el panorama general de la industria en nuestro informe detallado.

La decisión depende de factores como la experiencia de tu equipo, la previsibilidad de la carga de trabajo y el presupuesto a largo plazo. Nuestra guía sobre si comprar o alquilar GPU analiza las ventajas y desventajas de cada opción para ayudarte a tomar la decisión estratégica más adecuada para tu negocio.

Esta puntuación mide la relación coste-eficacia de una GPU. Indica cuántos millones (M) de tokens o imágenes se obtienen por cada dólar estadounidense invertido, combinando velocidad y precio en un único valor de rendimiento por dólar. En todas las pruebas de rendimiento de esta página, una puntuación más alta siempre es mejor, ya que significa que se obtiene un mayor rendimiento por el dinero invertido.

La inferencia mide la eficiencia al usar un modelo preentrenado para generar contenido nuevo (como texto o imágenes). Una puntuación alta en inferencia es crucial para que aplicaciones como chatbots o generadores de arte con IA funcionen sin problemas y de forma económica.

El entrenamiento (o ajuste fino) mide la eficiencia para personalizar un modelo existente con tus propios datos. Una puntuación alta en el entrenamiento es importante si necesitas crear modelos especializados de forma rápida y rentable.

Pruebas de rendimiento de texto (medidas en tokens/$): Estas puntuaciones son relevantes para cargas de trabajo basadas en lenguaje. Elija una GPU con puntuaciones altas en pruebas de texto para tareas como la ejecución de modelos de lenguaje complejos (LLM), la creación de contenido y la generación de código.

Rendimiento de imagen (medido en imágenes/$): Estas puntuaciones son relevantes para cargas de trabajo visuales. Elija una GPU con un alto rendimiento de imagen para tareas como la generación de arte con IA, el reconocimiento de objetos o la creación de datos de imágenes sintéticas.

Modelos de GPU

B200 SXM

Rendimiento de referencia

Especificaciones técnicas

Precios de los proveedores por región

FAQ

¿Cómo elijo la mejor GPU en la nube para mi tarea específica?

¿Cuál es la diferencia entre una instancia de GPU en la nube y una GPU sin servidor?

¿Cuáles son las empresas líderes que producen estos chips de IA?

¿Debería comprar mis propias tarjetas gráficas o alquilarlas en la nube?

¿Qué significa una puntuación de referencia como 'Inferencia (2465M tokens/$)'?

¿Cuál es la diferencia entre 'Inferencia' y 'Entrenamiento'?

¿Cuál es la diferencia entre los benchmarks 'Texto' e 'Imagen'?