Contáctanos
No se encontraron resultados.

Modelos de GPU

Última actualización: Feb 2026

Rango
Modelo
Aprovechar.
VRAM
BW
Costo
NVIDIA
NVIDIA
Liberado: 2024

B200 SXM

1st
Categoría
$4.89
Verda Cloud
1st
Categoría
$4.89
Verda Cloud

Rendimiento de referencia

Rango
Categoría
Actuación
7th
Inferencia de imágenes (eficiencia)
79k token/$
1st
Inferencia de imágenes (Rendimiento)
110 token/s
7th
Ajuste fino de imagen (eficiencia)
82k image/$
1st
Ajuste fino de imágenes (rendimiento)
114 image/s
3rd
Inferencia de texto (Eficiencia)
23M token/$
1st
Inferencia de texto (Rendimiento)
33k token/s
4th
Optimización del texto (Eficiencia)
13M image/$
1st
Ajuste fino del texto (rendimiento)
18k image/s

Especificaciones técnicas

Blackwell
Arquitectura
192 GB
Memoria
8.20 TB/s
Ancho de banda
1,000 W
TDP
75 TFLOPS
Rendimiento FP32
2,250 TFLOPS
Rendimiento del BF16

Precios de los proveedores por región

Proveedor
/ Región
Precio por hora
Verda Cloud
/ North Europe
$4.89 (x1 GPU)
Runpod
/ East Europe
$4.99 (x1 GPU)
Lambda
/ Australia & New Zealand
$5.29 (x1 GPU)
Vultr
/ Not Specified
$23.92 (x8 GPUs)
Cirrascale
/ North America
$47.92 (x8 GPUs)
Coreweave
/ Not Specified
$68.80 (x8 GPUs)

FAQ

Esta página te ayuda a comparar las especificaciones técnicas y los precios de los distintos modelos. Para obtener una visión general del mercado basada en la relación rendimiento-precio, puedes consultar nuestra completa comparativa de GPU en la nube , que compara diferentes proveedores y modelos de precios para diversas cargas de trabajo de IA.

Una instancia de GPU en la nube, tema central de esta página, consiste en alquilar un servidor virtual con una GPU dedicada por horas. Esto proporciona acceso continuo al hardware, lo que resulta ideal para tareas de larga duración como el entrenamiento de modelos o cargas de trabajo predecibles. Puede consultar una comparación más amplia de proveedores en nuestra comparativa principal de GPU en la nube .

Una GPU sin servidor es un modelo diferente en el que solo se paga por segundo, por el tiempo real de ejecución del código, sin necesidad de gestionar ningún servidor. Esto resulta muy rentable para tareas con tráfico variable, como las API de inferencia. Si este modelo se ajusta a sus necesidades, puede comparar proveedores en nuestra herramienta de evaluación comparativa de GPU sin servidor .

Si bien NVIDIA es actualmente el líder del mercado, empresas como AMD e Intel son fuertes competidores, y proveedores de servicios en la nube como AWS y Google también fabrican sus propios chips personalizados. Puede obtener más información sobre los principales fabricantes de chips de IA y el panorama general de la industria en nuestro informe detallado.

La decisión depende de factores como la experiencia de tu equipo, la previsibilidad de la carga de trabajo y el presupuesto a largo plazo. Nuestra guía sobre si comprar o alquilar GPU analiza las ventajas y desventajas de cada opción para ayudarte a tomar la decisión estratégica más adecuada para tu negocio.

Esta puntuación mide la relación coste-eficacia de una GPU. Indica cuántos millones (M) de tokens o imágenes se obtienen por cada dólar estadounidense invertido, combinando velocidad y precio en un único valor de rendimiento por dólar. En todas las pruebas de rendimiento de esta página, una puntuación más alta siempre es mejor, ya que significa que se obtiene un mayor rendimiento por el dinero invertido.

La inferencia mide la eficiencia al usar un modelo preentrenado para generar contenido nuevo (como texto o imágenes). Una puntuación alta en inferencia es crucial para que aplicaciones como chatbots o generadores de arte con IA funcionen sin problemas y de forma económica.

El entrenamiento (o ajuste fino) mide la eficiencia para personalizar un modelo existente con tus propios datos. Una puntuación alta en el entrenamiento es importante si necesitas crear modelos especializados de forma rápida y rentable.

Pruebas de rendimiento de texto (medidas en tokens/$): Estas puntuaciones son relevantes para cargas de trabajo basadas en lenguaje. Elija una GPU con puntuaciones altas en pruebas de texto para tareas como la ejecución de modelos de lenguaje complejos (LLM), la creación de contenido y la generación de código.

Rendimiento de imagen (medido en imágenes/$): Estas puntuaciones son relevantes para cargas de trabajo visuales. Elija una GPU con un alto rendimiento de imagen para tareas como la generación de arte con IA, el reconocimiento de objetos o la creación de datos de imágenes sintéticas.