Servicios
Contáctanos

Modelos de IA

Explore los principales modelos LLM en cuanto a referencias de rendimiento, latencia y precios.

Model
Score (%)
Input Price
Output Price
Anthropic
Anthropic
Jun/9/2026

Claude Fable 5

Puntuación general92
Ventana de contexto1M
Input Price($/M)$10.00
Output Price($/M)$50.00
Max Output Tokens128k
Max Output Tokens128k

Rendimiento de referencia

IA múltiple
Resistente
Rango
Categoría
Puntos de referencia
Puntaje
1st
Finance
FinanceReasoning
90
2nd
Intelligence
Agentic RAG
98
1st
Intelligence
Text-to-SQL
90
1st
Legal
LegalBench
89

Análisis de costos

Precio combinado (USD/1 millón de tokens)
$7.70
De Anthropic
Latencia mínima
90.16s
De Google Vertex

FAQ

Considere sus necesidades principales: Creación de contenido: Concéntrese en el razonamiento de la IA y las puntuaciones de memoria. Desarrollo de software: Priorice el rendimiento del código de IA. Análisis de datos: Analice las puntuaciones de texto a SQL y finanzas de IA. Automatización empresarial: Considere Agentic RAG y el rendimiento de los agentes de IA. Precisión fáctica: Enfatice las bajas tasas de alucinaciones.

Estos representan diferentes niveles de la familia GPT-5 de OpenAI: GPT-5: Modelo insignia con todas las funciones. GPT-5 Mini: Optimizado para velocidad y costo manteniendo un alto rendimiento. GPT-5 Nano: Versión ultrarrápida y ligera para aplicaciones de alto volumen.

Los sufijos de fecha indican fechas límite específicas para la capacitación o versiones de lanzamiento. Por ejemplo, "claude-3-7-sonnet-20250219" se lanzó el 19 de febrero de 2025, lo que ayuda a los usuarios a saber qué versión exacta están evaluando.

El "32b" en modelos como "exaone-4.0-32b" se refiere a 32 mil millones de parámetros. Generalmente, un mayor número de parámetros permite un mejor rendimiento, pero también requiere más recursos computacionales y, por lo tanto, su ejecución es más costosa.

Variantes mini: Optimizadas para velocidad y coste, con un rendimiento típico del 65-80% de los modelos completos. Variantes altas: Configuraciones de máximo rendimiento, a menudo con mayores requisitos computacionales.