AI

Explore perspectivas prácticas, investigaciones y puntos de referencia sobre inteligencia artificial, incluyendo IA generativa, modelos de lenguaje a gran escala, RAG, marcos de gobernanza, prácticas MLOps y hardware de IA. Comprenda las herramientas clave, las estrategias de implementación y los casos de uso empresariales que dan forma al panorama de la IA.

Explorar: categoría

Codificación de IA Fundamentos de la IA Hardware de IA Modelos de IA Productividad de la IA IA en las industrias Automatización de documentos Aplicaciones de GenAI TRAPO

Evaluación comparativa de modelos tabulares: Rendimiento en 19 conjuntos de datos

AI ModelsMay 22

Evaluamos el rendimiento de 7 modelos de aprendizaje tabular ampliamente utilizados en 19 conjuntos de datos reales, que abarcan aproximadamente 260 000 muestras y más de 250 características en total, con tamaños de conjuntos de datos que oscilan entre 435 y casi 49 000 filas.

LLMMay 22

Evaluación de modelos de lenguaje a gran escala en: más de 10 métricas y métodos

La evaluación de modelos de lenguaje a gran escala (LLM eval) es la valoración multidimensional de estos modelos. Una evaluación eficaz es crucial para seleccionar y optimizar los LLM. Las empresas disponen de una variedad de modelos base y sus variantes, pero el éxito es incierto sin una medición precisa del rendimiento.

LLMMay 22

El panorama de la evaluación con marcos de trabajo (LLM)

La evaluación de LLM requiere herramientas que evalúen el razonamiento de múltiples turnos, el rendimiento de producción y el uso de herramientas. Dedicamos dos días a revisar marcos de evaluación populares de LLM que proporcionan métricas estructuradas, registros y trazas para identificar cómo y cuándo un modelo se desvía del comportamiento esperado.

LLMMay 22

Leyes de escalamiento de LLM: Análisis de investigadores de IA

Los grandes modelos de lenguaje predicen el siguiente token basándose en patrones aprendidos a partir de datos de texto. El término leyes de escalado de LLM se refiere a regularidades empíricas que vinculan el rendimiento del modelo con la cantidad de computación, datos de entrenamiento y parámetros del modelo utilizados durante el entrenamiento.

LLMMay 22

Más de 50 casos de uso de ChatGPT con ejemplos reales

ChatGPT alcanzó los 900 millones de usuarios activos semanales a principios de 2026, aproximadamente el 10 % de la población mundial. OpenAI llegó a los 10 mil millones de dólares en ingresos recurrentes anuales a mediados de 2025. Pero, ¿qué hacen esos 900 millones de personas con él? OpenAI y el economista de Harvard David Deming analizaron 1,5 millones de conversaciones para averiguarlo.

LLMMay 21

Comparación de 9 modelos de lenguaje de gran tamaño en el sector sanitario

Evaluamos 9 modelos LLM utilizando el conjunto de datos MedQA, un referente para exámenes clínicos de posgrado derivado de preguntas del USMLE. Cada modelo respondió los mismos escenarios clínicos de opción múltiple con una consigna estandarizada, lo que permitió una comparación directa de la precisión. También registramos la latencia por pregunta dividiendo el tiempo total de ejecución entre el número de ítems de MedQA completados.

AI HardwareMay 20

Índice de precios de alquiler de GPU en la nube

Las tarifas bajo demanda para las GPU en la nube de última generación (B200, B300, MI300X, RTX 5090) prácticamente se duplicaron durante el último año, mientras que las tarjetas convencionales (H100, H200, A100) mantuvieron precios estables. Recopilamos mensualmente el índice de GPU de 58 proveedores y 17 modelos de GPU, que abarca niveles bajo demanda, spot y de reserva anual.

RAGMay 20

Modelos de incrustación multimodal: Apple vs Meta vs OpenAI

Los modelos de incrustación multimodal destacan en la identificación de objetos, pero tienen dificultades con las relaciones. Los modelos actuales tienen problemas para distinguir entre "teléfono en un mapa" y "mapa en un teléfono". Realizamos pruebas comparativas con 7 modelos líderes en MS-COCO y Winoground para medir esta limitación específica. Para garantizar una comparación justa, evaluamos cada modelo en condiciones idénticas utilizando hardware A40 (NVIDIA) y precisión bfloat16.

AI HardwareMay 20

DGX Spark vs Mac Studio y Halo: Pruebas de rendimiento y alternativas

El DGX Spark de NVIDIA entró en el mercado de la IA de escritorio en 2025 a un precio de 4699 dólares, posicionándose como una «supercomputadora de IA de escritorio». Incorpora 128 GB de memoria unificada y promete un petaflop de rendimiento de IA FP4 en un chasis del tamaño de un Mac Mini.

AI HardwareMay 20

Los 25 principales fabricantes de chips de IA: NVIDIA y sus competidores

Según nuestra experiencia ejecutando la prueba de rendimiento de GPU en la nube de AIMultiple con 10 modelos de GPU diferentes en 4 escenarios distintos, estas son las principales empresas de hardware de IA para cargas de trabajo de centros de datos. Siga los enlaces para ver nuestra justificación de cada selección: Más de 25 fabricantes de chips de IA por categoría *Los modelos seleccionados se basan en los últimos anuncios.

AI HardwareMay 20

GPU en la nube para aprendizaje profundo: disponibilidad y precio/rendimiento

Si tiene flexibilidad en cuanto al modelo de GPU, identifique la GPU en la nube más rentable según nuestra comparativa de 10 modelos de GPU en escenarios de generación y ajuste de imágenes y texto. Precio de la GPU en la nube por rendimiento. Dos modelos de precios comunes para las GPU son las instancias «bajo demanda» y las instancias «spot».

...5 6 7 8 9...