Şevval Alper
Şevval es investigadora de IA en AIMultiple. Cuenta con experiencia previa en la generación de números pseudoaleatorios mediante sistemas caóticos.
Intereses de investigación
Şevval se centra en herramientas de codificación de IA, agentes de IA y tecnologías cuánticas.
Forma parte del equipo de evaluación comparativa de AIMultiple, donde realiza análisis y aporta información para ayudar a los lectores a comprender diversas tecnologías emergentes y sus aplicaciones.
Experiencia profesional
Contribuyó a la organización y orientación de los participantes en tres eventos de "Clases Magistrales Internacionales del CERN: física de partículas práctica" en Turquía, trabajando junto con el profesorado para facilitar el aprendizaje.
Educación
Şevval posee una licenciatura en Física por la Universidad Técnica de Oriente Medio.
Últimos artículos de Şevval
Comparativa de plataformas de agentes de IA: Agentes gestionados por Claude frente a Vertex Agent Engine (Google)
Evaluamos cuatro plataformas de agentes de IA en tres dimensiones: finalización de tareas (10 tareas de codificación × 3 ejecuciones), capacidades específicas del entorno (dirección, reconexión, recuperación de conversaciones largas, manejo de archivos grandes) y costo.
MCP Benchmark: Los mejores servidores MCP para acceso web
Realizamos pruebas de rendimiento en 8 servidores MCP en tareas de búsqueda y extracción web, así como en tareas de automatización de navegadores, ejecutando 4 tareas diferentes 5 veces en todos los MCP adecuados. También realizamos una prueba de carga con 250 agentes de IA concurrentes.
Comparativa de creación de vídeos con IA para comercio electrónico: Veo 3 frente a Sora 2
La visualización de productos juega un papel crucial en el éxito del comercio electrónico, pero crear videos de productos de alta calidad sigue siendo un desafío importante. Los recientes avances en la tecnología de generación de video con IA ofrecen soluciones prometedoras.
Evaluación comparativa de herramientas de revisión de código de IA
Con el creciente uso de herramientas de codificación con IA, las bases de código se han vuelto más propensas a las vulnerabilidades, lo que ha aumentado la necesidad de revisiones de código efectivas.
Referencia de la IA general: ¿Puede la IA generar valor económico?
La IA tendrá su mayor impacto cuando los sistemas de IA comiencen a crear valor económico de forma autónoma. Evaluamos si los modelos de vanguardia pueden generar valor económico. Les pedimos que crearan una nueva aplicación digital (por ejemplo, un sitio web o una aplicación móvil) que pudiera monetizarse con un modelo SaaS o basado en publicidad.
8 modelos de código de IA evaluados: LMC-Eval
Más del 37 % de las tareas realizadas en modelos de IA están relacionadas con la programación informática y las matemáticas.
Prueba de rendimiento OCR: Precisión en la extracción/captura de texto
La precisión del OCR es fundamental para muchas tareas de procesamiento de documentos, y los sistemas LLM multimodales de última generación ofrecen ahora una alternativa al OCR. Realizamos una evaluación comparativa de los principales servicios de OCR en DeltOCR Bench para identificar sus niveles de precisión en diferentes tipos de documentos: Evaluación comparativa de OCR: DeltOCR Bench.
Prueba de rendimiento del generador de texto a vídeo
Un generador de texto a vídeo es un sistema de IA que convierte textos escritos en vídeos cortos generando imágenes, movimiento y, a veces, audio directamente a partir del lenguaje natural.
Ejecución de código con MCP: Un nuevo enfoque para la eficiencia de los agentes de IA
Anthropic introdujo un método en el que los agentes de IA interactúan con los servidores del Protocolo de Contexto del Modelo (MCP) escribiendo código ejecutable en lugar de realizar llamadas directas a las herramientas. El agente trata las herramientas como archivos en una computadora, encuentra lo que necesita y las usa directamente con el código, por lo que los datos intermedios no tienen que pasar por la memoria del modelo.
Parámetros LLM: GPT-5 Alto, Medio, Bajo y Mínimo
Los nuevos LLM, como la familia OpenAI (GPT-5), vienen en diferentes versiones (por ejemplo, GPT-5, GPT-5-mini y GPT-5-nano) y con diversas configuraciones de parámetros, incluyendo alto, medio, bajo y mínimo. A continuación, exploramos las diferencias entre estas versiones del modelo recopilando su rendimiento en pruebas de referencia y los costos de ejecución de dichas pruebas. Precio vs.
Boletín informativo de AIMultiple
Reciba un correo electrónico gratuito a la semana con las últimas noticias tecnológicas B2B y análisis de expertos para impulsar su empresa.