Análisis

Los 7 mejores métodos para el análisis de sentimiento en audio

actualizado el 3 de jul. de 2026

A medida que aumenta el número de consumidores y los datos de los usuarios se acumulan a diario, la explosión de datos no es ninguna sorpresa. Las empresas utilizan la recolección de datos y el análisis para mejorar las ventas, los conocimientos sobre los clientes o la reputación de la marca. Aunque los datos de voz son la retroalimentación más directa que las empresas reciben de los clientes, a menudo pasan por alto su importancia.

Para comprender mejor cómo evalúan los clientes los productos y servicios, explore cómo analizar el sentimiento en archivos de audio y los ocho métodos principales que las empresas pueden implementar:

¿Qué es el análisis de sentimiento en audio?

Los métodos tradicionales de análisis de sentimiento se basan principalmente en textos escritos como reseñas, comentarios, encuestas, etc. Sin embargo, dado que el lenguaje humano es complejo, matices como la ironía, el sarcasmo o las intenciones no siempre se entienden fácilmente en el contenido escrito.

El tono acústico en los archivos de audio contiene información más rica y ofrece mejores perspectivas sobre los sentimientos.¹ La información sobre el sentimiento se puede recopilar a partir de diversas características de la voz, como²

tono
volumen
timbre de voz
otras medidas relacionadas con la frecuencia

Por lo tanto, las emociones se pueden reconocer mejor combinando el tono del habla y el análisis del contenido escrito que considerando solo los comentarios escritos.

En los últimos años, las empresas comenzaron a implementar métodos de análisis de sentimiento en audio para comprender mejor los sentimientos de sus clientes y brindarles una mejor experiencia.

¿Cómo funciona el análisis de sentimiento en audio?

Figura 1. Una comparación simplificada del análisis de sentimiento en contenido escrito y multimodal (texto + audio)

Aquí puede ver la importancia de considerar las fuentes de audio al analizar el sentimiento. Cuando se tiene en cuenta la voz, el sentimiento general cambia en el análisis de sentimiento en audio.

Fuente: CM-BERT: Cross-Modal BERT para el análisis de sentimiento de texto y audio.³

Los pasos del análisis de sentimiento en audio son:

1. Recopilación del audio

Recopilación del audio

Comience por recopilar el audio. Puede utilizar grabaciones en vivo, archivos pregrabados o audio de plataformas en línea.

Garantizar la calidad

Un audio claro es esencial. Intente reducir el ruido de fondo y mantener el sonido nítido. Además, asegúrese de que sus datos sean diversos: diferentes voces, tonos y emociones ayudarán a que su modelo aprenda mejor.

Preprocesamiento

Una vez recopilado, limpie el audio. Esto incluye eliminar el ruido, ajustar el volumen y recortar los silencios. Estos pasos preparan el audio para las siguientes fases.

2. Transcripción a texto

Conversión de audio a texto

Las herramientas de reconocimiento de voz convierten las palabras habladas en texto. OpenAI’s Whisper sigue siendo una opción común, pero las versiones actuales, como large-v3 y el más rápido large-v3-turbo, han reemplazado la versión de 2022 que la mayoría de las guías todavía citan. Las opciones más recientes, incluidos los modelos de transcripción GPT-4o de OpenAI, añaden etiquetado de hablante incorporado. Eso elimina la necesidad de una herramienta separada para distinguir la voz de un agente de la de un cliente en una llamada grabada.

Limpieza del texto

El texto transcrito puede necesitar formateo. Es posible que deba eliminar la puntuación adicional, poner todas las palabras en minúsculas o limpiar caracteres especiales.

3. Elección del modelo

Elija un modelo que funcione bien con audio y texto. Algunos modelos están entrenados con lenguaje emocional o hablado. Elija uno con buena precisión y flexibilidad.

4. Interpretación y uso de los resultados

Comprender los resultados

Utilice los datos para conocer cómo se sienten las personas. Esto es útil en áreas como el servicio al cliente, el marketing y la retroalimentación pública.

Visualización de resultados

Muestre las puntuaciones de sentimiento en gráficos, tablas o paneles. Esto ayuda a las personas a ver rápidamente el tono emocional del audio.

7 métodos para realizar el análisis de sentimiento en audio

Existen siete métodos principales para realizar el análisis de sentimiento en audio.

1- Reconocimiento automático del habla (ASR)

Figura 2. Un ejemplo de cómo funciona el ASR

Aquí hay una imagen de cómo funciona el reconocimiento automático del habla y cómo ayuda al análisis de sentimiento en audio.

Fuente: Extracción de sentimiento de flujos de audio naturales⁴

Proceso: El ASR transcribe las oraciones habladas a texto mediante el reconocimiento de voz. Luego, el texto transcrito se analiza en busca de sentimiento utilizando técnicas de procesamiento del lenguaje natural (NLP).

Ejemplo: En los centros de llamadas, el ASR puede transcribir las conversaciones con los clientes, lo que permite que los modelos de análisis de sentimiento determinen el sentimiento general de la interacción.

2- WaveNet (Análisis de forma de onda de audio sin procesar)

Proceso: WaveNet analiza las formas de onda de audio sin procesar directamente para extraer características de audio utilizando redes neuronales profundas. Este método no requiere la transcripción del audio y puede capturar detalles intrincados de la señal de audio. Es un método probabilístico que ofrece resultados de vanguardia con un conjunto de datos multimodal (texto+audio).

Ejemplo: WaveNet puede detectar diferentes emociones a partir del tono y el timbre del audio, proporcionando una buena representación del estado emocional del hablante.

WaveNet se creó principalmente para generar voz, no para puntuar el sentimiento. Los equipos que hoy trabajan en el análisis de sentimiento a partir de formas de onda sin procesar suelen recurrir más a codificadores autosupervisados como Wav2Vec 2.0 o HuBERT, entrenados específicamente para representar tanto el contenido del habla como las señales vocales como el tono.⁵ La idea central de WaveNet, aprender directamente de la forma de onda en lugar de utilizar características diseñadas manualmente, sigue siendo válida. El modelo específico ha sido reemplazado en gran medida por estos codificadores más nuevos.

3- Representaciones de codificador bidireccional intermodal de transformadores (CM-BERT)

Figura 3. La arquitectura de la red CM-BERT

La figura muestra cómo funcionan las representaciones de codificador bidireccional intermodal de transformadores. Al ser un marco intermodal, puede comparar la información procedente de diferentes modalidades, como texto y análisis de sentimiento en audio.

Fuente: CM-BERT: Cross-Modal BERT para el análisis de sentimiento de texto y audio.⁶

Proceso: El enfoque CM-BERT se basa en la interacción entre texto y audio y ajusta dinámicamente el peso de las palabras comparando la información de diferentes modalidades. Utiliza modelos de aprendizaje automático para analizar tanto la señal de audio como su transcripción, aprovechando las fortalezas de ambas modalidades.

Ejemplo: En un proyecto que analiza grabaciones de audio de podcasts, CM-BERT puede proporcionar información sobre el sentimiento expresado tanto en las palabras habladas como en las características del audio.

4- Coeficientes cepstrales de frecuencia Mel (MFCCs)

Proceso: Los MFCCs se utilizan para representar el espectro de potencia a corto plazo del sonido. Se extraen de las grabaciones de audio y se utilizan como características para los modelos de análisis de sentimiento.

Ejemplo: Al analizar los MFCCs, los modelos de aprendizaje automático pueden reconocer diferentes estados emocionales en archivos de audio, como felicidad, tristeza o ira.

Los MFCCs siguen funcionando como un conjunto de características ligero y rápido, y siguen siendo una opción predeterminada razonable para equipos con presupuestos de cómputo ajustados. Los modelos autosupervisados más nuevos, como Wav2Vec 2.0, HuBERT y emotion2vec, ahora superan a los sistemas basados en MFCCs en la mayoría de los benchmarks publicados, ya que aprenden características directamente del audio sin procesar en lugar de depender de una fórmula fija.⁷ Los equipos que buscan la máxima precisión tienden a elegir uno de estos en su lugar.

5- Análisis de características prosódicas

Proceso: Este método analiza las características prosódicas como la entonación, el acento y el ritmo en el habla. Estas características son cruciales para comprender el tono emocional en las grabaciones de audio.

Ejemplo: El análisis de características prosódicas se puede utilizar en las interacciones de servicio al cliente para identificar el estrés o la frustración en la voz de un cliente, lo que ayuda a mejorar la interfaz de usuario y las estrategias de respuesta.

6- Redes neuronales profundas (DNNs)

Proceso: Las DNNs se pueden entrenar en grandes conjuntos de datos de grabaciones de audio para reconocer patrones y clasificar sentimientos. Son capaces de aprender representaciones complejas de datos de audio.

Ejemplo: Las DNNs se pueden emplear en proyectos de análisis de sentimiento donde se requiere una alta precisión, como en publicaciones de audio en redes sociales para medir la opinión pública.

emotion2vec, lanzado en 2024 y mantenido activamente hasta 2026, es un modelo de código abierto entrenado específicamente para extraer señales emocionales del audio sin procesar.⁸ Se ejecuta en una sola GPU, es de uso gratuito y se ha convertido en una línea base común en la investigación de emociones en el habla: el papel que Whisper juega para la transcripción.

7- Redes neuronales recurrentes (RNNs) y redes de memoria a corto y largo plazo (LSTM)

Figura 4. Redes neuronales recurrentes con dos capas ocultas

Redes neuronales recurrentes con dos capas ocultas en el análisis de sentimiento en audio

Fuente: Clasificación y predicción de sistemas caóticos de ondas con técnicas de aprendizaje automático.⁹

Proceso: Las RNNs y LSTMs están diseñadas para manejar datos secuenciales, lo que las hace adecuadas para analizar dependencias temporales en las señales de audio. Pueden capturar la progresión de las emociones.

Ejemplo: Al analizar grabaciones de audio largas como entrevistas o discursos, las RNNs y LSTMs pueden rastrear los cambios en el sentimiento a lo largo de todo el archivo de audio.

8- Modelos de lenguaje de audio grandes (LALMs)

Proceso: Un modelo de lenguaje de audio grande lee audio y texto en una sola pasada, dentro de un único modelo. Los métodos más antiguos dividen el trabajo en dos: un modelo convierte el habla en texto, y otro modelo lee ese texto en busca de sentimiento. Dividir el trabajo hace que se pierda información; un "Eso es genial" plano e inexpresivo puede leerse como positivo cuando se puntúan las palabras. Un modelo de lenguaje de audio grande mantiene unidos el tono, la velocidad y la elección de palabras, por lo que detecta esa falta de coincidencia.

Los ejemplos en producción a partir de 2026 incluyen GPT-4o Audio de OpenAI, Gemini 2.5 de Google y Qwen2.5-Omni de Alibaba. Cada uno acepta un clip de audio directamente y devuelve una transcripción, una etiqueta de emoción o ambas, sin exponer un paso de transcripción separado.

Ejemplo: Una plataforma de soporte enruta una llamada de cliente directamente a uno de estos modelos. Devuelve una transcripción, una puntuación de sentimiento y una nota sobre dónde cambió el tono durante la llamada, todo en una sola pasada sobre el audio.

Inconveniente: Estos modelos cuestan más por minuto de audio que los modelos más pequeños y específicos para una tarea. Los equipos que manejan grandes volúmenes de llamadas a menudo ejecutan un modelo ligero de código abierto, como emotion2vec, como un primer filtro, y luego envían las llamadas marcadas a un modelo más grande para un análisis más detallado.¹⁰

Deja que nuestro equipo automatice uno de tus procesos de negocio con agentes de IA, sin coste alguno.

Automatizar un proceso

Las 8 principales aplicaciones del análisis de sentimiento en audio

El análisis de sentimiento en audio tiene una amplia gama de aplicaciones en diversos campos, mejorando los procesos y proporcionando información valiosa en todas las industrias.

1- Centros de llamadas

En los centros de llamadas, el análisis de sentimiento en audio se utiliza para analizar las interacciones con los clientes. Al realizar un análisis de sentimiento en las grabaciones de audio, las empresas pueden determinar el sentimiento expresado durante las llamadas, ya sea positivo, negativo o neutral. Esta información puede ayudar a mejorar el servicio al cliente al:

Identificar problemas: Detectar los sentimientos negativos a tiempo permite que los agentes del centro de llamadas aborden las preocupaciones de los clientes de manera más efectiva.
Fines de capacitación: Comprender los estados emocionales de los clientes durante las llamadas se puede utilizar para capacitar a los agentes, mejorando su capacidad para manejar diferentes emociones.
Garantía de calidad: Los resultados del análisis de sentimiento se pueden utilizar para monitorear y mantener la calidad del servicio, asegurando una satisfacción constante del cliente.

2- Reconocimiento de emociones

La detección de diferentes emociones en grabaciones de audio puede mejorar significativamente las interfaces de usuario y crear sistemas de IA más empáticos. El reconocimiento de emociones a través del análisis de sentimiento en audio implica:

Experiencias personalizadas: Adaptar las respuestas en función de las emociones detectadas para proporcionar una experiencia de usuario más personalizada y atractiva.
Aplicaciones de salud mental: El monitoreo de los estados emocionales puede ayudar en las aplicaciones de salud mental al reconocer signos de estrés, ansiedad o depresión en las grabaciones de audio.
Asistentes virtuales: Mejorar las interacciones de los asistentes virtuales al permitirles responder de manera más apropiada al tono emocional del usuario.

3- Investigación de mercado

En la investigación de mercado, el análisis de sentimiento en audio de archivos de audio de grupos focales o comentarios de clientes puede proporcionar información valiosa. Al analizar los sentimientos en las respuestas habladas, las empresas pueden:

Comprender las preferencias del consumidor: Obtener información sobre las opiniones de los clientes sobre productos o servicios, lo que ayuda a las empresas a tomar decisiones informadas.
Desarrollo de productos: Utilizar los datos de sentimiento para guiar el desarrollo y la mejora de productos basados en los comentarios de los clientes.
Percepción de marca: Monitorear y analizar el sentimiento público hacia una marca, lo que permite a las empresas ajustar sus estrategias en consecuencia.

El análisis de sentimiento en audio también se puede aplicar a archivos de audio de podcasts o contenido de video compartido en plataformas de redes sociales. Esta aplicación ayuda en:

Análisis de la opinión pública: Analizar los sentimientos en el contenido hablado para medir la opinión pública sobre diversos temas.
Estrategia de contenido: Influir en las estrategias de creación de contenido al comprender las reacciones emocionales de la audiencia a diferentes tipos de contenido.
Análisis de tendencias: Identificar tendencias y sentimientos emergentes en las conversaciones de las redes sociales, lo que permite a las empresas mantenerse a la vanguardia en sus esfuerzos de marketing.

5- Atención médica

En el sector de la atención médica, el análisis de sentimiento en audio se puede aplicar a las interacciones médico-paciente, consultas de telemedicina y comentarios de los pacientes. Esto puede conducir a:

Atención mejorada al paciente: Comprender las emociones del paciente puede ayudar a los proveedores de atención médica a ofrecer una atención más empática y personalizada.
Detección temprana de afecciones: Reconocer cambios en el estado emocional de un paciente puede ayudar en la detección temprana de problemas de salud mental u otras afecciones.
Satisfacción del paciente: Analizar los comentarios de los pacientes para mejorar la calidad de los servicios de atención médica y garantizar la satisfacción del paciente.

6- Educación

En entornos educativos, el análisis de sentimiento en audio se puede utilizar para analizar las interacciones de los estudiantes, los comentarios de los profesores y las discusiones en el aula. Esto puede apoyar:

Compromiso de los estudiantes: Comprender las respuestas emocionales de los estudiantes puede ayudar a los educadores a ajustar sus métodos de enseñanza para mantener a los estudiantes comprometidos.
Monitoreo del rendimiento: El monitoreo del sentimiento en los comentarios de los estudiantes puede proporcionar información sobre la efectividad de los programas educativos y las estrategias de enseñanza.
Apoyo emocional: Identificar a los estudiantes que pueden necesitar apoyo emocional adicional, lo que permite una intervención oportuna.

7- Industria del entretenimiento

La industria del entretenimiento puede aprovechar el análisis de sentimiento en audio para analizar las reacciones de la audiencia a películas, música y otros contenidos multimedia. Esto puede conducir a:

Mejora del contenido: Utilizar los resultados del análisis de sentimiento para mejorar guiones, diálogos y el contenido general basándose en las reacciones de la audiencia.
Estrategias de marketing: Adaptar las campañas de marketing para que resuenen mejor con las respuestas emocionales de la audiencia.
Compromiso de la audiencia: Crear contenido más atractivo y emocionalmente resonante al comprender los sentimientos de la audiencia.

8- Recursos humanos

En recursos humanos, el análisis de sentimiento en audio se puede aplicar a los comentarios de los empleados, entrevistas y evaluaciones de desempeño. Esto puede mejorar:

Satisfacción de los empleados: Analizar los sentimientos en los comentarios de los empleados para mejorar las condiciones del lugar de trabajo y abordar las preocupaciones.
Procesos de reclutamiento: Comprender las respuestas emocionales de los candidatos durante las entrevistas para tomar mejores decisiones de contratación.
Gestión del desempeño: Utilizar los datos de sentimiento para respaldar las evaluaciones de desempeño y proporcionar comentarios constructivos.

Normas que debe conocer antes de implementar el análisis de sentimiento en audio en la UE

La Ley de IA de la UE prohíbe un uso específico de esta tecnología: inferir las emociones de un empleado a partir de su voz en el trabajo. Esa prohibición, en virtud del artículo 5, apartado 1, letra f), es una de las disposiciones de prácticas prohibidas de la Ley, y se aplica desde el 2 de febrero de 2025.¹¹ Los reguladores nacionales, incluida la CNIL de Francia, han publicado orientación sobre cómo prepararse para la aplicación a medida que el resto de la Ley entra en vigor: las normas sobre IA de propósito general llegaron en agosto de 2025 y la mayoría de las disposiciones restantes alcanzan su plena aplicación el 2 de agosto de 2026.

Lo que está prohibido

Interpretar las emociones a partir de la voz, el rostro u otra señal biométrica de un empleado durante las tareas laborales, entrevistas o evaluaciones de desempeño.

Lo que no está cubierto por la prohibición

Sistemas que transcriben una reunión a texto.
Sistemas centrados en la seguridad, como herramientas que detectan la fatiga del conductor.

Las dos excepciones

Uso médico.
Uso por motivos de seguridad.
Puntuar el nivel de estrés de un agente de servicio al cliente con fines de formación no se ajusta a ninguna de las dos.

El uso de cara al cliente recibe un trato diferente: Interpretar el estado de ánimo de un cliente durante una llamada de soporte no está prohibido por la legislación de la UE. Sin embargo, fuera del ámbito laboral y educativo, algunos despliegues de reconocimiento de emociones aún podrían calificarse como de alto riesgo en virtud de una parte separada de la Ley (Anexo III) y pueden desencadenar deberes de transparencia adicionales en virtud del artículo 50. La clasificación depende del despliegue específico, no del caso de uso en su conjunto.¹²

Sanciones: Las multas por infringir la prohibición en el lugar de trabajo ascienden a 35 millones de euros o al 7% de los ingresos anuales globales de una empresa, lo que sea mayor.¹³ Incluso antes de que existiera esta prohibición, la autoridad de protección de datos de Hungría ordenó a un banco que dejara de analizar el tono de voz de los empleados en virtud de las normas separadas del RGPD, en lo que ahora se conoce como el caso Budapest Bank: una señal de que los reguladores ya estaban considerando esto como un problema en virtud de la ley de privacidad anterior.¹⁴

Lo que esto significa para los métodos anteriores

Puntuar el sentimiento del cliente en un centro de llamadas sigue siendo viable en toda la UE, sujeto a los controles de alto riesgo y transparencia mencionados anteriormente.
Aplicar la misma puntuación a la voz de un agente, para rastrear el estado de ánimo o el estrés durante un turno, está prohibido en virtud del artículo 5, apartado 1, letra f), a menos que se aplique la excepción médica o de seguridad.
Los casos de uso de entrevistas y evaluaciones de desempeño, mencionados en la sección de recursos humanos anterior, suelen estar prohibidos directamente en lugar de ser meramente de alto riesgo. Considérelos como fuera de los límites en los despliegues en la UE sin una justificación médica o de seguridad confirmada, no como una "revisión antes del lanzamiento".

Descubre más de nuestros análisis comparativos e insights basados en datos en la Búsqueda de Google.

Añadir como fuente preferida

¿Qué tan exitosas son las herramientas de análisis de sentimiento en audio?

Un benchmark de 2025, AHELM, probó qué tan bien los modelos de lenguaje de audio grandes manejan la detección de emociones específicamente, junto con otras nueve tareas de comprensión de audio.¹⁵ Gemini 2.5 Pro de Google lideró el grupo en general, encabezando cinco de las diez categorías, incluida la detección de emociones. Ningún modelo lideró todas las categorías. La elección de un modelo todavía depende del caso de uso específico, no del puesto en una tabla de clasificación.

Un experimento de benchmarking de 2026 evaluó qué tan bien los modelos modernos detectan el sentimiento directamente a partir de las señales del habla.¹⁶ Los resultados muestran que el análisis de sentimiento basado en audio puede capturar señales emocionales como el tono, el timbre y la velocidad del habla. Estas señales a menudo se pierden cuando el habla se convierte a texto.

El estudio evaluó varios modelos de voz conocidos, incluidos HuBERT,¹⁷ Wav2Vec,¹⁸ y Whisper.¹⁹ Cuando los modelos analizaron frases cortas pronunciadas con diferentes tonos emocionales, el rendimiento fue relativamente bueno. La precisión osciló entre el 78–91%, lo que indica que estos modelos pueden detectar señales emocionales claras en el habla controlada.

Sin embargo, el rendimiento disminuyó cuando los modelos se evaluaron en oraciones más complejas y variadas. En estos casos, la precisión cayó a alrededor del 54–60%. Los modelos tuvieron dificultades porque el significado de las oraciones, el estilo del hablante y el contexto variaban más ampliamente.

En general, los resultados sugieren que las herramientas de análisis de sentimiento en audio pueden funcionar bien cuando las señales emocionales son claras. Sin embargo, su rendimiento disminuye en conversaciones realistas. Por esta razón, muchos sistemas combinan señales de audio y análisis de texto para mejorar la fiabilidad.

Lecturas adicionales

Cita esta investigación

Elige el formato que se ajuste al lugar donde vas a publicar. Pegar la versión con enlace en tu CMS conserva el enlace de retroceso.

Ezgi Arslan, PhD. (2026) - "Los 7 mejores métodos para el análisis de sentimiento en audio". Publicado en línea en AIMultiple.com. Recuperado el 3 de Julio de 2026, de: https://aimultiple.com/audio-sentiment-analysis [Recurso en línea]

PhD., E. A. (2026, 3 de Julio). Los 7 mejores métodos para el análisis de sentimiento en audio. AIMultiple. https://aimultiple.com/audio-sentiment-analysis

@misc{phd2026,
  author = {PhD., Ezgi Arslan,},
  title  = {{Los 7 mejores métodos para el análisis de sentimiento en audio}},
  year   = {2026},
  month  = jul,
  howpublished    = {\url{https://aimultiple.com/audio-sentiment-analysis}},
  note   = {AIMultiple. Recuperado el 3 de Julio de 2026}
}

Enlaces de referencia

APA PsycNet

Towards Discriminative Representation Learning for Speech Emotion Recognition | IJCAI

CM-BERT | Proceedings of the 28th ACM International Conference on Multimedia

Cerrar este diálogo

Speaker Emotion Recognition: Leveraging Self-Supervised Models for Feature Extraction Using Wav2Vec2 and HuBERT

CM-BERT | Proceedings of the 28th ACM International Conference on Multimedia

https://www.isca-archive.org/interspeech_2025/uniyal25_interspeech.pdf

Speech emotion recognition using fine-tuned Wav2vec2.0 and neural controlled differential equations classifier - PMC

[1908.04716] Classification and prediction of wave chaotic systems with machine learning techniques

arXiv preprint arXiv:1908.04716

10.

emotion2vec (emotion2vec)

11.

EU AI Act Article 5: The Complete Guide to Prohibited AI Practices – eyreACT: AI Compliance Automation Platform

12.

Article 5: Prohibited AI Practices | EU Artificial Intelligence Act

13.

Article 99: Penalties | AI Act Service Desk

14.

https://cjc.eui.eu/data/data/data?idPermanent=858&triial=1

15.

AHELM: A Holistic Evaluation of Audio-Language Models

16.

Sentiment Analysis with Text and Audio Using AWS Generative AI Services: Approaches, Challenges, and Solutions | Artificial Intelligence

17.

[2106.07447] HuBERT: Self-Supervised Speech Representation Learning by Masked Prediction of Hidden Units

18.

[2006.11477] wav2vec 2.0: A Framework for Self-Supervised Learning of Speech Representations

19.

GitHub - openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervision · GitHub

Ezgi Arslan, PhD.

Analista de Industria

Ezgi tiene un doctorado en Administración de Empresas con especialización en finanzas y se desempeña como Analista de Industria en AIMultiple. Ella impulsa la investigación y los conocimientos en la intersección de la tecnología y los negocios, con experiencia en sostenibilidad, análisis de encuestas y sentimientos, aplicaciones de agentes de IA en finanzas, optimización de motores de respuestas, gestión de firewalls y tecnologías de adquisiciones.

Ver perfil completo