Un modelo de IA pequeño pero potente domina el discurso emocional
Nari Labs ha desarrollado Dia-1.6B, un modelo compacto de inteligencia artificial de código abierto diseñado para revolucionar la síntesis del habla emocional. A pesar de su pequeño tamaño, con solo 1600 millones de parámetros, el modelo afirma superar a líderes del sector como ElevenLabs y Sesame. La capacidad de Dia para imitar matices emocionales, como la risa, la tos e incluso un grito convincente, lo diferencia de sus competidores, que a menudo fallan a la hora de transmitir emociones de forma natural. Funcionando de manera eficiente en tiempo real en una sola GPU, aborda retos persistentes como la granularidad emocional y el efecto «valle inquietante», en el que las voces sintéticas suenan realistas pero carecen de emoción auténtica. El lanzamiento del modelo despierta el interés de las comunidades de IA, destacando los avances en la comunicación entre humanos y máquinas.
¿Por qué Inbenta?

