Un modèle d'IA minuscule mais puissant maîtrise le discours émotionnel

28 avril 2025
Automatiser l'expérience client grâce à l'IA conversationnelle
Découvrez la puissance d'une plateforme qui vous offre le contrôle et la flexibilité nécessaires pour offrir des expériences client enrichissantes à grande échelle.
Planifier une démo

Nari Labs a développé Dia-1.6B, un modèle d'IA open source compact conçu pour révolutionner la synthèse vocale émotionnelle. Malgré sa petite taille (seulement 1,6 milliard de paramètres), ce modèle prétend surpasser les leaders du secteur tels qu'ElevenLabs et Sesame. La capacité de Dia à imiter les nuances émotionnelles, notamment le rire, la toux et même un cri convaincant, le distingue de ses concurrents qui peinent souvent à restituer des émotions naturelles. Fonctionnant efficacement en temps réel sur un seul GPU, il relève des défis persistants tels que la granularité émotionnelle et l'effet « uncanny valley », où les voix synthétiques semblent réalistes mais manquent d'émotions authentiques. La sortie de ce modèle suscite l'intérêt des communautés d'IA, soulignant les progrès réalisés dans le domaine de la communication homme-machine.

Pourquoi Inbenta ?

Grâce à notre solution d'IA composite, votre agent virtuel apprend en permanence de chaque interaction, atteignant une précision supérieure à 99 %.
En savoir plus
Logo Gartners Peer Insights
Basé sur plus de 20 évaluations par des pairs
Service et assistance

Articles connexes publiés cette semaine sur l'IA

OpenAI clôture un tour de table record de 122 milliards de dollars, avec une valorisation de 852 milliards de dollars
En savoir plus
Microsoft fait collaborer des modèles d'IA concurrents dans un nouvel outil de recherche
En savoir plus
Anthropic divulgue accidentellement des informations sur son modèle d'IA le plus puissant à ce jour
En savoir plus