Taalas dévoile une puce IA hardcore destinée à l'inférence éclair
Taalas a présenté son architecture Hardcore AI, une nouvelle approche des puces d'inférence IA dont un des premiers utilisateurs a qualifié les performances de « folles ». Fondée il y a environ deux ans et demi, la société affirme pouvoir transformer un modèle IA en silicium personnalisé en renforçant les paramètres et les poids du modèle dans la conception d'une puce, dans le but d'augmenter la vitesse et l'efficacité par rapport à l'exécution du même modèle sur des accélérateurs à usage général. Cette annonce témoigne d'une pression renouvelée dans le domaine du matériel IA, les start-ups proposant des alternatives aux déploiements traditionnels centrés sur les GPU pour l'inférence de production. Taalas positionne sa plateforme comme un moyen de passer de modèles définis par logiciel à du matériel d'inférence spécialement conçu pour des charges de travail spécifiques.
Pourquoi Inbenta ?

