Après deux ans de travail acharné, la startup Etched annonce une avancée majeure qui pourrait bouleverser le marché des puces pour l’intelligence artificielle (IA). La puce Sohu, promet d’équiper les prochaines générations de plateformes dédiées à l’IA générative, avec des performances qui surpassent de loin les meilleures solutions actuelles de Nvidia.
Etched a développé un circuit intégré spécifique à l’application (ASIC) destiné à traiter les “transformers”, une architecture de modèle d’apprentissage profond. Cette technologie est au cœur des modèles d’IA les plus avancés, comme GPT-4 d’OpenAI, Antrophic Claude, Gemini de Google et Llama de Meta (Facebook).
La puce Sohu se dessine comme un monstre de puissance, capable de surpasser les meilleures solutions de Nvidia par un facteur de 10. Là où une configuration serveur avec huit clusters GPU H100 atteint 25 000 jetons par seconde pour les modèles Llama-3 70B, et où les huit derniers clusters GPU B200 “Blackwell” poussent le curseur à 43 000 jetons/s, les huit clusters Sohu seraient capables de produire 500 000 jetons par seconde. Ces chiffres indiquent une performance 20 fois supérieure à Hopper et 10 fois supérieure à Blackwell.
L’architecture de Sohu est si efficace que 90 % des FLOPS (opérations en virgule flottante par seconde) peuvent être utilisés, alors que les GPU traditionnels n’affichent qu’un taux d’utilisation de 30 à 40 %. Cette efficacité est susceptible d’ouvrir la voie à une nouvelle gamme d’applications d’IA nécessitant une sortie en temps réel.
Cependant, l’enthousiasme doit être tempéré par une certaine prudence. Bien que les transformateurs soient actuellement considérés comme l’avenir du développement de l’IA, il n’est pas certain que cette approche reste dominante à long terme. La pertinence de puces très spécialisées comme la Sohu pourrait être que temporaire. Cela rappelle l’engouement pour le minage de crypto-monnaies avec l’arrivée de “crypto-ASIC” spécialisés, qui ont rapidement perdu de leur valeur. L’un des exemples les plus récent est le passage de l’Ethereum de la preuve de travail à la preuve d’enjeu.
La puce Sohu de’Etched représente une avancée dans le domaine des puces dédiées à l’IA, avec des performances et une efficacité prometteuses. Cependant, l’évolution rapide des technologies et des approches en IA nécessite de rester prudent quant à la durabilité de cette innovation.
Source : TechPowerUp
Si vous recherchez une carte mère Intel ou AMD, de bonnes affaires sont en cours… Lire d'avantage
À l'occasion du Black Friday, Gigabyte propose une page spéciale sur son site Internet, mettant… Lire d'avantage
Les joueurs espérant des cartes graphiques à prix réduit pendant les fêtes pourraient être déçus.… Lire d'avantage
Microsoft a publié KB5046714 pour les PC Windows 10 22H2. Il s’agit d’une mise à… Lire d'avantage
Positionné à 149,90 € et équipé de deux ventilateurs NF-A14x25r G2 à cadre rond le… Lire d'avantage
Positionné à 149,90 €, le NH-D15 G2 promet des performances Aircooling ultimes. A l'usage est-il… Lire d'avantage