Le plus grand processeur jamais construit contient 1,2 billion de transistors, laissant derrière les processeurs et GPU Intel et AMD haut de gamme

Matériel / Le plus grand processeur jamais construit contient 1,2 billion de transistors, laissant derrière les processeurs et GPU Intel et AMD haut de gamme 3 minutes de lecture

Source du processeur CerebrasSystems - HPCGuru



Une entreprise a réussi à créer la plus grande puce de traitement jamais produite qui dépasse de loin tout ce qu'Intel ou AMD a jamais produit. Avec 1,2 billion de transistors insensés sur la tranche de silicium, le processeur est de loin la plus grande puce semi-conductrice jamais construite. La société derrière le processeur prévoit de dédier la puce pour stimuler l'intelligence artificielle (IA).

Le moteur Cerebras Wafer Scale Engine, fabriqué par la nouvelle société d'intelligence artificielle Cerebras Systems, est la plus grande puce semi-conductrice jamais construite. L'unité centrale de traitement ou CPU a 1,2 billion de transistors, qui sont les commutateurs électroniques marche-arrêt les plus basiques et les plus essentiels de toutes les puces de silicium. Le processeur récemment fabriqué par le processeur Advanced Micro Devices compte 32 milliards de transistors. Inutile de mentionner que le nombre de transistors sur Cerebras Wafer Scale Engine dépasse de loin les CPU et GPU AMD et Intel haut de gamme.



Le moteur Cerebras Wafer Scale est le plus grand processeur monopuce jamais construit:

Le Cerebras WSE est un énorme 46225 millimètres carrés d'une plaquette de silicium qui abrite 400000 cœurs de calcul optimisés pour l'IA, sans cache, sans frais généraux et 18 gigaoctets de mémoire SRAM locale, distribuée et ultra-rapide comme seul et unique niveau de mémoire hiérarchie. En comparaison, le plus grand GPU NVIDIA mesure 815 millimètres carrés et contient 21,1 milliards de transistors. Des calculs simples indiqueront que le Cerebras WSE est 56,7 fois plus grand que le GPU NVIDIA haut de gamme.



La bande passante mémoire du Cerebras WSE est de 9 pétaoctets par seconde. En d’autres termes, le plus grand processeur du monde dispose d’une mémoire intégrée à haut débit 3 000 fois supérieure et de 10 000 fois plus de bande passante mémoire. Les cœurs du processeur sont reliés entre eux par un réseau de communication maillé sur puce, à grain fin, entièrement matériel. En raison de l'architecture simplifiée et de l'énorme taille de la puce, combinée à une bande passante ultra-élevée, le processeur peut fournir une bande passante totale de 100 pétabits par seconde. En termes simples, le grand nombre de cœurs de Cerebras WSE, plus de mémoire locale et une structure à faible latence et à large bande passante en font un processeur idéal pour accélérer considérablement les tâches d'intelligence artificielle.

Pourquoi Intel et AMD ne fabriquent-ils pas d’énormes processeurs et GPU conçus sur mesure?

Intel, AMD et la plupart des autres fabricants de puces de silicium adopter une approche complètement différente et traditionnelle. Les puissants GPU et processeurs couramment disponibles sont en fait une collection de puces créées sur une tranche de silicium de 12 pouces et sont traitées dans une usine de puces par lots. Le Cerebras WSE, quant à lui, est une puce unique interconnectée sur une seule plaquette. En termes simples, tous les 1,2 billion de transistors du plus gros processeur fonctionnent vraiment ensemble comme une seule puce de silicium géante.



Il existe une raison assez simple pour laquelle des entreprises comme Intel et AMD n’investissent pas dans des tranches de silicium aussi volumineuses. Une seule tranche de silicium contient quelques impuretés, qui peuvent avoir un effet en cascade et éventuellement provoquer une défaillance. Les fabricants de puces sont bien conscients de la même chose et construisent leurs processeurs en conséquence. Par conséquent, le rendement réel des tranches de silicium en termes de puces de silicium qui fonctionnent de manière fiable est assez faible. En d'autres termes, si la plaquette de silicium ne comporte qu'une seule puce, les risques d'impuretés et de défaillance sont assez élevés.

Fait intéressant, alors que d'autres entreprises n'ont pas trouvé de solution viable, Cerebras aurait conçu sa puce pour être redondante. En termes simples, une impureté ne désactivera pas toute la puce, a noté Andrew Feldman, qui a cofondé Cerebras Systems et en est le PDG. ' Conçu à partir de zéro pour le travail d'IA, le Cerebras WSE contient des innovations fondamentales qui font progresser l'état de l'art en résolvant des défis techniques vieux de plusieurs décennies qui limitaient la taille des puces - tels que la connectivité, le rendement, la puissance et emballage. Chaque décision architecturale a été prise pour optimiser les performances du travail d'IA. Le résultat est que le Cerebras WSE offre, en fonction de la charge de travail, des centaines ou des milliers de fois les performances des solutions existantes pour une infime fraction de la consommation d'énergie et de l'espace. »

Les tâches AI continueront d'exiger des puces plus grandes:

Le nouveau processeur est conçu sur mesure pour gérer les tâches d'IA, principalement parce que les puces plus volumineuses traitent les informations plus rapidement, produisant des réponses en moins de temps. La plupart des entreprises technologiques affirment que la limitation fondamentale de l'IA d'aujourd'hui est qu'il faut trop de temps pour former des modèles. Par conséquent, quelques leaders technologiques tentent d'optimiser leurs algorithmes d'IA pour s'appuyer sur moins d'ensembles de données. Cependant, toute bonne IA s'améliorera évidemment avec des ensembles de données plus volumineux. Réduire le temps d'entraînement en augmentant la taille du processeur est un moyen d'augmenter le traitement et de réduire le temps d'entraînement sans compromettre la qualité de l'IA résultante.

La structure de communication inter-processeurs déployée sur le Cerebras WSE est également unique en son genre. Le maillage 2D à faible latence et à bande passante élevée relie les 400 000 cœurs du WSE avec un total de 100 pétabits par seconde de bande passante. De plus, les cœurs du processeur sont des noyaux d'algèbre linéaire clairsemés (SLAC), optimisés pour les primitives de calcul de réseau neuronal. Les deux aspects mettent la puce bien en tête pour les tâches d'IA. Par conséquent, il est peu probable que les joueurs puissent acheter le processeur ou le GPU le plus gros et le plus puissant pour leurs PC.

Mots clés amd intel