Au apărut detalii despre procesorul Arm al gigantului IT japonez Fujitsu, care susține că se pare că va oferi performanțe HPC mai bune decât GPU-urile Nvidia, dar cu un cost de putere mai mic.
Fujitsu dezvoltă A64FX, un derivat Arm8 cu 48 de nuclee conceput special pentru calcule performante (HPC). În loc să proiecteze nuclee de calcul cu scop general, Fujitsu a adăugat motoare de calcul specifice inteligenței artificiale, machine learning și alte tehnologii specifice nevoilor HPC. Acesta va fi implementat într-un nou supercomputer numit Fugaku sau Post-K. Post-K este o referire la supercomputerul K, la un moment dat cel mai rapid supercomputer din lume, care a rulat pe cipuri Sparc personalizate înainte de RIKEN Lab.
În loc de design-ul chiplet al AMD Epyc și al unor Xeons, noul produs are un design monolitic unic. Mai important, există patru cipuri de înaltă lățime de bandă Memory 2 (HBM2), o memorie scumpă, dar foarte rapidă, utilizată doar în sisteme high-end, conectate la procesor. Două module de 8 GB sunt plasate pe fiecare parte a procesorului.
Prototipurile plăcii de bază A64FX arată că nu are mufe RAM DIMM. O placă de bază Intel sau AMD va afișa până la o duzină de prize DIMM de memorie pentru fiecare procesor, în timp ce placa de bază A64FX nu are niciuna. Acest lucru se datorează faptului că A64FX are memoria HBM2 pe matriță pentru 32 GB pe procesor.
În HPC, lățimea de bandă a memoriei a fost blocajul, iar sarcinile de lucru intensiv de date precum analytics, simulări și machine learning le încetinesc. Și mai multă putere – de până la 100 de ori mai mare – este folosită în mutarea datelor în HPC decât în procesarea efectivă a acestora. Așadar, pentru a obține eficiența energetică, datele trebuie să se miște cât mai puțin.
Astfel, A64FX are un design total diferit standard sau de cipul x86. Fără memorie de sistem, doar 32 GB per procesor de memorie extrem de rapidă, conectată direct la cip printr-o interconectare de mare viteză, în loc de un bus de memorie mult mai lent. Această structură va reduce considerabil latența între procesor și memorie și va reduce și puterea, deoarece datele nu trebuie mutate în și din soclurile de memorie.
Cele 48 de nuclee ale A64FX funcționează ca un GPU, prin faptul că sunt conectate printr-o interconectare foarte rapidă numită Tofu, care a fost utilizată pentru prima dată în supercomputer K și a fost avansată în A64FX. Tofu este proiectat pentru eficiență energetică și latență scăzută. A64FX este capabil de 3Tflops de lățime de bandă maximă, fiind în același timp de 10 ori mai eficient decât un procesor x86.
Un prototip Fugaku a fost numărul unu pe lista Green500, o listă a celor mai eficiente supercomputere din punct de vedere energetic publicate de același grup care realizează lista de supercomputere Top500 și care este un prototip, nu un design finalizat.
În referințele timpurii, Fujitsu susține că a dezvoltat Xeon Platinum, topul liniei Intel și este concurențial cu linia Volta a GPU-urilor HPC Nvidia. Totuși, acesta nu este produsul final. Fujitsu a încheiat un acord cu Cray pentru a produce serverele HPC folosind A64FX vândute sub numele de marcă Cray. De atunci, Cray a fost cumpărat de către HP Enterprise, astfel încât HPE nu va putea identifica unul, ci două servere bazate pe Arm, serverele sale mai mainstream Project Moonshot și A64FX.