Kina leder fortfarande racet mot superdatorer som levererar en miljard miljarder räkneoperationer per sekund. Alla de fyra tävlande anpassar sig till maskininlärning. Tre av dem använder Arm-kärnor. EU använder dessutom Risc-V.
Kampen om att bli först till en exaflops utkämpas idag mellan EU, USA, Kina och Japan. USA tycks hålla sitt tidsschema medan de andra tre tappat farten, även om Kina fortfarande ser ut att bli först, enligt den senaste skattningen med 6–9 månaders marginal till USA.
Här kommer en uppdatering av vad som hänt på exaflopsfronten sedan i vintras.
I december i fjol frågade Elektroniktidningen spanska Semidynamics om det möjligen var dess Risc-V-expertis som var skälet att det fick medverka i EU:s superdatorprojekt Mont Blanc.
Vi fick inget svar. Men jo, numera är det officiellt att EU:s två aktuella exaflopsprojekt inte bara kan komma att byggas av brittiska Arm-kärnor, utan även av öppna Risc-V-kärnor. EU-projektet European Processor Initiative (EPI) tar fram både Risc-V- och Armprocessorerna.
För Sveriges del finns Chalmers med på ett hörn i Risc-V-projektet. Chalmers leder utvecklingsarbete kring cache-koherens mellan Risc-V-acceleratorerna. Dessutom hjälper Chalmers till med parallellprogrammeringsmodeller.
Att EU är så piggt på att testa nytt – också Arm-kärnor är ett relativt oprövat kort i superdatorer – är spännande, men också en orsak till att analytikern Hyperion flyttar fram sin prognos för när Mont Blanc är färdigbyggd och tror att den i bästa fall blir fullt klar år 2023.
En exadator räknas som fullt klar när den kan hålla en exaflops i marschtakt – alltså upprätthålla tempot. Över kortare sprintersträckor tror Hyperion att EU:s Mont Blanc klarar en exaflops året innan. Det är ungefär samma tidssspann mellan dessa två milstolpar som gäller för alla de fyra.
En spännande gemensam nämnare för de fyra länderna är att de alla använder inhemskt utvecklade processorer.
USA är den som håller sitt tidsschema bäst, tror Hyperion, beroende bland annat på att dess komponenter är nya generationer av arkitekturer med många år på nacken, från Intel, AMD, IBM och Nvidia. Det förkortar utvecklingstiden.
Utmaningen är större för EU, Japan och Kina som börjar närmare ett blankt ark med sina processorer.
USA:s projekt Aurora ska bygga två exaflopsdatorer i olika arkitekturer. De ska kosta en halv miljard dollar styck och dra högst 40 MW, gärna 20 MW om det går.
År 2021 ska den ena, kallad A21, kunna sprinta i en exaflops och 2022–2023 ska tempot vara marschfart.
Japan bygger datorn Post K som ska nå marschtakt brännandes 30–40 MW år 2022. Eller möjligen något tidigare, efter att från början siktat på 2020.
Också Japan använder Arm – en 48-kärna utvecklad av Fujitsu vid namn A64FX.
Chipet presenterades på konferensen Hot Chips i slutet av augusti, och verkade ganska färdigt i sin konstruktion. Det ska tillverkas i 7 nm FinFET och innehålla 8,8 miljarder transistorer.
Ett ensamt A64FX-chip ska leverera 21,6 biljoner åttabitars räkneroperationer per sekund. Datatakten mellan två chip är 28 Gbps.
Japan lägger en dryg miljard dollar på att ta fram Post K, men den siffran inkluderar inte bara byggpriset utan all forskning och utveckling som leder fram till den.
Kina hoppas kunna nå marschtakt år 2021, efter att tidigare siktat på 2020. Kina har tre exaprojekt i luften: Sugon Exascale, Sunway 2020 och NUDT 2020, varav kanske en eller två kommer att fullbordas.
Den egna processorarkitekturen Shenwei togs första gången i bruk i landets – och länge världens – snabbaste superdator Sunway Taihulight. Kina utvecklar dessutom egna implementationer av både X86 och Arm. Kina vill utveckla egna processorer om inte annat för att USA då och då stoppar exporten av processorer till Kina.
Maskininlärning är en spännande utmaning som vi ännu inte vet hur någon av de fyra kommer att lyckas att hantera. Även inom superdatorvärlden har nämligen maskininlärning flyttat upp till högsta prioritet.
Det kommer till exempel att betyda att grafikkärnor kan få en ännu viktigare roll för den totala beräkningsprestandan, eftersom de var kvicka på neuronberäkningar redan innan Nvidida började optimera sina processorer för ändamålet.
När superdatorarkitekturer bestäms idag sneglas det allt mindre på det prestandamått Linpack som används som ranking i listan Top500 över de snabbaste superdatorna. Riktiga arbetsuppgifter är viktigare.
Bob Sorensen |
– Vad Linpack värderar och vad resten av världen optimerar för är något som divergerar ganska snabbt just nu, säger Bob Sorensen på Hyperion Research.
Modern maskininlärning är forfarande såpass färsk att den inte fixerats i sina algoritmer. Så alla villl avvakta med de sista konstruktionsbesluten så länge som möjligt. Det gäller till exempel frågan om vilken beräkningsprecision man vill optimera för.
– Vi kan inte riktigt förutsäga idag vilken typ av tillämpningar som kommer att köras i de exascalesystem som vi bygger idag. De kommer kanske att köra en massa tillämpningar som vi aldrig har sett förut.
Här är EU:s användning av Risc-V spännande. Arkitekturen tillåter – för att inte säga uppmuntrar till – addition av egna instruktioner och det är ingen vild gissning att Mont Blanc:s Risc-V-processorer kommer att ha ett antal sådana instruktioner för AI.
BILDEN ÖVERST: Amerikanska datorn Summit petade i juni ner Kina till andraplatsen i superdatorlistan Top500. Summit producerade redan i somras 1,88 miljarder miljarder operationer per sekund och kallas därför för världens första exadator. Det var dock inte flyttalsoperationer den utförde, så den är ännu ingen exaflopsdator.