Skriv ut

Upp till åtta ARM-cpu:er, var och en i sin egen unika storlek i ett och samma kluster – det kan du pussla ihop på ett chip med hjälp av en ny teknik kallad Dynamiq (”DynamIQ”) från japansk-brittiska Arm. 

Arm kompletterar sin existerande teknik big-little* genom att tillåta att man blandar cpu:er av olika storlek i samma kluster (en multikärna på ett chip med gemensamt L2-cache och snabba förbindelser). I dagens big-kluster och little-kluster är alla kärnor identiska.

Big-little lanserades 2011 och låter dig lägga två stycken cpu-kluster på ett och samma chip. Typiskt lägger du i det ena klustret snabba cpu:er, det vill säga stora, och i det andra strömsnåla cpu:er.  

Därmed får du en processor som är optimerad för både strömsnålhet och beräkningskraft. Du slipper välja det ena eller det andra. Priset du betalar är chipyta. De två klustren väcks bara om det är strömsnålhet respektive beräkningskraft som processorn för tillfället behöver.

De flesta mobilprocessortillverkare har släppt big-little-processorer. Mediatek har till och med generaliserat konceptet och släppt en big-median-little-processor och kallar det för en treväxlad processor, vilket är en utmärkt metafor. 

Resultatet har blivit mobiler som både är snabba och har lång batterilivslängd. Om operativsystemet är välprogrammerat aktiveras big-klustret endast då mobilen exempelvis spelar häftiga spel eller gör VR-animeringar. Operativsystemet behöver dock inte bekymra sig om detaljerna i hur program och cache fysiskt och logiskt flyttas från det ena till det andra klustret, det hanteras automatiskt.    

Nu generaliserar Arm sitt big-little koncept, fast inte i samma dimension som Mediatek genom att tillåta fler cpu-kluster, utan genom att ändra reglerna för vad som kan finnas i det enskilda klustret. Nu kan du blanda cpu:er av olika typ även där.

De kan till och med ha olika klockfrekvens och spänning, och dessutom dynamiskt stänga ner sig oberoende av varandra. Dessutom kan klustren innehålla upp till åtta cpu:er mot idag fyra.

Sammantaget får därmed konstruktörerna ännu friare händer till att hitta sweet spots som balaserar prestanda mot strömsnålhet. Big-little har hittills låtit dig bygga hetorogena multikärnor av två homogena kluster. Med Dynamiq blir även klustren heterogena.

Dynamiq stöds i ännu ej lanserade ARMv8-cpu:er. Pilotkunderna har redan Dynamiq i sina verktyg. Vilka av de oändliga kombinationer som är möjliga som konstruktörerna kommer att finna meningsfulla att utnyttja – det återstår att se.

Arm trimmar även upp andra delar av sin teknik för multikärnor: cpu:erna kan växla snabbare mellan uppgifter; minneshanteringen är strömsnålare; minnet kan delas upp i banker som kan stängas av individuellt; och kommunikationen mellan acceleratorkärnor och cpu-kluster ska ha oljats upp till att bli tio gånger snabbare.

Dessutom har Arm tagit fram nya cpu-instruktioner som dramatiskt ska höja prestanda för det heta AI-området maskininlärning. Fler tekniska detaljer ska släppas under kommande månader, men ett knep som Nvidia använt för AI-optimering är att införa flyttal med sänkt precision – ett lager i ett djupt neuronnät kan ibland fungera utmärkt med bara en enda bits precision. 

Upp till femtio gånger snabbare ska ARM-processorer kunna bli på maskininlärning under de kommande 3–5 åren, jämfört med de idag kraftfullaste ARM-processorerna.

Liksom flera gånger tidigare passar Arm på att pusha för server som tillämpningsområde för ARM-processorer. Det är en ambition som hittills kommit på skam, men vem vet – det finns alltid ett eller flera företag som experimenterar med ARM-servrar, och kanske är tiden mogen nu för att de ska hitta en stor nisch. 

Mellan 1991 och 2017 – 26 år – skeppade Arms kunder 100 miljarder cpu-kärnor. Lika många kommer att skeppas mellan 2017 och 2021 – fem år. ARM-processorer används främst i strömsnåla sammanhang. Genombrottet för ARM-arkitekturen kom i mobiltelefoner och där har ARM idag ett de facto-monopol.

Arm tillverkar inte processorer utan licenserar cpu:er och andra kärnor – och konstruktionsteknik av typen big-little och Dynamiq – till processortillverkare.  


* Arm kallar tekniken för ”big.LITTLE”.