En miljon Epiphany V ger dig en exaflops-dator på en bråkdel av energin och kostnaden för dagens superdatorteknik. Andreas Olofsson tog fram en ny generation av sin superprocessor på en hundradel av vad sådana projekt brukar kosta.
De 1024 kärnorna är liksom hos föregångarna kompletta risc-cpu:er – nu 64-bitare – som kör varsitt program. Bland instruktionerna finns flyttalsoperationer på både 32 och 64 bitar. Chipet har ett distribuerat minne på 64 Mbyte som styckas upp i bitar för enskilda cpu:er eller användas gemensamt.
4,5 miljarder transistorer har Andreas Olofsson lyckats klämma in på 117 mm2. Var och en av dessa mm2 levererar teoretiskt 8,8 Gflops i 500 MHz, att jämföra med Nvidias grafikchip P100 på 7,7 per mm2. Båda är tillverkade i 16 nm Finfet+.
Andreas Olofsson listar en rad jämförelser med andra chip (P100, KNL, Broadwell, Kilocore) men ofta finns det en lucka för det egna chipet, eftersom verkningsgraden behöver bestämas på de fysiska exemplaren – om 4–5 månader vet vi mer.
Han tror att prestanda per watt kommer att utklassa alla de andra och han vågar hävda att standby-strömmen är betydligt lägre. Det senare är relevant för IoT – en av de tillämpningsområden han talar om för processorn. Han tänker sig att Epiphany V skulle kunna sitta i gateways.
Chipet är ett forskningschip och en innovation på många sätt.
Att Andreas Olofsson lyckats komma till tape-out i en state-of-the-art-geometri – 16 Finfet+ TSMC – med en budget på bara en miljon dollar är ett brott mot branschens tumregler. Det är enligt Andreas Olofsson mellan en tjugondel och en hundradel av vad andra lägger ner.
Andreas Olofsson tillskriver inte sig själv äran för detta, utan anser att nya verktyg och öppen källkod håller på att rita om kartan. Branschen står inför en omdaning där små aktörer som han plötsligt har möjlighet att konkurrera på samma spelplan som jättarna.
Darpa betalade kalaset. Dels är Darpa på jakt efter nya metoder att bygga superdatorer på, eftersom projekteringarna av nästa generations superdatorer – kallade ”exascaledatorer” för att de klarar triljoner operationer per sekund – framför allt kostar massor av energi att driva. Effekten måste ner från 200–300 MW till kanske 20–30 MW.
Darpa vill också sänka kostnaden och tiden för att ta fram ett chip, vilket Andreas Olofsson härmed anser bevisat vara möjligt. Han gjorde på ett år vad som brukar ta flera år för storföretag.
Andreas Olofsson hoppas att utvärderingarna av kretsen, som nu ska vidta, kommer att visa att det är meningsfullt att också ta fram en kommersiell version. Han ska mäta upp vilka klockfrekvenser den klarar och hur stor effekt den drar.
Andreas Olofsson |
– Om våra simuleringar stämmer är chipet ett genombrott, säger han.
Om 4–5 månader vet vi mer.
Nästa chipsprojekt för Andreas Olofsson kan bli en kommersiell version av Epiphany V med acceleratorkärnor för bland annat Deep learning.
Här är en länk till en teknisk rapport om Epiphany V, om du vill veta mer (pdf, 580 kbyte)