Sju stegs pipeline Atmel har startat från noll med en helt ny arkitektur. Man använder många knep för att öka genomströmningen. Instruktionerna exekveras out-of-order, det vill säga i omkastad ordning, om det är effektivare. Rörledningen är på sju steg, och slutar i tre parallella grenar som kan fyllas samtidigt: en med upp till två multiplikatorer eller en MAC, en med upp till två aritmetisk-logiska enheter (dito) och en som sköter minnesaccess. Resultaten kan kortslutas tillbaka till början från mitten av rörledningen. AVR32 förutser villkorliga hopp för att slippa tömma rörledningen. Atmel satsar mycket på att snabba upp minneshanteringen. I detta ingår att instruktionslängderna optimerats, i samarbete med kompilatortillverkare. Det betyder att koden blir kortare och därmed ryms bättre i cacheminnet som därmed inte behöver bytas lika ofta. Laddning och lagring (load och store) utgör 30 procent av cykeltiden i en typisk riscprocessor. Därtill kommer cykler för att räkna ut pekarvärden som ska används i load och store. Atmels lösning är på detta 28 specialiserade minnesinstruktioner, bland annat:
För att snabba upp hanteringen av avbrott har kärnan åtta registeruppsättningar reserverade för olika avbrottstyper. |
Så defensivt presenterar Atmel sin nya processorkärna. Åttabitaren har sålts i 1,6 miljarder exemplar sedan den introducerades år 1997.
Atmel tar nu steget från åtta bitar upp direkt till 32.
Det släpps inga verktyg för bakåtkompatibilitet med åttabitarna, utan siktet är inställt på helt nya tillämpningar som infotainment, modem, användargränssnitt, skrivare, smarta kort, spelmaskiner, handdatorer och avancerade leksaker. Fickteve blir en gigantisk marknad, tror Atmel. 2005 såldes 25 miljoner fickteveapparater. År 2009 blir det en halv miljard. Atmel hänvisar prognosen till Semico Research.
Atmels offensiva argument är: betydligt bättre prestanda än konkurrenterna. Företaget hänvisar till EEMBC-mätningar där man jämfört sig med Arm9, Arm11 och V850E. Armkärnorna används i processorer från både Sharp, OKI, Cirrus Logic, Samsung och Freescale.
Resultat: seger i alla fem kategorierna med 20 procent eller mer, med ett enda undantag: dött lopp med V850E i telemark.
Jämförelsen gäller prestanda per megahertz, för det är just i verkningsgrad som Atmel säger sig triumfera. Som exempel kan Atmel avkoda 30 bilder MPEG4 i 100 MHz där konkurrenter behöver 266 MHz.
Enligt EEMBC-testerna har AVR32 dessutom en kodstorlek som är minst 25 procent mindre än nämnda konkurrenter. Den siffran gäller out of the box, det vill säga utan optimering av koden.
AVR32 stöder Linux 2.6.14. Utöver de obligatoriska GCC-verktygen är svenska IAR först med kompilatorer.
Utvecklingskort finns nu. Fysiska processorer ska lanseras i april. Priserna ska ligga på konkurrenternas nivåer.