JavaScript is currently disabled.Please enable it for a better experience of Jumi. PICMG: Med IPMI som fjärrkontroll till COM-HPC
Guidelines for contributing Technical Papers: download PDF

Organisationen PICMG har lanserat en ny standard för fjärradministration av COM-HPC (High Performance Computing  – en formfaktor för högpresterande inbyggnadsmoduler).


Ladda ner artikeln här (länk, pdf).

Fler tekniska rapporter finns på etn.se/expert

Nu slipper administratören ge sig ut på fabriksgolvet – eller till annan ort – för att trycka på resetknappen när ett kort låser sig. Målet är förenklat underhåll och förbättrad QoS (tjänstekvalitet).

Specifikationen är baserad på den befintliga serverstandarden IPMI för fjärradministration och adresserar i synnerhet kantdatorsystem (edge computing) baserade på COM-HPC.

Fjärradministration, inklusive via reservkanaler (out-of-band), är standard idag för administration av IT-system. Det går att monitorera att systemfunktioner är uppe, installera uppdateringar och patchar, felsöka, med mera – allt utan att fysiskt befinna i serverhallen.

Tjänsteleverantörer använder typiskt fjärradministration för att ge sig själva åtkomst till sina kunders lokala eller molnplacerade servrar. Med IPMI för COM-HPC blir nu fjärrsupport av det slaget också en option för kantservrar och gateways. Det blir en möjliggörare inom digitalisering och IIoT. Fjärradministration överbryggar klyftan mellan IT och OT (operationell teknik).

Den som konstruerar kantsystem på datormoduler vill typiskt kunna ta fram egna fjärrstyrningsfunktioner anpassade efter egna behov. Därför finns en specifik delspecifikation för detta behov inom PICMG COM-HPC.

För att inte uppfinna hjulet på nytt hämtas delar av COM-HPC-underspecifikationen från IPMI (Intelligent Platform Management Interface). Vi ska nu göra en djupdykning i gränssnittet för att förstå hur COM-HPC kan ha nytta av det.

IPMI valdes eftersom det är ett robust, moget och allmänt accepterat gränssnitt. Det skapades 1998 och genomgick revideringar 2001 och 2004. PICMG använder IPMI:s specifikation Redfish som baseras på ett så kallat REST-API. Då och då definieras ny funktionalitet.

Livslängd och stabilitet gör skillnad
IPMI definierar protokoll, gränssnitt och arkitektur för monitorering och administration av datordelsystem. Standardiserade format används för att referera till hårdvaran på låg nivå. Kommunikationen med kortet sker via en styrenhet på kortet kallad BMC (board management controller).

IPMI-meddelanden kan antingen skickas över nätverket till en BMC på ett fjärrsystem eller från en BMC till ett lokalt delsystem, som en strömförsörjningsenhet. Mångsidigheten när det gäller att skicka IPMI -meddelanden gör det möjligt att dela upp komplexa administrativa uppgifter i delområden.

Ett meddelande kan vara en förfrågan om hårdvarans aktuella tillstånd. Eller så kan det vara en instruktion till BMC:n att vidta åtgärder, som att öka kylningen, göra en omstart eller läsa av en sensor.

Att administrationen sköts av en dedikerad komponent minskar bördan på värdmaskin och operativsystem. För IPMI gäller att administrationen är helt frikopplad från målplattformen vilket betyder att den kan göras även när målplattformen är nere. Allt detta har gjort IPMI till en de facto-standard för serveradministration. Dess skapare höll medvetet kommandona enkla för att inte lämna utrymme för missförstånd vilket bäddar för att specifikationen kommer att leva kvar länge till.

IPMI bjuder på flexibilitet i form av möjligheten att addera nya nätverksfunktioner (NetFn) och nya instruktioner, utöver de som är standard och de som är tillval. Branscharbetsgrupper utnyttjar den friheten när de definierar egna funktioner och kommandon för att hantera teknik och funktioner som ingen tänkte på när specifikationen skapades.

Flera alternativa möjligheter
System baserade på COM-moduler (Computer-on-Module) bygger på ett flexibelt ramverk vilket gör det enkelt att göra de justeringar som krävs för att addera fjärradministration. En av justeringarna gällde det EEEP-minne (Embedded EEPROM) som används för att lagra data om leverantörer, minnesplatser, nätverksfunktioner, med mera. En hel del av den informationen lagras även i IPMI FRU-enheten (Field Replaceable Unit). För att inte dessa data ska dupliceras finns rekommendationer om hur en IPMI-enhet kan överföra data från EEEP till FRU.

Med tanke på hur många tillämpningar det finns för COM-HPC-moduler – datacenter, isolerade noder, edge, fog – var det viktigt att det skulle finnas alternativa sätt att administrera. Standarden specificerar dessutom olika nivåer av IPMI-stöd på både bärarkort och moduler. Moduler kan vara MU, MB eller MF – unmanaged, basic eller fully managed. Bärarkort (Carrier Boards) kan vara CU eller CM, unmanaged eller managed. Skillnaderna i detalj framgår av specifikationen, men det viktiga att ta med sig är att alla dessa moduler och bärarkort är interoperabla vad gäller IPMI – alla typer av bärarkort fungerar korrekt med alla typer av moduler.

Flexibilitet är en nyckel
Designgruppen för COM-HPC IPMI insåg att one-size-fits-all skulle vara en olämplig approach med tanke på att det finns så vitt skilda scenarier för fjärradministration. Därför finns flera olika designer för kombinationer av moduler och bärare tillgängliga för olika uppgifter, som att starta och stänga av systemet, eller kommendera systemet att hämta nätverksinformation.

Om du till exempel arbetar mot ett bärarkort med upp till fyra moduler är det mest effektivt om varje modul har sin egen oberoende administration. I ett annat scenario skulle du istället kunna dra nytta av en fullfjädrad IPMI-implementering på bärarkortet, för att göra en unik anpassning för specifika funktioner oavsett om modulerna kan administreras eller inte. Det kommer alltid att finnas systemdesigners som inte vill ha några administrationsmöjligheter alls. Och det kommer alltid att finnas systemdesigners som vill hålla administrationsfunktionaliteten till ett minimum. Därför var det viktigt att prioritera kompatibilitet mellan olika nivåer av modulhantering.

Kontroll av plattformar
Ju mer av systemresurserna som öppnas för åtkomst desto kraftfullare blir IPMI. Därför använder den nya COM-HPC-specifikationen vissa specifika gränssnitt för de mest kompletta administrationsmöjligheterna. Det främsta av dem är IPMB (Intelligent Platform Management Bus) som ger BMC:n på bärarkortet åtkomst till MMC:n (Module Management Controller). Men inte bara det. Ett av de nya gränssnitt som BMC:n kan använda är en dedikerad PCI Express-kanal som inkluderar en grafikkontroller. Ytterligare gränssnitt dedikerade för IPMI är I2C, USB och strömbrytare. Genom dessa IPMI-kanaler – tillgängliga på distans via BMC – kan systemadministratören styra nästan hela plattformens beteende för högsta möjlig QoS, minimala driftstopp och effektivast möjliga fjärrunderhåll. För att ge några exempel:
•I2C kan användas för att komma åt EEEP-data på en modul.
•USB kan användas för att emulera USB-enheter som tangentbord, mus eller en DVD-enhet.
•Strömkontrollerna kan användas för att slå på/av strömmen på distans…
•… eller för att fördröja systemstart medan BMC:n kör initieringsprocesser.

Nya PICMG COM-HPC-specifikationen ­bäddar därmed för omfattande möjligheter till IPMI-administration. Som konstruktör kan du börja fundera över hårdvarudesign för att implementera IPMI. Och modulleverantörer med partners kan börja arbeta med sina BMC- och MMC-implementeringar. Till exempel genom att utnyttja SP-X och/eller öppen firmware som OpenBMC.

Det sistnämnda, OpenBMC, är en Linux-distribution avsedd för administration av servrar, rack-switchar, RAID-enheter, med mera. OpenBMC passar utmärkt för nästa generations COM-HPC system. Den är baserad på Yocto, OpenEmbedded, systemd och D-Bus och kan därmed enkelt skräddarsys för olika plattformar. Den är fullt IPMI 2.0-kompatibel med DCMI och kan administrera funktioner som ström, kylning, lysdioder, händelser och watchdogs. OpenBMC erbjuder ett brett utbud av gränssnitt – från Remote KVM, SSH-baserad SOL och webb­baserade användargränssnitt, till REST- och D-Bus-baserade gränssnitt. Konstruktörer kan utnyttja hårdvarusimulering och automatiserat test. Och så finns slutligen i den senaste funktionsuppdateringen ett stöd för koduppdatering av multipla BMC/BIOS-paket.

Vad gäller SP-X finns exempelvis en serveradministrationslösning kallad MegaRAC SP-X hos amerikanska AMI. Den baseras på IPMI 2.0, DMTF Redfish, SMASH och Serial over LAN (SOL). Den stöder centrala servicefunktioner som hälsoövervakning, remote presence och avancerad automatisering. Det finns även en robustifierad produktversion av MegaRAC kallad OpenEdition som använder OpenBMC som firmware och har ett intuitivt, utbyggbart ramverk i en öppen arkitektur som inkluderar ovannämnda administreringsfunktioner. Både SP-X och Open­Edition finns för alla de större BMC-SoC:erna och stöder följande plattformar: Intel/AMD x86, Arm64 (inklusive Ampere eMAG och Qualcomm) och IBM POWER 8/9.

MegaRAC SP-X och OpenEdition hjälper till att ge COM-HPC RAS-administration (Reliability, Availability and Serviceability) via IPMI och Redfish. Det kommer att påskynda spridningen av COM-HPC över branschens alla vertikaler.

Slutsatser
Systembyggare har stor nytta av PICMG COM-HPC. Specifikationen är helt ny men utnyttjar väl de beprövade standarderna IPMI och Redfish för att innovera inom fjärradministration. Detta kommer säkerligen att sätta fart på godkännandeprocessen för PICMG: s nya COM-HPC-specifikation.

MER LÄSNING:
 
KOMMENTARER
Kommentarer via Disqus

Anne-Charlotte Lantz

Anne-Charlotte
Lantz

+46(0)734-171099 ac@etn.se
(sälj och marknads­föring)
Per Henricsson

Per
Henricsson
+46(0)734-171303 per@etn.se
(redaktion)

Jan Tångring

Jan
Tångring
+46(0)734-171309 jan@etn.se
(redaktion)