Server-Prozessoren: Intels neue Xeon-Generation:
Intel Xeon 5500: »Nehalem« macht Servern Beine

von Andreas Stolzenberger (ast@nwc.de), bre

23.03.2009

Fünf Jahre nach AMD verabschiedet sich auch Intel vom Flaschenhals Frontside-Bus. Mit vier Kernen und drei integrierten DDR3-Memory-Controllern deklassiert der Xeon 5500 die Konkurrenz.

Vor gerade einmal drei Jahren löste Intel [1] mit dem »Core«-Ansatz die in die Jahre gekommene »Netburst«-Architektur ab. Bereits im Herbst 2008 stellte der Chipriese mit Core-i7 (Codename Nehalem) ein drastisches Update vor.

Bislang kommunizierten Intel-CPUs über einen Frontside-Bus (FSB) miteinander und dem als »Northbridge« bezeichneten Memory-Control-Hub (MCH). Dieser Baustein wiederum adressierte den Hauptspeicher des PCs oder Servers und entwickelte sich immer stärker zum Flaschenhals. Zum Schluss packte Intel bis zu 12 MByte Level-3-Cache in seine Prozessoren, um die Schwäche des FSB zu kaschieren.

Den FSB ersetzen bei Nehalem drei direkt im Prozessor integrierte DDR3-Controller sowie der Quick-Path-Interconnect (QPI). Dieser Bus dient zur Kommunikation zwischen mehreren Prozessoren und dem I/O-Hub.

QPI funktioniert ähnlich wie AMDs [2] »Hyper-Transport«. Aber Intel wollte offensichtlich nicht auf eine bereits etablierte, jedoch von der Konkurrenz entwickelte Technologie zurückgreifen. Stattdessen erfanden die Entwickler des Herstellers etwas Neues, das im Prinzip denselben Dienst verrichtet.

QPI und DDR3 statt FSB

Nach dem High-End-Desktop-Prozessor stellt Intel jetzt eine Familie von Server-CPUs für Maschinen mit zwei Sockeln vor. Der Xeon 5500 integriert vier Kerne und arbeitet, je nach Modell, mit Taktraten zwischen 1,8 und 3,2 GHz.

Mit den DDR-3-Interfaces (Registered ECC) erreichen die Core-i7-Prozessoren eine konkurrenzlose Speicherbandbreite von 32 GByte/s, vorausgesetzt der Anwender bestückt alle drei Kanäle mit Chips. Pro CPU lassen sich derzeit satte 96 GByte RAM adressieren.

Die deutlich einfacher aufgebauten DDR3-Module ersetzen die teuren und Strom fressenden Fully-Buffered-DIMMs der bisherigen Xeon-Server.

Hyper-Threading ist wieder da

Mit der Serie 5500 kehrt auch eine fast in Vergessenheit geratene Technologie zurück: das Hyper-Threading. Doppelte Pipelines und Registersätze füttern dabei die Instruktionseinheiten eines Prozessors von zwei Seiten und sollen diese besser auslasten.

Frontside-Bus ade: Bei

HT gaukelt dem Betriebssystem die doppelte Zahl von Kernen vor, als tatsächlich vorhanden ist. Die Technologie führte Intel bereits mit dem Pentium 4 ein. Damals waren die Betriebssysteme und Anwendungen aber nur unzureichend für Multi-Threading vorbereitet. Seit jedoch praktisch jede CPU mit mehreren Kernen arbeitet, haben die Software-Entwickler nachgezogen.

Davon verspricht sich auch Intel, dass das wieder eingeführte und leicht verbesserte Hyper-Threading zu messbaren Performance-Verbesserungen führt.

Besser Virtualisieren

Mit dem Xeon 5500 führt Intel weitere VT-Kommandos ein, um die Effizienz von Hypervisoren zu verbessern. Mit »VT-d«, dem »Intel VT for directed I/O«, kann der Prozessor Direct-Memory-Access-Zugriffe (DMA) virtualisieren. Im Klartext bedeutet dies, dass sich mithilfe von VT-d PCI-(x)-(e)-Devices exklusiv in einzelne VMs schalten lassen.

»Intel VT for Connectivity« virtualisiert Netzwerkadapter, funktioniert aber nur mit Intels hauseigenen NICs.

Mit der DMA-Virtualisierung zieht Intel nach, denn AMD hat die Funktion seit des ersten Releases von AMD-V (Pacifica) bereits 2006 in seine Opteron-CPUs integriert.

Variabler Stromverbrauch und Takt

Mit den i7-CPUs führt Intel ein sehr aufwändiges C- und P-States-Modell ein. Dabei können CPU, BIOS und Betriebssystem den Stromverbrauch einzelner Cores drosseln. Je nach Last takten die Kerne schneller oder langsamer oder nehmen Power-Saving-States ein, wie etwa »Standby« und »Suspend«.

Mit der Turbo-Boost-Technik können Nehalem-Rechenkerne gezielt übertaktet werden, um die Leistung zu steigern.

Unter Volllast kann der Prozessor seine Kerne mit der Technologie »Turbo-Boost« sogar gezielt übertakten. In der Praxis wird von den vielen möglichen Power-Saving-Modi allerdings nur ein Bruchteil im Server zum Einsatz kommen.

Fazit: Gehöriger Vorsprung vor AMD

Zusammenfassend lässt sich feststellen, dass derzeit keine x86-64-CPU dem Xeon 5500 das Wasser reichen kann. AMD scheint momentan weit abgeschlagen. Doch wird die i7-Architektur ihr volles Potential nicht sofort entfalten können.

Denn wieder einmal führt Intel mit SIMD 4.2, VT-d und VT-C eine Fülle neuer Instruktionen ein, welche die Softwareentwickler erst einmal in ihre Produkte einbauen müssen. Speziell bei den Virtualisierungsfunktionen driften die Implementierungen von AMD und Intel immer weiter auseinander.

Lobenswert ist, dass sich Intel endlich von dem schon lange obsoleten FSB trennt. Drei DDR3-Controller sorgen für ausreichend Memory-I/O bei vergleichsweise günstigen Speicherbausteinen. Sie schaffen die von Anfang an als Stromfresser kritisierten FB-DIMMs wieder ab.

Schade ist allerdings, dass Intel unbedingt bereits bestehende Technologien wie die DMA-Virtualisierung und den CPU-Transportkanal neu erfinden musste, um auf jeden Fall zur Konkurrenz inkompatibel zu bleiben. Das erschwert die Arbeit von Hardware-Designern und Software-Entwicklern.

Der Stolz erlaubte es dem Prozessorriesen offenbar nicht, mit dem Konkurrenten AMD zu verhandeln, um Hyper-Transport und Pacifica zu lizensieren.

[1] http://www.intel.de/
[2] http://www.amd.com/