Rechtzeitiger Umzug dank Hardware-Monitoring möglich:
Test: Stratus nutzt Virtualisierung für Failover-Lösung

von Werner Veith (werner.veith@networkcomputing.de), Andreas Stolzenberger

22.03.2010

Mit »Avance« nutzt Stratus die Virtualisierung geschickt, um eine Failover-Lösung zu entwickeln. Virtuelle Maschinen starten im Fehlerfall auf einem anderen Rechner. Dies ist ein guter Ansatz, wie sich im Test zeigt. Es gibt aber noch Verbesserungsbedarf.

Die Firma Stratus ist bislang vor allem für die hoch verfügbaren FT-Server bekannt. Gespiegelte Serverkomponenten in einer Box sollen Ausfälle komplett verhindern. Das ist auch der wesentliche Unterschied zwischen Failover und High-Availability. Bei Failover-Lösungen kann ein Server ausfallen und die während des Ausfalls verarbeiteten Daten verlieren. Die Failover-Technik sorgt lediglich dafür, dass die Ausfallzeiten so gering wie möglich bleiben.

Avance [1]
Hersteller: Stratus
Charakteristik: Quasi-Hochverfügbarkeitslösung
Preis: 4000 Euro (nur Software ohne Server)
Web: www.stratus.de [2]

Plusminus:
+ Hardware-Monitoring
+ gutes Management-Interface
– keine Verbindung zu Netzwerklaufwerken

Hochverfügbare Lösungen verhindern den Ausfall an sich, in dem sie Systeme gespiegelt betreiben. Fällt eine Maschine aus, übernimmt die synchronisiert mitlaufende Maschine ohne Datenverlust.

Der zweite wichtige Unterschied:Hochverfügbarkeits-Lösungen kosten deutlich mehr, als Failover-Installationen. Stratus [3] bringt mit »Avance [1]« nun eine günstige Software auf den Markt, welche als Failover-Lösung Hochverfügbarkeit erreichen möchte.

Hardware-Überwachung sorgt für Failover vor einem Ausfall

Der Ansatz ist dabei ebenso einfach wie einleuchtend. Avance besteht aus zwei Xen-Servern, einem Master- und einem Standby-Node. Auf den Xen-Hosts arbeiten die quasi ausfallsicheren virtuellen Rechner. Dank Xen-Motion lassen sich VMs zur Laufzeit vom Master- auf den Standy-Node umziehen. Fällt der Master-Node jedoch ohne Vorwarnung aus, starten die VMs nach einer geringen Ausfallzeit auf dem Backup-System neu.

Das Interface der Failover-Software »Avance« von Stratus

Diese Funktionen lassen sich so weit alleine mit Xen-Features abbilden. Das wesentliche Stratus-Know-how, was die Lösung vom nackten Xen-Cluster abhebt, ist das Hardware-Monitoring. Stratus geht davon aus, dass sich die meisten Ausfälle von Serverkomponenten vorhersagen lassen. Alle neuen Server-Boards verfügen über eine IPMI-Schnittstelle (Intelligent-Platform-Management-Interface).

Darüber kann Avance den Zustand der Hardware ermitteln. Zu den ausgewerteten Informationen zählen dabei die Spannungen des Netzteils, Temperaturen von System und CPU sowie Fehlerinformationen des ECC-Speichers. Die korrekte Funktion der Platten kann die Software über das S.m.a.r.t.-Interface (Self-Monitoring, Analysis and Reporting Technology) erfragen.

Stratus-Avance überwacht diese Messwerte permanent. Sollte der primäre Server auch nur die geringsten Probleme melden, lässt die Software die VMs auf den Backup-Knoten umlagern.

So versucht die Lösung, einem drohenden Ausfall rechtzeitig vorzugreifen. Im Labor Poing installiert Stratus für den Test einen Cluster aus zwei Dell-Poweredge-1950-Servern. Die Quad-Core-Maschinen mit je 4 GByte RAM verfügen über zwei 72-GByte-SASPlatten. Über ein privates Netzwerk mit den jeweiligen Eth1-Ports kommunizieren die Cluster-Nodes untereinander. Nur das erste Interface steht für Management und virtuelle Maschinen (VMs) zur Verfügung.

Ausgefallene Rechner lassen sich einfach ersetzen

Die Installation erledigt der Verwalter nur am ersten Knoten. Sobald die Grundkonfiguration steht genügt es, den Backup-Rechner einzuschalten. Dieser startet per PXE über den privaten Link und bezieht die Software und die Konfiguration automatisch vom ersten Rechner. Diese praktische Funktion ermöglicht es, einen komplett ausgefallenen Knoten durch eine nackte Reservemaschine zu ersetzen, ohne dass der Verwalter groß eingreifen muss.

Die Konfiguration des Clusters erledigt der Verwalter über den Web-Browser. Das Interface ist Stratus sehr gut gelungen. In simplen, übersichtlichen Dialogen überblickt der Verwalter den Status von VMs und den Cluster-Nodes. In die VM-Sitzungen kann sich der Administrator aus dem Browser heraus über VNC einloggen. Im Labortest reagiert Avance prompt auf äußere Störeinflüsse.

Bei einem schwerwiegenden Systemfehler führt die Software einen Failover der VMs durch und versucht, sofern das noch geht, den beschädigten Knoten abzuschalten. Bei kleineren Störungen, wie künstlich generierten Stromschwankungen, Überhitzung des aktiven Knotens oder Plattenfehlern verschiebt das Management die VMs sofort auf den Standby-Rechner.

Fazit

Das Grundkonzept von Avance geht in die richtige Richtung, allerdings gibt es eine Reihe von Verbesserungsmöglichkeiten. Die Architektur würde ohne weiteres erlauben, dass im Normalbetrieb beide Knoten arbeiten und sich die VM-Last teilen. Es bringt keinen ersichtlichen Vorteil, eine Maschine als passives Standby-System zu behandeln.

Die getestete Version kann noch keine Netzwerklaufwerke einbinden. Das ist zwar nicht für VM-Speicher vonnöten. Der Verwalter könnte jedoch bestehende ISO-Images auf LAN-Freigaben nutzen, anstatt die Abbilder von Betriebssystem-CDs neu erstellen zu müssen.

[1] http://www.stratus.com/products/avance/overview.htm
[2] http://www.stratus.de
[3] http://www.de.stratus.com/
[4] http://www.stratus.com/products/avance/overview.htm

Verwandte Artikel