Bei virtuellen Exchange 2010 Servern auf VMware vSphere Umgebungen kann es passieren, dass während eines vMotion Vorgangs der Exchange Datenbank Server ein FailOver der Datenbanken ausgelöst wird.
Die Ursache ist häufig der Heartbeat TimeOut, wenn die Exchange VM auf einen anderen ESX Host verschoben wird. Es kann vorkommen das die Switches den geänderten Port nicht schnell genug lernen, oder eben der vMotion Vorgang einen Tick zu lange dauert.
In der Standard Einstellung liegt der TimeOut bei einer Sekunde (1000ms). Die Einstellungen können mit dem Befehl „cluster /prop“ überprüft werden:
Um zu Verhindern, dass während einen vMotion Vorgangs ein Fail Over der Exchange Datenbanken ausgelöst wird, kann der Wert auf zwei Sekunden angehoben werden. In dieser Zeit sollten alle Switches den geänderten Switch Port mitbekommen haben und auch der kurze Verbindungsabbruch während des vMotion Vorgangs sollte überbrückt sein.
Mit dem folgenden Befehl lässt sich der TimeOut auf zwei Sekunden anheben:
cluster /prop samesubnetdelay=2000
Wenn DRS innerhalb der vSphere Umgebung aktiv ist, hilft es allerdings auch, die Anzahl der automatischen vMotion Vorgänge möglichst gering zu halten und lieber den FileServer oder ähnliches zu verschieben, wenn es zu Leistungsproblemen kommt.
Um die Anzahl der vMotion Vorgänge für die Exchange Datenbank Server möglichst gering zu halten sind zwei Sphere DRS Regeln nötig:
1. Virtuelle Maschinen zu Hosts: Um beispielsweise 3 Datenbank Server auf 3 ESX Hosts zu halten
2. Separate Virtuelle Maschinen: Um sicher zu stellen, dass die Exchange Datenbank Server nicht auf demselben ESX Host laufen
Die DRS Regeln können auch für Client Access und Hub Transport Server verwendet werden.