Erweiterung der „kleinen Exchange Organisation“ – Teil 4

Im vierten Teil der Erweiterung der kleinen Exchange Organisation ist die DAG an der Reihe. Domain Controller und Sophos UTM laufen bereits redundant und der zweite Exchange Server ist auch vorbereitet. Damit nun auch der Ausfall eines Exchange Servers oder der Ausfall des Hyper-V / ESX Servers abgefangen werden kann, ist eine Exchange DAG (Database Availability Group) nötig.

Vorwort

Für die DAG mit zwei Exchange Servern wird zusätzlich ein weiterer Windows Server als Zeugenserver benötigt. Der Zeugenserver darf dabei nicht auf einem der beiden Hypervisor laufen, die auch die Exchange Server beherbergen. In der von mir beschriebenen Umgebung ist also ein dritter physikalischer Server (Server 3) nötig:

Organisation

Der Zeugenserver wird benötigt um zu ermitteln welcher Exchange Server ausgefallen ist und welcher der verbleibende Exchange Server ist. Der Zeugenserver muss keine besonderen Hardware Anforderungen erfüllen, hier liegen später nur ein paar kleine Dateien.

Hintergrund Zeugenserver

Die DAG basiert auf dem Windows Failover Cluster Feature und der Windows Failover Cluster arbeitet nach dem „Stimmenprinzip“. Vereinfacht gesagt: Jedes Cluster Mitglied erhält eine Stimme, innerhalb des Clusters muss immer die Stimmenmehrheit gewährleistet sein, sonst wird der Betrieb eingestellt. Im Falle von zwei Exchange Servern, hat also jeder Exchange Server 1 Stimme, fällt nun einer der Exchange Server aus, fällt somit auch eine Stimme weg. Der Cluster würde seinen Betrieb einstellen, da die Mehrheit nicht mehr gegeben ist. Die eine verbleibende Stimme ist eben nicht die Mehrheit, wir bräuchten also mehr als 50% der Stimmen.

Hier kommt der Zeugenserver ist Spiel. Der Zeugenserver bekommt 0,5 Stimmen. Bei zwei Exchange Servern und einem Zeugenserver hat der gesamte Cluster also 2,5 Stimmen. Fällt ein Exchange Server aus, bleiben 1,5 Stimmen übrig. Somit ist die Mehrheit gewahrt und alles ist schön. Der Grund für die Mehrheit ist einfach, nur wenn zweifelsfrei feststeht, welcher von 2 Servern ausgefallen ist, kann auch ein Failover durchgeführt werden.

Das Horrorszenario: Irgendwo fällt ein Switch oder Uplink aus, Exchange1 kann nicht mehr mit Exchange2 kommunizieren, Exchange1 denkt er müsste die passive Datenbank online schalten, Exchange2 denkt ebenfalls er muss die passive Datenbank online schalten. Ohne einen Zeugenserver hätten wir in diesem Fall Datenbanken auf beiden Exchange Servern aktiv und unweigerlich korrupte Daten. Um dies zu vermeiden wird der Zeugenserver gefragt und die Mehrheit bestimmt.

Konfiguration des Zeugenservers

Auf dem Zeugenserver muss kaum etwas vorbereitet werden. Es reicht Server 2012 R2 zu installieren und in das Active Directory aufzunehmen. Ich habe dazu den Server fs.frankysweb.org mit der IP 172.16.100.17 installiert.

Bei der Netzwerkkonfiguration ist darauf zu achten das beide DNS Server angegeben werden:

image

Damit das Zeugenverzeichnis durch Exchange konfiguriert werden kann, muss noch die Gruppe „Exchange Trusted Subsystem“ zur Gruppe der lokalen Administratoren hinzugefügt werden:

image_thumb1

Das ist schon alles, weiter geht es mit der Konfiguration der DAG.

Konfiguration Exchange DAG

Auf einem der beiden Exchange Server kann nun die DAG konfiguriert werden

image

Nachdem die DAG angelegt wurde, können die beiden Exchange Server hinzugefügt werden:

image

Nach kurzer Zeit wurden die Server hinzugefügt und der Dialog kann geschlossen werden.

image

Im EAC sollte es nun wie folgt aussehen:

image

Eine DAG mit dem Namen „FWDAG1“. Die Server mit dem Namen „Exchange“ und „Exchange2“ sind Mitglieder, Zeugenserver ist „FS“.

Konfiguration Datenbankkopien

Für die beiden Datenbanken muss jetzt jeweils eine Kopie auf dem anderen Exchange Server hinzugefügt werden:

image

Für die Datenbank „MailboxDB“ wird also eine Kopie auf „Exchange2“ konfiguriert:

image

Für die zweite Datenbank wird ebenfalls eine Kopie auf dem Server „Exchange“ hinzugefügt:

image

Nachdem die Kopien hinzugefügt wurden, sollte es in etwa so aussehen:

image

Nachdem die Kopien hinzugefügt wurden, kann der Status überprüft werden.

Überprüfung

Bevor ein Ausfall getestet werden kann, sollte überprüft werden, ob die die Postfachkopien und der Index in Ordnung ist:

Get-MailboxDatabaseCopyStatus -Server exchange
Get-MailboxDatabaseCopyStatus -Server exchange2

image

  • Bei mir war ein Index beschädigt. Ich habe den Index neu erstellt:

Exchange Index neu erstellen

Mittels des folgenden Befehls, kann der Index dann an den zweiten Server übertragen werden (falls auf beiden Servern der Index defekt sein sollte)

Update-MailboxDatabaseCopy MailboxDB\EXCHANGE2 -CatalogOnly

Der Ausfall

Der wichtigste Test ist natürlich der Ausfall eines kompletten Servers. In diesem Fall sind zeitgleich ein Domain Controller, ein Exchange Server und eine Sophos UTM nicht mehr verfügbar. Ich teste den Ausfall von Server1:

image

Auf Server1 befindet sich die aktive Sophos UTM, ein Domain Controller und der Exchange Server mit der aktiven Datenbank „MailboxDB“ in der das Administrator Postfach gespeichert ist. In meinem Fall passiert also ein Failover des UTM Clusters und ein Failover der Postfachdatenbank „MailboxDB“. Zur Erinnerung, ein Loadbalancer für Exchange wird nicht eingesetzt. Das Ergebnis könnt ihr euch im Video anschauen:

Oben rechts läuft ein Ping gegen den Domain Controller „DC“, in der Mitte ein Ping zum Exchange Server. Oben links läuft ein Ping zu meinem Blog und unten links der Ping zur UTM. Beim Ausfall von Server1 übernimmt die passive UTM nach kurzer Zeit, hier geht nur ein Ping verloren. Exchange Server und Domain Controller bleiben offline, Outlook bekommt von all dem nichts mit. Das Failover auf Exchange2 war erfolgreich:

image

Fazit

An dieser Stelle gibt es kein kleines Fazit. Es gibt noch einen ausführlicheren Artikel zu Pro und Kontra und zu den ungelösten Problemen.

6 thoughts on “Erweiterung der „kleinen Exchange Organisation“ – Teil 4”

  1. Guter Artikel, falls jemand hier das mit einem Exchange 2019 als Vorlage zur Installation iner DAG nutzt: Lasst euch nicht irritieren bei dem Index Thema. Bei der Anzeige der Datenbanken steht da contentindexstate
    notapplicable

    Das heißt nicht, das der Index nicht geht. Der Exchange 2019 benutzt nur BigFunnel. Am besten ein Postfach in die entpsrechende DB verschieben und das Postfach abfragen mit:

    Get-MailboxStatistics test2|fl BigFunnel*

    @Franky: Ggf. ein kleiner Hinweis in dem Artikel als Update?

    Reply
  2. Hallo Franky,

    danke für deinen immer wieder kehrenden Artikel zu allem was ich in Sachen Exchange suche ;-)

    Wir setzen gerade bei einem Kunden eine neue Exchange Landschaft auf, da noch ein einzelner 2016er Exchange auf einem alten 2012R2 läuft …

    Eine kurze Frage zu den Replikationswegen: Ich habe noch irgendwie im Kopf aus alten Zeiten und Claude empfiehlt mir es auch gerade wieder eigene NICs und ein eigenes Netzwerk für die Replikation einer DAG zu konfigurieren, die nur für die Replikation zuständig sind. Hast du da Erfahrungen mit? Möglich wäre es ohne Probleme ein zusätzlichen Netz einzurichten. Aber bei nicht ganz 100 Usern halte ich das für etwas Oversized, gerade weil die Netze eh als Bridge in Proxmox hängen und wir 10GB zwischen den Servern haben. Was sind da deine aktuellen Erfahrungen? Danke und toll das es deine Seite gibt, danke!

    Reply
  3. Hallo Frank

    Ich habe Deine Dokumentationen zum Aufbau einer kleinen Exchange Umgebung und der Erweiterung auf Basis Exchange 2019 gelesen und bin begeistert von Deinem ganzheitlichem Ansatz. Weiter so … bitte.

    Beim Durcharbeiten Deiner Anleitung ist mir nun in Verbindung mit der „Hochverfügbarkeit“ aufgefallen, dass der ClientAccess nicht auf beide Exchange Server erfolgt, da anfangs ein echter Host und ein virtueller Host nur auf einen Exchange Server verwiesen.

    Habe ich den Punkt überlesen? Ich habe es leider bisher nicht geschafft beide Exchange Server über den virtuellen Host auf der Sophos ansprechen zu können. Der Versuch den DNS Host „mail.domain.ltd“ zu verwenden, der im internen DNS auf beide Systeme deutet, als echten Webserver in Sophos über einen virtuellen Webserver ansprechen zu können, brachte keine Verbindung zusammen.

    Wo liegt mein Problem? Hast Du einen Tipp für mich?

    LG
    Michael

    Reply
  4. Hello Frank,

    beim Erstellen einer DAG bekomme ich immer auf beiden Servern diesen Fehler:

    Fehler beim serverseitigen Verwaltungsvorgang für eine Database Availability Group. Fehler: Fehler bei Vorgang. CreateCluster-Fehler können von falsch konfigurierten statischen Adressen verursacht werden. Fehler: Das Windows-Failoverclustering ist auf SERVER1.domain.de‘ nicht installiert. [Server: server1.domain.de]

    Beide sind 2012 R2 Server mit fester IP, eigentlich exakt Dein Nachbau. Wo könnte der Fehler liegen? DNS Auflösung funktioniert fehlerfrei an beiden Servern.

    Gruß Karsten

    Reply
  5. Hi Andreas,
    auf welches Problem spielst du an? HTTP Keep Alive? Dann ist es nur eine Frage, wo die EAS Verbindung terminiert wird.
    Gruß, Frank

    Reply

Leave a Comment