ich bin auf der Suche nach ein paar guten Tipps oder Links zum Thema Redundanz bei MTAs.
Warum das ganze?
Da unsere Geschäfte sehr stark vom Mailversand und -empfang abhängig sind, planen wir eine Umstrukturierung unseres Mailsystems. Gegenwärtig betreiben wir das ganze auf einem Server "in House", der an ner 2 MBit Leitung nach draußen hängt. Aller ausgehender Verkehr geht über einen (na gut, es werden wohl eher ein paar mehr sein ;)) weiteren MTA, der von 1&1 betrieben wird. Eingehender Verkehr geht direkt an unseren Server, und der/die 1&1 MTA sind mit geringerer Preferenz in den MX-Records hinterlegt.
Drei Probleme können wir nun momentan beobachten:
- Wenn unser interne MTA mal aus irgendwelchen Gründen Offline ist, ignorieren viele Gegenseiten die Backup-MX-Einträge und warten - mit Glück, manchmal lassen sie es auch bleiben - bis der primäre MTA wieder erreichbar ist.
- Die Zustellung unser ausgehenden Mails ist extrem unzuverlässig, bzw. geschieht oft um bis zu 24h verzögert. Das Problem hat seine Ursache irgendwo, nachdem es unseren Einflussbereich verlassen hat.
- Relativ viel Schrott - den unser Filter dann gleich wieder droppt - verstopft unsere schmale Außenleitung.
Im wesentlichen möchten wir unsere Backup-MTA sowie unsere Smarthost in Eigenregie nehmen. Es sind zwei Server in unterschiedlichen Rechenzentren bei unterschiedlichen Anbietern geplant, die dann primärer und sekundärer MTA spielen dürfen und - durch VPN Tunnel - Mails für unsere Domain in beide Richtungen "relayen" dürfen. Außerdem sollen unsere Mailfilter direkt auf den Frontendservern laufen. Dafür geht dann unser eigentlicher MTA wieder vom Netz und redet nur noch mit den beiden Frontends.
Und wo ist nun das Problem?
Soweit erstmal technisch und von der Umsetzung her alles kein Problem. Was mir allerdings völlig abgeht, ist wie ich Problem #1 beseitige. Eigentlich sollte die Verfügbarkeit der MTA in den Rechenzentren zwar höher liegen, als unsere hiesige, aber wenn die Gegenstellen das Backup einfach ignorieren, hab ich irgendwie keine Chance, wenn doch mal einer ausfällt oder zu Wartungszwecken außer Betrieb geht.
Wie geht man bei solchen Fällen am besten vor? Ließe sich sowas wie ein Failover zwischen den beiden Servern realisieren? Welche Erfolgschancen bringt das mit sich? Wie sieht das ganze unter Kostengesichtspunkten aus? Kennt Ihr irgendwas an Literatur, die das ganze Thema mal aus praktischen Gesichtspunkten beleuchtet? Und zum guten Schluss: Was haltet Ihr grundsätzlich von obigem Ansatz?
Danke & Gruß Jens