Monitoring und Alerting

Beschreibung

Wir überwachen alle Hard- und Softwarekomponenten für die Bereitstellung unserer Service Dienste und optional auch Ihre Anwendung. In diesem Dokument wird das Alerting für Managed Services erklärt. Eingehende Alarme werden durch unser Event Management im Service Operation Center kategorisiert und priorisiert. Die Einteilung in Fehlerklassen, Reaktionszeiten und die Vorgehensweise wird im mit Ihnen vereinbarten SLA definiert. Ebenso werden im SLA die Meldewege definiert. SysEleven bietet einen identischen Basisprozess für das Alerting für alle Kunden an. Durch optionales Buchen von Service Management kann dieser Prozess erweitert und durch Buchen von Server Management Enterprise individualisiert werden.

Basisprozess
SysEleven implementiert mit jedem Service eine Basismenge an Checks, die Sie der jeweiligen Dienstbeschreibung entnehmen können. Beim Alerting ist es uns wichtig, die richtige Balance zwischen entstehenden Kosten durch ein zu empfindliches Alerting und den möglichen Folgekosten durch eine Nicht-Verfügbarkeit von Services zu finden. Unsere Best-Practice ist eine Unterteilung von Alarmen in

  • Warnung (Warnings) und
  • kritische Alarme (Criticals),
    sowie ein mehrstufiger Erkennungsprozess dieser Zustände, wenn möglich. Wir prüfen in der Regel in einem Intervall von 5 Minuten und nach einer Statusänderung im Intervall von einer Minute insgesamt vier weitere Male. Davon abweichende Einstellungen sind in den jeweiligen Dienstbeschreibungen aufgeführt.

Kritische Alarme
Bei einem kritischen Alarm kann es, je nach Typ, bereits zu einer Verminderung der Service Qualität kommen. Da Fehlalarme nicht auszuschließen sind und es sich auch um einen kurzfristigen Zustand des betroffenen Dienstes handeln kann, sprechen wir beim ersten Auftreten von einem „weichen“ Alarm und beobachten den Dienst weiter. Schlägt der Check auch mit dem vierten weiteren Versuch immer noch fehl, so wechselt der Alarm in den harten Zustand und es wird eine Alarmierung gemäß SLA angestoßen und eine Benachrichtigung an die in unserem Alarmsystem hinterlegten Kontakte und Adressen (Email oder Telefonnummer) ausgelöst. Je nach Vereinbarung melden Sie eine Störung oder unser System meldet uns diese Störung.

Warnungen
Eine Warnung wird grundsätzlich vor einem Critical ausgelöst und soll eine frühzeitige Reaktion ermöglichen. Eine Warnung ist aber keine qualifizierte Störung, da wir die Schwellwerte nach Möglichkeit so wählen, dass bei einer Warnung keine Beeinträchtigung des betroffenen Dienstes zu beobachten ist. Sie zeigt aber an, dass eventuell bald ein kritischer Alarm ausgelöst wird. SysEleven betrachtet Warnungen nach Best-Effort und wertet beispielsweise Trending-Daten aus, um kommende Störungen nach Möglichkeit zu verhindern. Auch für Warnungen gilt der Unterschied zwischen weichem und harten Zustand.

Erweiterter Prozess

Die Erweiterung erlaubt Ihnen die Anpassung der Schwellwerte für die Auslösung von Warnungen und kritischen Alarmen an die Bedürfnisse Ihres Setups.

Individueller Prozess

Kunden mit Service Management Enterprise können Schwellwerte und die Übergänge zwischen weichem und harten Alarmstatus für jeden Alarm festlegen. Zusätzlich kann mit dem optional zu definierenden Betriebsstörungshandbuch eine individuelle Basis zur Behebung der Fehlerzustände definiert werden.

Das wollen wir mit diesem Service erreichen:

  • Drohende Störungen abwenden
  • Im Fall einer Störung schnell den richtigen Ansprechpartner informieren

Das können Sie von uns erwarten:

  • Basis Checks nach SysEleven Best-Practices
  • Individuelle Checks (optional)

Optionale Service Features

  • Direkte Alarmierung von SysEleven (siehe Service Level Agreement Managed Hosting)
  • Zusätzliche Checks
  • Erweiterter Prozess
  • Individueller Prozess

Service Requests

Öffnen Sie ein Ticket unter https://helpdesk.syseleven.de und benutzen sie folgende Zeilen als Betreff ihres Tickets, um einen Standard Service Request zu erstellen:

  • Ändern der Kontaktdaten zum Empfang von Alarmmeldungen
  • Individuellen Check einrichten
  • Checkintervalle ändern (Nur mit Service Management Enterprise)

Wichtige Hinweise

  1. Die Kontaktinformationen, die Sie im Kunden-Frontend selbst eingetragen haben, werden nicht von unserem Alarmsystem verwendet. Diese dienen nur der Kontaktaufnahme durch einen Mitarbeiter von SysEleven.
  2. Bitte sorgen sie stets für aktuelle Kontaktinformationen in unserem Alarmsystem. Sie können dazu gerne ein Ticket im Helpdesk anlegen.

Weitere Informationen schicken wir Ihnen gern auf Anfrage zu