Weiter zum Inhalt

Warum Sie ServiceNow Event Management wirklich brauchen

Glutnester erkennen und Fehlalarme vermeiden

Aktuelle IT-Herausforderungen

Die Herausforderung für die IT-Abteilung ist heute zunehmend digital und die Services  sind softwarebasiert. 

Für IT Abteilungen von Unternehmen, deren Geschäft von digitalen Services abhängig ist, ist es eine wettbewerbsentscheidende Notwendigkeit, die Auswirkungen eines Serviceausfalls auf das Unternehmen in Echtzeit zu kennen und zu wissen, welche Infrastrukturkomponenten einen bestimmten Service bereitstellen und wie diese Komponenten miteinander verbunden sind. 

Leider erhöhen die zahlreichen getrennten Überwachungstools, die den Zustand der Ressourcen überwachen, die die Dienste unterstützen, oft die Herausforderung für die IT. 

Jedes Tool generiert seinen eigenen isolierten Datenstrom und häufig melden  mehrere Tools dasselbe Problem. Ein einziges Problem kann zu Tausenden von Ereignissen führen, die möglicherweise keinerlei Auswirkungen auf das Geschäft haben. 

Der folgende Artikel wird die Lösung für die obige Herausforderung und auch den Mehrwert für die Event-Management-Umgebung zusammen mit den IT-Überwachungstools hervorheben.

(Das obige animierte Bild zeigt das Problem mit dem Switch, der 4 Alarme ausgelöst hat, von denen 3 Fehlalarme sind)

Die Lösung mit ServiceNow – Event Management:

ServiceNow – Event Management reduziert das von Überwachungstools erzeugte Event-Rauschen  , was den Zeit- und Arbeitsaufwand für die manuelle Korrelation von Ereignissen drastisch reduziert, indem es sich automatisch an sich veränderndeIT-Umgebungen anpasst. 

Es bietet die Möglichkeit, Überwachungssysteme mit den Automatisierungs- und Task-Management Fähigkeiten von ServiceNow zu kombinieren.

Event Management ermöglicht es, Ereignisse, die von bestehenden Infrastrukturüberwachungstools erfasst wurden, in ServiceNow zu konsolidieren und zu analysieren und erforderliche Aktionen durchzuführen

Die Ereignisse werden dann durch Filter verarbeitet, die den eingehenden Ereignisstrom normalisieren und de-duplizieren und das Ereignisrauschen um bis zu 99% zu reduzieren. Aus den verbleibenden relevanten Ereignissen werden Meldungen erzeugt.

(Das obige Bild zeigt das Problem mit dem Switch und hat 1 Alarm ausgelöst, die übrigen werden unterdrückt)

Wie funktioniert das?

ServiceNow – Event Management verfügt über Out-of-the-Box Konnektoren zu Überwachungstools und kann über eine REST-API, SNMP-Traps, E-Mail oder JavaScript-basierte benutzerdefinierte Konnektoren in andere Ereignisquellen integriert werden. 

Darüber hinaus sind Konnektoren von Drittanbietern über den ServiceNow Store erhältlich. 

Event Management sammelt Rohereignisse und verarbeitet sie, um qualifiziertere Warnhinweise für die betroffenen Configuration Items (CIs) zu generieren. 

Es de-dupliziert  Ereignisse von Überwachungstools in einen einzigen normalisierten Alarm, der automatisch mit einem CI in der ServiceNow Configuration Management Database (CMDB) korreliert werden kann.

Architektur:

Highlights von ServiceNow Event Management für das Quebec-Release

(Quelle: ServiceNow)

  • Verbesserte Problemlösung mit ServiceNow Health Log Analytics.
  • Verbesserte Datenerfassung mit dem Event Management Connector-Plugin (com.glideapp.itom.snac).
  • Installation von Event Management Komponenten über den ServiceNow Store. Wählen Sie im ServiceNow Store auf der Registerkarte ServiceNow-Produkte die Option Opt-in für die ITOM-Health-Produktkomponente aus, um die vollständige Event-Management-Funktionalität sicherzustellen.

Neu im Quebec-Release

Health Log Analytics

ServiceNow Event Management integriert die Health Log Analytics-Anwendung, um eine verbesserte Problemlösung basierend auf der Technologie aus der Loom-Übernahme bereitzustellen. Diese Alerts werden den standardmäßigen Event Management Alerts zugeordnet und bieten Informationen zu problematischen Bereichen, bevor sie in Echtzeit auftreten. Mitarbeiter des Überwachungsteams bearbeiten die  neuen Log-Analytics-Alerts und nutzen zur Anzeige der Logs den Log Viewer.

Berechtigte Kunden können die Health Log Analytics-Komponente aus dem ServiceNow Store installieren, um die Arbeit mit dieser Funktion zu ermöglichen.

Zu den in Event Management aktivierten Health Log Analytics-Funktionen gehören:

  • Vorhersage von IT-Problemen durch Erkennen von Anomalien in Ihren Protokolldaten.
  • Erhalten von Alerts zu einem aufkommenden Problem, bevor es Benutzer betrifft.
  • Verkürzen Sie die mittlere Wiederherstellungszeit (MTTR), indem Sie die wahre Ursache eines Problems in Echtzeit ermitteln.
  • Sehen Sie sich an, wie sich ein Problem auf Ihre Dienste auswirkt, und korrelieren Sie es mit Infrastrukturwarnungen in ServiceNow Operator Workspace.

Neu im Rom-Release

EIF Connector: Leiten Sie Ereignisse von Produkten, die das Event Integration (EIF)-Format unterstützen, an einen MID-Server weiter. Die Integration mit EIF ist nur durch Herunterladen des Event Management Connector-Plugins aus dem ServiceNow Store verfügbar.

Grafana-Events integrieren: Zusätzlich zu OOTB-Konnektoren für verschiedene Überwachungstools, werden Grafana-Konnektoren durch das Rom-Release angeboten, die den Import von Metriken und Events aus Grafana ermöglichen

Event Management Core App: funktioniert mit der Site Reliability Operations (SRO)-Anwendung und ist jetzt über den ServiceNow Store erhältlich.
Es enthält erweiterte Regeln für das Alert-Management. Es ermöglicht Bedienern, zu Alerts und Alert-Gruppen zu navigieren und einen Drilldown durchzuführen.

Roadmap der Implementierung – (High Level) 

Ergebnis:

Ein einziges dynamisches Dashboard, das den vollständigen Überblick über das Ereignismanagement als Anzahl von primären Alerts, sekundären Alerts, Top 10 der aktiven Alerts, Top-CIs mit Alerts und vielem mehr darstellt. Das Dashboard kann mit den Best Practices von ServiceNow an die Geschäftsanforderungen angepasst werden. Die dynamischen Dashboards bieten den Stakeholdern die Möglichkeit, den Zustand der IT-Überwachung zu überprüfen. 

Reduzierung von Event Rauschen, Minimierung der Duplizierung von Incidents, mehrere Dashboards je nach Bedarf können erstellt werden und noch vieles mehr können in ServiceNow Event Management genutzt werden.

Beispiel-Dashboard

(Individuelles Gesundheits-Dashboard)
(Operator Workspace); Bewerten Sie die Leistung von Geschäftsdiensten auf einen Blick über das Operator Workspace Dashboard.

Funktionen:

Rauschunterdrückung: Sammeln Sie Rohereignisse und verarbeiten Sie sie, um qualifiziertere Alerts zu identifizieren.

Einblicke in die Ursachen: Rangieren Sie Serviceprobleme mit automatischer Ursachenanalyse und beschleunigen Sie die Problemlösung.

Automatisierte Behebung: ServiceNow Event Management ermöglicht die Konfiguration von Regeln für die Alarmverwaltung, um Reaktionen auf Alarme, die bestimmte Kriterien erfüllen, zu automatisieren, was zu einer schnelleren Lösung von Serviceproblemen führt. Regeln können verwendet werden, um einen Alert automatisch zu schließen oder einen Knowledge-Base-Artikel an einen Alert anzuhängen. Alert Management-Regeln können auch dazu verwendet werden, automatisch Aufgaben wie Vorfälle, Änderungsanfragen, Sicherheitsvorfälle, Arbeitsaufträge für den Außendienst oder sogar einen Kundendienstfall zu erstellen. Mit Flow Designer und Integration Hub kann die IT-Abteilung eine Reihe von Abhilfemaßnahmen erstellen, die automatisch ausgelöst oder von einem Alert initiiert werden können, z. B. das Abrufen einer Protokolldatei, das Freigeben von Speicherplatz auf einer vollen Festplatte oder das Neustarten eines Dienstes.

Alert Intelligence: Alert Intelligence kann die mittlere Reparaturzeit (MTTR) erheblich verkürzen und die Arbeit des Bedieners vereinfachen, indem alle wichtigen Informationen, die zur Behebung eines Alarms erforderlich sind, in einer Konsole zusammengefasst werden. Das Öffnen eines Alerts zeigt Details wie die Beschreibung, die betroffene CI, die berechnete Priorität, den Schweregrad, die Aktivität, die betroffenen Dienste und eine Zeitleiste mit sekundären Alerts an.

Identifizieren und verhindern Sie Serviceausfälle: Die IT-Abteilung kann Probleme an der Wurzel erkennen und Serviceausfälle verhindern, indem sie sofort einsetzbare Techniken des maschinellen Lernens verwendet. Durch das Hinzufügen von ServiceNow Operational Intelligence zum Event Management kann die IT auch betriebliche Metriken nutzen, die von Überwachungstools über OOTB-Konnektoren gesammelt werden, um Leistungsprobleme zu untersuchen, die Vorläufer von Serviceausfällen sein können.