Monitoring

Icinga 2 Monitoring Software

Ansprechpartner
Alexander Trautsch, Christian Sperl


Kontakt
it-monitoring@desy.de


Überwachung
IT bietet allen interessierten Gruppen an, ihre Systeme und Services mit in das bestehende Monitoring aufzunehmen.
Als Softwarelösung wird "Icinga 2" im Cluster betrieben.
Es dient zur Überwachung der Erreichbarkeit von Servern und Diensten. Neben typischen Abfragen, wie CPU- und Arbeitsspeichernutzung, freier Festplattenplatz oder die Pruefung nach bestimmten Prozesse und/oder Ports sind auch speziellere Ueberwachungen moeglich.
Für eine aktuelle Einsicht der Zustände kann in der verwendeten Weboberfläche "Icinga Web 2" eine Ansicht bereitgestellt werden.
Zudem ist es möglich mittels Grafana eine Visualisierung von Metriken der Systeme zu bieten.
Bei Fragen wenden Sie sich bitte an die oben genannte Kontaktadresse.


Allgemeine Information zur eingesetzten Software finden Sie unter:

https://confluence.desy.de/display/I2I/Allgemeine+Informationen


Alarmierung
Alle Rechner im Rechenzentrum werden 24 Stunden täglich und 7 Tage die Woche überwacht. Es besteht die Möglichkeit einer automatischen Alarmierung per E-Mail oder SMS.
IT bietet eine Rufbereitschaft für die Bearbeitung von Fehlern außerhalb der Öffnungszeiten. Wenden Sie sich dafür per E-Mail an die oben genannte Kontaktadresse.
Eine solche erweiterte Alarmierung wird für Rechner und Dienste von zentraler Bedeutung eingesetzt, sofern die entsprechenden Voraussetzungen gegeben sind.

 

Weitere Links

https://icinga.com

https://icinga.com/products/user-experience

 

Kontakt Alexander Trautsch
Überwachung Das Rechenzentrum (RZ) bietet allen interessierten Gruppen an, Systeme im RZ zu überwachen. Derzeit nutzt IT das Werkzeug Nagios
Hier wird die Erreichbarkeit von Rechnern und Diensten überwacht. Zusätzlich können typische Betriebsparameter überwacht werden, wie Prozessorauslastung (Load), freier Festplattenplatz oder das Vorhandensein von vorgebenen Prozessen und Ports. (Derzeit nur für Unix-Systeme eingesetzt) Bei Fragen wenden Sie sich bitte an die oben angebenen Kontaktadressen.
Alarmierung

Alle Rechner im Rechenzentrum werden 24 Stunden täglich und 7 Tage die Woche überwacht. Innerhalb der Öffnungszeiten bearbeitet das Operating dann alle anfallenden Alarme.

Wenn Alarme für ein System auch außerhalb der Öffnungszeiten bearbeitet werden sollen, dann wenden Sie sich an den Fachgruppenleiter IT-Operations (rz@desy.de). Eine solche erweiterte Alarmierung wird für Rechner von zentraler Bedeutung eingesetzt, sofern die technischen Vorraussetzungen gegeben sind.
Vor der Beschaffung von solchen Systemen ist daher zunächst zu prüfen, ob sie die technische Vorraussetzungen erfüllen, d.h. dass die Systeme fernüberwachbar und administrierbar sind. Bei der Prüfung unterstützen wir Sie gerne.