Die kontinuierliche Überwachung Ihrer Server ermöglicht es, Problemquellen zu erkennen und zu beheben, so dass diese nicht zu einem Ausfall führen. Unvorhergesehene Ausfälle werden zudem schnell festgestellt und können beseitigt werden, noch bevor Ihre Kunden das Problem bemerken. Auf diese Weise verbessern Sie die Verfügbarkeit Ihrer Dienste und schaffen Vertrauen.

Durch die Aufzeichnung von Performance-Daten können Sie frühzeitig Trends erkennen und den Einsatz zusätzlicher Hardware zur Performancesteigerung besser planen oder unnötige Ressourcen einsparen.

Neben der reinen Verfügbarkeit überwachen wir diverse Systemparameter und Kennzahlen. So können wir Hardware-Schäden, wie einen Festplattendefekt oder einen nicht korrekt montierten CPU-Kühler erkennen und die Behebung des Problems einleiten, noch bevor ein Datenverlust eintritt oder die CPU durch Überhitzung Schaden nimmt.

Kundenfreundliche Übersicht

Einige Parameter, welche wir für unsere Kunden überwachen:


CPU-Auslastung
Nutzung durch User- und System-Prozesse; Messung für jeden einzelnen CPU-Core
Load
Wert der Systemlast ("Load"-Wert) - 1min, 5min und 15min-Wert
Arbeitsspeicher
Nutzung des Arbeitsspeichers, aufgeteilt in freien Speicher, Buffers, Cache und Swap
Services
Überprüfung, ob alle Systemdienste gestartet sind, sowie deren Status
Systemzeit
Diffenrenz der Uhrzeit zur Weltzeit
Prozesse
Gesamtanzahl laufender Prozesse, sowie die Anzahl an Zombie-Prozessen
Benutzeranzahl
Anzahl der am System angemeldeten Benutzer
Updates
Verfügbarkeit von Sicherheits-Updates

FTPS
Erreichbarkeit des Dienstes, sowie Ablegen und Überprüfen einer Testdatei
HTTP
Erreichbarkeit bzw. Auslieferung einer Webseite und Fehlercode-Auswertung
SSH
Kontrolle der Erreichbarkeit
SMB/Samba
Erreichbarkeit einer SMB-Verzeichnisfreigabe

MySQL
Erreichbarkeit, Anzahl Verbindungen pro Sekunde; Anzahl Abfragen pro Sekunde
PostgreSQL
Erreichbarkeit der Datenbank

Netzwerktraffic
Messung des Durchsatzes aller Interfaces in KB/s (RX und TX)
Ping
Erreichbarkeit, Paketverlustrate in Prozent, RTA Umlaufzeit in ms, sowohl IPv4 als auch IPv6
DHCP
Erreichbarkeit des DHCP-Servers, Anzahl der DHCP-Requests, Durchführung von Test-Requests
Tunnel
Messung der Funktion von Netzwerk-Tunneln (z.B. OpenVPN): Paketverlustrate, Latenz

Speicherbelegung
Belegung der einzelnen Partitionen auf der Festplatte
Disk I/O
Messung des Durchsatzes in KB/s, sowie die Anzahl der I/O-Operationen pro Sekunde
RAID
Status des RAIDs: Platten aktiv oder defekt, Status einer laufenden Synchronisation

E-Mail-Zustellung
Erreichbarkeit und Absenden einer Testmail
IMAP
Login und Abruf einer Testmail
POP3
Erreichbarkeit des Dienstes
SMTP
Erreichbarkeit des Dienstes
Blacklist
Kontrolle, ob der Server in SPAM-Blacklisten verzeichnet ist
Queue Length
Messung der Anzahl Mails, welche in der Mail-Queue auf ihre Auslieferung warten
Greylisting
Anzahl der durchlaufenden Mails und Mails im Greylisting (Spamschutzmaßnahme)

HDDTemp
Temperatur der Festplatten
SMART
SMART-Status (Selbsttest) der Festplatten
CPU-Temperatur
Temperaturmessung für jeden einzelnen CPU-Core
Mainboard-Temperatur
Auswertung der Temperatur-Sensoren auf dem Mainboard
Lüfterdrehzahlen
Messung der Lüfterdrehzahlen, für jeden Lüfter einzeln

MySQL
Status und Latenz einer Datenbank-Replikation
DRBD
Status und Funktion der Replikation von verteilten Festplatten-Devices
Pacemaker
Kontrolle einer Pacemaker-Hochverfügbarkeitslösung auf Status und Verteilung der konfigurierten Dienste

Rack-Temperatur
Temperatur des ins Rack einströmenden Luftstroms im Rechenzentrum
Netzwerktraffic
Messung des Gesamt-Netzwerktraffic am Switch
DNS
Erreichbarkeit und Funktionskontrolle der Nameserver
Überwachung
Gegenseitige Kontrolle der Überwachungsserver auf Funktion und Aktualität der Daten
RIPE-Atlas
Messung der Erreichbarkeit und Latenzen von verschiedenen Orten der Welt aus (über das RIPE-Atlas-Projekt)

Diskpace
Füllstand der Partitionen (z.B. NTFS)
Load
Windows CPU Load in Prozent
Speicherbelegung
Gesamtgröße und prozentuale Belegung des Arbeitsspeichers


Überwachung nach Kundenanforderung

Daneben führen wir für unsere Kunden individuelle Überwachungen durch. Beispielsweise auf die Aktualität der Bilder einer Webcam, Online-Überprüfung von Guthabenkonten, sowie die Abfrage auf bestimmte Inhalte einer Webseite. Durch die Inhaltsabfrage ist es möglich, kundeneigene Skripte auf korrekt Funktion zu überprüfen.


Sie haben noch Fragen zum Thema?

Tralios IT GmbH