Lösungsansätze um IPS zu Überwachen

Hallo zusammen,

ich möchte hiermit mal ein Thema eröffnen, wo alle Infos gesammelt werden, um IPS zu überwachen,
oder wie ihr das Überwachen gelöst habt.
Damit meine Ich nicht nur reine IPS, sondern auch alle externen Komponenten wie CCU oder 1-Wire.
Oder im schlimmsten Fall Server total Ausfall weil Festplatte im Eimer.

IPS übernimmt bei mir im Haus immer mehr aufgaben an Anfang war es nur Licht ein und aus und vielleicht mal was zu dokumentieren, aber jetzt steuert IPS die komplette Heizungsanlage und Warmwasser Aufbereitung.
Darüber ist geplant die Umstellung aller Elektrogeräte auf primär Tag betrieb so weit möglich (wegen Solarstrom Eigennutzung).
Darum sollte es dauerhaft schnurren wie eine Katze.

Meine Überwachung ist noch sehr lückenhaft:

  1. Ich habe IPS Watch Dog am Laufen, was den Rechner bei Fehlern neu startet.
  2. Mein größtes Sorgenkind ist 1 Wire, was in unregelmäßigen Abständen die Verbindung unterbricht. Wenn das
    geschehen sollte, bekomme ich eine Prowl Meldung und Mail und ich kann den Rechner mit Hilfe von Team Viewer
    neu starten.
  3. Sicherung Ist klar jeden Tag intern und extern.
  4. Und dann steht immer ein zweiter Rechner daneben startbereit, wo einmal im Monat von Hand das letzte IPS
    aufgespielt ist.

So und jetzt zu EUCH

Hallo,

da kann man natürlich viel machen um den Rechner zu überwachen.
Die Frage ist: Reichen Neustarts?
oder auch Redundante Hardware / Server

Im ersten Fall mal so ein günstiger Ansatz:
-> Es gibt einen netten Plug-Computer namens SheevaPlug (könnte evtl. auch mit einer Raspberry Pi gehen) Dort läuft Debian Linux drauf.
-> Mit etwas Linux knowHow kann man da ohne Probleme einen Apache mit PHP installieren und von dort aus den IPS Server und Andere Dinge überwachen:

Zum Beispiel könntest Du in IPS eine eigene Webserver Instanz erstellen auf bpsw. Port 8082, dann dort eine PHP Seite, die alle wichtigen Dinge überprüft und ggf. Fehler ausgibt.
Da sind dann keine Grenzen gesetzt:

  • von Betriebssystemaufrufen
  • IPS letzte Änderung an Variablen überwachen,
  • prüfen ob ein Dienst läuft, Ports offen sind etc.

Das Sheevaplug prüft dann alle paar Minuten diese Seite und wertet diese entsprechend aus.
Wenn dort eine Fehlermeldung ausgegeben wird, oder die Seite gar nicht mehr aufrufbar ist (vom SheevaPlug), dann könnte der SheevaPlug den ganzen Rechner neu starten, auch stromlos machen über IPSteckdose oder auch andere Dinge auf dem Windows Server initiieren.

Ich hatte ein Sheevaplug ohne reboot sehr stabil über 2 Jahre am laufen und durchweg positive Erfahrungen damit gemacht.

Im Zweiten Fall, bei redundanter Hardware, wäre folgendes eine Überlegung wert:
Windows Server auf beiden Rechnern zu installieren und sich mal die Microsoft Cluster Services anzuschauen.
Da kann ein Server dann den anderen ohne Probleme übernehmen etc.
Im Prinzip ist das so, dass man aus den beiden Physischen Servern mit eigener IP und Diensten und Platten einen Logischen baut.

Viel möglich.

Hallo,

das einzige, was mich ziemlich zurück werfen könnte, währe ein Hardwaredefekt. Aber ich halte IPS derzeit bei mir nicht für so wichtig, das ich deswegen eine redundante Installation aufbauen würde - schlimmster Fall währe ein Ausfall des Servermainboards oder der CPU, alles andere könnte ich kurzfristig ersetzen.

Alles andere versuche ich soweit es mit Hausmitteln geht, abzufangen, da mein IPS auf einer virtuellen Maschine läuft, währe das auch recht einfach.

  • virtuelle Maschine ist innerhalb von Minuten neu aufgesetzt, hab Sicherungen davon, die wöchentlich aktuallisiert werden und an zwei Orten gesichert sind.
  • Backups der IPS-Installation wird alle 6 Std. auf das sep. RAID in meinem Server erstellt, zudem wird die Konfig in den 3 Std. dazwischen seperat gesichert - ich verlier also max. 3 Std. an Daten.
  • Ausfall der Server-SSD währe auch kein Problem, die könnte ich kurzfristig durch eine 2,5" Platte ersetzen, ein Komplett-Image davon sichere ich wöchentlich auf eine externe Platte.

Überwachung: derzeit eher nur manuell, an eine automatische Überwachung auf der Serverseitigen Linux-Installation arbeite ich derzeit noch. Ich möchte nach Möglichkeit alle wichtigen Daten wie CPU-/Speicher-/Festplattenauslastung/SMART-Parameter/Temperaturen monitoren und dann in IPS virtualisieren und bei Schwellwertüberschreitung auch per SMS/Email alamieren. Hardwareprobleme kündigen sich in der Regel immer vorher an.

Ich noch ein ongoing-Project und wohl was für die langen Weihnachtfeiertage, hab da eh Rufbereitschaft und kann nicht viel unternehmen.

Netzwerkverbindungen überwache ich derzeit bereits mit einfachen „pings“ zu CCU, Internet-Router, DNS-Server im Internet, usw. allerdings noch ohne Alarmierung und ohne Virtualisierung. Die Lösung ist mir derzeit noch zu instabil und fehleranfällig.

Stromversorgung ist derzeit noch ein wunder Punkt, aber eine kleine USV ist bereits bestellt. Die wird zumindest ein Zeit den Server am laufen halten und dann runterfahren können - allerdings hab ich noch keine Lösung, wie. Die Software der USV läuft nur auf Windows. Somit muss ich vom meinem virtuellen Windows-Server die Linux-Maschine darunter runterfahren. Ich hoffe, das funktioniert so, wie ich mir das gerade so vorstelle.

IPS & IPS-Server per Watchdog überwachen: Ich habe zwar das IPS-868 Watchdogteil hier liegen, aber ich weiss noch nicht so ganz, ob ich damit bei einem Hänger der virtuellen IPS-Maschine direkt den kompletten Server rebooten will.
Da überlege ich mir lieber erst mal eine Lösung auf dem phy. Server, der z.b. dann per regelmässiger Anfrage die IPS-Instanz „ping“ und bei 3 oder 5 Fehlern hintereinander mal einen reboot der virtuellen Maschine durchführt. Sollte das nicht reichen, dann eben den Hard-Reboot durchführt.

Machen kann man viel, aber ob das alles sinnhaft ist, steht auf einem anderen Blatt.

Darüber ist geplant die Umstellung aller Elektrogeräte auf primär Tag betrieb so weit möglich (wegen Solarstrom Eigennutzung).
Darum sollte es dauerhaft schnurren wie eine Katze.

Ein Bekannter von mir macht genau das bereits, der speisst mit seinem Solarstrom als erste mal den Eigenverbrauch, Überschüsse laden einen Energiespeicher im Keller auf, der aus dicken Akkuspacks besteht und wenn der auch voll ist, geht der Rest an Solarenergie erst ins öffentliche Netz. Liefert die PVA nicht mehr genug Strom, wird erst mal der Akkupuffer angezapft, ist der auch leer, gehts ans öffentliche Netz.
Allerdings reicht die Akkukapazität nicht aus, das Haus 24h am Tag autark mit Strom zu beliefern, in den Morgenstunden ist der Speicher leer und es wird Strom aus dem Netz benötigt. Somit fällt das Teil als „USV“ aus - liegt auch daran, das nur 50% der Speicherkapazität benutzt wird, um die Akkulebensdauer max. zu verlängern.
Übers Gesamtjahr gesehen ist die selbsterzeugte Energiemenge immer noch grösser als der Gesamtverbrauch, aber im Winter ist der Eigenverbrauch doch deutlich höher, als die selbst erzeugte Strommenge.
Mein Bekannter überlegt schon, den Akkuspeicher zu verdoppeln, wirtschaftlich gesehen vollkomm sinnfrei, ökologisch aber sehr sinnvoll. Damit währe sein Haus autark und ein richtiges +Energiehaus, er würde dann mehr Strom produzieren als selber benötigen.