Absturz CCU2 bei Homematic IP und IPS auf Ubuntu16

Hallo Leute, ich habe gestern probiert ein paar HM IP Aktoren zum Laufen zu bekommen, leider stürzt ständig dabei die CCU2 ab.

  1. Akt: IPS aktualisiert
  2. Akt: CCU2 aktualisiert
  3. Akt: gemerkt, dass Linux 14 nich ausreicht für den neusten IPS RC und System auf 16 LTS update gemacht (vorher lieber mal nen Snapshot der VM und n Backup gemacht ;))
  4. Akt: alles läuft! Checkbox: „Use Homematic IP“ in der HM Instanz gesetzt
  5. Akt: Einlesen des 1. Aktors in CCU2 ok, auch in IPS. Aber nach unbestimmter Zeit kommt keine Reaktion mehr von der CCU2. Keine Reaktion mehr der Aktoren (auch die alten nicht) auslösbar.
  6. Akt: CCU2 per ssh zu reboot gebracht weil weboberfläche keine reaktion zeigt… Hinweis: kurz nach eingabe des reboot befehls in ssh reagiert das CCU Frontend kurz doch wieder und geht dann off… mein Schluss daraus: irgendein Dienst hängt sich auf, der beim Runterfahren gekillt wird und dann den Knoten löst)
  7. Akt: Hochgefahren und nächsten 2 HMIP Aktoren eingelsen… klappte auch, aber nach paar Minuten wieder alles tot :frowning: CCU wirft massenweise Verbindungsprobleme zu fast allen aktoren … sie hat alle LanGateways verloren

    Ende vom Lied… und mehrere Stunden später habe ich dann herausgefunden, dass meine CCU2 nicht kaputt oder so ist…
    Sondern:
    Checkbox bei IPS löst es aus… und nun die alles entscheidende Frage in die Runde: „wer weis woran es liegt?“:slight_smile:

Ich hab als nächstes die Firewall in Verdacht oder irgendeine Einstellung in IPS, die ich vergessen habe.

Sent from my iPhone using Tapatalk

Eigentlich kannst du in IP-Symcon keine Einstellung vergessen haben, da nur dieser eine Haken dafür existiert :slight_smile: Der Rückkanal geht über den selben Port wie beim normalen Funk/Wired. Du bist, glaube ich, auch der erste bei dem die CCU2 vollkommen abstürzt. Normalerweise zickst Sie nur etwas rum. Vielleicht kannst du mal die Logs der CCU ansehen, ob dort etwas brauchbares zu finden ist?

paresy

Wie kann ich die Logs oder die laufenden Prozesse ansehen? Welche ssh Terminal Befehle kann ich da am besten verwenden

Sent from my iPhone using Tapatalk

Ich wollte mal kurz berichten, wie ich vorwärts komme:

Stand heute morgen:

  • CCU2 spinnt noch immer rum, fast alle Aktoren als „nicht erreichbar“ in den Servicemeldungen
  • Gateways geben keinerlei Statusmeldung an CCU (oder CCU wertet sie nicht aus)

Aktion:

  1. Habe alle 10 Gateways gelöscht und reboot durchgeführt
  2. nach Reboot zeigen einige Komponenten wenigstens wieder eine GatewayZuweisung

–> Frage hier: Habt Ihr die Aktoren fest zugewiesen, oder auf Standard oder habt ihr den Haken bei „feste Zuordnung aufheben“ gesetzt?

  1. erstes Gatewas habe ich neu eingerichtet und es wird nach Reboot auch wieder als „aktiv“ angezeigt…
    …to be continued, ich füge jetzt mal alle Gateways neu ein

Suche auch noch immer nach einer Liste von Befehlen für die CCU2 Konsole. --> auslesen von laufenden Prozessen und andere Dinge, die helfen könnten… Kann mir da jemand einen heißen Tipp geben?

Danke

Und einen weiteren Tag später nun die Finalen durchgeführten Schritte… leider ohne dass ich die konkreten Fehler gefunden habe wobei ich stark den Archiv Handler sowie die HM I/O und Konfig Instanzen im Verdacht habe!

Das System läuft wieder und IPS sowie die CCU2 reden schneller denn je miteinander. Die Reaktionszeiten sind gefühlt um das 2-3fache schneller als vorher und Aktoren musste ich nicht neu anlernen, zurücksetzen oder ähnliches.


Nach dieser 2-Tage Odyssee kann ich nur dringen davor warnen die Updates Linux 14 auf 16 / IPS 4.0 auf 4.1 / CCU2 auf 2.25.15 in einem Zug durchzuführen! Ggf ist auch die Reihenfolge ausschlaggebend. Ich habe erst Linux, parallel die CCU2 und am Ende IPS aktualisiert. Das Durcheinander kam dann mit dem Anlernen des ersten HMIP Schaltaktors und der HMIP Checkbox in IPS.

Meine auf den vorherigen Post folgenden Aktivitäten waren nun:

  1. Ich habe die HM CCU I/O und Konfigurator Instanz in IP Symcon gelöscht! --> Verbindung damit zu CCU unterbrochen und IPS konnte sich damit irgendwie auch neu sortieren (glaube ich…verstehe aber zu wenig vom Background, was da wirklich passiert).

  2. Alle Gateways in CCU2 neu eingerichtet --> dann war die Verbindung zu den Komponenten wieder möglich

  3. Instanzen wieder installiert und die Verbindungen klappten etwas besser… in der CCU flogen nun weniger Sensoren auf die Servicemeldungen Liste. (IN IPS konnte ich damit aber noch immer nicht Homematic IP aktivieren)

  4. Habe dann in der ganzen Sucherei in irgendeinem Forumbeitrag davon gelesen dass der Archiv-Handler von IPS manchmal Probleme macht. --> Kurzerhand den Archiv Handler gelöscht und ALLE historischen Daten von IPS Variablen per SSH von der HDD geworfen.

  5. Archiv Handler neu installiert und von hand alle dort nun „grau“ dargestellten Variablen gelöscht.

  6. Anschließend beide System zum tausendsten mal durchgestartet und siehe da… die Fehlermeldungen in IPS UND in der CCU2 waren weg! Nur noch 3 Kommunikationsfehler zu Aktoren in der CCU (Vor dem Update waren es übrigens 6 :slight_smile: )

  7. Ich bin jetzt wieder glücklicher Besitzer eines gut laufenden Systems :slight_smile: INKLUSIVE Homematic IP (wobei hier das Statussetzen nicht klappt… aber das packe ich gleich in einen weiteren Post.

Gibt es schon als Thema.
Bedenke das die Datenpunkte andere sind. STATE ist z.B. nicht direkt auf jeden Kanal beschreibbar.
Michael

Tja, zu früh gefreut… ich habe dann heute die anderen drei HMIP Aktoren wieder versucht anzulernen und siehe da, der HMIP-RF Dienst in der CCU geht wieder in die Knie. Alle Schaltaktionen kommen nach und nach ins Stocken und alle Verbindungen gehen verlohren… der IPS Socket ist irgendwann nicht mehr ansprechbar und alles wieder Tot. Wenn ich die HMIP Komponenten wieder aus der CCU lösche und reboote, dann fängt sich das System langsam und alles klappt ohne Probleme.

Da ist irgendwas noch echt mies umgesetzt von eQ3. Komisch ist, dass es bei dem HMIP-SPM geht und die HMIP-SP bringen es zum Absturz. … ich weis langsam nich mehr was ich tun kann um es noch ans Laufen zu bekommen. …:frowning:

Aus Frust erstmal n Bierchen und nen Raspberry als CCU Ersatz/bzw Testumgebung bestellt. Ich kann es mir dann doch nicht leisten, dass meine Prod Umgebung ständig down geht.

Sent from my iPhone using Tapatalk

Einige Tage nach dem ersten Absturz bin ich nun etwas schlauer geworden. Ich robbe mich so langsam an die Ursache heran.
Für alle, die ähnliche Probleme haben:
Mir ist aufgefallen, dass mit Anlegen der HMIP Geräte, dem Reboot der CCU oder dem Update der CCU Gewerke und Räume angelegt wurden!
Diese sind glaube ich die Hauptauslöser.
Außerdem habe ich aus einem anderen Forum die Info, dass Systemvariablen und Skripte ebenso tödlich für die CCU sind. (Hab ich aber keine, kann es daher nicht bestätigen).

Nach dem Löschen der Räume und Gewerke schnurrt die CCU2 nun wieder. Auch die IP Aktoren laufen. Es wird jetzt aber wieder spannend, was beim Öffnen der HMIP Schnittstelle in IPS passiert… to be continued…

Sent from my iPhone using Tapatalk