ich habe seit einigen Jahren ein ZWave Netz am laufen, Symcon läuft auf einem PI4, zwei andere Pis mit jeweils einem Razberry Modul sind die Controller. Zwei, weil ich vor 2/3 Jahren Probleme mit der Erreichbarkeit einiger Nodes hatte, daher habe ich mein Netz zwei geteilt. Das Ganze lief nun über die Jahre mehr oder weniger problemlos. Seit einigen Wochen habe ich nun das Problem, das Symcon plötzlich einen der Controller nicht mehr erreichen kann. Alle Requests dahin laufen (nach einer langen Zeit) in einen Timeout. Ich muss Symcon neu starten, damit hier alles wieder funktioniert. also ein Neustart des Controllers bringt nichts bzw. ist auch nicht notwendig, nur Symcon muss neu gesartet werden. Ein deaktivieren/aktivieren der Schnittstelle in Symcon bringt auch nichts, es hilft wirklich nur ein Neustart. Somit scheint es also „nur“ an Symcon zu liegen und nichts mit dem Controller zu tun zu haben oder generell das nichts mit dem ZWave Netz als solches zu tun, sondern wirklich nur mit der Erreichbarkeit des Controllers von Symcon aus. Die Probleme treten leider (oder glücklicherweise, kann man auch so interpretieren ) nur sporadisch auf, daher ist eine Fehlersuche extrem schwierig. Jedenfalls habe ich im Symcon-Log und auch im Rasberry-System-Log eigentlich nichts auffälliges zum Problemzeitpunkt finden können, warum das immer wieder mal so ist. Normalerweise laufen auch alle anderen Sachen in Symcon ohne Probleme weiter, also bsp. auch das zweite ZWave Netz funktioniert ohne Probleme. Ein Mal musste ich aber tatsächlich den ganzen Raspberry abschiessen, Symcon lies sich nicht beenden bzw. Restarten. Das ist aber nur ein mal passiert, ich gehe hier also nicht unbedingt von einem Zusammenhang aus. Hat jemand eine Idee oder einen Tipp wo ich das nächste Mal noch nachschauen könnte um das Problem weiter einzugrenzen? Oder muss ich irgendwo noch den Loglevel o.ä. erhöhen?
Oder hat jemand eine Idee, wie ich diesen Fehler überwachen kann, dann könnte ich zumindest per POE Powercycle den ganzen PI auf dem Symcon läuft hart neu starten… so wie es im Moment ist, ist es eigentlich nicht mehr zuverlässig einsetzbar