Razberry Firmware 7.36 API 10

Hi,

ich habe auf die aktuelle Razberry Firmware (API Version ist jetzt 10) aktualisiert, irgendwie verschluckt sich IPS an manchen langen Telegrammen…

Hat jemand auch schon auf die 7.36 umgestellt? (7.36 is the latest. 7.6 (7.06) is the one programmed on production line; New SDK and fixed Z-Wave code reboot on failed nodes. This is improving the stability dramatically) siehe Razberry Firmware

Ciao
HerbertF

Hallo Herbert,

ich habe jetzt die 7.36 seit ca. 1 Woche am Laufen und leider klappt das Zusammenspiel mit IPS noch nicht so gut. Laut IPS meldet das Modul (Razberry 7 Pro) „The network is busy“ aber mein Zniffer zeigt gar keinen Datenverkehr an. Die Situation beruhigt sich dann auch nicht mehr. Der Razberry ist so lange nicht mehr ansprechbar, bis man ihn komplett stromlos macht. Ein Service- oder OS-Neustart reicht nicht. Ich habe ca. 108 nodes im Netzwerk.

Die Fehler werde ich auf jeden Fall melden. Mal sehen, woran das liegen kann.

Viele Grüße

Wobei das ja leider kein gutes Zeichen ist, dass wir etwas verändern könnten :frowning:

paresy

Hi Paresy,

manchmal läuft es über Stunden, jetzt schon fast 24h. Im IPS sind dann „queud…?“ Einträge im Debug der Schnittstelle, ich musste (m.E.) auch immer den IPS mit neu starten…

Kann es sein, dass es jetzt deutlich längere Telegramme gibt (siehe Snap)??

Es kann sein, dass die Telegramme länger sind (die wir empfangen). Seit API 9, glaube ich, gab es ja eine Erweiterung, dass man mehr Daten wie z.B. Signalstärke mit übermitteln kann. Das sollten wir aber eigentlich korrekt unterstützen. Und es ist ja auch die Empfangsseite - beim Senden hat sich ja nicht verändert.

paresy

Kurzes Update: Ich hatte eben wieder den Absturz - zwangsläufig (da ich momentan keinen phys. Zugriff auf den Razberry habe) - habe ich diesen neu gestartet (reboot) - kein Effekt.
Dann habe ich IPS neu gestartet und danach nochmals Reboot beim Razberry - jetzt geht es wieder.
@Paresy: Ich glaube - ihr könntet schon helfen …
Besten Dank im Voraus
HerbertF

Scheinbar kein nachhaltiger Erfolg (eingelesen 4096 :upside_down_face:):

@paresy Könnet Ihr zumindest die Instanz in einen Fehlerzustand setzen wenn so viele Pakete am Stück nicht mehr gesendet werden können? Das würde die zumindest die Fehlerdiagnose schneller machen und man könnte direkt eine Automatisierung triggern.

Aktuell muss ich zugeben, dass ich das Problem noch nicht durchdrungen habe - bzw. auch noch nicht verstehe, warum so viele Meldungen auf einmal reinkommen (die wir dann auch nicht verarbeiten - denn eigentlich sollten wir genug CPU Power haben um dies zu tun)

@herbertf Hättest du die Möglichkeit passend zu diesem I/O Debug auch den vom Z-Wave Gateway zu zeigen? Dort müssten die Pakete ja verarbeitet oder verworfen werden.

paresy

Hallo Paresy,

ich mache Dir gern ein paar Logs. An welche Mailadresse soll ich die denn senden?

Als Workaround habe ich mir jetzt einen „neuen“ Razberry (mit alter Firmware :laughing:) bestellt, dieser hat auch mehrere Fehler welcher in der 7.28 weg waren, läuft aber trotzdem stabiler.

Du bekommst beide Logs …

Ciao
HerbertF

Gerne an die support@symcon.de

Kann man keine Downgrades machen?

paresy

Downgrade habe ich angefragt im RazberryForum und zusätzlich versucht die „alten Firmware-Dateien“ herunterzuladen - zumindest mit den heruntergeladenen war kein Downgrade möglich (Upload fehlgeschlagen) :money_mouth_face:

@Paresy: Du hast Post.

Hi Paresy,

ich hatte das Problem eben selbst „mit der alten Firmware“. Ein Kaltstart des Razberry (auf Raspi) führt nicht zu einer Lösung, ich muss zwingend auch IPS neu starten … :upside_down_face:

Bei mir läuft der Razberry mit 7.36 jetzt seit ca. einer Woche stabil, ich muss keinen Power-Off oder Symcon-Neustart mehr machen.

Allerdings gibt es ab und zu Phasen, in denen mehrere Minuten kein Z-Wave-Traffic mehr möglich ist, bzw. erst später verarbeitet wird. Z.B. habe ich einen Schalter betätigt, der eine Sene-ID sendet. Die ID wurde aber erst ca. 11 Minuten nachdem ich den Schalter betätigt habe gesetzt. Aufgrund der Timeout-Werte kann das eigentlich nur bedeuten, dass der Controller den Wert empfangen hat, aber IPS das dann nicht abgeholt hat.

Ich habe leider noch keinen Weg gefunden, den Fehler zu reproduzieren, aber sobald ich es schaffe schicke ich Euch das Log.

@Augustinus Ich habe mal zur nächsten Version der 7.0 unsere Bibliothek aktualisiert, die wir im Backend für alle I/O Operationen nutzen. Evtl. hat sich da ein Fehler eingeschlichen (tatsächlich haben wir dort zur 6.4 eine Änderung durchgeführt). Ob dies hilft müssen wir aber sehen. Ich freue mich da auf dein Feedback, ob es besser ist.

paresy