IPS hängt beim schreiben auf KNX

Hallo zusammen,

ich habe jetzt schön öfter seit der Installation der 6.0 die Situation gehabt, das IPS komplett hängt und hunderte Meldungen mit „max. Anzahl der Threads überschritten“ ausgibt.
Max. Threads habe ich auf 50 stehen und die sind dann auch alle am Anschlag.

Hierbei kann ich sehen, das alle Scripte, die auf den KNX Bus schreiben hängen und die Queue zulaufen lassen.

Ein Neustart des KNX Routers bringt keine Besserung, meist muss ich den Raspi komplett abschiessen.
Teilweise geht der Threadzähler dann nach kurzer Zeit auch wieder hoch mit hängenden KNX Scripten, sodass ich nochmals neustarten muss.

Wie gesagt sehe ich dieses Verhalten erst nach dem Update auf die 6.0 (von der 5.4 kommend).

Kennt jemand dieses Verhalten?
Oder was passiert eigentlich, wenn der KNX Bus mal nicht erreichbar ist oder wie kann ich das absichern, das IPS hier komplett blockiert?

Danke u. viele Grüße,
Doc

Könntest du mal versuchen das Limit auf 100 anzugehen, ob dies das Problem löst?

paresy

Meintest du „ThreadCount“ oder „ThreadQueueLimit“?

Limit stand schon auf 100, ThreadCount habe ich jetzt mal hoch gesetzt.

Kann jetzt aber etwas dauern, das Problem ist nicht reproduzierbar und trat so alle 1-2 Wochen auf.

Danke u. viele Grüße,
Doc

1 „Gefällt mir“

Hat leider nicht lange auf sich warten lassen.
Threads wurden jetz anscheinend gar nicht mehr ausgeführt …

Kannst du mal die PHP Threads zeigen? Sind wirklich alle mit KNX Befehlen belegt?

paresy

Ja werde ich machen, wenn es wieder auftritt.
Habe neu gestartet und jetzt läuft es wieder 1-15 Tage …
Komischerweise wurde bei dem letzten Screenshoot gar nichts mehr ausgeführt.
Das muss ich mal beobachten, ob das erst seit dem hochsetzen auf 100 ist.

Ging jetzt wieder schneller als erwartet:

… allerdings sah es nach einem Neustart dann strotzdem so aus und die Queue füllte sich langsam wieder …

… erst jetzt nach dem 2. Neustart läuft es wieder mit Threads < 10.
Kannst du dir darauf einen Reim machen?

Kann das ggf. ein HW Fehler der Speicherkarte sein?

VG,
Doc

Leider noch nicht wirklich. Da du auf dem Pi aktiv bist: Kannst du, sobald die Queue wieder voll ist, mal den Debugger mit Option B starten und mir die gdb.txt zusenden? (https://community.symcon.de/t/debugging-fuer-experten-raspberry-pi-linux-symbox/36530=

paresy

Ja werde ich so dann machen, danke dir.
Ich bin zur Sicherheit mal auf einen ander RPi4 mit eMMC umgezogen, um ein HW Problem auszuschließen.
Kann ich die aktive Anzahl an Threads irgendwie abfragen um ggf. noch vor erreichen der 100 eine Nachricht abzusetzen?

VG,
Doc

Hallo Paresy
Habe ich das gleiche Problem?
Nach einigen Tagen kommt diese Fehlermeldung:
Server is shutting down
Dann geht nichts mehr
Reboot nutzt da auch nichts.
Erst nach Stromstecker ziehen läufts einige Tage wieder.
Ab einem Zeitpunkt wird die Log Datei plötzlich 77 MB gross vorher ca. 45 Kb.

Schönen Gruß
Egon

Heute morgen ist IPS trotz anderer HW und neuer Installation wieder abgestürtzt und konnte nur durch den Neustart des RPi wieder gestartet werden. Lief jetzt wieder ca. 7 Tage durch.
Leider konnte ich den Debugger noch nicht starten, weil ich denn noch nicht auf dem System installiert hatte.
Muss ich dann wohl beim nächsten Absturz machen.

VG,
Doc

… und schon wieder ist die Queue mit 100 Threads zugelaufen.

Ich habe dir jetzt mal die gdb.txt zugesendet.

Danke u. viele Grüße,
Doc

Ich bin jetzt mal mit der IPS Installation auf einen Win10 Rechner umgezogen.
Bei den PHP Informationen tauchen alle Threads jetzt immer mit rotem Hintergrund auf.
Welche Bedeutung hat dies?

Ich hatte bis jetzt immer gedacht, das wäre bei Threads mit langer Laufzeit der Fall.
Auf dem Raspi waren die ausgeführten immer grau hinterlegt?

VG,
Doc

Kann es sein, dass du eine Zeitdifferenz zwischen den Systemen hast? Das könnte dies auch erklären.

Die gdb.txt ist angekommen und werde ich zeitnah prüfen.

paresy

Worauf bezieht sich deine Anfrage mit der Zeitdifferenz, wegen den roten Hintergründen bei den Threads?
Wenn das deine Frage sein sollte kann dies in diesem Fall sein, weil ich einen neuen Win10 Rechner aufgesetzt habe und sich die Uhrzeit noch nicht richtig synchronisiert haben könnte.
Jetzt ist der Hintergrund auch wieder hell.
Bei der Installation auf dem Raspi waren die Zeiten identisch, die Threads hingen da auch fest.

Wofür steht denn der rote Hintergrund genau, was kann ich im Fehlerfall daraus ableiten?

VG,
Doc

Im Prinzip bedeutet „rot“, dass der Thread > 30 Sekunden läuft. Das kann ok sein, muss aber nicht. Und wenn die Uhrzeiten nicht stimmen hast du „false positives“ in der Liste.

Bei den Hängen Threads bin ich noch dran. Passiert es auf deinem Win10 Rechner auch?

paresy

Bis jetzt noch nicht, aber auf dem Raspi hat das aber auch schon mal 5-10 Tage gedauert.
Ich hatte noch einen zweiten Raspi4 8GB aufgesetzt mit einer frischen IPS Installation, dort ist das Problem auch aufgetreten, deshalb jetzt noch mal der Versuch mit dem PC.

1 „Gefällt mir“