Archivumbau zur 5.5

Stimmt Datum und Uhrzeit in deinem Ubuntu System?

paresy

Hallo paresy,

das wars. Zeitzone stimmte nicht. Vielen Dank für die schnelle Hilfe.

Moin,

und bei mir seit 2 Tagen ruhe und keine Auffälligkeiten.

Gruß

Erst einmal herzlichen Dank für eure ganzen Beobachtungen! Leider habe ich bisher noch nichts gefunden, ich bin aber weiterhin am Ball. Daher habe ich auch mal eine neue Debug-Version gebaut. Diese schreibt für jede Variable alle Dateien der letzten Stunde ins Log mit welchen die neue Stundenaggregation bei einem Neustart geschrieben wird und auch das Ergebnis. Wenn man dann wieder einen Ausreißer sieht, dann kann man schauen, wo hier die Differenzen stecken. Je nach Systemgröße könnte das beim Start einiges an Text sein. Die entstehenden Daten würden mir allerdings ungemein helfen.

Die Downloads findet ihr hier:

Wenn ihr dann nach einem Neustart einen Ausreißer bei einer Variablen entdeckt, dann wäre der Abschnitt im Log nach „Aktualisiere Aggregationsdaten für Variable… #12345“ von der entsprechenden ID spannend. Am einfachsten macht ihr das auf altbewährtem Weg:

  • Vor dem Neustart ein Backup machen
  • Neustarten
  • Fehlerhafte Variable finden
  • Auf Abschluss der laufenden Stunde warten, damit der Ausreißer auch in den Dateien landet
  • Ein Dateipaket zusammensammeln mit:
    • Rohdaten des aktuellen Monats von der fehlerhaften Variable aus dem Backup
    • Aggregationsdateien der Variable, sowohl aus dem Backup als auch die aktuellen
    • Eure Logdatei

Ich freue mich auf eure Rückmeldungen und besten Dank für eure Unterstützung! Dann können wir den Fehler hoffentlich langsam mal finden und beheben

@PC Oldie: Ich bin heute nicht dazu gekommen, ich schaue mir den Fehler aber definitiv noch einmal an. Aktuell liegt mein Fokus auf den Ausreißern zur Null.

Moin,

kurze Frage dazu. Kriege ich einer der Versionen auch in einem Docker installiert? Qnap bei mir.

Gruß

So, ich habe mal die Testversion installiert.
Bei mir ist jetzt der 16 und 20.10. betroffen, siehe Grafik. Ich habe nur ein Backup von gestern. Variablen ID 47153.
Sicherung von heute Nacht 04:00 Ich hatte mal wieder nicht dran gedacht, dass beim Installieren des deb Paketes Symcon automatisch gestartet wird. Die Variable ist Float. Es handelt sich um einen PV Ertragszähler, der nur ganze kWh zählt. Erfassung über Homematic, falls es irgendwie eine Rolle spielen sollte.
Diesen Fehler habe ich so in der Vergangenheit nicht gehabt. Der Zähler wird seit ca. einem Jahr erfasst. Die Option Ignoriere geloggte Nullen habe ich noch nicht gesetzt. Vielleicht hilft es ja.

Der Fehler verschwindet, sobald ich die Variable von Hand im Archivhandler reaggregiere. Ich habe auch diese Daten mal angehängt.



logs.zip (110 KB)

data_2020-10-21_Aktuell.zip (54.4 KB)

data_2020-10-21_Backup_04_00.zip (54.3 KB)

data_2020-10-21_NachEinzelReaggregation.zip (50.4 KB)

PS:
so sieht der Graph korrekt aus.

Danke für die Daten! So wie es aussieht, kommt der Fehler nicht direkt beim Neustart, denn laut den geloggten Daten sieht das alles richtig aus. Möglicherweise merkt sich die Variable aber nach dem Neustart einen falschen Referenzwert für die nächsten Zählerwerte. Daher habe ich das Debug noch einmal erweitert. Jetzt wird am Ende der initialen Vorbereitungen noch einmal der aktuelle Stand für jede Variable ausgegeben. Dann können wir mal schauen, ob es dort irgendwo einen Fehler gibt. Das hilft mir dann wieder weiter, wo ich als nächstes schauen muss…

Die neuen Versionen findet ihr hier:

@power dodge: Docker ist leider ein bisschen umständlicher, da ich die Versionen eigentlich nicht als „reguläre“ IP-Symcon-Versionen rausbringen möchte… Da wir momentan ja trotzdem vorankommen, würde ich erst einmal nicht die Energie in eine Debug-Docker-Version investieren. Besten Dank aber für das Angebot!

So, hab mit der neuen Debug Version getestet. Ich habe mal die Variable ID 31798 genommen. Diese weist den Fehler weiterhin auf.


Im Anhang mal die Daten von vor dem Update (v5.5-83), nach dem Update (v5.5-84) und aktuelle vom Neustart Logfiles. Die 31798 werde ich jetzt mal nicht reaggregieren.
Diesmal habe ich die Daten direkt vor dem Update gesichert.

Ich hab zwei Logs angehängt, damit alles vollständig ist.

VorNeustart_5.5-83.zip (51 KB)

NachNeustart_5…5-84.zip (50.9 KB)

logs.zip (114 KB)

log2.zip (571 KB)

Danke für das Feedback! „Leider“ sieht weiterhin alles korrekt aus… Kannst du mir vielleicht mal ein vollständiges Backup von dir irgendwo hochladen? Dann könnte ich mal ausprobieren, ob der Fehler dann auch bei mir auftritt… Das würde den Suchvorgang deutlich beschleunigen. Ansonsten befürchte ich, das könnte mit den Debug-Versionen noch ein bisschen hin und her gehen…

Hallo,

ich finde es auch irgendwie crazy. Ich schicke dir mal einen Link mit dem Gesamtprojekt per PN. Kann etwas dauern.
Ich meine mich mal entsinnen zu können, dass ich mal ein Problem mit einer Zählervariablen hatte, wo quasi der gleiche Wert gespeichert wurde. Da hatte sich durch Berechnungen in der Nachkommastelle eine minimale Abweichung ergeben, so dass der neue Wert oft minimal kleiner als der alte Wert war. Habe ich später programmtechnisch abgefangen. Da kam es dann auch zu solchen Effekten.

Vielleicht hat es sich erledigt. Ich hatte noch eine Rückmeldung per Mail bekommen und der hat das Problem möglicherweise gefunden. Ich habe den Fix mal schnell gebaut: Bitte testet das gerne, damit wir mit dem Fehler dann auch hoffentlich abschließen können:

Reaggregiert am besten vor der Installation noch einmal alle Variablen, damit sich hier keine vorherigen Fehler mit einschleichen. Und dann meldet euch nach mal nach der Installation, ob der Fehler weiterhin auftritt oder nicht.

Hallo,

ich habe die neue Version eingespielt. Davor habe ich alle Variablen reaggregiert. Der Fehler verschwindet bei Gesamtaggregation nicht. Ich habe jetzt die Variable einzeln reaggregiert. Das korrigiert den Fehler. System werde ich jetzt nochmal komplettneu starten und weiter beobachten. Ich werde berichten.
Falls notwendig, kann ich dir dann nochmal komplette Backups zur Verfügung stellen (dann per PN).

Hallo Martin,

das kann eigentlich nicht sein. Die Gesamtaggregation reaggregiert jede Variable einzeln. Man kann es auch am Datum der csv-Dateien im db Verzeichnis sehen.

Burkhard

Hallo Burkhard,

schön von dir zu hören. Ich geb dir da absolut Recht. Das komische ist, dass der Fehler erst seit der 5.5 auftritt. Ich verstehe das auch nicht wirklich. Offensichtliche Fehler in den Dateien habe ich auch nicht finden können. Ich sehe nur das graphische Ergebnis.
Ich habe jetzt alles rebootet und nochmal Gesamtaggregiert. Jetzt scheint es erstmal ok zu sein. Soweit ich das beim „durchzappen“ der Variablen feststellen konnte, hat es auch nur die PV Zählervariablen betroffen. Ich halte das mal im Auge. Nicht das es durch Zufall ein Fehler in meinem System ist, der genau zum Zeitpunkt der 5.5er Umstellung aufgetreten ist.

PS: Ich habe demnächst mal wieder etwas Zeit für SMA :slight_smile: Sorry, dass ich mich solange nicht gemeldet habe. Bei mir war sowas von Land unter…

Hallo Martin,

kein Problem, SMA kann warten [emoji1]

Bei meinen Zählervariablen ist nun mit dem letzten Teststand alles wieder in Ordnung - auch nach mehreren Neustarts und mehreren Stunden.

Betroffen war wohl nur die Stundenaggregation bei Zählern. Meinem Eindruck nach waren vor allem Zähler betroffen, die sich über eine Stunde hinweg mal nicht geändert haben

Aber da klärt uns Niels vielleicht noch auf [emoji1]

Burkhard

Hallo Burkhard,

genau das war das Problem. Wenn beim Start noch keine Rohwerte für die laufende Stunde existierten, dann wurde der Referenzwert für das nächste Schreiben der Aggregationswerte nach der initialen Vorbereitung falsch gesetzt und halt wohl den Sprung verursacht. Es freut mich, dass es scheinbar wieder korrekt läuft! Dann bringen wir heute damit auch den RC2 raus.

Hi Niels,

das klingt sehr plausibel. Wenn ich mir jetzt meine Variablen anschaue die betroffen waren, dann sind das Werte die täglich, max. stündlich geschrieben wurden. Erläuterungen passt jedenfalls zu meinen Variablen!

Danke
Heiko

Gesendet von iPhone mit Tapatalk

Hallo Niels,

bei mir sieht es jetzt auch gut aus. Bei mir waren auch Werte wie bei pitti betroffen. Z. B. PV Zählervariablen, die sich nur tagsüber ändern. Und seit Beginn der wetterbedingten grauen Zeiten - bei uns jedenfalls - nur wenig ändern.

Ich hatte gestern auch einige Symcon Restarts gemacht. Ebenso heute morgen. Alle Werte sind nach wie vor ok.

Ich habe auch noch Probleme mit Zählern, meist wird der Gesamtwert an einem Tag angezeigt, obwohl die Varaiable auf Zähler steht.

Meinen Versuch zu Aggregieren habe ich gerade abbrechen wollen, da der PI3B+ extrem zäh wurde.

Das Ergebnis ist ein Absturz von symcon und ein crashdump


Stack trace (most recent call last) in thread 24348:
#2    Object "/lib/arm-linux-gnueabihf/libc.so.6", at 0x76cca12f, in
#1    Object "/usr/bin/symcon", at 0xf7419f, in backward::SignalHandling::sig_handler(int, siginfo_t*, void*)
#0    Object "/usr/bin/symcon", at 0xf735ab, in backward::SignalHandling::handleSignal(int, siginfo_t*, void*)