IPS und Konsole starten nicht mehr... settings.json natürlich

Aloha!

Ich habe ein Problem, das ich offenbar nicht mehr selber gelöst bekomme. In der Vergangenheit habe ich einfach die settings.json durch ein funktionierendes BackUp ersetzt. Das musste ich so alle 5-7 Tage machen, hat aber funktioniert.

Jetzt habe ich die Herausforderung, dass die Konsole auf gar keinen mehr starten will, ums verrecken nicht. Und das ausgerechnet heute, wo wir den Babysitter engagiert haben, die Sonne gleich untergeht und wir eigentlich alles andere vor hatten. Aber zurück zum Thema:


06.05.2015 17:49:48.662 |     0 | MESSAGE | Kernel               | *** IPS STARTET
06.05.2015 17:49:48.662 |     0 | MESSAGE | Kernel               | Erstelle...
06.05.2015 17:49:48.695 |     0 | MESSAGE | Kernel               | Kernel erstellt #Version: 3.40, CRC: F3F6BE78
06.05.2015 17:49:48.696 |     0 | MESSAGE | Kernel               | Initialisiere...
06.05.2015 17:49:48.696 |     0 | MESSAGE | Settings             | Erstelle...
06.05.2015 17:49:49.389 |     0 | MESSAGE | Settings             | Aufräumarbeiten im Settings Ordner...
06.05.2015 17:49:49.391 |     0 | MESSAGE | ScriptEngine         | Erstelle...
06.05.2015 17:49:49.394 |     0 | MESSAGE | ScriptEngine         | Benutze PHP 5.4.24
06.05.2015 17:49:49.435 |     0 | MESSAGE | ScriptEngine         | >OpenSSL #1: 1.0.1
06.05.2015 17:49:49.435 |     0 | MESSAGE | ScriptEngine         | >OpenSSL #1: 1.0.1
06.05.2015 17:49:49.437 |     0 | MESSAGE | ScriptEngine         | >Erweiterung: php_curl.dll
06.05.2015 17:49:49.439 |     0 | MESSAGE | ScriptEngine         | >Erweiterung: php_gd2.dll
06.05.2015 17:49:49.441 |     0 | MESSAGE | ScriptEngine         | >Erweiterung: php_gettext.dll
06.05.2015 17:49:49.443 |     0 | MESSAGE | ScriptEngine         | >Erweiterung: php_mbstring.dll
06.05.2015 17:49:49.444 |     0 | MESSAGE | ScriptEngine         | >Erweiterung php_openssl.dll nicht geladen. Nicht nutzbar in Verbindung mit OpenSSL 1.0.1
06.05.2015 17:49:49.446 |     0 | MESSAGE | ScriptEngine         | >Erweiterung: php_soap.dll
06.05.2015 17:49:49.449 |     0 | MESSAGE | DebugServer          | Erstelle...
06.05.2015 17:49:49.449 |     0 | MESSAGE | TimerPool            | Erstelle...
06.05.2015 17:49:49.451 |     0 | MESSAGE | LicensePool          | Version: 30.04.15, #3705
06.05.2015 17:49:49.451 |     0 | MESSAGE | LicensePool          | Limit WebFront: 0
06.05.2015 17:49:49.451 |     0 | MESSAGE | LicensePool          | Limit Variable: 0
06.05.2015 17:49:49.451 |     0 | MESSAGE | DiscoveryServer      | Erstelle...
06.05.2015 17:49:49.469 |     0 | MESSAGE | ProfilePool          | Erstelle...
06.05.2015 17:49:49.471 |     0 | MESSAGE | ObjectManager        | Erstelle...
06.05.2015 17:49:49.476 |     0 | MESSAGE | CategoryManager      | Erstelle...
06.05.2015 17:49:49.477 |     0 | MESSAGE | InstanceManager      | Erstelle...
06.05.2015 17:49:49.480 |     0 | MESSAGE | EventManager         | Erstelle...
06.05.2015 17:49:49.487 |     0 | MESSAGE | ScriptManager        | Erstelle...
06.05.2015 17:49:49.493 |     0 | MESSAGE | VariableManager      | Erstelle...
06.05.2015 17:49:49.497 |     0 | MESSAGE | MediaManager         | Erstelle...
06.05.2015 17:49:49.504 |     0 | MESSAGE | LinkManager          | Erstelle...
06.05.2015 17:49:49.508 |     0 | MESSAGE | DataHandler          | Erstelle...
06.05.2015 17:49:49.508 |     0 | MESSAGE | ModuleLoader         | Erstelle...
06.05.2015 17:49:49.514 |     0 | MESSAGE | SOAPServer           | Erstelle...
06.05.2015 17:49:49.516 |     0 | MESSAGE | Settings             | 14 Profile innerhalb von 15 Milliseconds geladen
06.05.2015 17:49:50.534 |     0 | ERROR   | Kernel               | Untermodul konnten nicht geladen werden: Loop detected on node 23780. Starting halted.
06.05.2015 17:49:50.534 |     0 | ERROR   | Kernel               | Error on Init. Aborting. Message: Untermodul konnten nicht geladen werden: Loop detected on node 23780. Starting halted.

In der settings.json und den settings.xml finde ich keine ID/Instanz 23780, die ich aus den Files nehmen könnte. Damit kann ich das Problem leider nicht selber beheben. Ein BackUp vom April letzten Jahres habe ich noch, das ist das einzig funktionierende - aber völlig veraltet, damit kann ich nichts mehr anfangen.

Von Problemen mit der settings.json haben hier ja schon so einige Forumsmitglieder berichtet, ohne dass sich nach der Behebung irgendwo ein Hinweis darauf finden würde, was nun letztlich zu diesem Problem geführt hat und wie sich dieses vermeiden lässt. Bis auf den Hinweis mit den Windows Updates, der für uns nicht zutreffen kann, weil das Problem bereit wesentlich länger besteht, kann ich dem Forum bisher keine ernsthafte Hilfestellung entnehmen. Ich gehe hier wirklich von einem Problem mit IP-Symcon aus, welches mich stark dazu tendieren lässt, die ganze Sch**** hier aus dem Haus harauszuwerfen.

Für weiterführende Hilfe, auch genereller Natur, die das Problem einmal an der Wurzel packt, wäre ich äußerst dankbar.

Viele Grüße
Björn

Solche Probleme kannte ich nur bei Windowsabsturz oder Neustart ohne den IPS-Dienst vorher zu beenden und hab daher das Phänomen schon Jahre nicht mehr gesehen.

Alle im Ordner ‚\backup‘ jetzt auch schon durchprobiert?

Das musste ich so alle 5-7 Tage machen, hat aber funktioniert.

Fragwürdige Vorgehensweise… :eek:

Ein BackUp vom April letzten Jahres habe ich noch

Sehr konsequent! :rolleyes:
Zumindest konntest du auf die aktuelle Stable 3. -> 3.4 (#3705) updaten.
Vor einem Versionswechsel wäre ein Komplett-Backup auf alle Fälle Pflicht gewesen.
Nützt dir jetzt auch nichts… die Floskeln… du bist gerade gefrustet… verstehe ich, aber IPS läuft bei anderen auch, deshalb denke ich eher nicht direkt an "wirklich von einem Problem mit IP-Symcon ".

Mit welchem Editor hast du settings.json untersucht?
Zuerst mal Ruhe bewahren nichts in Eile oder Hektik in die man bei solchen Situationen schnell verfällt…

  • Sichere erstmal den backup-Ordner mit den *.json weg und die settings.json, bevor du weiter vorgehst!
    Zuguterletzt …wenn garnichts mehr geht, ist paresy sicher auch bereit, deine settings mal anzusehen.
    Vorher solltest du jedoch nichts unversucht lassen, aber beachte… *

In aller Regel lässt sich IPS nicht mehr starten da ein externes Modul hängt. Bei mir wars nach nem update glaub ein cul EM 1010 Modul… Also testweise einfach mal alle externen Zusatzmodule mit DLL verschieben und IPS nochmals starten

Gerne auch die Settings an office@ip-symcon.de schicken und wir schauen schnellstmöglich rauf, wo es klemmt.
Wenn du sagst, dass der Fehler öfters passiert, wäre es cool wenn wir die Ursache finden und beheben können. Ist definitiv nicht Normal, dass die Settings an der Stelle ein Problem aufweist.

paresy

Guten Morgen!

Ich habe gestern eine Datei aus Dezember zurückgespielt, mit der es dann auch funktionierte. Anschliessend habe ich einen ganzen Satz der Media-Files gelöscht und damit die Größe der settings.json verringert, bzw. ein Neuschreiben dieser erzwungen. Meine letzten Änderungen sind zwar futsch, da sich mein Innovationsbedürfnis bei IPS familienbedingt in Grenzen hält, ist das ein vergleichsweise geringer Verlust. :wink:

Noch mal für mich zum Verständnis: In der settings.json befindet sich sozusagen die komplette Liste aller Objekte. Wann genau wird die gespeichert? Kann ich davon ausgehen, dass die settings.json auch noch einmal zurückgeschrieben wird, wenn der Dienst beendet wird und bei einem u. U. erzwungenen Neustart nicht mehr vollständig ist? Dateigröße ist jedoch immer gleich. Und warum lese ich von Problemen, wenn das Webfrontend bei der Shutdown-Sequenz noch geöffnet ist? Zu dem Zeitpunkt ist der Browser doch nur ein lesendes Element? Müssen auch andere Clients (Android-Tablets & Phones, WIndows Clients) das Webfrontend schliessen? Gibt es eine Größenbeschränkung der settings.json oder einen Wert, bei dem das Processing leiden kann?

Das ist noch mal ein Ansatz - ich kann in die Batch-Datei für den Shutdown der VM mal ein ‚net stop IPSServer‘ aufnehmen. Im Zweifel werden die Prozesse nämlich einfach gekillt, wenn der Server ein erzwungenen Shutdown durchzieht.

Mir fehlt ein funktionsfähiges BackUp-Szenario, ja. Ich mache alle paar (kleingeschrieben) Monate ein Vollbackup der kompletten VM - jedoch sind die settingsxxxxxxxxxx.json immer 472 kB groß und deshalb ging ich davon aus, dass deren Inhalt auch identisch ist. Davor waren die 448 kB groß, funktionieren aber auch nicht. Wenn die Größe identisch war, habe ich die jetzt nicht wirklich alle einzeln durchprobiert, aber bestimmt 10-15 davon.

Das Update auf die 3705 habe ich gestern Abend mit der funktionsfähigen Version aus April 2014 machen können. Hat dann aber nicht viel geholfen.

Früher dachte ich immer, Homematic wäre die Schwachstelle. Wenn ich allerdings mal Probleme mit den Diensten oder alle 2 Jahre mal einen hängenden Homematic LAN-Konfigurationsadapter habe, sind die Ursachen schnell behoben. Bei IP-Symcon dauert das debuggen schon länger. Sucht man im Forum nach 10061 oder speziell nach der settings.json, findet man viele Beiträge, in denen ein Backup der Settings uzrückgespielt wurde, um das Problem zu beheben.

Leider nur Notepad, habe ich mit Notepad++ noch nicht versucht, werde ich aber heute Abend nachholen. Danke für den Hinweis!

Da habe ich ein Wissensdefizit. Sind das die .DLLs, die im IPS-Ordner liegen? Aktuell wären das:

04.05.2014 14:47 107.584 bass.dll
04.05.2014 14:47 17.472 basswma.dll
12.02.2015 23:19 719.360 git2.dll
04.05.2014 14:47 1.277.440 libeay32.dll
28.09.2012 03:50 126.976 libnodave.dll
06.04.2012 10:09 97.792 libpq.dll
12.02.2014 06:20 6.128.128 php5ts.dll
08.12.2011 21:16 950.272 rrdtools.dll
12.02.2015 23:19 183.808 schedule.dll
08.12.2011 21:16 90.112 SiUSBXp.dll
08.12.2011 21:16 499.246 sqlite3.dll
04.05.2014 14:47 336.384 ssleay32.dll
08.12.2011 21:15 15.280 tags.dll
In den Logfiles ist nur der Vermerk vorhanden, dass die „Erweiterung: php_opnssl.dll nicht geladen“ werden konnte. Ich lese mich mal schlau, wie ich die .DLLs exkludieren kann.

Danke für das Angebot! Die Settings von gestern kann ich Euch gerne zukommen lassen oder Ihr guckt einfach mal direkt auf die Kiste im Rahmen des Supports - wenn ich mich wieder auf die Kiste verlassen kann, wäre mir das auch Euer kostenpflichtiges Support-Angebot wert. :slight_smile: Die Logfiles sind jedoch schon etwas größer, insges. 40 MB mit max. Kompression, .ZIP und .RAR geben sich da nicht viel. Wäre die für Euch auch hilfreich? Dann würde ich die Logfiles eher über den FTP zur Verfügung stellen.

Also nach meiner Erfahrung führt das Vorgehen zum gesicherten Tod der Settings.
Und ich hatte das Phänomen auch bevor ich lernte, dass IPS immer schön sauber beendet sein möchte.

Update: In der Darstellung der settings.json unterscheidet sich der Windows Editor von Notepad++ nicht. Auch wird der Syntax von Notepad++ nicht erkannt, da dies kein PHP ist. Um xdebug dafür zu installieren oder ein parsing zu basteln fehlt mir gerade die Lust. :wink:

Module wären wohl im IPS-Verzeichnis unter \modules zu finden - das Verzeichnis gibt es bei mir nicht. Kann ich sonst noch geladene Module checken? Ich habe an Basiskomponenten nur ProJet/IPS 868, LAN-CFGs und Pokeys im Einsatz - würde mich wundern.

Viele Grüße
Björn

Ändert sich die ID, oder zeigt es immer 23780 an dieser Stelle des Logs an?
Wenn sie sich ändern sollte, dann wird vermutlich beim Start versucht irgendetwas zu erstellen. Wäre es immer 23780, dann müsste sie eigentlich auch in den Settings zu finden sein … :confused:

Sehr guter Hinweis. Aktuell läuft es wieder. Aber anhand der Logfiles von gestern lässt sich nachvollziehen, dass sich die ID bei jedem Versuch, den IPSService zu starten, verändert:
06.05.2015 17:15:19.094 | 0 | ERROR | Kernel | Untermodul konnten nicht geladen werden: Loop detected on node 21079. Starting halted.
06.05.2015 17:15:19.094 | 0 | ERROR | Kernel | Error on Init. Aborting. Message: Untermodul konnten nicht geladen werden: Loop detected on node 21079. Starting halted.
06.05.2015 17:16:18.620 | 0 | ERROR | Kernel | Untermodul konnten nicht geladen werden: Loop detected on node 29344. Starting halted.
06.05.2015 17:16:18.620 | 0 | ERROR | Kernel | Error on Init. Aborting. Message: Untermodul konnten nicht geladen werden: Loop detected on node 29344. Starting halted.
06.05.2015 17:29:29.791 | 0 | ERROR | Kernel | Untermodul konnten nicht geladen werden: Loop detected on node 35842. Starting halted.
06.05.2015 17:29:29.791 | 0 | ERROR | Kernel | Error on Init. Aborting. Message: Untermodul konnten nicht geladen werden: Loop detected on node 35842. Starting halted.
06.05.2015 17:31:47.561 | 0 | ERROR | Kernel | Untermodul konnten nicht geladen werden: Loop detected on node 21557. Starting halted.
06.05.2015 17:31:47.561 | 0 | ERROR | Kernel | Error on Init. Aborting. Message: Untermodul konnten nicht geladen werden: Loop detected on node 21557. Starting halted.
06.05.2015 17:47:21.298 | 0 | ERROR | Kernel | Untermodul konnten nicht geladen werden: Loop detected on node 56370. Starting halted.
06.05.2015 17:47:21.298 | 0 | ERROR | Kernel | Error on Init. Aborting. Message: Untermodul konnten nicht geladen werden: Loop detected on node 56370. Starting halted.
Was da erstellt werden soll, kann ich mir nicht vorstellen. Ich habe u. a. eine Software, welche Bilder der Cams im Medienverzeichnis aktualisiert und diese dann im WebFront darstellt. Dies geschieht mit unter bis zu 1 FPS. Gelegentlich bekomme ich deshalb eine Meldung, dass auf ein .JPG-File nicht zugegriffen werden kann. Mehr Baustellen habe ich nicht, denke ich. Oder könnte es damit zusammenhängen, dass Bilder im Webfrontend dargestellt werden sollen, welche sich im Zugriff von anderen Programmen befinden. Benutzt habe ich dafür den „Inhalt-Wechsler“.

Könnte bisschen zuviel sein bei der Initalisierung bzw. Startzyklus vom IPS-Dienst.
Evtl. ist der Rechner dafür auch zu lahm oder es läuft zuviel im Hintergrund um die Verarbeitung abzuschließen.

Da haben wir doch einen heißen Ansatz?!

Ich würde eine gezippte settings.json nehmen. Auf die Logfiles komme ich zurück, falls ich die benötige. Erstmal wäre es schön, wenn ich hier das Loop-Problem nachstellen könnte.

paresy