Socketerror 10054 IPS<->HM - aber erst seit kurzem

Hallo zusammen,

ich habe seit einem Stromausfall vor 2 Wochen das Problem dass sich der IPS-Server (fast) nicht mehr mit der HM-Zentrale verbindet.

Eingegrenzt passiert folgendes:
(im Netz befinden sich diverse PCs und 3 Homematic-Zentralen)
Gegeben für das Beispiel: PC1, PC2, HM1, HM2 und HM3

Es soll ein Homematic Socket verbunden werden mit einer Zentrale

  • PC1 --> HM1 Fehlermeldung „Socket Error # 10054“ „Connection reset by peer“
  • PC1 --> HM2 und HM3 alles ok
  • PC2 --> HM1 und HM2 und HM3 alles ok

Der Fehler liegt also zwischen PC1 und HM1.

  • bis vor 2 Wochen war das problemlos
  • Fehler reproduzierbar mit 1 Ausnahme: sofort nach dem Booten PC1 scheint es EINMAL zu funktionieren
  • Reboot HM1 bringt keine Besserung

Folgende Maßnahmen habe ich probiert und alle waren erfolglos:

  • Werksreset HM1
  • HM1 nochmals aktuelle Firmware drauf
  • IPS auf PC1 mehrfach neu installiert in frisches Verzeichnis
  • IPS frisch beginnen lassen nur mit HM-Konfigurator und HM-Socket.
  • IPS-Dienst mit anderen Berechtigungen als „Lokales Systemkonto“
  • Datei Settings überprüft auf XML-Fehler („ist wohlgeformt“)

Weitere Effekt: sollte es wirklich nach einem Bootvorgang mal klappen dann werden andere Netzwerkanfragen des IPS-Dienstes von der HM1 mit Fehler quittiert.
(Beispiel: Das Script zum Auslesen der Variablen unterbricht mit "… errno 10054 Eine vorhandene Verbindung wurde vom Remotehost geschlossen). Weiteres Beispiel: Ein Script das einer Cam den Befeht gibt ein Bild zu speichern bricht ebenfalls ab.

Besonderheiten:

  • PC1 und HM1 stehen ca. 5 m auseinander, die anderen PCs und HM2 und HM3 sind per VPN eingebunden aus
    mehreren 100 km Entfernung
  • PC1 und HM1 hängen am gleichen 1GBit-switch
  • PC1 zeigt mit anderen Programmen die gleichzeitig laufen (Faxserver, Anrufbeantworter) keine Probleme

Wer könnte hier noch Ideen beitragen?
(danke fürs Mitdenken)

Alexander

Irgendwelche „Sicherheitsfeatures - z.B. Flood Protection“ am Switch neu konfiguriert? Autosensing neu angeschaltet? Schon mal Kabel getauscht?

der Switch ist nicht „manageble“ - Typ TL-SG1024
in der Zwischenzeit wurde auch er diverse Male stromlos gemacht.

Der Router (Lancom 1721VPN) hat keine Firewallregel bezüglich der beiden PC1 und HM1, Syslog von ihm zeigt keine Einträge bezüglich Flooding.
Außerdem läuft der Transfer PC1-HM1 „am Router vorbei“.

btw: Firewall der Homematik steht jeweils für RPC und Script auf „Vollzugriff“

Lösung scheinbar gefunden - und ich kann jeden verstehen der sich jetzt „an’s Hirn langt“:

Im VPN-Verbund hängen ca. 17 Router - und irgendeiner hat wohl was falsch verstanden und propagiert per RIP Informationen die zu diesem Verhalten führen.

Im Augenblick hat es geholfen das VPN zu deaktivieren. Nach Reset aller Router heute abend wird sich weiteres zeigen.

Nö, wieso? Ist halt irgendwo ein Fehler im Netz und ist doch gut, dass Du diesem auf die Spur kommst.

Neue Erkenntnisse und eventuell abschließende Lösung:

Analyse mit Wireshark hat gezeigt, dass der Lancom-Router die Überwachung des lokalen Traffics übernimmt, obwohl man annehmen könnte dass IPS-Server (192.168.0.2) und HM (192.168.0.61) im gleichen Subnetz direkt miteinander kommunizieren.

Dieser Router meinte wohl dass ihm am Traffic zwischen den beiden etwas nicht gefällt und die Firewall hat mitgemischt.
Abhilfe derzeit: Neue Firewallregel im Router, dass der Verkehr zwischen IPS und HM direkt ohne „weitere Würdigung“ durchgereicht wird.

Ergebnis: Es funktioniert jetzt problemlos

Ob es an irgendwelchen Timeouts oder halboffenen Verbindungen liegt - keine Ahnung.