RS Pingdom Analysis: Einbindung Pingdom-Webseiten Monitoring

Da habe ich noch nie was drinstehen gehabt. Habe dein Skript vor 2 Wochen installiert.

Hallo zusammen,
sorry für die letzte Frage. Weiterlesen hilft.
Habs heute installiert und LÄUFT.
Danke dafür.
Mal sehn wie sich das entwickelt.

Hallo zusammen,
hab bisher auch keine Pingdom-Aktivitäten aus Deutschland zu vermerken.
Hab die Leute von Pingdom mal angeschrieben.
Die verweisen zum besseren Verständnis ihres Systems auf folgende Seite:
http://blog.pingdom.com/2011/12/21/new-grouping-of-monitoring-servers/

Kurz zusammengefasst heisst das:
Die haben z.Z. 4 Gruppen von Servern die den Dienst bediehnen. In allen Gruppen sind Server aus NA und EU. Dabei ist aber nicht zwangsläufig einer aus De dabei.
Die User haben primär keinen Einfluss darauf welche Servergruppe ihre „Checks“ bediehnt.
Die bieten aber an, auf Anfrage, Eure Checks in eine Gruppe mit deutschen Servern zu nehmen.

Ich habs bereits beantragt. Mal sehn.

na das ist mal ne coole News, danke dir :wink: .

ich hatte auch schon Support-Kontakt (wegen ner anderen Sache), die Jungs machen einen guten Eindruck

Hallo RS und die anderen 28 die RS-Pingdom schon downgeloadet haben,

hab da verschiedene kleine Probleme:

  1. WF linke Seite: die Higstocks legen sekundenlang (ca 15) den FF lahm. Danach bekomme ich erst die HS links zusammengequetscht bis sie dann nach einem refresh richtig angezeigt werden. Beim zugriff von extern bekomm ich sogar manchmal eine meldung: das script reagiert nicht …
    Welche HS-Version nutzt Du?

  2. WF rechte Seite: die Ereignisse zeigen immer „Keine Meldngen vorhanden“, obwohl IPS zwischen 5:00 und 5:10 definitiv nicht erreichbar ist. Bei PingDom werden diese Downtimes auch geloggt und ich bekomme von Pingdom alert-mails. Nur im WF rechts werden die nicht angezeigt. Im HS Tageswerte wird für heute auch 100% angezeigt.

  3. WF linke Seite Detailinfos 24h Ticker: die werden für heute nur bis 10:58 angezeigt. Auch in meinem Pingdom UptimeReport hörts bei 11:00 auf. In meiner PublicStatusPage steht aber LastChecked 20:24 heute.

Denke 2. u. 3. könnten zusammenhängen. Bin mir aber nicht sicher.

Hat jemand ähnliche Probleme?

Bin für jede Hilfe dankbar.

Hi Wolfgang,

meine Kommentare dazu:

ich nutze HS 1.2.4. Die Probleme habe ich -ebenfalls sporadisch - auch mit dem FF. Das Ding ärgert mich mittlerweile so maßlos, dass ich ihn in kürze aus meiner IT verbannen werde. Mit Chrome und Opera keine Probleme.

bei mir exakt synchrone Meldungen mit Pingdom Online-Portal

auch hier keine Probleme. Noch nie gehabt. Und ich schaue häufig drauf. Hört sich eher nach einem connection-Problem an.
Selbst wenn das Tool mal keine Daten bekommt, holt es sich rückwirkend bis zu 24h rein. Das hab ich mehrfach getestet und funktioniert

Hallo RS,

danke für die schnellen Kommentare.

Hab mittlerweile mein HS von 1.1.6 auf 1.2.4 upgedatet(drüberkopiert, Verzeichnis 1.1.6 umbenennen und neues nur mit 1.2.4 anlegen funktioniert nicht. Kommt im WF Not Found??).
Ist deutlich schneller. Auch nach einem Neustart des Clients.

Die Werte/Zeiten für die letzten Daten haben sich mittlerweile um 6:30h nach vorn (heute 17:30) aktualisiert.
Woran könnte diese Verzögerung liegen?

Update zu den Meldlungen: Keine Meldung vorhanden
beim ausführen des Scripts Meldungen bekomm ich folgende Notice im IPS-Logger:
Undefined Variable: action in Script .\id = Meldungen in Line 82 =

case 'remove':

Undefined Variable: action in Script .\id = Meldungen in Line 89 =

case 'add':

Undefined Variable: action in Script .\id = Meldungen in Line 98 =

case 'removeAll':

Hab ich irgend wo was falsch eingesellt? Hat sonst noch jemand die selben Probleme?

Hallo Wolfgang,

das Meldungs-Script ist nicht zum manuellen Ausführen gedacht (das dient nur zur Einrichtung und ist - da im Pingdom Analysis Projekt eingebettet - nicht notwendig). Es dient dazu, Meldungen aus anderen Scripten aufzunehmen und zu verwalten.

Hallo RS,
zu

                                                                            [IMG]http://www.ip-symcon.de/forum/images/misc/quote_icon.png[/IMG] Zitat von [b]wolfgang[/b]                     [[IMG]http://www.ip-symcon.de/forum/images/buttons/viewpost-right.png[/IMG]](http://www.ip-symcon.de/forum/showthread.php?p=183187#post183187)                 
              2. WF rechte Seite: die Ereignisse zeigen  immer "Keine Meldngen vorhanden", obwohl IPS zwischen 5:00 und 5:10  definitiv nicht erreichbar ist. Bei PingDom werden diese Downtimes auch  geloggt und ich bekomme von Pingdom alert-mails. Nur im WF rechts werden  die nicht angezeigt. Im HS Tageswerte wird für heute auch 100%  angezeigt.

bei mir exakt synchrone Meldungen mit Pingdom Online-Portal
.
.
.
Hört sich eher nach einem connection-Problem an

Ein connection Problem hab ich nicht, da die Detail-Infos im Dashboard einen aktuellen Stand haben.

Hab eben noch mal installiert/upgedatet.
Gewissenhaft die „Kontrolle durch user“ abgearbeitet"

bei Objektinstallation siehts so aus:

    --- Kontrolle durch User erforderlich -----------------------------------------------------
   #3066 Event-Objekt ScriptTimer, neuID #30296 neu konfiguriert, NICHT aktiviert
   #3066 Event-Objekt ScriptTimer, neuID #20535 neu konfiguriert, NICHT aktiviert
   #3066 Event-Objekt ScriptTimer, neuID #45561 neu konfiguriert, NICHT aktiviert
   #3066 Event-Objekt ScriptTimer, neuID #21016 neu konfiguriert, NICHT aktiviert
   #3066 Event-Objekt ScriptTimer, neuID #38943 neu konfiguriert, NICHT aktiviert
   #3066 Event-Objekt ScriptTimer, neuID #30868 neu konfiguriert, NICHT aktiviert
   #3066 Event-Objekt ScriptTimer, neuID #36497 neu konfiguriert, NICHT aktiviert
   #3066 Event-Objekt ScriptTimer, neuID #41271 neu konfiguriert, NICHT aktiviert
    --- Kontrolle durch User erforderlich Ende-------------------------------------------------

Einige Events waren inaktiv. Wenn ich die aktiviere sind sie nach Aktualisierung wieder inaktiv.
Andere waren entgegen des Logs schon aktiv.

bei ID-Austausch siehts so aus:

    --- Kontrolle durch User erforderlich -----------------------------------------------------
   #5010 Script ID#25864.ips.php: Inhalt NICHT verändert: Zeile 88, alte Target-ID #25864 nicht innerhalb des Projektes
   #5010 Script ID#25864.ips.php: Inhalt NICHT verändert: Zeile 90, alte Target-ID #17483 nicht innerhalb des Projektes
   #5010 Script ID#28887.ips.php: Inhalt NICHT verändert: Zeile 620, alte Target-ID #10000 nicht innerhalb des Projektes
    --- Kontrolle durch User erforderlich Ende-------------------------------------------------

ID 25864 nicht innerhalb des Prokekts: ist drin
ID 17483 nicht innerhalb des Prokekts: ist drin
Die ScriptIS 28887 gibts bei mir nicht.

Irgend eine Idee?

ok, das klingt plausibel. Kann man auch überprüfen, in dem man ins „Name_jahr.csv“ schaut: da müssen 1:1 die einträge drin stehen, die auch im Pingdom-Portal zu sehen sind.

klar, das managed das Melde-Script.

Das ist gut möglich, wenn ein Update gemacht wird: die stammen von vorherigen Meldungen

den Rest würde ich erst mal aussen vorlassen.

Das sieht mir so aus, als wäre dein Meldescript durcheinander gekommen.

Lösch mal alle Timer unter dem Meldescript, anschließend die Inhalte der Variablen unter der Instanz Meldungen löschen.
Dann beobachte mal, was bei der nächsten Pingdom-Störung passiert.

Hallo RS,
danke für die Tipps,
hab die alle umgesetzt und eine Störung provoziert.
Leider ohne Ergebnis. Hab ich was übersehen?

Hi Wolfgang,

im HC-Verfügbarkeitsgraphen sehe ich keine Einbrüche, die mit den Pingdom-Ausfallmeldungen korrelieren. Da müssten aber welche sein. Also kommen die Negativ-Meldungen entweder nicht an oder werden nicht richtig weiter verarbeitet.
Was sagt denn das CSV-File? sind da NOK-Meldungen drin?

Hallo RS,
danke für Deine Analysen. In den *.csv gibts nur up + OK, keine NOK. Das heisst die kommen gar nicht rein.
Kann man das irgend wo ausschalten? Evtl hab ich ja versehentlich …
Wenn nicht woran könnts liegen?

Hi Wolfgang,

nee, einstellen kann man da nichts (lieber nicht).

man könnte sich aber ein Stück weiter ranrobben:

im Script „Pingdom WebAPI LoggingData“ kannst du mal ein print_r einbauen:

dann das Script starten. Im Meldungsfenster siehst du alle von der Schnittstelle kommenden Daten im Array. Wenn du jetzt NOK-Events in den verg. 24h hattest, kannst du diese (max!!!) 24h aus dem CSV löschen. Beim Start des Scripts saugt er sich alle fehlenden Daten erneut ein. Da wäre es interessant, ob die NOK’s auch hier fehlen bzw. ankommen. Wenn die da auch nicht drin sind, muss es irgendwo zwischen Deinem WAN-port und dem Pingdom-Server liegen

mein print_r gibt folgendes aus:

Array
(
[results] => Array
(
[0] => Array
(
[probeid] => 69
[time] => 1355343321
[status] => up
[responsetime] => 1953
[statusdesc] => OK
[statusdesclong] => OK
)

        [1] => Array
            (
                [probeid] => 71
                [time] => 1355343261
                [status] => up
                [responsetime] => 480
                [statusdesc] => OK
                [statusdesclong] => OK
            )
        [2] => Array
            (
                [probeid] => 33
                [time] => 1355343201
                [status] => up
                [responsetime] => 437
                [statusdesc] => OK
                [statusdesclong] => OK
            )
    )
[activeprobes] => Array
    (
        [0] => 33
        [1] => 69
        [2] => 71
    )

)

ohne was gelöscht zu haben.

das bringt nichts, weil nur Messages abgeholt werden, die noch nicht im CSV waren. Du musst einen Zeitraum abholen, in dem ein NOK enthalten ist und dessen Daten noch nicht im CSV sind

hab jetzt mal alle Einträge der pingdom_rs.net_2012.csv nach heute früh 4:07 gelöscht und noch mal das Script laufen lassen. Danach noch mal in die csv geschaut. Da sind nur neue Einträge seit heute abend ab ca 18:20. Die auf dies angekommen wär 5:00-5:20 wurden leider nicht mehr geholt.
In der ellenlangen print_r find ich mit der Suche auch kein down.

ich mach für heute feierabend.

ok, ich habs eben mal probehalber gelöscht (alle Daten ab heute 0:00 uhr) und das Script gestartet: exakt alle Datensätze wieder da.

Irgendwas an deiner Konnektivität ist faul.

Magst du morgen mal das CSV einstellen?

Hallo RS,
anbei die csv. Zeile 5049 ist leer. Von da an sind die Daten gestern nach dem löschen reingekommen.
Hatte heute 3 Ausfälle. Einer um 5 bei der Sicherung (ist nicht drin), einer um 13:48 ist drin, und einer um 19:36 (ist nicht drin). Pingdom hat aber alle mitbekommen und mails geschickt. Nur in der csv ist nur einer. Das WF korreliert.
pingdom_rs.net_2012.zip (38.6 KB)