Das Internet geht schon wieder nicht …!

Published by IT-Native on

Wer kennt das nicht auch?
Die Zugriffe auf Webseiten oder Clouddienste sind langsam oder brechen ab. Das ist Ärgerlich! Wie gehen wir dann mit dem Problem am besten um und wie kann IT-Monitoring bei der Analyse unterstützen?

Das Problem

Die Gespräche laufen dann oft wie folgt ab:

Wir rufen beim Internetprovider an:

Callcenter (mit dem ultimativen Tipp): Schalten Sie das Modem aus und wieder ein.
Wir: Es funktioniert noch immer nicht…
Callcenter: Die Verbindung zum Modem passt – von uns aus funktioniert alles…
Wir: 🙁

Analog läufts in größeren Unternehmen so ab:

User: Es geht nichts
Applikation Team: Wir haben ein Netzwerk Problem
Netzwerk Team: Das Netzwerk ist nie die Ursache. Wir haben ein Applikations Problem.

Die Lösung – Monitoring & Analyse mit 3 Pings

Mit geringem Aufwand schaffen wir klare Fakten können Maßnahmen für die Problembehbung ableiten:

Wir überwachen 3 IP-Adressen

  • Die interne Firewall
  • Den Gateway/das Modem des Providers
  • Einen zentralen Router
    Wenn man den nicht kennt, setzt man einfach mehrere „Traceroutes“ auf unterschiedliche Ziele ab und nimmt dann eine IP, die überall aufscheint.
    Sollte es keinen Router geben der pingbar ist, kann man alternativ ein „verlässliches“ Ziel nehmen z.B: DNS Server des Providers oder performante Webseiten (die es zulassen)

So sieht dann das Ergebnis im IT-Monitoring Dashboard aus:

Was erkennen wir hier?

  1. Unsere Firewall antwortet fast mit 0 ms und hat keine Paketverluste – so soll es sein
  2. Der Router/das Modem vom Provider antwortet im Schnitt mit 1 ms ohne Paketverluste – passt auch
  3. Was ist mit dem nächsten Router im Providernetzwerk? Im Schnitt gibt’s eine Antwortzeit von ~17 ms – das ist gerade noch ok
  4. Aber plötzlich gibt es Ausreisser in Richtung 60-70 ms. – hier beginnt das Problem!
    D.h. die Antwortzeiten sind bis um das 3-4 fache langsamer
  5. Was aber noch schlimmer ist, sind die Paketverluste (Packet loss).
    Das bedeutet die Verbindungen werden neu aufgebaut (3-4x langsamer) oder brechen ganz ab.

Fazit

Wir wissen jetzt:

Ja, wir haben ein „Internetproblem“
Nein, es liegt nicht an unserer internen IT
Ja, lieber Provider es liegt bei euch

Und was haben wir davon?

  • Wir können belegen, dass wir Probleme haben und wann sie aufgetreten sind
  • Wir müssen nicht weiter nach internen Problemen suchen
  • Wir müssen nicht bei der Website oder beim Cloudservice nach Problemen suchen (vorerst)
  • Wir sehen wann das Problem behoben wurde oder ob es sich verschlimmert