… erlebt(e) gerade ein Geschäftskunde von uns. Seit 5:00 Uhr heute früh bricht an einem Standort in Frankfurt am Main das VDSL des öfteren weg. Zwischenzeitlich ging es dann kurzzeitig wieder, ein Arbeiten mit einer Standortvernetzung über die ein Zugriff auf Terminalserver als auch die Telefone laufen ist nicht wirklich möglich.

Spannend gestalteten sich (mal wieder) die Telefonate mit der Hotline der Telekom. Aussagen wie z.B. “Da gibt’s keine Störung, es muss am Router liegen.” helfen da nicht wirklich weiter.

Die Krönung war dann gegen 18:00 Uhr die Aussage, das seit ca. 17:00 Uhr eine Großraumstörung vorliege, die 5532 Teilnehmer betrifft und die Entstörung bis zum Nachmittag des darauffolgenden Tages dauern wird.

Auf unseren Hinweis, das der Kunde laut Vertrag eine “garantierte Entstörung innerhalb von acht Stunden” (siehe Quellen) hat folgte die Aussage “Was soll man machen, is’ so.”.

Überschlägt man das nun kommt man, nach aktuellem Kenntnisstand, auf zwei (Werk-)Tage Ausfallzeit, an dem an diesem Standort mehrere Mitarbeiter nicht effektiv arbeiten können und schlimmer noch dort niemand telefonisch erreichbar ist.

Persönliche Bemerkung

Service ist ein schwieriges Thema, je nach Fehlerfall kann es nunmal dauern bis es wieder läuft. Eine solch lapidare Aussage ist allerdings wenig hilfreich, parallel dazu fragt man sich, wie es den anderen 5532 Telekom-Kunden dabei geht. Nun ja, unser Kunde ist eine Anwalts- und Steuerberaterkanzlei, da ist man über solche Werbung und (wenn’s drauf ankommt) nicht erbrachter Leistung schwer von begeistert.

Irgendwie ist heute sowieso “Telekom-Tag”, vom abgestürzten Speedport-Router bei einem Privatkunden, einer ausgefallenen CompanyConnect-Leitung (da gibt’s wenigstens ein ADSL-Fallback), Telefon-Problemen bis hin zu eben diesem Fall war alles dabei.

Bleibt zu hoffen, das es in einem Tag wieder anders aussieht.

Quellen

Telekom – BusinessBasic Complete

Update 22.07.2015

Passend zum Titel eine weitere Geschichte:

Ein Kunde hat von der Telekom einen CompanyConnect-Anschluss (Standleitung). Diese Anschlüsse werden ebenfalls mit Enstörung binnen sechs bis acht Stunden angeboten. Ferner ist (zumindest beim Vertrieb) die Rede davon, das die Leitungen überwacht werden und im Falle einer Störung oder eines Ausfalls entsprechend reagiert wird.

Bei besagtem Kunden gab es die letzten Tage immer wieder Probleme mit der Verbindung die sich in kurzen Unterbrechungen bei VPN und VoIP bemerkbar machten. Zunächst wurde ausgeschlossen, das es ein Problem mit dem Firewall-Router (Securepoint UTM RC100) ist, in dem zu allererst das Netzwerkkabel zwischen dem Cisco-Router der Telekom und der UTM ausgetauscht wurde, als nächstes wurde der Port (die RC100 hat insgesamt vier) gewechselt. Auffällig die vergangenen zwei-drei Tage war, das im Log der UTM folgende Meldungen immer mal wieder auftauchten obwohl zu den jeweiligen Zeitpunkten keine Arbeiten vorgenommen wurden:

Events on 'eth0': ,link down

Kurz darauf dann wieder “link up”. Da dieser Fehler beim Port-Wechsel von LAN1 (eth0) zu LAN4 (eth3) mitgewandert ist, blieb als mögliche Ursache eigentlich nur noch der Cisco-Router übrig. Nebenbei erwähnt: An LAN2 und LAN3 (eth1 für’s LAN, eth2 für die Backup-Leitung, beide entsprechend beschaltet) gab es diese Meldungen nicht. Nach Rücksprache mit Securepoint wurde bestätigt, das die Log-Meldungen nur kommen, wenn physikalisch der Link weg ist (Kabel entfernt, Port defekt). Mit diesen Kenntnissen wurde die Telekom kontaktiert.

Die Diagnostik-Abteilung schaute sich die Leitung als auch den Cisco-Router an. Einer der ersten Aussagen war: “Ich hab noch nie erlebt, das ein einzelner Port eines Ciscos kaputt geht, wenn dann gehen die Kisten komplett kaputt.” Gut, das ist ein Erfahrungswert, aber es könnte ja (imho) dennoch sein. Jedenfalls würde der Cisco keine “Link downs” oder Paketverluste an seinen internen Anschluss anzeigen.

Anders ist die Situation bei der CompanyConnect-Leitung, in diesem Fall basiert diese auf einer Kupferleitung (gibt’s auch als Glasfaser). Dort wäre eines von vier Adernpaare “nicht gut” und würde für Probleme sorgen. Als schneller workaround wurde dieses Adernpaar Telekom-seitig stillgelegt, damit läuft der Anschluss mit weniger Bandbreite. Gute drei Stunden später war ein Telekom-Techniker vor Ort.

Das Problem sei auf den letzten Leitungsabschnitt eingrenzt worden, der letzte Regenerator (Verstärker) im KVZ sei nicht das Problem. Es bleibt also nur noch die Leitung zwischen diesem Kasten und dem Kunden (inkl. der Leitung innerhalb des Hauses). Das könne er alleine nicht weiter bearbeiten, es müssen zwei Telekom-Techniker her.

Weitere gute zwei Stunden später folgte ein Anruf der Telekom, das am darauffolgenden Tag kein Techniker-Einsatz erfolgen könne, da eine Betriebsversammlung stattfinde (!). Erst einen weiteren Tag später könnten, sofern zwei Techniker Zeit hätten (!) das Ticket weiter bearbeiten. Wie war das doch gleich mit der Entstörung innerhalb von acht Stunden?!

Das ist Tag heuer der aktuelle Stand. Ich bin gespannt, ob’s dann morgen was wird und was dabei heraus kommt. Ich bin ja kein Jurist, aber aktuell läuft der Anschluss jenseits der AGBs, ferner wundert mich, das die Probleme erst nach unserer Meldung erkannt wurden (War nicht was mit der Überwachung der Leitung?!).

Auf den möglichen (zusätzlichen) Fehler mit dem Cisco-Router ist bislang kein Telekom-Mitarbeiter weder an der Hotline noch Vor-Ort weiter eingegangen. Mal sehen was das noch wird, ich werde an dieser Stelle berichten.

Update 23.07.2015

Heute Nachmittag wurde der CompanyConnect des Kunden entstört, letztlich waren es gleich zwei Stellen in der Leitung, die für Probleme gesorgt haben. Kurioserweise betraf es das gleiche Adernpaar.

Die “link down”-Meldungen konnten ebenfalls geklärt werden und zwar ist die Sache relativ einfach (wenn man es weiß): Das Telekom-Equipment gibt, laut Telekom-Techniker-Aussage, Fehler auf der Leitung weiter (“link-error-forward” oder so ähnlich nannte er das), d.h.: Gibt’s Ausfälle beim CompanyConnect weil, wie in diesem Fall, ein Adernpaar nicht synchron ist ist, meldet der NT und nachfolgend der Cisco ebenfals “link down”, obwohl die Ports an den jeweiligen Geräten in Ordnung sind. Das konnte man wunderbar im Log der UTM beobachten, als das Kabel vom NT entfernt wurde.

Dadurch ist es möglich, das nachgeschaltene Geräte wie z.B. die Securepoint UTM ebenfalls etwas vom Leitungsausfall mitbekommen. Also in der GUI wird dies entsprechend angezeigt (keine grüne Lampe) und im Log die oben genannten Meldungen. Man könnte nun zwecks Monitoring bzw. Alarmierung nun entsprechend einen Syslog-Server aufsetzen, der im Falle von bestimmten Ereignissen eine Alarmierung oder sonstige Aktionen ausführt (sofern der verwendete Syslog soetwas unterstützt), in der UTM gibt man dann an, das auf den Syslog-Server protokolliert werden soll.

Protokollieren kann auf jeden Fall das SOC, ob es auch reagieren kann, ist mir nicht bekannt. Im übrigen meinte einer der zwei Telekom-Techniker, die heute Vor-Ort waren, das es keine proaktive Überwachung gäbe. Der Vertrieb hat das damals allerdings behauptet, der Kunde wird nun seinen Vertrag prüfen, was nun wirklich abgedeckt ist. Dementgegen steht allerdings noch eine Aussage eines Technikers, das die “link down”-Meldung ebenfalls für die Telekom relevant ist, damit man im PoP (Point-of-presence) den Leitungsausfall ebenfalls mitbekommt.

Abschließend kann man sagen: Wieder etwas dazu gelernt, gemeint ist der “link-error-forward”, schade das es dazu insgesamt drei Telekom-Mitarbeiter gebraucht hat, wovon nur der letzte den Sachverhalt klären konnte.