Legacy: Massenausfall?

Moin,

es sind seit Montag morgen etliche Knoten offline im fastd-Netz (Legacy). Da dies zeitgleich über viele Knoten geschah, vermute ich ein Routingproblem zw. einem/einigen Providern und uns — Telekom und Ex-Unitymedia tut.

Ideen, anyone?



Makerspace z.B. ist über Bitel angeschlossen meine ich. Haben wir aktive Knoten die über Bitel funktionieren?

Das paßt; zwei Knoten, die ich mal installiert habe, sind auch zeitgleich weg und waren damals zumindest über BItel angebunden. Hmmm …

Wie haben leider keine Zuordnug Knoten <> Anschluß.

33803-CheckPoint-967b, 33803-CheckPoint-ba4f habe ich Anfang des Jahres aufgebaut (am Beginn der Corona-Kacke), das war IIRC BItel.
33330-Stadt-Guetersloh-Berliner-Platz1, 33330-Stadt-Guetersloh-Berliner-Platz2 hängen an einem BITel-Anschluß der Stadt.
ffgt-Romain, ffgt-Romaina hatte ich vor ~5 Jahren installiert (der eine oder andere erinnert sich vielleicht noch an den rüstigen Rentner, der mit Hardware in der Hand in der Weberei auftauchte ;)), das war damals zumindest BITel.
33330-Esperanza-bbd2 habe ich damals installiert, ebenfalls BITel.

Jetzt wäre es interessant zu wissen, was den Zugriff aus dem BITel-Netz blockiert, z. B. “logread | tail -100” von einem betroffenen Knoten und ggf. traceroutes.

@igami weisst du ob im Space Bitel anliegt?

Wenn ja, können wir uns ja Morgen Abend auf einen Hefetee in der Weberei treffen.Oder gleich noch?

Wenn’s Dir paßt, gerne heute noch; u. a. ist auch der Offloader in der Bibliothek (33332-Stadtbibliothek) seit 31.08.2020, 9:37:35 offline, auch das war IIRC BITel, fällt mir gerade ein. Dann kann ich noch heute am Abend bzw in der Nacht nach dem Grund suchen, warum explizit BITel nimmer tut.

Ganz sicher bin ich mir nicht, aber ich meine schon, dass die BITEL haben.

Wir sind vor Ort und ich höre nur w… und wieso das denn.

Erstmal vielen Dank, daß das kurzfristig geklappt hat.

Der Grund für die … Verwunderung war ein doppeltes what-the-firetruck, denn der Trace vom Knoten im Makerspace zeigte zwei Probleme:

root@33330-Makerspace-185e:~# gluon-wan traceroute fastd176.4830.org
traceroute      fastd176.4830.org
traceroute to fastd176.4830.org (192.251.226.176), 30 hops max, 38 byte packets
 1  192.168.0.1 (192.168.0.1)  0.309 ms  0.212 ms  0.204 ms
 2  fritz.box (192.168.179.1)  0.710 ms  0.575 ms  0.381 ms
 3  dsl-77-75-201-1.pool.bitel.net (77.75.201.1)  6.118 ms  6.328 ms  6.007 ms
 4  switch0.int.bitel.net (212.100.40.50)  6.394 ms  6.525 ms  6.487 ms
 5  185.48.244.116 (185.48.244.116)  5.721 ms  5.912 ms  5.793 ms
 6  185.48.244.138 (185.48.244.138)  12.261 ms  12.443 ms  12.121 ms
 7  *  *  *
 8  greven2.work.de (212.12.32.16)  23.723 ms  22.682 ms  20.607 ms
 9  hg2.gre.irz42.net (212.12.45.38)  19.313 ms  18.062 ms  18.275 ms
10  de2.as206946.net (193.26.120.91)  18.301 ms  18.081 ms  18.291 ms
11  de0.as206946.net (193.26.120.92)  36.435 ms !N  *  36.895 ms !N

Erstens lief der Datenverkehr zum 192.251.226er Netz von BITel statt über Plusserver über mein autonomes Netz — was es nicht sollte, da aus Sicht von BITel die Adressen so 3 statt nur 1 Teilnetz des Internets bis zum Ziel entfernt waren.

Zu allem Überfluß machte dann auch noch der »de0«-Router in meinem Netz Unsinn, denn anstatt das nun ins Freifunk-AS zu übergeben, meldete er »Netzwerk nicht erreichbar« zurück — WTF Nummer 2.

Ich habe das Problem temporär durch Verschlechterung der 192.251.226.0/24-Route durch das AS49745 kaschiert, nun nimmt auch BITel die Route über unser Freifunk-AS; warum bei BITel nicht der kürzere Weg über das Plusserver-AS greift, verstehe ich z. Zt. nicht …

root@33330-Makerspace-185e:~# gluon-wan traceroute fastd176.4830.org
traceroute	fastd176.4830.org
traceroute to fastd176.4830.org (192.251.226.176), 30 hops max, 38 byte packets
 1  192.168.0.1 (192.168.0.1)  0.292 ms  0.256 ms  0.209 ms
 2  fritz.box (192.168.179.1)  0.682 ms  0.495 ms  0.404 ms
 3  dsl-77-75-201-1.pool.bitel.net (77.75.201.1)  6.213 ms  6.736 ms  5.781 ms
 4  switch0.int.bitel.net (212.100.40.50)  6.573 ms  6.324 ms  6.773 ms
 5  185.48.244.116 (185.48.244.116)  5.828 ms  5.383 ms  5.638 ms
 6  185.48.244.138 (185.48.244.138)  12.401 ms  12.421 ms  12.018 ms
 7  bgp-fra01.4830.org (193.26.120.81)  12.559 ms  13.067 ms  12.655 ms
 8  bgp-ham02.4830.org (193.26.120.85)  18.229 ms  18.548 ms  18.323 ms
 9  bellicose.4830.org (192.251.226.123)  30.733 ms  29.395 ms  29.258 ms
10  192.251.226.176 (192.251.226.176)  29.156 ms  28.921 ms  29.161 ms

Wie auch immer, aus den ~80 Knoten Offline sind ~30 Knoten Offline geworden, damit können an ca. 50 Orten im Kreis Gütersloh nun wieder Menschen über Freifunk ins Internet; weitere ca. 6 Knoten, die zeitgleich ausfielen, erwarten wir ab Beginn der Arbeitswoche ebenfalls zurück:

Vorher Nachher

Daher vielen Dank an @echo, @igami und alle anderen vom Makerspace, die das Debugging am Sonntag abend ermöglicht haben.

1 Like

FTR, mittlerweile routet auch BITel wieder, wie es sein sollte.

root@33330-Makerspace-185e:~# gluon-wan traceroute fastd176.4830.org
traceroute	fastd176.4830.org
traceroute to fastd176.4830.org (192.251.226.176), 30 hops max, 38 byte packets
 1  192.168.0.1 (192.168.0.1)  0.325 ms  0.247 ms  0.212 ms
 2  fritz.box (192.168.179.1)  0.708 ms  0.522 ms  0.418 ms
 3  dsl-77-75-201-1.pool.bitel.net (77.75.201.1)  5.971 ms  5.590 ms  6.210 ms
 4  switch0.int.bitel.net (212.100.40.50)  7.273 ms  7.171 ms  6.023 ms
 5  185.48.244.116 (185.48.244.116)  6.049 ms  5.709 ms  6.246 ms
 6  185.48.244.146 (185.48.244.146)  5.966 ms  6.182 ms  5.713 ms
 7  185.48.244.142 (185.48.244.142)  8.124 ms  8.652 ms  8.747 ms
 8  vlan1246.ae11.cr1.dus6.plusserver.com (194.146.118.2)  11.026 ms  8.659 ms  9.419 ms
 9  ae0.cr2.dus6.plusserver.com (213.203.192.10)  9.341 ms  9.165 ms  8.820 ms
10  ae1.cr1.gut1.plusserver.com (85.119.200.206)  20.919 ms  20.625 ms  20.763 ms
11  te1-5.xmws-gtso-de11.gut1.plusserver.com (85.119.200.230)  20.565 ms  20.577 ms  20.205 ms
12  de0.as206946.net (193.26.120.92)  26.579 ms  30.293 ms  30.866 ms
13  192.251.226.176 (192.251.226.176)  20.929 ms  21.761 ms  20.750 ms
1 Like

Dieses Thema wurde automatisch 10 Tage nach der letzten Antwort geschlossen. Es sind keine neuen Nachrichten mehr erlaubt.