Stabilität 841v10+

Das ursprünglich genannte Phänomen war, daß »ein Freifunk Router täglich neu gestartet werden muß damit er funktioniert« — ob’s sich um einen v10 handelt, ist unklar. Da Du aber augenscheinlich sonderbare Effekte bei Nutzung von v9 & v10+ feststellst, kannst Du bitte etwas mehr ins Detail gehen?

Hintergrund: 841 <= v8, 841 v9 und 841 v10/v11 sind jeweils andere Hardwareplattformen (anderer SoC (CPU+WLAN)), sodaß es grundsätzlich sein kann, daß v10/v11 sich anders verhält als v9 (292 Geräte; v8 haben wir nur 6 im Feld, v10 66, v11 5) — falls dem so wäre, sollte man dem versuchen, auf die Spur zu kommen.

das mache ich gerne:
viele Kombinationen v9/v9 oder v10/v10 laufen über Wochen stabil
Die Kombination v10 (33415-Kolping-Fuerstenstr-1) / v9 (33415-Kolping-Fuerstenstrasse) läuft selten eine Woche am Stück. Die v10 ist an einem Speedport an einer Telekom Leitung und hält stabil die VPN Verbindung. Die gemeshte v9 verliert dann irgendwann die Verbindung und bleibt auch für mehrere Tage offline. Sobald mir dies auffällt reboote ich per SSH die v10 und schon verbinden sich beide wieder.
Wenn ich mich recht entsinne konnten sich Clients auf der v10 einloggen wenn die v9 offline war. (ist aber schwer zu verfolgen, da dort an der v10 seltener Clients angemeldet sind)
Wenn der Fall wieder auftritt kann ich gerne bestimmte Prozesse in der v10 “auslesen”, wenn ich weiß welche :slight_smile:

Hmm, das klingt ehrlich gesagt nach dem »kolportierten Problem« (ich habe es selbst noch nicht so gehabt, aber in anderen Communities tritt dies wohl gelegentlich auf), daß der Knoten gelegentlich sein Funknetzwerk »verliert« (hier allerdings der v10er mit dem Uplink, denn dessen Reboot restauriert ja die Funktion).

Wir haben »sowas« bei 1043v2 in den Notunterkunftsturnhallen gesehen – Phänomen war spontaner Abfall der Clients auf Null, obwohl der Knoten ansonsten weiterzulaufen schien –; mangels Zugriff auf die Knoten (Aufsteller war die Stadt GT) waren die Diagnosemöglichkeiten beschränkt.

Die aktuell ausgerollte Firmware hat dafür einen Patch aus Paderborn drin, der ein evtl. dafür verantworliches Feature (»ANI«) deaktiviert.

Ferner haben wir in der aktuellen Firmware einen Patch der »Eulenfunker« drin, der als eine Art Watchdog auf das Verschwinden von WiFi-Links mit Reboot des Knotens reagieren soll(te). Die Idee ist es festzustellen, daß es WiFi-Links gibt (vorzugsweise >1), und ab dann, sollte die Anzahl für >9 Minuten unter 1 fallen, einen Reboot auszulösen, weil vermutlich das WiFi ausgefallen ist. Der Patch loggt auch schön — ins RAM des Knotens, welches beim Reboot ja neu organisiert wird …

Kernproblem: es gibt aktuell keine sichere Erkennungsmöglichkeit, daß/ob es WiFi-Problem gibt. Viele Knoten haben im Tagesmittel, auf Ganzzahl gebracht, 0 Clients. Bei Knoten mit WiFi-Links hingegen macht es schon Sinn, auf deren Wegfall zu reagieren; allerdings vorzugsweise erst beim Fall von 5 auf 0 statt von 1 auf 0.

Auch scheint es vorkommen zu können, daß Mesh nicht mehr tut, AP allerdings durchaus noch. Auch in dem Falle wäre, egal auf welcher Seite der Verbindung, ein Mesh-only-Knoten abgehängt.

Vorschläge, wie man derlei besser eingrenzen, erkennen, signalisieren, debuggen kann, sind herzlich willkommen.

(FTR: der geheimnisvolle, nun mit einer Schaltuhr bedachte, Knoten im Vorgänger-Thread stellte sich als ein v9 mit tagsüber >20 Clients, der unter der Last dann auch spontan rebootet (wahrscheinlich wegen out-of-memory), heraus: Das ist ein bekanntes Problem — für mehr als einstellige Clientzahlen sind die Winzrouter mit 32 MB Hauptspeicher nicht geeignet. Bitte im Zweifel die 20-30 EUR mehr für einen 1034v2/v3 ausgeben, das erweist sich mittlerweile als langfristig betriebssicherer.)

Kurze Zwischeninfo: die Situation ist eingetreten, dass die v9 abgehängt wurde. Ich bin auf dem Weg zum Büro eben vorbeigefahren und habe vor dem Haus mit dem v10 und Uplink kein Wifi-Signal erhalten können. Der v10 sendet also wirklich nichts mehr und dadurch kann der v9 auch nicht anmeshen. Per SSH hätte ich Zugriff auf die v10. (und kann auch andere drauflassen)

[quote=“ArnoSy, post:4, topic:173”]
Der v10 sendet also wirklich nichts mehr und dadurch kann der v9 auch nicht anmeshen.[/quote]

Danke für die Info und die Bestätigung der Vermutung, daß es am v10 liegt (der, zur Erinnerung, eine andere Hardware nutzt als der v9). Plöd, daß offensichtlich die dafür vorgesehenen Mechanismen nicht greifen :frowning:

Es soll “wifi restart” z. T. geholfen haben; interessant wäre für uns/mich, was in syslog aufgelaufen ist (logread-Befehl auf dem v10), evtl. kann man auf bestimmte Fehlermeldungen triggern. Um direkt rumstochern zu können, wäre in der Tat Zugriff hilfreich; aber das zeitlich zu koordinieren wird schwierig, d. h. der v10 wäre ggf. länger im WLAN-tot-Modus. Besteht die Möglichkeit, vorübergehend einen v9 parallel aufzustellen und an den Uplink zu hängen, sodaß mit einem in den WLAN-tot-Modus gefallenen v10 experimentiert werden kann, ohne die Leute dahinter abzuhängen? (v9 könnte ich stellen …)

Dieses Thema wurde automatisch 10 Tage nach der letzten Antwort geschlossen. Es sind keine neuen Nachrichten mehr erlaubt.