Brace for impact: FW 0.7.9~129 pushed to experimental

Ich hatte gerade auf einem 1043er folgende Meldung und kann damit erstmal nix anfangen …
Davor und danach sieht’s wie immer/normal aus.

Mon Aug  7 02:30:01 2017 kern.warn kernel: [46058.690000] ------------[ cut here ]------------
Mon Aug  7 02:30:01 2017 kern.warn kernel: [46058.690000] WARNING: CPU: 0 PID: 12188 at /home/ffgt/jenkins_data/build/gluon-ffgt-v2016.2/openwrt/build_dir/target-mips_34kc_uClibc-0.9.33.2_gluon-ar71xx-generic/linux-ar71xx_generic/compat-wireless-2016-06-20/net/mac80211/ibss.c:1082 ieee80211_get_vht_mask_from_cap+0x1814/0x1b14 [mac80211]()
Mon Aug  7 02:30:01 2017 kern.warn kernel: [46058.720000] Modules linked in: ath9k ath9k_common iptable_nat ath9k_hw ath nf_nat_ipv4 nf_conntrack_ipv6 nf_conntrack_ipv4 mac80211 ipt_REJECT ipt_MASQUERADE ebtable_nat ebtable_filter ebtable_broute cfg80211 xt_time xt_tcpudp xt_state xt_quota xt_pkttype xt_physdev xt_owner xt_nat xt_multiport xt_mark xt_mac xt_limit xt_id xt_conntrack xt_comment xt_addrtype xt_TCPMSS xt_REDIRECT xt_LOG xt_CT nf_reject_ipv4 nf_nat_masquerade_ipv4 nf_nat nf_log_ipv4 nf_defrag_iMon Aug  7 02:30:01 2017 kern.warn kernel: [46058.830000] CPU: 0 PID: 12188 Comm: kworker/u2:2 Not tainted 3.18.44 #9
Mon Aug  7 02:30:01 2017 kern.warn kernel: [46058.840000] Workqueue: phy0 ieee80211_ibss_leave [mac80211]
Mon Aug  7 02:30:01 2017 kern.warn kernel: [46058.840000] Stack : 00000001 00000000 831ee500 80365eec 832585a8 83211e08 0000043a 00000001
Mon Aug  7 02:30:01 2017 kern.warn kernel: [46058.840000]         8246e000 00000000 00000000 800a3e8c 00002f9c 80096a6c 82d75f58 00000001
Mon Aug  7 02:30:01 2017 kern.warn kernel: [46058.840000]         80376bbc 82ecfacc 82ecfacc 800a3e8c 00000003 80094460 0000043a 00000000
Mon Aug  7 02:30:01 2017 kern.warn kernel: [46058.840000]         00000000 801da354 00000000 00000000 00000000 00000000 00000000 00000000
Mon Aug  7 02:30:01 2017 kern.warn kernel: [46058.840000]         70687930 00000000 00000000 00000000 00000000 00000000 830cb200 830cb300
Mon Aug  7 02:30:01 2017 kern.warn kernel: [46058.840000]         ...
Mon Aug  7 02:30:01 2017 kern.warn kernel: [46058.880000] Call Trace:
Mon Aug  7 02:30:01 2017 kern.warn kernel: [46058.880000] [<80071738>] show_stack+0x50/0x84
Mon Aug  7 02:30:01 2017 kern.warn kernel: [46058.890000] [<80080c34>] warn_slowpath_common+0x84/0xb4
Mon Aug  7 02:30:01 2017 kern.warn kernel: [46058.900000] [<80080cec>] warn_slowpath_null+0x18/0x24
Mon Aug  7 02:30:01 2017 kern.warn kernel: [46058.900000] [<83211e08>] ieee80211_get_vht_mask_from_cap+0x1814/0x1b14 [mac80211]
Mon Aug  7 02:30:01 2017 kern.warn kernel: [46058.910000]
Mon Aug  7 02:30:01 2017 kern.warn kernel: [46058.910000] ---[ end trace f09d4c225f3c1f54 ]---

Wahrscheinlich ein HW-/Treiber-Bug. Isso, andere Treiber gibt’s nicht …

Gretchenfrage: tut’s WiFi danach noch? Falls nicht, kommt ein grep darauf in den »autorebooter« …

Das WLAN ging danach noch und der Fehler ist auch noch nicht weiter aufgetaucht. :spy:

Dann würde ich gerne gen stable die FW schieben; wie weit bist Du mit dem ‘de-patching’?

Moin.
Bei der Version 0.7.9~132 ist mir aufgefallen, das die Statusseite auf den Knoten nicht mit allen angebotenen IPv6-Adressen aufrufbar ist:
z.B.
geht:
2001:bf7:170:0:32b5:c2ff:feb5:6608
geht nicht: Not Found - The requested URL /cgi-bin/status was not found on this server.
fd39:e4e3:eee1:0:32b5:c2ff:feb5:6608

Die letzten sind heute dran … :runner:

Kannst du bitte die Zeitserver kontrollieren?
Zu den, in der Firmware angebenen Zeitserver, kommen die Knoten nicht. So habe ich erstmal [0-3].pool.ntp.org eingetragen … sind aber nach upgrade wieder raus.

Browsercache? /cgi-bin/status war die alte, / ist die neue URL …

ntp.4830.org sollte nun tun; auf gw10 war der ntpd mal wieder gestorben, auf beiden (gw10, bgp-gut01) klappt das mit der Freischaltung nicht, wenn erst alle Clients ausgesperrt werden und hinterher erlaubt.

Wat 'ne Grütze. Man sollte meinen, ntp wäre 2017 keine Raketenwissenschaft mehr :frowning: Freiwillige, sich den Kram anzusehen?

Auf einem TP-Link Archer C7 v2 und FW 0.7.9~132 kommt beim Booten immer folgende Meldung.
Andere Auffälligkeiten sind zurzeit nicht …

Sat Aug 12 09:46:38 2017 kern.info kernel: [   32.900000] IPv6: ADDRCONF(NETDEV_CHANGE): client0: link becomes ready
Sat Aug 12 09:46:38 2017 kern.info kernel: [   32.900000] br-client: port 4(client0) entered forwarding state
Sat Aug 12 09:46:38 2017 kern.info kernel: [   32.910000] br-client: port 4(client0) entered forwarding state
Sat Aug 12 09:46:38 2017 daemon.notice netifd: radio0 (1285): client0: interface state COUNTRY_UPDATE->ENABLED
Sat Aug 12 09:46:38 2017 daemon.notice netifd: radio0 (1285): client0: AP-ENABLED
Sat Aug 12 09:46:38 2017 daemon.info dnsmasq[1775]: read /tmp/hosts/dhcp - 0 addresses
Sat Aug 12 09:46:38 2017 user.notice firewall: Reloading firewall due to ifup of wan (br-wan)
Sat Aug 12 09:46:38 2017 kern.info kernel: [   32.980000] ibss1: Created IBSS using preconfigured BSSID 00:23:de:ca:fb:ad
Sat Aug 12 09:46:38 2017 kern.info kernel: [   32.980000] ibss1: Creating new IBSS network, BSSID 00:23:de:ca:fb:ad
Sat Aug 12 09:46:38 2017 kern.info kernel: [   32.990000] IPv6: ADDRCONF(NETDEV_CHANGE): ibss1: link becomes ready
Sat Aug 12 09:46:38 2017 daemon.notice netifd: Network device 'client0' link is up
Sat Aug 12 09:46:38 2017 daemon.notice netifd: Network device 'ibss1' link is up
Sat Aug 12 09:46:38 2017 daemon.notice netifd: Interface 'ibss_radio1' is enabled
Sat Aug 12 09:46:38 2017 daemon.notice netifd: Interface 'ibss_radio1' has link connectivity
Sat Aug 12 09:46:38 2017 daemon.notice netifd: Interface 'ibss_radio1' is setting up now
Sat Aug 12 09:46:38 2017 daemon.notice netifd: Network device 'client1' link is up
Sat Aug 12 09:46:38 2017 kern.debug kernel: [   33.730000] ath10k_pci 0000:01:00.0: ath10k_pci ATH10K_DBG_BUFFER:
Sat Aug 12 09:46:38 2017 kern.debug kernel: [   33.730000] ath10k: [0000]: 049A0000 0500FC17 70201031 08000000 80000000 B8F74000 01000600 0E9A0000
Sat Aug 12 09:46:38 2017 kern.debug kernel: [   33.730000] ath10k: [0008]: 085CFC0F 8C6B4400 08000000 80000000 0E9A0000 065CFC0F B8F74000 84774400
Sat Aug 12 09:46:38 2017 kern.debug kernel: [   33.730000] ath10k: [0016]: 19000000 0E9A0000 065CFC0F 09000000 84774400 847D9C00 289A0000 100CFC0B
Sat Aug 12 09:46:38 2017 kern.debug kernel: [   33.730000] ath10k: [0024]: 8A291001 03000000 289A0000 130CFC03 2F9A0000 234CFC0F 01000000 01000000
Sat Aug 12 09:46:38 2017 kern.debug kernel: [   33.730000] ath10k: [0032]: 01000000 359A0000 234CFC0F 01000000 01000000 01000000 3C9A0000 234CFC0F
Sat Aug 12 09:46:38 2017 kern.debug kernel: [   33.730000] ath10k: [0040]: 01000000 01000000 01000000 429A0000 234CFC0F 01000000 01000000 01000000
Sat Aug 12 09:46:38 2017 kern.debug kernel: [   33.730000] ath10k: [0048]: 499A0000 234CFC0F 01000000 01000000 01000000 509A0000 234CFC0F 01000000
Sat Aug 12 09:46:38 2017 kern.debug kernel: [   33.730000] ath10k: [0056]: 01000000 01000000 569A0000 234CFC0F 01000000 01000000 01000000 5D9A0000
Sat Aug 12 09:46:38 2017 kern.debug kernel: [   33.730000] ath10k: [0064]: 234CFC0F 01000000 01000000 01000000 5D9A0000 0C64FC07 01000000 649A0000
Sat Aug 12 09:46:38 2017 kern.debug kernel: [   33.730000] ath10k: [0072]: 234CFC0F 01000000 01000000 01000000 649A0000 0920000C 34F84300 02000000
Sat Aug 12 09:46:38 2017 kern.debug kernel: [   33.730000] ath10k: [0080]: 00000000 649A0000 065C000C 08000000 84774400 8C7D9C00 649A0000 0928000C
Sat Aug 12 09:46:38 2017 kern.debug kernel: [   33.730000] ath10k: [0088]: 61661071 34F84300 9CFE4300 649A0000 0928000C 60661071 34F84300 9CFE4300
Sat Aug 12 09:46:38 2017 kern.debug kernel: [   33.730000] ath10k: [0096]: 649A0000 085C0008 34F84300 B46B4400 649A0000 065C000C 11000000 84774400
Sat Aug 12 09:46:38 2017 kern.debug kernel: [   33.730000] ath10k: [0104]: 947D9C00 649A0000 045C000C 03001081 34F84300 00000000 649A0000 02280008
Sat Aug 12 09:46:38 2017 kern.debug kernel: [   33.730000] ath10k: [0112]: 03000000 03000000 649A0000 02280004 03000000 649A0000 2F4C0014 02010000
Sat Aug 12 09:46:38 2017 kern.debug kernel: [   33.730000] ath10k: [0120]: 54EE4100 988C4300 00000000 00000000 649A0000 2F4C0014 72010000 8CEE4100
Sat Aug 12 09:46:38 2017 kern.debug kernel: [   33.730000] ath10k: [0128]: 988C4300 00000000 01000000 649A0000 364C0014 988C4300 84B09B00 11000000
Sat Aug 12 09:46:38 2017 kern.debug kernel: [   33.730000] ath10k: [0136]: 00000000 203D0000 649A0000 364C0014 988C4300 CCB09B00 12000000 00000000
Sat Aug 12 09:46:38 2017 kern.debug kernel: [   33.730000] ath10k: [0144]: 202D0000 649A0000 364C0014 988C4300 14B19B00 10000000 0A000000 403D0000
Sat Aug 12 09:46:38 2017 kern.debug kernel: [   33.730000] ath10k: [0152]: 649A0000 364C0014 988C4300 5CB19B00 13000000 00000000 203D0000 649A0000
Sat Aug 12 09:46:38 2017 kern.debug kernel: [   33.730000] ath10k: [0160]: 035C0014 01000000 F4F26D94 9C9D0000 148A9B00 988C4300 A79A0000 0B200010
Sat Aug 12 09:46:38 2017 kern.debug kernel: [   33.730000] ath10k: [0168]: 34F84300 00000000 00000000 04000000 AF9A0000 07200004 34F84300 AF9A0000
Sat Aug 12 09:46:38 2017 kern.debug kernel: [   33.730000] ath10k: [0176]: 094C0014 00000000 00000001 FF000000 01000000 80000000 AF9A0000 074C0008
Sat Aug 12 09:46:38 2017 kern.debug kernel: [   33.730000] ath10k: [0184]: 00000000 00000000
Sat Aug 12 09:46:38 2017 kern.debug kernel: [   33.730000] ath10k_pci 0000:01:00.0: ATH10K_END
Sat Aug 12 09:46:39 2017 kern.info kernel: [   34.040000] batman_adv: bat0: Adding interface: ibss1
Sat Aug 12 09:46:39 2017 kern.info kernel: [   34.040000] batman_adv: bat0: Interface activated: ibss1
Sat Aug 12 09:46:39 2017 daemon.notice netifd: Interface 'ibss_radio1' is now up
Sat Aug 12 09:46:39 2017 daemon.notice fastd[1999]: fastd v18 starting
Sat Aug 12 09:46:39 2017 daemon.notice netifd: Interface 'mesh_vpn' is enabled
Sat Aug 12 09:46:39 2017 daemon.notice netifd: Network device 'mesh-vpn' link is up
Sat Aug 12 09:46:39 2017 daemon.notice netifd: Interface 'mesh_vpn' has link connectivity

Sat Aug 12 09:46:39 2017 daemon.notice netifd: Interface ‘mesh_vpn’ is setting up now

Hmm, »ath10k_pci ATH10K_DBG_BUFFER:«, dürften wohl Debugging-Infos für die Treiberentwickler sein. Der 10k-Treiber ist IIRC noch immer in der »Betastung«, wundere mich auch, daß auf 5 GHz ein Mesh-IF gestartet wird. Meinte verstanden zu haben, daß auf 5 GHz nicht (mehr) gemesht würde. Muß ich mal bei meinem nachgucken …

Ich habe jetzt die Version noch nicht im Config-Modus gesehen … ‘meine’ C7 hatten in FW-Version 0.7.4~210 bei 2.4 GHz und 5 GHz standardmäßig den Haken drin.
Wenn bei 5GHz nicht gemesht werden ‘soll’, wäre eine andere Voreinstellung oder ein Verzicht der Option auf der Oberfläche mit entsprechenden Kommentar nötig. Wer weiß was er tut, könnte dies über Console wenn nötig aktivieren.

Ich hatte das so aus Diskussionen rund um Gluon abgespeichert, aber ich mag mich auch irren; vielleicht verwechsele ich das auch mit der notwendigen Auswahl, ob man IBSS oder 802.11s nutzen will bei ath10k.

Version 0.7.9~133, die die Upstrempatches bzgl. des Autoupdaters beinhaltet und 0.7.9~129 damit ersetzt, ist seit heute im “testing”-Zweig.

Moin, moin.

Mir ist (gefühlt) aufgefallen, dass die “Ausfallrate” bei einem Reboot per Cronjob bei der Firmware >= 132 höher geworden ist.
Erst mit einem beherzten Strom ‘Aus/An’ kommen diese Knoten (841er) wieder in die Gänge. :frowning:

Nachvollziehen konnte ich dies leider nicht, da bisher Fremdgeräte/-standorte betroffen waren. Ich schau mal, ob ich von den Eigentümern noch einige Infos mehr bekomme.

Hmm, 0.7.9 basiert auf neuerem OpenWRT als 0.7.4. Kann also prinzipiell sein, mir sind aber keine derartigen Berichte bekannt.

Was heißt »bei einem Reboot per Cronjob«?

/etc/crontabs/root:
13 3 * * * /sbin/reboot > /dev/null

Gibt’s bei OpenWRT/den SOCs auch sowas wie SysReq? Einen meiner NUCs im Keller bekomme ich nur mit (sleep 10 ; echo 1 > /proc/sys/kernel/sysrq ; echo b > /proc/sysrq-trigger) & sauber rebootet, mit normalem reboot bleibt der irgendwo hängen und ich muß hinlaufen & resetten/powercyclen :frowning:

So ein “reboote jetzt und basta” wäre ja auch für MIPS & Co. schick.