Forum |  HardWare.fr | News | Articles | PC | Prix | S'identifier | S'inscrire | Shop Recherche
2036 connectés 

  FORUM HardWare.fr
  Systèmes & Réseaux Pro
  Réseaux

  SSID qui "décrochent" qqs minutes, plusieurs fois par jour - ALE

 



 Mot :   Pseudo :  
 
Bas de page
Auteur Sujet :

SSID qui "décrochent" qqs minutes, plusieurs fois par jour - ALE

n°160218
antoincy
Posté le 06-02-2019 à 09:01:09  profilanswer
 

Bonjour à tous,
 
Sur un de mes sites j'ai un contrôleur de bornes Alcatel-Lucent OmniAccess 6000 (oui, je sais que ça commence à dater)
Ce contrôleur manage environ 40 bornes Aruba réparties sur les bâtiments.
 
Depuis quelques temps on me fait remonter des déconnexions intempestives : (plusieurs fois par jour)
 
- les SSID disparaissent d'un coup, cela a pour effet de déconnecter les clients
- quelques minutes plus tard, sans aucune intervention, les SSID réapparaissent et tout fonctionne correctement
- cela ne se produit pas forcément quand la charge est lourde : ex vendredi soir vers 18h nous avons constaté ce dysfonctionnement, alors que je n'avais plus grand monde sur les réseaux.
 
Mon système de supervision ne me remonte absolument rien en ce qui concerne un événement quelconque sur l'OA6000.
J'ai peur que le matos commence à lâcher mais j'aimerais explorer toutes les pistes avant de me précipiter.
 
Avez vous une idée ? Des spécialistes ALE dans la salle ?
Merci


Message édité par antoincy le 06-02-2019 à 09:03:18
mood
Publicité
Posté le 06-02-2019 à 09:01:09  profilanswer
 

n°160265
CK Ze CaRi​BoO
Posté le 06-02-2019 à 20:10:47  profilanswer
 

Je connais pas ce contrôleur mais en principe les bornes ne devraient pas arrêter de broadcaster comme ça par sa faute.
Est-ce que tu aurais un paramètre d'ajustement auto des canaux qui pourrait provoquer un reboot des radios ?


Message édité par CK Ze CaRiBoO le 06-02-2019 à 23:01:26

---------------
The only thing necessary for the triumph of evil is for good people to do nothing.
n°160268
antoincy
Posté le 06-02-2019 à 21:33:19  profilanswer
 

Merci de ta réponse. Il faut que je vérifie mais de mémoire il me semble que les canaux ont été réglés manuellement

n°160278
saarh
Posté le 07-02-2019 à 11:51:54  profilanswer
 

je ne connais pas non plus ce contrôleur, mais il n'y aurait pas aussi une protection style WPA countermeasure qui ferait l'andouille ? (on avait ça, déco aléatoire et simili "reboot" des AP)
Toutes les AP sont alimentées via l'Omniaccess, ou via des POE ? l'idéal serait de voir aussi la tronche des AP au moment du soucis...indépendamment du Omni.elles sont monitorées (style ping avec centreon, etc) ou pas ?  
ça pourrait donner des pistes ;)

n°160295
antoincy
Posté le 07-02-2019 à 17:09:40  profilanswer
 

saarh a écrit :

je ne connais pas non plus ce contrôleur, mais il n'y aurait pas aussi une protection style WPA countermeasure qui ferait l'andouille ? (on avait ça, déco aléatoire et simili "reboot" des AP)
Toutes les AP sont alimentées via l'Omniaccess, ou via des POE ? l'idéal serait de voir aussi la tronche des AP au moment du soucis...indépendamment du Omni.elles sont monitorées (style ping avec centreon, etc) ou pas ?  
ça pourrait donner des pistes ;)


merci à toi.
je n'ai pas trouvé de WPA countermeasure pour l'instant.
malheureusement je ne les supervise pas individuellement > l'interface web de l'OA6000 permet le monitoring basique.
peut-être que je devrais les faire remonter sur mon Nagios.
 
en attendant voici une capture du réglage d'une borne sur un des SSID :
edit : à préciser que cela a toujours fonctionné correctement depuis des années. je n'ai fait aucune modif...
edit2 : elles sont sur des OmniSwitch POE - pas alimentées via l'OA directement  
 
https://reho.st/medium/self/ebe190a730a4f2da932873dd82b45e27afbe5f1e.png

Message cité 1 fois
Message édité par antoincy le 07-02-2019 à 18:13:24
n°160300
antoincy
Posté le 07-02-2019 à 18:18:19  profilanswer
 

Cela s'est produit à 17h48, pour la premier fois Nagios me dit "This host is flapping"

n°160401
saarh
Posté le 11-02-2019 à 15:42:49  profilanswer
 

antoincy a écrit :


 
edit : à préciser que cela a toujours fonctionné correctement depuis des années. je n'ai fait aucune modif...
 
https://reho.st/medium/self/ebe190a [...] be5f1e.png


 
Comme ma voiture avant qu'un beau matin elle refuse de démarrer...."elle marchait pourtant bien hier" :D
 
ça serait sans doute pas mal de remonter les AP (ou au moins un bon échantillonnage) sous Nagios. Histoire de voir un peu ou chercher, et si ça bagotte par là...
Ton Nagios, il a gueulé sur un process en particulier ? Tu supervise quels services de ton OA6000 ?
 
Ici, sur le RFS, on supervise les AP adoptées, les periph connectés en wifi, et les classiques load / ram / ping, en plus des ping sur AP
 
https://reho.st/medium/self/6067ca715034cba4f0c0671f3ee310ff307495c3.jpg
 
ça permet déjà de trouver des pistes en cas de merdouillage.
 
Effectivement, si tes AP sont sur différents switch POE, tu peux déjà éliminer un soucis d'alim....si elles sont toute sur le même, par contre....

n°160469
antoincy
Posté le 12-02-2019 à 13:52:15  profilanswer
 

Merci à toi saarh pour ta réponse.
J'ai ajouté 5 AP à monitorer. Je vais voir si je remarque qqchose.
 
Sur l'OA6000 je ne suis qu'en check-host-alive. Mais je suis entrain de faire remonter cpu/ram et temperature car j'ai un doute sur l'état du chassis.
 
Et oui les AP sont sur différents switchs POE, j'ai plusieurs stacks répartis sur 6 locaux techniques.  
 
Pour le moment je ne vois toujours pas... Cela a recommencé ce matin

n°160517
saarh
Posté le 13-02-2019 à 09:21:49  profilanswer
 

Parti comme c'est , ça sent quand même pas très bon sur L'OA. Par contre, je ne connais pas son mode de fonctionnement....par exemple, chez nous, les RFS ne servent qu'à pousser les confs, et l'administration du bordel. Si ils tombent ou défaillent, les AP continuent à fonctionner en autonomie. (je ne peux juste plus modifier le moindre paramètre dessus, diffuser un new ssid, etc)
Sur nos vieux WS 5100, ils tombaient, les AP associées tombaient. Si c'est sur le même principe que les WS, le doubler aurait été une idée ^^ (surtout si le WiFi est critique chez vous)
 
Après, pas de soucis sur un switch qui merdouillerait ? (broadcast merdique, etc, tout ce qui pourrait faire tomber le lien vers l'OA)

n°160543
antoincy
Posté le 13-02-2019 à 12:56:26  profilanswer
 

Oui, si l’OA tombe, les bornes sont orphelines et ne diffusent plus rien.
Le doubler n’était pas envisagé car c’est déjà costaud à la base (2x PSU voir trois à une époque) ect.
Et puis sans parler budget...
 
J’ai un OmniSwitch 6850 en cœur de réseau. C’est sur lui qu’est connecté mon OA6000. Je n’ose pas l’incriminer vu la bête (et puis lui n’a pas 10 ans par contre).  
 
Ce qui est sur c’est que Nagios me donne des uptimes différends pour le switch/ l’OA/ les AP
Le 6850 a son uptime normal (depuis dernier reboot volontaire)
L’OA a un uptime à partir du moment où il a eu ce comportement, par exemple ici il y a 13h...
Les AP ont leur uptime normal cad pas celui de l’OA...


Message édité par antoincy le 13-02-2019 à 12:57:29
mood
Publicité
Posté le 13-02-2019 à 12:56:26  profilanswer
 

n°160576
saarh
Posté le 14-02-2019 à 08:11:51  profilanswer
 

On dirait bien que ton OA a un "léger" soucis...
Si c'était un problème de contre mesure ou un paramétrage foireux, on ne devrait pas perdre l'OA6000 sur le lan.... qu'il coupe (éventuellement) la diffusion des SSID, ejecte les périph connectés, pourquoi pas, mais on dirait qu'il reboot un peu sans raison...l'uptime, c'est celui donné par l'OA ou par Nagios ? on le perd juste du réseau ou il reboot réellement ? (ce qui semble être le cas, puisque tout revient à la normale au bout de quelques minutes.....temps de boot)
Les alims redondées sont sur 2 sources de courant séparées ? (ondulé / non ondulé)
Je ne sais pas si il est encore possible de mettre à jour le firmware sur cet engin, mais parfois.....(bien que si il était foireux, en 10 ans, vous auriez déjà eu le soucis :) )

n°160581
antoincy
Posté le 14-02-2019 à 10:56:42  profilanswer
 

L'uptime est celui récupéré par Nagios :
 
https://reho.st/self/09a143164926d8144cdddc0e5a3def8fe07d20fd.png
 
Je ne trouve pas de logs qui me mettraient sur une piste sur l'OA. Effectivement on dirait un reboot mais je pense que ce n'est pas le cas : le machin mets au moins 10 minutes à ré-up lors d'un vrai reboot. Là, la coupure ne dure que qqs minutes... Donc il perd juste le réseau. En revanche tu me donnes une piste pour les alims. Je vais faire un essai en mettant une des deux alims sur un autre onduleur... Actuellement les deux sont sur le même (une en battery et l'autre en surge)


Aller à :
Ajouter une réponse
  FORUM HardWare.fr
  Systèmes & Réseaux Pro
  Réseaux

  SSID qui "décrochent" qqs minutes, plusieurs fois par jour - ALE

 

Sujets relatifs
Mise a jour Infra 2019Mettre à Jour les pilotes DELL - HP - LENOVO avec MDT
Connexion VPN L2TP depuis un site distant 1 seul utilisateur a la foisMise a jour IE 11 Windows 7
Masquer SSID borne WifiMise à jour d'un parc Windows
.Ralentissement de Chrome suite à la mise à jour RGBD
Architecture WEB d'un site sur plusieurs serveurs dans le mondeProblème AD très étrange avec OU Builtin
Plus de sujets relatifs à : SSID qui "décrochent" qqs minutes, plusieurs fois par jour - ALE


Copyright © 1997-2018 Hardware.fr SARL (Signaler un contenu illicite / Données personnelles) / Groupe LDLC / Shop HFR