Bien le bonjour à vous,
depuis bientôt 3 mois je rencontre un problème qui semble empirer de plus en plus rapidement ces dernières semaines/jours, et jusqu'ici pas moyen d'en diagnostiquer l'origine !
Configuration :
- OS: Windows 10 x64 Officiel et à jour
- MB: Asus Rampage IV Black Edition
- CPU: i7-3930K@4.25Ghz (auto-OC du mode performances élevées)
- GPU: RTX 2060 Super (achetée en Novembre 2019)
- RAM: 16GB DDR3
- Stockage: 3x SSD Samsung Evo
- Alim: Seasonic X Series Modulaire - 1250W, norme 80+ Gold
les symptômes en résumé : freezes complets du PC (arrêt sur image, son qui reste figé sur la dernière tonalité, plus rien qui ne répond) nécessitant un hard-shutdown, qui se sont transformés en reboot avec avertissement de l'Asus Anti-Surge lors du post au redémarrage.
Plus de précisions (attention pavé, désolé par avance...) :
Pour bien resituer le contexte, l'ensemble de ma configuration a plus de 6 ans et n'a jamais rencontrée de problème hardware majeur avant fin 2019, où l'une de mes deux anciennes GTX 780 Ti a grillée. Il est à noter que cette panne a été provoquée par une légère fuite du waterblock de la seconde 780 Ti qui était juste au dessus d'elle, l'affichage a crashé dans les secondes qui ont suivi, le PC s'est mit en sécurité => CG inférieure HS. Après un gros nettoyage/inspection visuelle des composants restants, j'ai constaté qu'il ne semblait pas y avoir de dégât au niveau du port PCI, que ce soit au niveau de la CM ou de la CG grillée, donc j'ai pris le risque de remonter le tout avec la 780 Ti restante et tout est reparti sans problème. Par manque de ports DVI du fait de ma CG en moins, j'ai acheté une RTX 2060 Super quelques jours plus tard afin de passer mes écrans en DisplayPort et me suis débarrassé de la 780 Ti restante, en conservant tout le reste du matos. Je n'ai pas souvenir d'avoir constaté la moindre anomalie dans les mois qui ont suivi, jusqu'à début Février où, en pleine session de jeu (ça devait bien faire 4-5h de jeu à ce moment là, et j'en avais au moins bien 100h de plus au compteur depuis l'achat de la RTX) le PC a freezé, arrêt sur image, son freezé sur la dernière tonalité, plus aucune réponse de quoi que ce soit. J'ai fais un hard-shutdown sans trop m'inquiéter, relancé mon jeu et quelques minutes plus tard même problème. J'ai commencé à faire quelques tests (retrait des périphériques USB type manette, chargeurs[...], fermeture des programmes potentiellement conflictuels type Synapse, GeForce Experience, vérification des pilotes graphique[...]) en vain, le PC a crashé 4 fois en 2h ce soir là avant que j'abandonne pour la soirée. Dans les jours/semaines qui ont suivi j'ai fait de nombreux tests pour tenter de diagnostiquer le problème, grossièrement :
- Plusieurs tests OCCT Power Supply de 45min à 1h : aucun problème rencontré
- Sfc /scannow: RAS
- Dans le doute, formatage et réinstallation complète du système, à plusieurs reprises
- Memtest86 de 3h : aucune erreur
- CrystalDiskInfo : 100% de santé sur mes trois SSD
- Je suis passé par 2 ou 3 mises à jour de pilotes graphique différentes
- Windows officiel et entièrement à jour
- Retour sous Windows 7 pendant un temps, sur lequel je n'ai rencontré le soucis que deux fois sur une vingtaine d'heure de jeu, mais c'est toujours deux fois de trop pour prouver que ça pourrait venir d'un soucis de compatibilité W10
- Aucun log, dump mémoire, BSOD, à la notable exception d'un, lors du chargement du bureau à la suite d'un premier freeze, sauf que le BSOD a freeze aussi et je n'ai pas eu la moindre info
- Vérification des connecteurs d'alimentation
A partir de là j'ai commencé à un peu tirer la langue, d'autant que le problème reste très aléatoire, se produisant parfois au bout de 15 minutes de jeu, parfois au bout de 3h, parfois même pas du tout sur des sessions de 5-6h. Je me suis penché sur mes températures, notamment CPU qui ne sont pas géniales mais théoriquement pas susceptibles de déclencher une sécurité (75°C~), et j'ai donc essayé de downgrader les perfs du processeur en repassant en mode "Normal" dans les performances système du Bios, réduisant la fréquence CPU de 4.25Ghz à 3.8. Immédiatement après ça les choses ont...... Évoluées, j'ai lancé un jeu à la suite du redémarrage et après moins de 5 minutes le PC s'est éteint, alors que jusqu'ici je n'avais eu droit qu'à des freezes nécessitants un redémarrage forcé. Lors du post du redémarrage suivant l'Anti-Surge d'Asus m'a indiqué le message suivant :
Citation :
Power supply surges detected during the previous power on. ASUS Anti-Surge was triggered to protect system from unstable power supply unit!
|
Alors évidemment; reboot intempestifs en charge, Anti-Surge => Alimentation ? J'ai relevé mes tensions, et là je n'y connais absolument rien pour les interpréter correctement, mais je note toutefois que mon +3.3V oscille entre 2.9 et 3.0V, à défaut de savoir si ça peut engendrer un quelconque soucis, ce n'est en tout cas pas ce qu'on semble attendre d'une alim sérieuse norme 80+. Je n'ai pas le matériel pour mesurer manuellement les tensions afin de confirmer ces valeurs, toutefois sur les screenshots des tests OCCT effectués en Février ce dernier relevait un +3.3V entre 3.2 et 3.1V, si ça ne prouve toujours pas la fiabilité de la mesure, ça semble en tout cas indiquer qu'elle est en chute libre, que les valeurs affichées soient correctes ou non.
Depuis lors je n'ai plus eu que des reboots de ce genre, toujours en jeu, toujours au bout d'une durée très variable, et toujours avec ce même message de l'Asus Anti-Surge, mais plus aucun freeze du genre de ceux que j'avais depuis presque 3 mois. Puis ce matin, pour la toute première fois (et je précise que le PC a toujours été allumé 24 heures sur 24), j'ai eu la mauvaise surprise de le retrouver sur l'écran du post, me signalant une nouvelle fois un déclenchement de l'Anti-Surge, indiquant qu'il a de nouveau crashé cette nuit mais cette fois hors jeu/charge ! Le problème semble donc empirer rapidement et je m'inquiète pour la santé des composants potentiellement sains
Un très grand merci à vous par avance pour vos réponses éclairées
Test Power Supply / Tensions OCCT Février : https://i.imgur.com/bVvBXdl.png
HWMonitor sur 48h avec quelques courtes périodes de charge (26-27 Avril, les tensions relevées sous OCCT sont les mêmes, pour la comparaison avec le screenshot de Février) : https://i.imgur.com/Z2F6VUt.jpg
Message édité par Hodir le 28-04-2020 à 15:38:02