Bonjour,
Je publie cette affaire car après de nombreux mois d'enquête, je commence à désespérer de trouver ce qui cloche!
Lecteur accroche toi bien, car beaucoup d'informations vont suivre.
J'ai commandé une config power user (pièce par pièce) mi-septembre 2015 chez différents revendeurs. Voici le détail :
Carte mère : ASUS Z170-A
CPU : i7-6700K
Ventilateur : Noctua NH-U12P SE2
RAM : 2 x Corsair Vengeance LPX Series Low Profile 8 Go DDR4 2400 MHz CL14 (CMK8GX4M1A2400C14)
PSU : Seasonic X-750 (SS-750KM3) 80PLUS Gold
GPU : MSI GeForce GTX 970 GAMING 4G 4 Go
SSD : Crucial BX100 - 500 Go
HDD : Seagate Barracuda 7200.14 SATA 6Gb/s 1 To
boitier : Fractal Design Define R5 Black
J'ai donc monté le tout sans soucis, puis installé windows 10 sur le SSD.
Le seul réglage que j'ai modifié dans le BIOS à cet instant est le profil XMP pour la RAM.
Les températures en utilisation intenssive étaient correctes, de l'ordre de 45°C CPU, et 60°C GPU.
Dès les premiers jours d'utilisation, les problèmes commencent : sur plusieurs jeux (GuildWars2, Borderlands2, ...) la machine plante.
Les symptomes sont : freeze graphique (image figée), et bruit blanc continu (son périodique continu, mais pas toujours les mêmes fréquences audio, je vais essayer de joindre des enregistrement en fin de post).
Le système ne réponds évidemment plus, et l'appui sur la touche CapsLock ne change pas l'état du voyant du clavier.
Au bout de plusieurs minutes d'attente, toujours pas de signe de BlueScreen, un arrêt de la machine par appui long sur le bouton est donc necessaire pour l'éteindre.
Après redemarrage de la machine, la seule chose visible dans le journal des évènements est : "Evenement 41 (63) Kernel-power : Le système a redémarré sans s’arrêter correctement au préalable. Cette erreur peut survenir si le système ne répond plus, s’est bloqué ou n’est plus alimenté de façon inattendue."
[Manipulations tentées]
Plantage aussi bien :
- OS : sur Windows 7 que Windows 10 (Clean install, licence officielle)
- OS : en ayant activé ou non le fastboot dans windows
- OS : En tournant seulement sur HDD ou seulement sur SSD
- OS : installation UEFI ou non UEFI
- OS : Avec ou sans logiciels tiers installés
- HDD/SSD : sur chaque port SATA de la carte mère, avec différents câbles SATA
- Drivers : avec les drivers fourni sur le CD de la carte mère, ceux du site du constructeur, ceux de windows de base
- Drivers : aucune information complémentaire en faisant tourner l'utilitaire système "driver-verifier" (le système freeze de la même façon)
- RAM : En XMP (2400MHz), que par défaut (2166MHz)
- RAM : Avec toute configuration possible (1 ou 2 barrette, sur chaque slot)
- GPU : En tournant sur ma 970, testée sur chaque port PCIe, sur sortie HDMI et DVI
- GPU : En tournant uniquement sur l'iGPU, GTX970 retirée du système
- BIOS : en ayant activé ou non le fastboot dans le BIOS
- BIOS : sur chacun des BIOS publié sur site constructeur
- BIOS : en ayant activé ou non les options "legacy USB" et "virtual USB"
- BIOS : avec les réglages par défaut, et avec un overclocking (de 5%)
- PSU : Branché directement sur secteur, multiprise, ou derrière un onduleur "line-interactive"
- MOBO : socket pris en photo (au cas où un contact serait défectueux), le SAV trouve que le socket est OK
[Tests effectués]
Notation : je désignerais les 2 barettes de RAM par 67 et 72
Tests mémoires (hors OS) :
(memtest86+ ne donnant pas d'erreurs, je suis passé sur memtest86 de passmark)
[67 et 72] memtest86+ : RAS 14h
[67 et 72] memtest86 : au bout de 5h, erreurs test n°10 (Bit fade test, 2 patterns)
[67] memtest86 parallele (sans hammering) : 2h30, RAS
[67] memtest86 sur coeur 0 : 3h, RAS
[72] memtest86 round robin : 10h , RAS
[67 et 72] memtest86 : erreurs au bout de 10h, 1 erreur test n°10 (Bit fade test, 2 patterns) et 139 erreurs test n°13 (hammering)
[72] memtest86 : 12 pass, 15h, RAS
[67] memtest86 : 12 pass, 15h35, RAS
-> Je suis confus face à ces résultats. J'ai des plantages système avec 1 ou 2 barrettes, mais le test n'échoue que quand les 2 barettes sont ensembles...
Tests divers (dans windows 10) :
[67 + 72] OCCT GPU : fail systématique, traduit par freeze ou BSOD (spoiler : GPU clean, car renvoyé au SAV, suivent donc des tests mémoire/CPU)
[67] OCCT Cpu : fail systématiquement rapidement, généralement au bout de 30min
[72] OCCT Cpu : beaucoup de tests n'ont rien montré au bout de 1h à 2h, mais 2 des tests effectués ont plantés au bout de quelques minutes.
[67 + 72] OCCT Cpu : Aléatoire, peut planter instantanément, au bout de quelques minutes, ou au bout de plusieurs heures.
OCCT signale juste : 'erreur' ou erreur sur coeur # 1 ou 0.
Ce test ci est completement aléatoire, j'en ai fait tourné un pendant 2h et un autre pendant plus de 7h !!!
[72] Prime95 Small FFTs : 3h RAS, CPU 75°C
[72] Prime95 Blend : 2h, RAS, CPU 60°C
[67 et 72] aida64 - system memory : fail hardware failure au bout de 1min à 30min
[67] aida64 - system memory : fail systématique aléatoirement au bout de 30sec, ou jusqu'à 45min
[72] aida64 - system memory : RAS pendant plus de 1h30 plusieurs fois
[72] aida64 - all : un test durant 4h20 n'a rien révélé
[67 + 72] aida64 - CPU : RAS
[67] aida64 - cpu : un test durant 5h20 n'a rien révélé
[72] aida64 - cpu : un test durant 5h n'a rien révélé
-> Je suis embetté par ces résultats, "aida64 - system memory" plante quasi-systématiquement avec 67, mais je n'arrive pas à avoir d'erreurs ciblées sur cette barette hors OS dans memtest.
De plus, mon système plante également avec l'autre barette 72, pour laquelle les tests sont encore plus timides...
[BSOD rencontrés]
aida64 - system memory 67 sur B1, 72 sur A1
BSOD : SYSTEM_SERVICE_EXCEPTION
aida64 - memory 67 sur B2
BSOD : PAGE_FAULT_IN_NONPAGED_AREA (ahcache.sys)
GuildWars2 (ce bsod a été obtenu 2 fois) :
BSOD CRITICAL_PROCESS_DIED
[SAV]
Avant d'arriver aux tests sur aida64, les conclusions des autres tests ont amenées à renvoyer au sav :
- GPU : mais ils n'ont rien trouvé (et effectivement en parallèle j'ai eu des soucis sur l'iGPU aussi)
Le GPU étant à priori clean, j'ai du renvoyer le coeur de ma configuration (sans le CPU car malheureusment je ne l'ai pas acheté chez le même revendeur...)
- MOBO + 2 RAM + PSU : Ils trouvent un défaut sur la carte mère, et m'en renvoie une nouvelle. Pas de précision du technicien sur le défaut, mais les plantages subsistent apres remontage.
[Bonus : Section ésothérique : plantage progressif]
Au début de la période (donc fin 2015), parfois le plantage survenait de facon progressive : je voyais la machine commencer à dérailler sous mes yeux. Les symptomes étaient très étranges : disparition du texte dans les jeux (comme si le jeu ne pouvait plus accéder aux données sur le disque ?), ou perte/retard des effets sonores.
[Bonus : Information complémentaire SSD+HDD]
A cette époque, j'avais mon OS sur SSD, et mon HDD en sata me servait de stockage de données. Apres un tel incident, le SSD n'était plus reconnu dans le BIOS au redemmarage. Un débrnachement secteur de la machine pendant quelque sminutes ou un power cycle du SSD (LIEN) permettait de le retrouver.
à noter cependant que part la suite, je n'ai concervé que mon SSD dans ma config (le temps de résoudre le plantage), et ce comportement ne s'est pas reprodui : le SSD était toujours reconnu apres un plantage.
[Résumé et état actuel]
Depuis janvier 2016, je fais donc tourner la machine uniquement avec la barette 72 et le SSD.
Le système semble stable, cependant, aléatoirement un plantage survient.
Il peut ne rien se produire pendant une 15aine de jours d'utilisation quotidienne intenssive, quand soudain, après une session de jeu/internet de 2 à 5h, le freeze se produit.
Le freeze peut avoir plusieurs aspects :
- soit freeze de l'affichage accompagné d'un fort bruit blanc dans les hauts parleurs, (cf fichier bas de page)
- soit freeze de l'affichage seulement accompagné d'un "POC" audio, suivit d'un silence.
Je suis donc à la recherche d'avis/conseils/pistes sur cette histoire, et je suis évidemment prêt à faire des tests complémentaires.
J'ai cependant un peu ralenti mon interaction avec le SAV, vu que ça a tendance à immobiliser ma machine pendant plusieurs semaines, sans forcément donner des résultats.
Actuellement, je me dis que ce sont peut être mes deux barrettes de RAM les coupables (incomptabilité exotique liée à la fabrication des barettes ?).
Il est également possible qu'un de mes drivers soit coupable (bien que j'ai testé plein de versions, et que driver-verifier n'ai rien détecté), particulièrement le driver audio.
J'envisage enfin également un défaut sur mon CPU, mais ceci étant peu probable, je garde cette piste en dernier recours ...
Mon idée du désespoir serait de commander un autre kit de RAM pour tester chez moi, mais avant cette solution je m'ouvre à l'internet pour des conseils.
TL;DR : Instabilité de ma config depuis septembre 2015 (freeze graphique, bruit blanc dans les HP), je désespère à trouver d'où vient de problème.
Merci d'avoir lu tout ça
Liens : fichier audio https://www.dropbox.com/s/9bs6pt0mx [...] 7.wav?dl=0
image du journal d'évènements : https://www.dropbox.com/s/2zlkimk04 [...] 1.png?dl=0
Message édité par markol le 04-04-2016 à 16:42:06