Forum |  HardWare.fr | News | Articles | PC | S'identifier | S'inscrire | Shop Recherche
1244 connectés 

  FORUM HardWare.fr
  Hardware
  Matériels & problèmes divers

  Surchauffe ? Écran noir random (AMD TR4)

 


 Mot :   Pseudo :  
 
Bas de page
Auteur Sujet :

Surchauffe ? Écran noir random (AMD TR4)

n°10619094
Ghashnarb
Posté le 17-08-2019 à 21:06:02  profilanswer
 

Bonjour,  
 
Je me suis monté un nouvel ordi il y a environ 6 mois pour pouvoir bosser tranquillement après être passé en freelance (je suis dev de jeux).  
 
Tout d'abord voilà la config en question :

  • CPU : AMD Ryzen Threadripper 2990WX (32c / 64t)
  • ventirad : Noctua NH-U14S TR4-SP3 (qui était dans la liste des ventirad recommandés pour ce CPU)
  • GPU : AMD Radeon RX Vega 56
  • Carte mère : MSI Carte Mère X399 Gaming Pro Carbon AC
  • RAM : Corsair Vengeance LPX 32Go (2x16Go) DDR4 3200MHz (qui est dans la liste des mémoires compatibles de la CM)
  • Alim : Corsait HX850i (850 Watts / 80+ Platinum)
  • SSD : Samsung 970 PRO 1 To (x2)

Mon problème est que mon ordi semble s'éteindre tout seul de manière assez fréquente. Ce que j'appelle s'éteindre tout seul c'est que les écrans deviennent noirs, le son s'arrête, mon clavier et ma souris qui sont rétro-éclairés s'éteignent... Par contre les ventilo continuent de tourner et les LEDs de la CM sont toujours allumées. Ça arrive globalement depuis que je l'ai monté.
 
J'ai un moyen presque infaillible de reproduire le problème (compilation d'un jeu et/ou cooking des assets) et ça correspond à un moment ou le CPU est chargé à 100% avec peu de charge GPU. Mais j'ai aussi eu le problème "au repos" ou en jouant à des jeux, par exemple Forza qui est loin d'utiliser toute la puissance du CPU.  
 
A savoir que mes firmware/BIOS sont à jours (j'utilise l'outil officiel MSI pour détecter les MAJ et les installer). Windows aussi est à jour.
 
J'ai fait plusieurs tests :

  • RAM : j'ai essayé de n'utiliser qu'une seule barrette de RAM (d'abord une, puis la seconde), j'ai aussi essayé sur plusieurs slots différent, même problème. Le memtest de Windows ne détecte aucune erreur.
  • GPU : j'ai essayé de mettre un vieux GPU et j'ai eu le problème.
  • Alim : j'ai essayé une vieille alim 450W que je sais être fonctionnelle (avec un petit GPU sinon j'imagine que ça aurait été trop peu) et j'ai eu le problème aussi.
  • SSD : au début j'en avais qu'un et j'avais déjà le problème.

J'ai récemment trouvé un workaround : dans l'appli Ryzen Master j'ai activé le Game Mode, qui désactive 3 NUMA (24 coeurs) pour ne garder que le premier (8 coeurs donc). Ce workaround m'a permis de terminer plusieurs gros projets ces derniers mois car je pouvais pas me permettre de renvoyer mon matériel à ce moment là mais maintenant c'est le moment de trouver le problème et donc une solution.
 
Je dirais bien que ça vient de la CM ou du CPU mais je suis pas sur. J'aimerais bien renvoyer le composant défectueux en garantie mais il faut déjà que je l'identifie ...
 
Qu'en pensez-vous ? CPU ou CM ? ou autre ? Est-ce que vous avez des conseils pour diagnostiquer le composant exact qui pose problème ?


Message édité par Ghashnarb le 18-08-2019 à 14:00:42
mood
Publicité
Posté le 17-08-2019 à 21:06:02  profilanswer
 

n°10619315
Ghashnarb
Posté le 18-08-2019 à 14:00:28  profilanswer
 

J'ai vu sur d'autres threads qu'il était souvent conseillé d'utiliser OCCT. J'ai donc fait quelques tests de mon côté.
 

  • CPU:OCCT : pas de problème quand je mets large ou medium data set (< 50°C), par contre quand je mets small data set il s'arrête au bout de 2 minutes pour cause d'overheat (les Node CPU étant à 64°C pendant le temps du test, 64 étant la température max du CPU).
  • CPU:Linpack : idem il s'arrête à cause d'overheat.
  • GPU:3D : pas de souci à priori.
  • Power Supply : je crois que ça ne pose pas de souci.


Pour tester j'ai augmenté la limite dans OCCT et au bout de quelques minutes l'ordi s'est bien éteint...
 
Donc ce serait une surchauffe ? Ça me semble bizarre car j'ai monté la même config (en tout cas même CPU et même ventirad) à un client et ils n'ont jamais eu le problème alors qu'ils ont le même cas d'utilisation que moi.

n°10619366
smad
Posté le 18-08-2019 à 16:28:38  profilanswer
 

Salut,
 
Je ne suis pas du tout connaisseur de ta plateforme, mais à la vue des symptômes, je contrôlerais la température des VRM de la carte mère avec HWmonitor ... en rapport peut-être avec la surchauffe indiquée par OCCT.
Perso, j'ai rajouté un ventilo sur les VRM de ma MSI B350 Tomahawk...
 
A voir donc..


Message édité par smad le 18-08-2019 à 16:29:27
n°10619465
Ghashnarb
Posté le 18-08-2019 à 19:43:34  profilanswer
 

Merci pour ta réponse, je viens de regarder avec HWmonitor. J'ai pas trouvé la température des VRM, voici les infos que j'ai au repos :
https://image.noelshack.com/minis/2019/33/7/1566147583-temperatures.png
 
Les chiffres sont les mêmes que dans OCCT ... et je pense qu'ils sont faux. En effet quand je faisais des tests avec OCCT j'ai suivi un peu les différentes températures et le CPUTIN et le TMPIN1 montent chacun à plus de 95°C, ce qui semble énorme et surtout c'est incohérent avec les chiffres remontés par le CPU (au moment de la capture ci-dessus < 40° et en charge 64°C quand les 2 autres sont à 95°C). En gros les capteurs semblent ajouter 25°C à la température CPU. J'ai vu un truc comme ça quelque part (+27°C sur les TR4) donc j'imagine que c'est normal.
 
Je me demande si c'est vraiment une surchauffe du coup ... Enfin disons que OCCT voit 90°C et traite ça comme une surchauffe (assez logiquement) mais si les chiffres récupérés sont supérieurs de 27°C par rapport à la réalité alors c'est pas vraiment une surchauffe. C'est logique ce que je dis ? J'ai l'impression de tourner en rond :pt1cable:  
 
Je vais quoiqu'il arrive rajouter un ventilo pour expulser l'air du boîtier en plus de ce que j'ai déjà...

n°10619469
Ghashnarb
Posté le 18-08-2019 à 19:47:09  profilanswer
 

Pour info, dans OCCT comme dans HWmonitor les consos par coeurs sont buggées aussi. Ça marche globalement mais de manière assez aléatoire je vois des consos instantanées de plusieurs milliers de W. La par exemple, après l'avoir laissé tourné pendant plus d'une heure, j'ai des max de 130.000W sur chaque coeurs en moyenne. Alors que globalement 1 coeur au repos consomme < 1W, c'est juste que dès fois le truc pète un cable... Je sais pas si c'est lié ? Par contre la conso sur le package (la somme des coeurs j'imagine) est bien de 50W, pas de problème à signaler là dessus je dirais.


Message édité par Ghashnarb le 18-08-2019 à 19:47:58
n°10619599
zonka
x58 forever!
Posté le 19-08-2019 à 00:15:12  profilanswer
 

Plop.
 
Epineux souci que le tien ; non connaisseur de ta plate-forme également, mais simplement, on est bien d'accord : en charge maximale et sans aucun overclock, ce CPU peut consommer en pointe quelque chose comme *** 450 WATTS ***
 
La piste des VRM est intéressante : pas toujours faciles à monitorer selon la plate-forme, et motif de coupure en cas de surchauffe.
 
AMD continue à être très "bricolo" au niveau de leur gestion/rapport de températures : c'est assez tiré par les cheveux : https://www.guru3d.com/articles-pag [...] iew,8.html
 
 

Citation :

Temperature Reporting
 
To keep a "consistent fan policy," AMD is forcing a 27C offset on all models Ryzen Threadripper processors. This makes them report temperature a good 10C above what the sensor reads. The rest of the models on the AM4 Platform have the same maximum tCTL value.  The primary temperature reporting sensor of the AMD Ryzen processor is a sensor called “T Control,” or tCTL for short. The tCTL sensor is derived from the junction (Tj) temperature—the interface point between the die and heatspreader—but it may be offset on certain CPU models so that all models on the AM4 Platform have the same maximum tCTL value. This approach ensures that all AMD Ryzen and thus Ryzen Threadripper processors have a consistent fan policy.
 
In short, if you use any monitoring software, you need to look at the Tdie as temperature, it's the correct one to look at.


Message édité par zonka le 19-08-2019 à 00:20:39

---------------
Guide OC x58 - Guide d'achat de config - ALIMS:qui fait quoi? - RKO - Radiooooo
n°10619605
Ghashnarb
Posté le 19-08-2019 à 00:38:05  profilanswer
 

Oui c'est de ça dont je parlais (les +27°C).
 
Par contre je me demande si j'ai pas pris une alim trop petite du coup... Enfin j'imagine que ça passe mais juste.
 
Pour info, j'ai désactivé une option dans l'UEFI (Performance boost je crois) et ça me semble beaucoup plus stable. J'ai refait le test OCCT small data set et ça a tenu plus d'une heure (je l'ai arrêté manuellement). Je crois que cette option permettait d'avoir de l'overclocking automatique, je voyais mon proc passer à parfois 4.0 GHz de manière temporaire. Maintenant il est bloqué à 3 GHz et comme je disais ça semble stable. Je vais faire plus de tests demain mais ça semble prometteur.
 
Étant donné que je n'ai strictement aucune expérience en overclocking (j'ai quelques connaissances, par rapport à des trucs que j'ai lu ou entendu) est-ce que quelququ'un peut me dire si un overclocking instable peut causer les problèmes que je rencontre ? (arrêt subite de manière presque aléatoire, souvent en forte charge) Finalement, si c'est possible, alors me semblerait plus cohérent qu'une surchauffe car j'imagine que l'arret de la machine n'est pas censé arriver à des températures aussi "faibles". De ce que j'ai lu aujourd'hui, quand un threadripper dépasse les 68°C ça va surtout ralentir (throttling) mais c'est censé continuer à marcher.
 
Je vais quand même regarder pour améliorer l'air flow de ma tour car je ne suis pas très satisfait. Tout à l'heure je l'ai ouverte (haut et côté) et j'ai perdu 4°C en quelques minutes.


Aller à :
Ajouter une réponse
  FORUM HardWare.fr
  Hardware
  Matériels & problèmes divers

  Surchauffe ? Écran noir random (AMD TR4)

 

Sujets relatifs
Écran noir au démarrage lors d'une amélioration...Problème d'écran bleu
Secteurs Instables + Ecran qui se fige fréquemmentRecherche top écran 27" 1440p en 144hz mini et G-Sync
MSI AMD RX 580 8G Armor OCFaut-il tout miser sur l'IA d'Nvidia au dépend d'AMD?
Pas d'affichage écranConseil achat ecran 4K
PC affiche un écran noir 
Plus de sujets relatifs à : Surchauffe ? Écran noir random (AMD TR4)


Copyright © 1997-2022 Hardware.fr SARL (Signaler un contenu illicite / Données personnelles) / Groupe LDLC / Shop HFR