Forum |  HardWare.fr | News | Articles | PC | S'identifier | S'inscrire | Shop Recherche
1401 connectés 

 


 Mot :   Pseudo :  
 
 Page :   1  2
Page Suivante
Auteur Sujet :

[HFR] Actu : Patch Ryzen pour Ashes of the Singularity

n°10114173
LuDFo
Posté le 31-03-2017 à 14:11:33  profilanswer
3Votes positifs
 

Reprise du message précédent :

HashBoost a écrit :

Mmm, intéressant mais cela démontre deux choses qui ne vont pas spécialement plairent aux pro AMD :
 
- 400h de boulot en plus pour optimiser un jeu / moteur pour un type particulier de processeur, ne rêvons pas, ce n'est possible que si AMD finance le projet.
 
- La plupart des programmes sont compilés pour du x86-generic et ne tirent absolument pas profit des améliorations architecturales des derniers modèles. Il est vraisemblable qu'avec 400h de travail sur le dernier né d'Intel apporterait elles aussi un bond en performance similaire. Et le compilateur Intel lui-même supporte des options qui boostent sacrément les performances au détriment d'autres types de CPU, ce qui fait que ces optimisations ne sont que rarement utilisées.


 
On doit pas avoir la même valeur du travail, 400h c'est justement rien du tout, 1 semaine de travail pour 10 personnes, n'importe quel studio digne de ce nom peut se le permettre haut la main, ne serait-ce que pour montrer qu'ils ont bien opti le jeu partout. Et à terme, ce ne sera même plus un effort puisque les jeux seront directement optimisés pendant leur développement, donc si ça viendra à n'en pas douter.

mood
Publicité
Posté le 31-03-2017 à 14:11:33  profilanswer
 

n°10114192
sagittaire
Posté le 31-03-2017 à 14:31:26  profilanswer
0Votes positifs
 

Oui mais l'optimisation du code ce n'est pas uniquement ça. Par exemple les instructions AVX/AVX2 sur intel sont plus performantes que celle de Rysen. Par contre les instructions SSE2/SSE3/SSE4 sur Rysen sont très performantes. Cela implique qu'une application qui va utiliser préférentiellement les instructions AVX/AVX2 va favoriser les derniers CPU intel:
http://blog-imgs-104.fc2.com/r/i/g/rigaya34589/bench_20170320_x265_10bit.png
 
Avec le x265, on voit que Rysen n'est pas plus rapide si on utilise les instructions AVX2 et parfois même moins rapide, alors que le gain peut-être de l'ordre de 20% avec Intel. Même si les instructions AVX/AVX2 sont beaucoup plus rapide chez intel que chez AMD, on ne devrait pas voir de baisse de performance avec Rysen quand on utilise les instructions AVX/AVX2. Cela implique que le code x265 n'est vraiment pas bien optimisé pour Rysen.
 
Je pense que l'on doit avoir des problèmes de ce type dans la plupart des applications/jeux: simplement un  équilibrage dans l'utilisation des ressources pour Rysen qui n'est pas optimal car les applications sont optimisées pour Intel. Je pense que désactiver tout simplement l'utilisation des instructions AVX/AVX2 au profit des SSE2/SSE3/SSE4 (quand c'est possible) devrait permettre à pas mal d'application (ou de jeux) de fonctionner un peu plus vite avec Rysen, en attendant des optimisation spécifique pour l'architecture Rysen.

Message cité 1 fois
Message édité par sagittaire le 31-03-2017 à 14:33:21
n°10114198
Flyman81
Posté le 31-03-2017 à 14:34:29  profilanswer
2Votes positifs
 

Ryzen, 'z'.

n°10114220
Marc
Super Administrateur
Chasseur de joce & sly
Posté le 31-03-2017 à 14:51:15  profilanswer
3Votes positifs
 

sagittaire :

 

- sur le graphique je ne vois pas de cas ou c'est moins rapide en AVX2 que sans AVX2
- il est normal que ce ne soit pas plus rapide en AVX2 sur Ryzen puisque les FP sont 128-bit contre 256-bit chez Intel, dès lors le passage au 256-bit de l'AVX2 n'apporte rien alors que chez Intel la puissance de traitement est potentiellement doublée par rapport à l'AVX et au SSE

Message cité 1 fois
Message édité par Marc le 31-03-2017 à 15:11:00
n°10114230
samurai80
Posté le 31-03-2017 à 15:00:43  profilanswer
0Votes positifs
 

Pour ceux qui lisent pas le japonais (je pense qu'il y en a :whistle: ), les barres claires sont les cas avec AVX2 off :jap:  
 

Citation :

Cela implique que le code x265 n'est vraiment pas bien optimisé pour Rysen.

Peut etre. Apres on peut aussi dire que Ryzen n'est pas optimisé pour les encodeurs x265 actuels.
 

Citation :

Je pense que désactiver tout simplement l'utilisation des instructions AVX/AVX2 au profit des SSE2/SSE3/SSE4 (quand c'est possible) devrait permettre à pas mal d'application (ou de jeux) de fonctionner un peu plus vite avec Rysen, en attendant des optimisation spécifique pour l'architecture Rysen.

En dehors de l'encodage a mon humble avis il n'y a pas enormement de softs utilisant AVX2. A ma connaissance pas de jeu en tous cas.

n°10114266
sagittaire
Posté le 31-03-2017 à 15:27:58  profilanswer
0Votes positifs
 

Marc a écrit :

sagittaire :
 
- sur le graphique je ne vois pas de cas ou c'est moins rapide en AVX2 que sans AVX2
- il est normal que ce ne soit pas plus rapide en AVX2 sur Ryzen puisque les FP sont 128-bit contre 256-bit chez Intel, dès lors le passage au 256-bit de l'AVX2 n'apporte rien alors que chez Intel la puissance de traitement est potentiellement doublée par rapport à l'AVX et au SSE


 
pour un encodage x265 en 8bits ou x264 8 bits c'est le cas:
http://blog-imgs-104.fc2.com/r/i/g/rigaya34589/bench_20170320_x265_8bit.png
 
http://blog-imgs-104.fc2.com/r/i/g/rigaya34589/bench_20170320_x264_8bit.png
 
De plus les instructions AVX2 sont, je pense, tout de même censées faire gagner des cycles CPU même en 128 bits car elles permettent des optimisations bien plus avancées que les instructions SSE2/SSE3 ou SSE4?


Message édité par sagittaire le 31-03-2017 à 20:52:50
n°10114327
Marc
Super Administrateur
Chasseur de joce & sly
Posté le 31-03-2017 à 16:10:12  profilanswer
1Votes positifs
 

Oui quand tu monte en version il y'a d'autres modifications mais entre AVX et AVX2 il n'y a que globalement que le 256-bit et le FMA.
 
Depuis HSW chez Intel en gros on peut avoir 2 FMA, 2 FMUL ou 1 FMA/FMUL+FADD par cycle. C'est aussi possible de faire deux additions par cycle mais l'unité FMA aura une latence > à l'unité FADD.
Avec Ryzen chez AMD on peut avoir en 128-bits 2 FMA ou 2 FADD+2 FMUL, et en 256-bits 1 FMA ou 1 FADD + 1 FMUL.
 
Donc en fonction de la charge liée au jeu d'instruction forcément ça ne réagit pas de la même façon.

n°10114549
luxy
le futur c'est ZEN et hydrogen
Posté le 31-03-2017 à 20:13:24  profilanswer
0Votes positifs
 

bien joué AMD

n°10114837
Elistrae
Posté le 01-04-2017 à 09:15:10  profilanswer
1Votes positifs
 

le fond du soucis proviens des compilateurs, la plus part des dev ne s'en preocupe pas trop et utilise du compilateur intel qui optimise pour les proc intel sur la base que c'est les processeurs les plus nombreux sur le parc pc. Bilan les perf AMD sont dépréciés et cela donne un cercle vicieux où AMD à l'air moins performant donc moins acheté...

n°10114843
Bourkkonen
Posté le 01-04-2017 à 09:23:24  profilanswer
2Votes positifs
 

c0rwin a écrit :

un G4460... pourquoi pas un Core 2 Duo aussi?


 
Ben quoi ? J'ai un Core 2 Duo E8400 avec une 4870 1G et j'arrive à me marrer sur rFactor2, Colin Mc Rae, Empire Total War, Silent Hunter 3-4, Far Cry 2 et last but not least, le démineur !!
Un peu de respect pour les antiquités !!

mood
Publicité
Posté le 01-04-2017 à 09:23:24  profilanswer
 

n°10114845
Marc
Super Administrateur
Chasseur de joce & sly
Posté le 01-04-2017 à 09:26:52  profilanswer
2Votes positifs
 

Source ? C'est plutôt celui de MS qui est utilisé. Pour celui d'Intel par le passé nous avions vu par le passé qu'il apportait des gains par rapport à VS/GCC sur Intel... et AMD (certes moins) !
 
Par contre le souci est au niveau de la détection auto des archis pour les instructions avancées qui ne marche qu'avec les Intel.

n°10114875
Bébé Yoda
Posté le 01-04-2017 à 10:23:43  profilanswer
0Votes positifs
 

Bourkkonen a écrit :

 

Ben quoi ? J'ai un Core 2 Duo E8400 avec une 4870 1G et j'arrive à me marrer sur rFactor2, Colin Mc Rae, Empire Total War, Silent Hunter 3-4, Far Cry 2 et last but not least, le démineur !!
Un peu de respect pour les antiquités !!

 

Et tu n'arrives pas à faire tourner ashes of the singularity a 144 FPS avec ?  :O

n°10114974
sagittaire
Posté le 01-04-2017 à 12:08:41  profilanswer
0Votes positifs
 

Marc a écrit :

Source ? C'est plutôt celui de MS qui est utilisé. Pour celui d'Intel par le passé nous avions vu par le passé qu'il apportait des gains par rapport à VS/GCC sur Intel... et AMD (certes moins) !
 
Par contre le souci est au niveau de la détection auto des archis pour les instructions avancées qui ne marche qu'avec les Intel.


 
Ca à l'air en fait d'être très variable:
https://forum.doom9.org/showthread. [...] ost1801899
 
Ce qui rend les comparaisons très difficile: la compilation optimale pour le CPU X ne sera plus optimale pour le le CPU Y.  
A la limite pour tirer le max de chaque archi, faudrait tester avec un profil de compilation différent pour chaque CPU.
 
D'après mes propres test, VS 2017 est en effet très performant pour les CPU AVX/AVX2 mais GCC 7.0 reprend la main en SSE2/SSE3/SSE4.
GCC 7.0 semble obtenir des performances beaucoup plus homogène que VS 2017, en tout cas pour une compilation x265 avec mon CPU.
Par contre ICC semble un peu largué sur les compilations x265.


Message édité par sagittaire le 01-04-2017 à 12:12:45
n°10115081
Bourkkonen
Posté le 01-04-2017 à 13:30:37  profilanswer
0Votes positifs
 

@zuf : pas essayé.. C'est bien ce truc ?

n°10116415
KrisKross
Posté le 03-04-2017 à 10:51:49  profilanswer
0Votes positifs
 

Marc a écrit :

https://twitter.com/AMDRyzen/status/847434538380808196
 
Le CEO d'Oxide parle pendant 2mn, mais ne donne aucune info sur ce qui a été fait... :sleep: dommage :/


 
Puisqu'on source via twitter, un fil sur twitter indique qu'une correction /notable/ du patch pour AOTS serait finalement l'abus des écritures non-temporelles (qui bypassent les caches L1 et L2). Généralement utilisées pour du streaming (write combining) vers ou de la mémoire du GPU.
 
Il semble qu'elles causent un flush du cache, justement, sur RyZen.

mood
Publicité
Posté le   profilanswer
 

 Page :   1  2
Page Suivante

Aller à :
Ajouter une réponse
 

Sujets relatifs
[HFR] Actu : Calyos lance son boitier passif NSG S0 sur KSRam 3200mhz pour Ryzen ? Je suis perdu
[HFR] Actu : Biostar 1er sur le mini-ITX AM4[HFR] Actu : Kaby Lake décliné en Xeon E3 v6
[HFR] Focus : Intel Technology and Manufacturing Day 2017[HFR] Actu : 3 GTX 1080 Ti personnalisées pour Gigabyte
Plus de sujets relatifs à : [HFR] Actu : Patch Ryzen pour Ashes of the Singularity


Copyright © 1997-2022 Hardware.fr SARL (Signaler un contenu illicite / Données personnelles) / Groupe LDLC / Shop HFR