Forum |  HardWare.fr | News | Articles | PC | S'identifier | S'inscrire | Shop Recherche
1799 connectés 

 

 

L'évolution de votre machine...




Attention si vous cliquez sur "voir les résultats" vous ne pourrez plus voter
Les invités peuvent voter

 Mot :   Pseudo :  
  Aller à la page :
 
 Page :   1  2  3  4  5  ..  367  368  369  ..  988  989  990  991  992  993
Auteur Sujet :

[Topic Unique] Processeurs AMD Bulldozer FX-8100/6100/4100 (32nm)

n°7926117
Darkad
Dark side only ...
Posté le 02-06-2011 à 22:59:42  profilanswer
 

Reprise du message précédent :

bulldozer_fusion a écrit :


d'accord donc des qu'on voit sample ES avec tout un tas de chiffres lettres = fake
j'tacherais de m'en rappeler désormais  :jap:


 
 
Mais non .... les chiffre c'est justement par ce que c'est un sample ES apparemment B0 ... [:klemton]
c'est pour cela qu'ils ont pas eu peur de le faire exploser à 6 Ghz avec de l'azote ....  :whistle:  
 
 :lol: [:aroh]


---------------
[Topic unique] ASROCK /// Chipset 9xx /// AM3+ & Ma Config
mood
Publicité
Posté le 02-06-2011 à 22:59:42  profilanswer
 

n°7926118
Wirmish
¡sıɹdɹns zǝɹǝs snoʌ
Posté le 02-06-2011 à 23:00:36  profilanswer
 

thevv27 a écrit :

Avec de la PC16000 on part à genre 8-9-8-24 pour les meilleures et 9-9-9 ou moins bien pour les autres...


T'es sûr ?
 
G.Skill Série Pi, DDR3-2000 MHz (PC3-16000 CAS 6-9-6-24.
G.Skill Série Pi, DDR3 2400 MHz (PC3-19200) CAS 8-11-8-28
 
 [:double c]

n°7926123
Darkad
Dark side only ...
Posté le 02-06-2011 à 23:04:46  profilanswer
 

[:already 47:2] //Troll mode ON //
voilà un vrai fake ... bon c'est le Fake du jour :D
 
http://slappa.ln2cooling.com/Misc/10k.PNG
 
//Troll mode OFF //
 
pour les RAM j'ai vu ça :
 
http://www.ldlc.com/fiche/PB00110239.html
 
et  
 
http://www.materiel.net/barrette-m [...] 66824.html

Message cité 1 fois
Message édité par Darkad le 02-06-2011 à 23:16:18

---------------
[Topic unique] ASROCK /// Chipset 9xx /// AM3+ & Ma Config
n°7926129
shenron67
Sure we can. We're Sega.
Posté le 02-06-2011 à 23:13:11  profilanswer
 

voltage trop haut pour un bulldo, clairement un fake, bulldozer tient cette fréquence avec 1.45 V :D

n°7926141
Wirmish
¡sıɹdɹns zǝɹǝs snoʌ
Posté le 02-06-2011 à 23:34:34  profilanswer
 

Gigathlon a écrit :

Logiquement, la FPU devrait souffrir un peu du partage, sans que ça ne soit dramatique pour autant, surtout compte tenu du gain en terme de transistors et consommation que ça devrait apporter.
 
Bref, je vois plutôt ça comme "ALU qui crève le plafond et FPU tout juste comparable à l'i7" (la comparaison avec un prétendu avantage de K10 en FP étant totalement à côté de la plaque... ça date du K7 ça :/), ce qui est loin d'être mauvais.


Je ne suis pas de ton avis... et voici pourquoi :
 
 
Exécution d'un ou de 2 threads dans un module :
 
1. Le core actif n'exécute que des instructions INT.
    · Le FPU se met alors en mode repos, ne consommant plus que 2% de sa limite normale.
 
2. Le core actif exécute des instructions INT et des instructions FP.
    · Si l'instruction FP à traiter est de type 128 bit (AVX, SSE, FMUL, FADD, ou FMAC), le FPU traite alors cette instruction normalement.
    · Si l'instruction FP suivante est aussi de 128 bit, alors le FPU exécute ces 2 instructions en parallèle, doublant ainsi les perfs.
    · Si une des instructions FP du pipeline est de 256 bit (AVX), alors le FPU combine les 2 FPUs de 128 bit, ce qui double les perfs vu qu'avant l'AVX cela nécessitait 2 instructions de 128 bit.
 
Si les 2 cores d'un module sont actifs, le Cache L2/Scheduler/Prefetch/etc est alors partagé entre les 2 threads.
Les performances diminuent alors de 10% par core (dans un même module).
 
Si les 2 cores sont actifs il peut se passer 4 choses pour le FPU:
    · Les 2 cores n'ont pas d'instructions FP à traiter, ce qui endors le FPU.
    · Le core #0 doit traiter une instruction FP:
           · Si l'instruction est de 128 bit (AVX, SSE, FMUL, FADD, ou FMAC), le core #0 s'empare de la moitié du FPU.
           · Si l'instruction est de 256 bit (AVX), le core #0 s'empare de la totalité du FPU.
    · Le core #1 doit traiter une instruction FP:
           · Si l'instruction est de 128 bit (AVX, SSE, FMUL, FADD, ou FMAC), le core #1 s'empare de la moitié du FPU.
           · Si l'instruction est de 256 bit (AVX), le core #1 s'empare de la totalité du FPU.
    · Le core #0 et le core #1 doivent traiter une instruction FP:
           · Si les 2 instructions sont de 128 bit (AVX, SSE, FMUL, FADD, ou FMAC), chaque core s'empare d'une moitié du FPU.
           · Si une des 2 instructions est de 256 bit (AVX), les 2 instructions FP s'exécutent en série.
 
Donc, si en tout temps chaque core doit traiter des instructions FP, alors chaque core aura à sa disposition un FPU de 128 bit, ce qui offre une puissance de calcul égale à l'archi "Stars".
Par contre, s'il n'y a qu'un thread, ou si les FP ne sont pas exécutés en même temps par les 2 cores d'un même module, alors les perfs sont doublés.
 
Le fait de partager le FPU ne ralentira l'exécution du code que si les 2 threads doivent traiter simultanément une instruction FP et qu'au moins une de ces 2 instructions est de 256 bit.
 
Étant donné qu'en moyenne un programme "FP heavy" ne contient qu'environ 40% d'instructions FP, et qu'aucun de ceux-ci n'utilise encore l'AVX, le ralentissement ne se produira qu'en de très rares occasions.
 
Nombre d'instruction FP dans une appli utilisant fortement les FP :
http://www.amdzone.com/phpbb3/download/file.php?id=394
 
Le ~40% en FP n'est pas anodin, loin de là.
 
En effet, s'il y a en moyenne moins de 50% d'instructions FP à exécuter, cela veut dire que le bloc FPU d'un core est occupé moins de 50% du temps.
Si un core est occupé moins de 50% du temps, qu'arriverait-il si 2 cores se partageaient le même bloc FPU ?
Réponse: Cela n'aurait pratiquement aucune incidence sur les performances réelles, mais ça ferait économiser énormément d'espace.
 

Citation :

The AMD Family 15h processor floating point unit (FPU) was designed to provide four times the raw FADD and FMUL bandwidth as the original AMD Opteron and Athlon 64 processors.
 
The FPU can receive up to four ops per cycle. These ops can only be from one thread, but the thread may change every cycle. Likewise the FPU is four wide, capable of issue, execution and completion of four ops each cycle. Once received by the FPU, ops from multiple threads can be executed.
 
• Within the FPU, up to two loads per cycle can be accepted, possibly from different threads.
• There are four logical pipes: two FMAC and two packed integer. For example, two 128-bit FMAC and two 128-bit integer ALU ops can be issued and executed per cycle.
• Two 128-bit FMAC units. Each FMAC supports four single precision or two double-precision ops.
 
http://i624.photobucket.com/albums/tt329/vietthanhpro/FPUE.jpg


 
Floating-Point Unit
 
The AMD Family 15h processor floating point unit (FPU) was designed to provide four times the raw
FADD and FMUL bandwidth as the original AMD Opteron and Athlon 64 processors
. It achieves this
by means of two 128-bit fused multiply-accumulate (FMAC) units which are supported by a 128-bit
high-bandwidth load-store system. The FPU is a coprocessor model that is shared between the two
cores of one AMD Family 15h compute unit. As such it contains its own scheduler, register files and
renamers and does not share them with the integer units. This decoupling provides optimal
performance of both the integer units and the FPU. In addition to the two FMACs, the FPU also
contains two 128-bit integer units which perform arithmetic and logical operations on AVX, MMX
and SSE packed integer data.
 
A 128-bit integer multiply accumulate (IMAC) unit is incorporated into FPU pipe 0. The IMAC
performs integer fused multiply and accumulate, and similar arithmetic operations on AVX, MMX
and SSE data. A crossbar (XBAR) unit is integrated into FPU pipe 1 to execute the permute
instruction along with shifts, packs/unpacks and shuffles. There is an FPU load-store unit which
supports up to two 128-bit loads and one 128-bit store per cycle.
 
http://i624.photobucket.com/albums/tt329/vietthanhpro/FPUE.jpg
 
FPU Features Summary and Specifications:
 • The FPU can receive up to four ops per cycle. These ops can only be from one thread, but the
    thread may change every cycle. Likewise the FPU is four wide, capable of issue, execution and
    completion of four ops each cycle. Once received by the FPU, ops from multiple threads can be
    executed.
 • Within the FPU, up to two loads per cycle can be accepted, possibly from different threads.
 • There are four logical pipes: two FMAC and two packed integer. For example, two 128-bit
    FMAC and two 128-bit integer ALU ops can be issued and executed per cycle.
 • Two 128-bit FMAC units. Each FMAC supports four single precision or two double-precision ops.
 • FADDs and FMULs are implemented within the FMAC's.
 • x87 FADDs and FMULs are also handled by the FMAC.
 • Each FMAC contains a variable latency divide/square root machine.
 • Only 1 256-bit operation can issue per cycle, however an extra cycle can be incurred as in the case
    of a FastPath Double if both micro ops cannot issue together.
 • Two-way 128-bit wide floating-point execution
 • Legacy single-instruction multiple-data (SIMD) instruction extensions, as well as support for
    XOP, FMA4, VPERMILx, and Advanced Vector Extensions (AVX).
 • Deep out-of-order floating-point execution
 • Improved data transfer between floating-point registers and general purpose registers
 • Improved floating-point register to floating-point register moves
 

Citation :

Page 23: AMD Family 15h processors add support for 128-bit floating-point execution units. As a result, the throughput of both single-precision and double-precision floating-point SIMD vector operations has improved by 2X over the previous generation of AMD processors.
 
Page 25: Instruction Fetching Improvements - While previous AMD64 processors had a single 32-byte fetch window, AMD Family 15h processors have two 32-byte fetch windows, from which four μops can be selected. These fetch windows, when combined with the 128-bit floating-point execution unit, allow the processor to sustain a fetch/dispatch/retire sequence of four instructions per cycle.
 
Page 26: Several integer and floating-point instructions have improved latencies and decode types on AMD Family 15h processors.
 
Page 26: Current AMD Family 15h processors support two SIMD logical/shuffle units, one in the FMUL pipe and another in the FADD pipe, while previous AMD64 processors have only one SIMD logical/shuffle unit in the FMUL pipe. As a result, the SIMD shuffle instructions can be processed at twice the previous bandwidth on AMD Family 15h processors. Furthermore, the PSHUFD and SHUFPx shuffle instructions are now DirectPath instructions instead of VectorPath instructions on AMD Family 15h processors and take advantage of the 128-bit floating point execution units. Hence, these instructions get a further 2X boost in bandwidth, resulting in an overall improvement of 4X in bandwidth compared to the previous generation of AMD processors.


 
 [:mrfreeze]

Message cité 2 fois
Message édité par Wirmish le 02-06-2011 à 23:36:34
n°7926144
Darkad
Dark side only ...
Posté le 02-06-2011 à 23:41:25  profilanswer
 

oula oula oula ... moi pas comprendre  ... :D


---------------
[Topic unique] ASROCK /// Chipset 9xx /// AM3+ & Ma Config
n°7926146
Wirmish
¡sıɹdɹns zǝɹǝs snoʌ
Posté le 02-06-2011 à 23:45:10  profilanswer
 

Houlàlà, perkam a mal pris le retard du Buldo.

Citation :

"**** you, AMD." - perkam, XS

n°7926152
wolfflyter
Posté le 02-06-2011 à 23:50:00  profilanswer
 

Wirmish a écrit :


Je ne suis pas de ton avis... et voici pourquoi :
 
 
Exécution d'un ou de 2 threads dans un module :
 
1. Le core actif n'exécute que des instructions INT.
    · Le FPU se met alors en mode repos, ne consommant plus que 2% de sa limite normale.
 
2. Le core actif exécute des instructions INT et des instructions FP.
    · Si l'instruction FP à traiter est de type 128 bit (AVX, SSE, FMUL, FADD, ou FMAC), le FPU traite alors cette instruction normalement.
    · Si l'instruction FP suivante est aussi de 128 bit, alors le FPU exécute ces 2 instructions en parallèle, doublant ainsi les perfs.
    · Si une des instructions FP du pipeline est de 256 bit (AVX), alors le FPU combine les 2 FPUs de 128 bit, ce qui double les perfs vu qu'avant l'AVX cela nécessitait 2 instructions de 128 bit.
 
Si les 2 cores d'un module sont actifs, le Cache L2/Scheduler/Prefetch/etc est alors partagé entre les 2 threads.
Les performances diminuent alors de 10% par core (dans un même module).
 
Si les 2 cores sont actifs il peut se passer 4 choses pour le FPU:
    · Les 2 cores n'ont pas d'instructions FP à traiter, ce qui endors le FPU.
    · Le core #0 doit traiter une instruction FP:
           · Si l'instruction est de 128 bit (AVX, SSE, FMUL, FADD, ou FMAC), le core #0 s'empare de la moitié du FPU.
           · Si l'instruction est de 256 bit (AVX), le core #0 s'empare de la totalité du FPU.
    · Le core #1 doit traiter une instruction FP:
           · Si l'instruction est de 128 bit (AVX, SSE, FMUL, FADD, ou FMAC), le core #1 s'empare de la moitié du FPU.
           · Si l'instruction est de 256 bit (AVX), le core #1 s'empare de la totalité du FPU.
    · Le core #0 et le core #1 doivent traiter une instruction FP:
           · Si les 2 instructions sont de 128 bit (AVX, SSE, FMUL, FADD, ou FMAC), chaque core s'empare d'une moitié du FPU.
           · Si une des 2 instructions est de 256 bit (AVX), les 2 instructions FP s'exécutent en série.
 
Donc, si en tout temps chaque core doit traiter des instructions FP, alors chaque core aura à sa disposition un FPU de 128 bit, ce qui offre une puissance de calcul égale à l'archi "Stars".
Par contre, s'il n'y a qu'un thread, ou si les FP ne sont pas exécutés en même temps par les 2 cores d'un même module, alors les perfs sont doublés.
 
Le fait de partager le FPU ne ralentira l'exécution du code que si les 2 threads doivent traiter simultanément une instruction FP et qu'au moins une de ces 2 instructions est de 256 bit.
 
Étant donné qu'en moyenne un programme "FP heavy" ne contient qu'environ 40% d'instructions FP, et qu'aucun de ceux-ci n'utilise encore l'AVX, le ralentissement ne se produira qu'en de très rares occasions.
 
Nombre d'instruction FP dans une appli utilisant fortement les FP :
http://www.amdzone.com/phpbb3/download/file.php?id=394
 
Le ~40% en FP n'est pas anodin, loin de là.
 
En effet, s'il y a en moyenne moins de 50% d'instructions FP à exécuter, cela veut dire que le bloc FPU d'un core est occupé moins de 50% du temps.
Si un core est occupé moins de 50% du temps, qu'arriverait-il si 2 cores se partageaient le même bloc FPU ?
Réponse: Cela n'aurait pratiquement aucune incidence sur les performances réelles, mais ça ferait économiser énormément d'espace.
 

Citation :

The AMD Family 15h processor floating point unit (FPU) was designed to provide four times the raw FADD and FMUL bandwidth as the original AMD Opteron and Athlon 64 processors.
 
The FPU can receive up to four ops per cycle. These ops can only be from one thread, but the thread may change every cycle. Likewise the FPU is four wide, capable of issue, execution and completion of four ops each cycle. Once received by the FPU, ops from multiple threads can be executed.
 
• Within the FPU, up to two loads per cycle can be accepted, possibly from different threads.
• There are four logical pipes: two FMAC and two packed integer. For example, two 128-bit FMAC and two 128-bit integer ALU ops can be issued and executed per cycle.
• Two 128-bit FMAC units. Each FMAC supports four single precision or two double-precision ops.
 
http://i624.photobucket.com/albums [...] o/FPUE.jpg


 
Floating-Point Unit
 
The AMD Family 15h processor floating point unit (FPU) was designed to provide four times the raw
FADD and FMUL bandwidth as the original AMD Opteron and Athlon 64 processors
. It achieves this
by means of two 128-bit fused multiply-accumulate (FMAC) units which are supported by a 128-bit
high-bandwidth load-store system. The FPU is a coprocessor model that is shared between the two
cores of one AMD Family 15h compute unit. As such it contains its own scheduler, register files and
renamers and does not share them with the integer units. This decoupling provides optimal
performance of both the integer units and the FPU. In addition to the two FMACs, the FPU also
contains two 128-bit integer units which perform arithmetic and logical operations on AVX, MMX
and SSE packed integer data.
 
A 128-bit integer multiply accumulate (IMAC) unit is incorporated into FPU pipe 0. The IMAC
performs integer fused multiply and accumulate, and similar arithmetic operations on AVX, MMX
and SSE data. A crossbar (XBAR) unit is integrated into FPU pipe 1 to execute the permute
instruction along with shifts, packs/unpacks and shuffles. There is an FPU load-store unit which
supports up to two 128-bit loads and one 128-bit store per cycle.
 
http://i624.photobucket.com/albums [...] o/FPUE.jpg
 
FPU Features Summary and Specifications:
 • The FPU can receive up to four ops per cycle. These ops can only be from one thread, but the
    thread may change every cycle. Likewise the FPU is four wide, capable of issue, execution and
    completion of four ops each cycle. Once received by the FPU, ops from multiple threads can be
    executed.
 • Within the FPU, up to two loads per cycle can be accepted, possibly from different threads.
 • There are four logical pipes: two FMAC and two packed integer. For example, two 128-bit
    FMAC and two 128-bit integer ALU ops can be issued and executed per cycle.
 • Two 128-bit FMAC units. Each FMAC supports four single precision or two double-precision ops.
 • FADDs and FMULs are implemented within the FMAC's.
 • x87 FADDs and FMULs are also handled by the FMAC.
 • Each FMAC contains a variable latency divide/square root machine.
 • Only 1 256-bit operation can issue per cycle, however an extra cycle can be incurred as in the case
    of a FastPath Double if both micro ops cannot issue together.
 • Two-way 128-bit wide floating-point execution
 • Legacy single-instruction multiple-data (SIMD) instruction extensions, as well as support for
    XOP, FMA4, VPERMILx, and Advanced Vector Extensions (AVX).
 • Deep out-of-order floating-point execution
 • Improved data transfer between floating-point registers and general purpose registers
 • Improved floating-point register to floating-point register moves
 

Citation :

Page 23: AMD Family 15h processors add support for 128-bit floating-point execution units. As a result, the throughput of both single-precision and double-precision floating-point SIMD vector operations has improved by 2X over the previous generation of AMD processors.
 
Page 25: Instruction Fetching Improvements - While previous AMD64 processors had a single 32-byte fetch window, AMD Family 15h processors have two 32-byte fetch windows, from which four μops can be selected. These fetch windows, when combined with the 128-bit floating-point execution unit, allow the processor to sustain a fetch/dispatch/retire sequence of four instructions per cycle.
 
Page 26: Several integer and floating-point instructions have improved latencies and decode types on AMD Family 15h processors.
 
Page 26: Current AMD Family 15h processors support two SIMD logical/shuffle units, one in the FMUL pipe and another in the FADD pipe, while previous AMD64 processors have only one SIMD logical/shuffle unit in the FMUL pipe. As a result, the SIMD shuffle instructions can be processed at twice the previous bandwidth on AMD Family 15h processors. Furthermore, the PSHUFD and SHUFPx shuffle instructions are now DirectPath instructions instead of VectorPath instructions on AMD Family 15h processors and take advantage of the 128-bit floating point execution units. Hence, these instructions get a further 2X boost in bandwidth, resulting in an overall improvement of 4X in bandwidth compared to the previous generation of AMD processors.


 
 [:mrfreeze]


 
On peut voir ce que ça donne de concret tout ça ?  :D  
 
Accepte les Fakes de circonstance  :jap:


---------------
該反思的是,往往有幫助
n°7926154
thevv27
Posté le 02-06-2011 à 23:51:58  profilanswer
 

Wirmish a écrit :


Bah oui on le saura.
 
Suffira de regarder le stepping/révision de la puce lors du lancement.


 
On ne saura rien de la cause était ce que je voulais dire.
Le stepping prouvera pas grand chose, si ce n'est éventuellement que Bulldo a été amélioré durant ces trois mois, ce qui peut avoir été fait qu'il ait ou pas eu un problème  [:spamafote]
 
 


 
Oué ben j'ai rapidement regardé ce que je trouvais en boutique, j'ai pas dit que j'étais exhaustif  :lol:  
La plupart des GSkill valide plus bas que leurs specs t'façon : GSkil ça roxe  :o  


Message édité par thevv27 le 02-06-2011 à 23:56:59
n°7926155
Darkad
Dark side only ...
Posté le 02-06-2011 à 23:53:22  profilanswer
 

[:al zheimer]
 
Fait gaffe avec tes post Wirmish car plus ils sont long et plus les pages passent vite ...  :whistle:  
.... 498 / 499 ... 500 !!!! Coucou Sandy !!!  :D  


---------------
[Topic unique] ASROCK /// Chipset 9xx /// AM3+ & Ma Config
mood
Publicité
Posté le 02-06-2011 à 23:53:22  profilanswer
 

n°7926159
wolfflyter
Posté le 03-06-2011 à 00:01:04  profilanswer
 

Darkad a écrit :

[:al zheimer]
 
Fait gaffe avec tes post Wirmish car plus ils sont long et plus les pages passent vite ...  :whistle:  
.... 498 / 499 ... 500 !!!! Coucou Sandy !!!  :D  


 
Il a dit il ne veut pas du Bulldozer ........... on sait pourquoi  :D


---------------
該反思的是,往往有幫助
n°7926160
thevv27
Posté le 03-06-2011 à 00:01:42  profilanswer
 


 
Faut pas trop s'en faire, la GSkill 2000MHz doit pouvoir valider des specs au moins aussi mauvaise  :D
Rien que sur le lien plus haut, il me semble qu'elle tient les 2133MHz en 9-9-9  :o  
Bon après c'est surtout une chasse des bonnes puces plutôt que des specs ;)

n°7926162
abe7
Posté le 03-06-2011 à 00:03:37  profilanswer
 

les chiffres c'est bien beau, mais rien de tel que de la pratique  :jap:

n°7926167
abw
Posté le 03-06-2011 à 00:12:01  profilanswer
 

Un petite foto...BD16C...l essentiel est ecrit dessus..
 
http://www.xbitlabs.com/images/news/2011-05/amd_opteron_6100.jpg
 
 
http://www.xbitlabs.com/news/cpu/d [...] Plans.html

Message cité 3 fois
Message édité par abw le 03-06-2011 à 00:12:41
n°7926169
Darkad
Dark side only ...
Posté le 03-06-2011 à 00:16:16  profilanswer
 


 
LOL j'avais pas vu avant et je trouve qu'elle est rectangulaire ...  :whistle:  ... c'est un opteron donc pas AM3+  :whistle:  


---------------
[Topic unique] ASROCK /// Chipset 9xx /// AM3+ & Ma Config
n°7926170
MEI
|DarthPingoo(tm)|
Posté le 03-06-2011 à 00:18:46  profilanswer
 

Wirmish a écrit :


Je ne suis pas de ton avis... et voici pourquoi :
 
 
Exécution d'un ou de 2 threads dans un module :
 
1. Le core actif n'exécute que des instructions INT.
    · Le FPU se met alors en mode repos, ne consommant plus que 2% de sa limite normale.
 
2. Le core actif exécute des instructions INT et des instructions FP.
    · Si l'instruction FP à traiter est de type 128 bit (AVX, SSE, FMUL, FADD, ou FMAC), le FPU traite alors cette instruction normalement.
    · Si l'instruction FP suivante est aussi de 128 bit, alors le FPU exécute ces 2 instructions en parallèle, doublant ainsi les perfs.
    · Si une des instructions FP du pipeline est de 256 bit (AVX), alors le FPU combine les 2 FPUs de 128 bit, ce qui double les perfs vu qu'avant l'AVX cela nécessitait 2 instructions de 128 bit.
 
Si les 2 cores d'un module sont actifs, le Cache L2/Scheduler/Prefetch/etc est alors partagé entre les 2 threads.
Les performances diminuent alors de 10% par core (dans un même module).
 
Si les 2 cores sont actifs il peut se passer 4 choses pour le FPU:
    · Les 2 cores n'ont pas d'instructions FP à traiter, ce qui endors le FPU.
    · Le core #0 doit traiter une instruction FP:
           · Si l'instruction est de 128 bit (AVX, SSE, FMUL, FADD, ou FMAC), le core #0 s'empare de la moitié du FPU.
           · Si l'instruction est de 256 bit (AVX), le core #0 s'empare de la totalité du FPU.
    · Le core #1 doit traiter une instruction FP:
           · Si l'instruction est de 128 bit (AVX, SSE, FMUL, FADD, ou FMAC), le core #1 s'empare de la moitié du FPU.
           · Si l'instruction est de 256 bit (AVX), le core #1 s'empare de la totalité du FPU.
    · Le core #0 et le core #1 doivent traiter une instruction FP:
           · Si les 2 instructions sont de 128 bit (AVX, SSE, FMUL, FADD, ou FMAC), chaque core s'empare d'une moitié du FPU.
           · Si une des 2 instructions est de 256 bit (AVX), les 2 instructions FP s'exécutent en série.
 
Donc, si en tout temps chaque core doit traiter des instructions FP, alors chaque core aura à sa disposition un FPU de 128 bit, ce qui offre une puissance de calcul égale à l'archi "Stars".
Par contre, s'il n'y a qu'un thread, ou si les FP ne sont pas exécutés en même temps par les 2 cores d'un même module, alors les perfs sont doublés.
 
Le fait de partager le FPU ne ralentira l'exécution du code que si les 2 threads doivent traiter simultanément une instruction FP et qu'au moins une de ces 2 instructions est de 256 bit.
 
Étant donné qu'en moyenne un programme "FP heavy" ne contient qu'environ 40% d'instructions FP, et qu'aucun de ceux-ci n'utilise encore l'AVX, le ralentissement ne se produira qu'en de très rares occasions.
 
Nombre d'instruction FP dans une appli utilisant fortement les FP :
http://www.amdzone.com/phpbb3/download/file.php?id=394
 
Le ~40% en FP n'est pas anodin, loin de là.
 
En effet, s'il y a en moyenne moins de 50% d'instructions FP à exécuter, cela veut dire que le bloc FPU d'un core est occupé moins de 50% du temps.
Si un core est occupé moins de 50% du temps, qu'arriverait-il si 2 cores se partageaient le même bloc FPU ?
Réponse: Cela n'aurait pratiquement aucune incidence sur les performances réelles, mais ça ferait économiser énormément d'espace.
 

Citation :

The AMD Family 15h processor floating point unit (FPU) was designed to provide four times the raw FADD and FMUL bandwidth as the original AMD Opteron and Athlon 64 processors.
 
The FPU can receive up to four ops per cycle. These ops can only be from one thread, but the thread may change every cycle. Likewise the FPU is four wide, capable of issue, execution and completion of four ops each cycle. Once received by the FPU, ops from multiple threads can be executed.
 
• Within the FPU, up to two loads per cycle can be accepted, possibly from different threads.
• There are four logical pipes: two FMAC and two packed integer. For example, two 128-bit FMAC and two 128-bit integer ALU ops can be issued and executed per cycle.
• Two 128-bit FMAC units. Each FMAC supports four single precision or two double-precision ops.
 
http://i624.photobucket.com/albums [...] o/FPUE.jpg


 
Floating-Point Unit
 
The AMD Family 15h processor floating point unit (FPU) was designed to provide four times the raw
FADD and FMUL bandwidth as the original AMD Opteron and Athlon 64 processors
. It achieves this
by means of two 128-bit fused multiply-accumulate (FMAC) units which are supported by a 128-bit
high-bandwidth load-store system. The FPU is a coprocessor model that is shared between the two
cores of one AMD Family 15h compute unit. As such it contains its own scheduler, register files and
renamers and does not share them with the integer units. This decoupling provides optimal
performance of both the integer units and the FPU. In addition to the two FMACs, the FPU also
contains two 128-bit integer units which perform arithmetic and logical operations on AVX, MMX
and SSE packed integer data.
 
A 128-bit integer multiply accumulate (IMAC) unit is incorporated into FPU pipe 0. The IMAC
performs integer fused multiply and accumulate, and similar arithmetic operations on AVX, MMX
and SSE data. A crossbar (XBAR) unit is integrated into FPU pipe 1 to execute the permute
instruction along with shifts, packs/unpacks and shuffles. There is an FPU load-store unit which
supports up to two 128-bit loads and one 128-bit store per cycle.
 
http://i624.photobucket.com/albums [...] o/FPUE.jpg
 
FPU Features Summary and Specifications:
 • The FPU can receive up to four ops per cycle. These ops can only be from one thread, but the
    thread may change every cycle. Likewise the FPU is four wide, capable of issue, execution and
    completion of four ops each cycle. Once received by the FPU, ops from multiple threads can be
    executed.
 • Within the FPU, up to two loads per cycle can be accepted, possibly from different threads.
 • There are four logical pipes: two FMAC and two packed integer. For example, two 128-bit
    FMAC and two 128-bit integer ALU ops can be issued and executed per cycle.
 • Two 128-bit FMAC units. Each FMAC supports four single precision or two double-precision ops.
 • FADDs and FMULs are implemented within the FMAC's.
 • x87 FADDs and FMULs are also handled by the FMAC.
 • Each FMAC contains a variable latency divide/square root machine.
 • Only 1 256-bit operation can issue per cycle, however an extra cycle can be incurred as in the case
    of a FastPath Double if both micro ops cannot issue together.
 • Two-way 128-bit wide floating-point execution
 • Legacy single-instruction multiple-data (SIMD) instruction extensions, as well as support for
    XOP, FMA4, VPERMILx, and Advanced Vector Extensions (AVX).
 • Deep out-of-order floating-point execution
 • Improved data transfer between floating-point registers and general purpose registers
 • Improved floating-point register to floating-point register moves
 

Citation :

Page 23: AMD Family 15h processors add support for 128-bit floating-point execution units. As a result, the throughput of both single-precision and double-precision floating-point SIMD vector operations has improved by 2X over the previous generation of AMD processors.
 
Page 25: Instruction Fetching Improvements - While previous AMD64 processors had a single 32-byte fetch window, AMD Family 15h processors have two 32-byte fetch windows, from which four μops can be selected. These fetch windows, when combined with the 128-bit floating-point execution unit, allow the processor to sustain a fetch/dispatch/retire sequence of four instructions per cycle.
 
Page 26: Several integer and floating-point instructions have improved latencies and decode types on AMD Family 15h processors.
 
Page 26: Current AMD Family 15h processors support two SIMD logical/shuffle units, one in the FMUL pipe and another in the FADD pipe, while previous AMD64 processors have only one SIMD logical/shuffle unit in the FMUL pipe. As a result, the SIMD shuffle instructions can be processed at twice the previous bandwidth on AMD Family 15h processors. Furthermore, the PSHUFD and SHUFPx shuffle instructions are now DirectPath instructions instead of VectorPath instructions on AMD Family 15h processors and take advantage of the 128-bit floating point execution units. Hence, these instructions get a further 2X boost in bandwidth, resulting in an overall improvement of 4X in bandwidth compared to the previous generation of AMD processors.


 
 [:mrfreeze]


 
Ton truc c'est bien, c'est idéaliste, mais bon je ne suis pas sur que ce soit si simple. D'autant que Linpack en AVX c'est +80% de perf, donc le pipe FPU est utilisé à plus de 50%...
 


---------------
| AMD Ryzen 7 7700X 8C/16T @ 4.5-5.4GHz - 64GB DDR5-6000 30-40-40 1T - AMD Radeon RX 7900 XTX 24GB @ 2680MHz/20Gbps |
n°7926172
MEI
|DarthPingoo(tm)|
Posté le 03-06-2011 à 00:20:54  profilanswer
 


Un Bulldozer fabriqué en 2009 :??:

Message cité 1 fois
Message édité par MEI le 03-06-2011 à 00:22:17

---------------
| AMD Ryzen 7 7700X 8C/16T @ 4.5-5.4GHz - 64GB DDR5-6000 30-40-40 1T - AMD Radeon RX 7900 XTX 24GB @ 2680MHz/20Gbps |
n°7926177
Invite_Sur​prise
Racaille de Shanghaï
Posté le 03-06-2011 à 00:24:56  profilanswer
 


Y'a écrit Magny-Cours 12 Core dessus ...

n°7926179
abw
Posté le 03-06-2011 à 00:25:20  profilanswer
 

MEI a écrit :


Un Bulldozer fabriqué en 2009 :??:


 
Merd...  :sleep:  
 
C est un Magny Cours 12C...Et ca y ressemble a donf.. :D
 
Je me disais bien que Xbitlabs , c est un site d escroqs... :fou:

Message cité 1 fois
Message édité par abw le 03-06-2011 à 00:27:48
n°7926183
mum1989
Posté le 03-06-2011 à 00:28:32  profilanswer
 

abw a écrit :


 
Merd...  :sleep:  
 
C est un Magny Cours 12C...Et ca y ressemble a donf.. :D
 
Je me disais bien que Xbitlabs , c est un site d escroqs


+1
 
MC= Magny Cours.

n°7926196
Gigathlon
Quad-neurones natif
Posté le 03-06-2011 à 00:43:01  profilanswer
 

MEI a écrit :

Ton truc c'est bien, c'est idéaliste, mais bon je ne suis pas sur que ce soit si simple. D'autant que Linpack en AVX c'est +80% de perf, donc le pipe FPU est utilisé à plus de 50%...


Je ne vois aucune démonstration.

 

Si la FPU est utilisée 50% du temps en SSE, une augmentation de perfs de 80% en AVX représente une baisse de l'utilisation à seulement 40%.

Message cité 1 fois
Message édité par Gigathlon le 03-06-2011 à 00:43:27
n°7926238
Mysterieus​eX
Chieuse
Posté le 03-06-2011 à 05:38:11  profilanswer
 

C'est 'dredi les gens non ?
Bon Wirmish, plus que ... 132 pages et salut Sandy !
 
Joyeux 'dredi a tous ! :)

n°7926310
MEI
|DarthPingoo(tm)|
Posté le 03-06-2011 à 09:38:35  profilanswer
 

Gigathlon a écrit :


Je ne vois aucune démonstration.
 
Si la FPU est utilisée 50% du temps en SSE, une augmentation de perfs de 80% en AVX représente une baisse de l'utilisation à seulement 40%.


Si tu passe de SSEx à AVX, tu doubles théoriquement les performances en calculs flottants.
 
Si tu passes de 100 à 180 en indice de performance, clairement c'est que ton pipe FPU était, au moins, utilisé à 90%... mais bon c'est pas grave...


---------------
| AMD Ryzen 7 7700X 8C/16T @ 4.5-5.4GHz - 64GB DDR5-6000 30-40-40 1T - AMD Radeon RX 7900 XTX 24GB @ 2680MHz/20Gbps |
n°7926322
Gigathlon
Quad-neurones natif
Posté le 03-06-2011 à 09:55:17  profilanswer
 

MEI a écrit :

Si tu passe de SSEx à AVX, tu doubles théoriquement les performances en calculs flottants.
 
Si tu passes de 100 à 180 en indice de performance, clairement c'est que ton pipe FPU était, au moins, utilisé à 90%... mais bon c'est pas grave...


C'est bien ce que je disais... le fait de prendre un parapluie n'implique pas qu'il pleuve car quand il pleut je prend mon parapluie.

n°7926327
chriskenob​y
Que la force soit avec vous
Posté le 03-06-2011 à 10:01:20  profilanswer
 

oui mais tu ne prend pas de pepin, si tu est sur qu il ne va pas pleuvoir....;)


---------------
Les créateurs de l'Electro, c'est eux KRAFTWERK http://www.kraftwerk.com/concerts/ [...] _robo.html - Mes Cartes https://drive.google.com/drive/fold [...] 0-vZPkdfoi
n°7926341
Fouge
Posté le 03-06-2011 à 10:20:24  profilanswer
 

MEI a écrit :


Si tu passe de SSEx à AVX, tu doubles théoriquement les performances en calculs flottants.

 

Si tu passes de 100 à 180 en indice de performance, clairement c'est que ton pipe FPU était, au moins, utilisé à 90%... mais bon c'est pas grave...

Aucun rapport. Tout ce que tu peux en déduire que le taux d'occupation FPU baisse (de 50 à 40% par ex), ou que le doublage des perf théorique n'est que théorique (x0.8 en pratique).


Message édité par Fouge le 03-06-2011 à 10:22:09
n°7926521
Wirmish
¡sıɹdɹns zǝɹǝs snoʌ
Posté le 03-06-2011 à 12:44:38  profilanswer
 

http://img829.imageshack.us/img829/1313/unledhu.jpg

n°7926563
moyen_moin​s
chat réincarné
Posté le 03-06-2011 à 13:24:07  profilanswer
 

Cool mais on veut déjà BD nous :sleep:

n°7926577
Zack38
Posté le 03-06-2011 à 13:37:20  profilanswer
 

Bon, je vais rajouter une petite règle.
 
Déjà que les posts mono-smilesques étaient proscrits, maintenant, les posts avec seulement une image le seront aussi. :sleep:  
 
En vigueur dès maintenant.

n°7926578
thevv27
Posté le 03-06-2011 à 13:37:47  profilanswer
 

moyen_moins a écrit :

Cool mais on veut déjà BD nous :sleep:


 
 
Avec AMD, on a autant d'infos sur le futur à 3 ou 4 ans qu'à quelques mois... de là à dire qu'il y a un problème de comm'  [:cosmoschtroumpf]


Message édité par thevv27 le 03-06-2011 à 13:38:09
n°7926752
dje5170
Posté le 03-06-2011 à 15:35:36  profilanswer
 

IL SORT QUAND LE PROCHAIN FAKE  :fou: :fou:  :fou:  :fou:  :fou:  
 
[:f5 powa][:f5 powa][:f5 powa][:f5 powa]

n°7926939
Darkad
Dark side only ...
Posté le 03-06-2011 à 17:38:55  profilanswer
 

dje5170 a écrit :

IL SORT QUAND LE PROCHAIN FAKE  :fou: :fou:  :fou:  :fou:  :fou:  
 
[:f5 powa][:f5 powa][:f5 powa][:f5 powa]


 
[:already 47:2]
ouai bien en cherchant un peu sur gogole.fr tu trouveras peut être un FX-8130P OC a 10Ghz avec 250 de TDP ... avec azote cooling quand même ...  :whistle:  
 
 :hello:  


---------------
[Topic unique] ASROCK /// Chipset 9xx /// AM3+ & Ma Config
n°7927013
moyen_moin​s
chat réincarné
Posté le 03-06-2011 à 18:25:13  profilanswer
 

AMD [H]ardOCP GamExperience - July 16
On va peut être avoir des leaks ? [:totoz]

 

edit: A propos de BD en ES : http://www.planet3dnow.de/vbulleti [...] count=2705
La vache, il montre haut en tension pour du 32nm :/

Message cité 1 fois
Message édité par moyen_moins le 03-06-2011 à 18:30:21
n°7927070
MEI
|DarthPingoo(tm)|
Posté le 03-06-2011 à 19:09:39  profilanswer
 

moyen_moins a écrit :

AMD [H]ardOCP GamExperience - July 16
On va peut être avoir des leaks ? [:totoz]
 
edit: A propos de BD en ES : http://www.planet3dnow.de/vbulleti [...] count=2705
La vache, il montre haut en tension pour du 32nm :/


Le pire c'est le 13x200 = 2600 @ 1,275V... Putain mon C2D X6800 B2 des premier batch faisait ces 2,93GHz @ 1,275V justement... en 65nm :'(
 
Mais bon rassuront nous, tout le monde dit que le 32nm de GloFo a pas de problème et est de loin supérieur à celui d'Intel... :o


---------------
| AMD Ryzen 7 7700X 8C/16T @ 4.5-5.4GHz - 64GB DDR5-6000 30-40-40 1T - AMD Radeon RX 7900 XTX 24GB @ 2680MHz/20Gbps |
n°7927080
moyen_moin​s
chat réincarné
Posté le 03-06-2011 à 19:15:51  profilanswer
 

Bah, c'est un ES, donc bon, ça peut être normal après tout.
Pis AMD et sa maladie de toujours survolter ses processeurs [:manust]
On verra bien avec Llano dans 2-3 semaines :)

n°7927092
MEI
|DarthPingoo(tm)|
Posté le 03-06-2011 à 19:22:36  profilanswer
 

moyen_moins a écrit :

Bah, c'est un ES, donc bon, ça peut être normal après tout.
Pis AMD et sa maladie de toujours survolter ses processeurs [:manust]
On verra bien avec Llano dans 2-3 semaines :)


C'est pas anormal (clairement j'avais un X6800 parmis les bas VID qu'on pouvais avoir...), mais ce n'est pas rassurant car a 3,6GHz @ 1,412V on est clairement au taquet de ce que supporte le process et donc ça peut expliqué le retard le temps d'ajuster pour pouvoir reduire la tension.
 
Parce que clairement faudrait qu'en Turbo @ 4,2Ghz on soit a 1,35V maxi. en 32nm si on veux avoir un TDP correct et tenir la distance niveau durée de vie...


---------------
| AMD Ryzen 7 7700X 8C/16T @ 4.5-5.4GHz - 64GB DDR5-6000 30-40-40 1T - AMD Radeon RX 7900 XTX 24GB @ 2680MHz/20Gbps |
n°7927140
moyen_moin​s
chat réincarné
Posté le 03-06-2011 à 19:53:07  profilanswer
 

Je suis d'accord.
Même si ça va aller en s'arrangeant avec le temps (le 45nm a quand même bien évolué) :)

n°7927159
Profil sup​primé
Posté le 03-06-2011 à 20:29:18  answer
 

MEI a écrit :

Mais bon rassuront nous, tout le monde dit que le 32nm de GloFo a pas de problème et est de loin supérieur à celui d'Intel... :o


Tu fais pas semblant le dredi :ange:  
 

MEI a écrit :

C'est pas anormal (clairement j'avais un X6800 parmis les bas VID qu'on pouvais avoir...), mais ce n'est pas rassurant car a 3,6GHz @ 1,412V on est clairement au taquet de ce que supporte le process et donc ça peut expliqué le retard le temps d'ajuster pour pouvoir reduire la tension.
 
Parce que clairement faudrait qu'en Turbo @ 4,2Ghz on soit a 1,35V maxi. en 32nm si on veux avoir un TDP correct et tenir la distance niveau durée de vie...


Je pense qu'on verra des valeurs supérieures que chez INTEL comme actuellement
Autour d'1.4+ ne devrait pas lui faire trop bobo

Message cité 1 fois
Message édité par Profil supprimé le 03-06-2011 à 20:29:47
n°7927162
Invite_Sur​prise
Racaille de Shanghaï
Posté le 03-06-2011 à 20:31:35  profilanswer
 

3600@1.41v y'a clairement un souci là  :pt1cable:

n°7927191
MEI
|DarthPingoo(tm)|
Posté le 03-06-2011 à 20:55:42  profilanswer
 


 
 
1,4V pour du 32nm quel que soit le fondeur, ça reste élevé.


---------------
| AMD Ryzen 7 7700X 8C/16T @ 4.5-5.4GHz - 64GB DDR5-6000 30-40-40 1T - AMD Radeon RX 7900 XTX 24GB @ 2680MHz/20Gbps |
n°7927194
Zack38
Posté le 03-06-2011 à 20:58:56  profilanswer
 

MEI a écrit :


1,4V pour du 32nm quel que soit le fondeur, ça reste élevé.


 
C'est pour ça que les processeurs AMD 32nm auront un voltage situé entre 0.8V et 1.3V.

mood
Publicité
Posté le   profilanswer
 

 Page :   1  2  3  4  5  ..  367  368  369  ..  988  989  990  991  992  993

Aller à :
Ajouter une réponse
 

Sujets relatifs
[topic uniq] LanParty MI P55-T36 mini itx[Topic unique] Crucial M225 (Version 64, 128, 256 Go)
AMD Athlon 64 FX-57 overclocké à 3.1ghz s/A8N32-SLI Deluxe+SLI 8800GTX[Topic unique] Gigabyte GA-MA770T-UD3P
Erreur CRC WinRar Config AMD 3 Windows 7 64[Topic Unique] Thermaltake Level 10
Plus de sujets relatifs à : [Topic Unique] Processeurs AMD Bulldozer FX-8100/6100/4100 (32nm)


Copyright © 1997-2025 Groupe LDLC (Signaler un contenu illicite / Données personnelles)