4100 (32nm)

Recherche :

Mot : Pseudo : Filtrer Aller à la page :
Page : 1 2 3 4 5 .. 367 368 369 .. 988 989 990 991 992 993 Page Suivante Page Précédente Bas de page
Auteur	Sujet : [Topic Unique] Processeurs AMD Bulldozer FX-8100/6100/4100 (32nm)

Darkad

Dark side only ...

Reprise du message précédent :

bulldozer_fusion a écrit :

d'accord donc des qu'on voit sample ES avec tout un tas de chiffres lettres = fake
j'tacherais de m'en rappeler désormais :jap:

Mais non .... les chiffre c'est justement par ce que c'est un sample ES apparemment B0 ... [:klemton]
c'est pour cela qu'ils ont pas eu peur de le faire exploser à 6 Ghz avec de l'azote .... :whistle:

:lol: [:aroh]

---------------
[Topic unique] ASROCK /// Chipset 9xx /// AM3+ & Ma Config

Publicité

Wirmish

¡sıɹdɹns zǝɹǝs snoʌ

thevv27 a écrit :

Avec de la PC16000 on part à genre 8-9-8-24 pour les meilleures et 9-9-9 ou moins bien pour les autres...

T'es sûr ?

G.Skill Série Pi, DDR3-2000 MHz (PC3-16000 CAS 6-9-6-24.
G.Skill Série Pi, DDR3 2400 MHz (PC3-19200) CAS 8-11-8-28

[:double c]

Message cité 1 fois

Darkad

Dark side only ...

[:already 47:2] //Troll mode ON //
voilà un vrai fake ... bon c'est le Fake du jour

//Troll mode OFF //

pour les RAM j'ai vu ça :

http://www.ldlc.com/fiche/PB00110239.html

et

http://www.materiel.net/barrette-m [...] 66824.html

Message cité 1 fois
Message édité par Darkad le 02-06-2011 à 23:16:18

---------------
[Topic unique] ASROCK /// Chipset 9xx /// AM3+ & Ma Config

shenron67

Sure we can. We're Sega.

voltage trop haut pour un bulldo, clairement un fake, bulldozer tient cette fréquence avec 1.45 V

Wirmish

¡sıɹdɹns zǝɹǝs snoʌ

Gigathlon a écrit :

Logiquement, la FPU devrait souffrir un peu du partage, sans que ça ne soit dramatique pour autant, surtout compte tenu du gain en terme de transistors et consommation que ça devrait apporter.

Bref, je vois plutôt ça comme "ALU qui crève le plafond et FPU tout juste comparable à l'i7" (la comparaison avec un prétendu avantage de K10 en FP étant totalement à côté de la plaque... ça date du K7 ça ), ce qui est loin d'être mauvais.

Je ne suis pas de ton avis... et voici pourquoi :

Exécution d'un ou de 2 threads dans un module :

1. Le core actif n'exécute que des instructions INT.
· Le FPU se met alors en mode repos, ne consommant plus que 2% de sa limite normale.

2. Le core actif exécute des instructions INT et des instructions FP.
· Si l'instruction FP à traiter est de type 128 bit (AVX, SSE, FMUL, FADD, ou FMAC), le FPU traite alors cette instruction normalement.
· Si l'instruction FP suivante est aussi de 128 bit, alors le FPU exécute ces 2 instructions en parallèle, doublant ainsi les perfs.
· Si une des instructions FP du pipeline est de 256 bit (AVX), alors le FPU combine les 2 FPUs de 128 bit, ce qui double les perfs vu qu'avant l'AVX cela nécessitait 2 instructions de 128 bit.

Si les 2 cores d'un module sont actifs, le Cache L2/Scheduler/Prefetch/etc est alors partagé entre les 2 threads.
Les performances diminuent alors de 10% par core (dans un même module).

Si les 2 cores sont actifs il peut se passer 4 choses pour le FPU:
· Les 2 cores n'ont pas d'instructions FP à traiter, ce qui endors le FPU.
· Le core #0 doit traiter une instruction FP:
· Si l'instruction est de 128 bit (AVX, SSE, FMUL, FADD, ou FMAC), le core #0 s'empare de la moitié du FPU.
· Si l'instruction est de 256 bit (AVX), le core #0 s'empare de la totalité du FPU.
· Le core #1 doit traiter une instruction FP:
· Si l'instruction est de 128 bit (AVX, SSE, FMUL, FADD, ou FMAC), le core #1 s'empare de la moitié du FPU.
· Si l'instruction est de 256 bit (AVX), le core #1 s'empare de la totalité du FPU.
· Le core #0 et le core #1 doivent traiter une instruction FP:
· Si les 2 instructions sont de 128 bit (AVX, SSE, FMUL, FADD, ou FMAC), chaque core s'empare d'une moitié du FPU.
· Si une des 2 instructions est de 256 bit (AVX), les 2 instructions FP s'exécutent en série.

Donc, si en tout temps chaque core doit traiter des instructions FP, alors chaque core aura à sa disposition un FPU de 128 bit, ce qui offre une puissance de calcul égale à l'archi "Stars".
Par contre, s'il n'y a qu'un thread, ou si les FP ne sont pas exécutés en même temps par les 2 cores d'un même module, alors les perfs sont doublés.

Le fait de partager le FPU ne ralentira l'exécution du code que si les 2 threads doivent traiter simultanément une instruction FP et qu'au moins une de ces 2 instructions est de 256 bit.

Étant donné qu'en moyenne un programme "FP heavy" ne contient qu'environ 40% d'instructions FP, et qu'aucun de ceux-ci n'utilise encore l'AVX, le ralentissement ne se produira qu'en de très rares occasions.

Nombre d'instruction FP dans une appli utilisant fortement les FP :

Le ~40% en FP n'est pas anodin, loin de là.

En effet, s'il y a en moyenne moins de 50% d'instructions FP à exécuter, cela veut dire que le bloc FPU d'un core est occupé moins de 50% du temps.
Si un core est occupé moins de 50% du temps, qu'arriverait-il si 2 cores se partageaient le même bloc FPU ?
Réponse: Cela n'aurait pratiquement aucune incidence sur les performances réelles, mais ça ferait économiser énormément d'espace.

Citation :

The AMD Family 15h processor floating point unit (FPU) was designed to provide four times the raw FADD and FMUL bandwidth as the original AMD Opteron and Athlon 64 processors.

The FPU can receive up to four ops per cycle. These ops can only be from one thread, but the thread may change every cycle. Likewise the FPU is four wide, capable of issue, execution and completion of four ops each cycle. Once received by the FPU, ops from multiple threads can be executed.

• Within the FPU, up to two loads per cycle can be accepted, possibly from different threads.
• There are four logical pipes: two FMAC and two packed integer. For example, two 128-bit FMAC and two 128-bit integer ALU ops can be issued and executed per cycle.
• Two 128-bit FMAC units. Each FMAC supports four single precision or two double-precision ops.

Floating-Point Unit

The AMD Family 15h processor floating point unit (FPU) was designed to provide four times the raw
FADD and FMUL bandwidth as the original AMD Opteron and Athlon 64 processors. It achieves this
by means of two 128-bit fused multiply-accumulate (FMAC) units which are supported by a 128-bit
high-bandwidth load-store system. The FPU is a coprocessor model that is shared between the two
cores of one AMD Family 15h compute unit. As such it contains its own scheduler, register files and
renamers and does not share them with the integer units. This decoupling provides optimal
performance of both the integer units and the FPU. In addition to the two FMACs, the FPU also
contains two 128-bit integer units which perform arithmetic and logical operations on AVX, MMX
and SSE packed integer data.

A 128-bit integer multiply accumulate (IMAC) unit is incorporated into FPU pipe 0. The IMAC
performs integer fused multiply and accumulate, and similar arithmetic operations on AVX, MMX
and SSE data. A crossbar (XBAR) unit is integrated into FPU pipe 1 to execute the permute
instruction along with shifts, packs/unpacks and shuffles. There is an FPU load-store unit which
supports up to two 128-bit loads and one 128-bit store per cycle.

FPU Features Summary and Specifications:
• The FPU can receive up to four ops per cycle. These ops can only be from one thread, but the
thread may change every cycle. Likewise the FPU is four wide, capable of issue, execution and
completion of four ops each cycle. Once received by the FPU, ops from multiple threads can be
executed.
• Within the FPU, up to two loads per cycle can be accepted, possibly from different threads.
• There are four logical pipes: two FMAC and two packed integer. For example, two 128-bit
FMAC and two 128-bit integer ALU ops can be issued and executed per cycle.
• Two 128-bit FMAC units. Each FMAC supports four single precision or two double-precision ops.
• FADDs and FMULs are implemented within the FMAC's.
• x87 FADDs and FMULs are also handled by the FMAC.
• Each FMAC contains a variable latency divide/square root machine.
• Only 1 256-bit operation can issue per cycle, however an extra cycle can be incurred as in the case
of a FastPath Double if both micro ops cannot issue together.
• Two-way 128-bit wide floating-point execution
• Legacy single-instruction multiple-data (SIMD) instruction extensions, as well as support for
XOP, FMA4, VPERMILx, and Advanced Vector Extensions (AVX).
• Deep out-of-order floating-point execution
• Improved data transfer between floating-point registers and general purpose registers
• Improved floating-point register to floating-point register moves

Citation :

Page 23: AMD Family 15h processors add support for 128-bit floating-point execution units. As a result, the throughput of both single-precision and double-precision floating-point SIMD vector operations has improved by 2X over the previous generation of AMD processors.

Page 25: Instruction Fetching Improvements - While previous AMD64 processors had a single 32-byte fetch window, AMD Family 15h processors have two 32-byte fetch windows, from which four μops can be selected. These fetch windows, when combined with the 128-bit floating-point execution unit, allow the processor to sustain a fetch/dispatch/retire sequence of four instructions per cycle.

Page 26: Several integer and floating-point instructions have improved latencies and decode types on AMD Family 15h processors.

Page 26: Current AMD Family 15h processors support two SIMD logical/shuffle units, one in the FMUL pipe and another in the FADD pipe, while previous AMD64 processors have only one SIMD logical/shuffle unit in the FMUL pipe. As a result, the SIMD shuffle instructions can be processed at twice the previous bandwidth on AMD Family 15h processors. Furthermore, the PSHUFD and SHUFPx shuffle instructions are now DirectPath instructions instead of VectorPath instructions on AMD Family 15h processors and take advantage of the 128-bit floating point execution units. Hence, these instructions get a further 2X boost in bandwidth, resulting in an overall improvement of 4X in bandwidth compared to the previous generation of AMD processors.

[:mrfreeze]

Message cité 2 fois
Message édité par Wirmish le 02-06-2011 à 23:36:34

Darkad

Dark side only ...

oula oula oula ... moi pas comprendre ...

---------------
[Topic unique] ASROCK /// Chipset 9xx /// AM3+ & Ma Config

Wirmish

¡sıɹdɹns zǝɹǝs snoʌ

Houlàlà, perkam a mal pris le retard du Buldo.

Citation :

"**** you, AMD." - perkam, XS

wolfflyter

Wirmish a écrit :

Je ne suis pas de ton avis... et voici pourquoi :

Exécution d'un ou de 2 threads dans un module :

1. Le core actif n'exécute que des instructions INT.
· Le FPU se met alors en mode repos, ne consommant plus que 2% de sa limite normale.

2. Le core actif exécute des instructions INT et des instructions FP.
· Si l'instruction FP à traiter est de type 128 bit (AVX, SSE, FMUL, FADD, ou FMAC), le FPU traite alors cette instruction normalement.
· Si l'instruction FP suivante est aussi de 128 bit, alors le FPU exécute ces 2 instructions en parallèle, doublant ainsi les perfs.
· Si une des instructions FP du pipeline est de 256 bit (AVX), alors le FPU combine les 2 FPUs de 128 bit, ce qui double les perfs vu qu'avant l'AVX cela nécessitait 2 instructions de 128 bit.

Si les 2 cores d'un module sont actifs, le Cache L2/Scheduler/Prefetch/etc est alors partagé entre les 2 threads.
Les performances diminuent alors de 10% par core (dans un même module).

Si les 2 cores sont actifs il peut se passer 4 choses pour le FPU:
· Les 2 cores n'ont pas d'instructions FP à traiter, ce qui endors le FPU.
· Le core #0 doit traiter une instruction FP:
· Si l'instruction est de 128 bit (AVX, SSE, FMUL, FADD, ou FMAC), le core #0 s'empare de la moitié du FPU.
· Si l'instruction est de 256 bit (AVX), le core #0 s'empare de la totalité du FPU.
· Le core #1 doit traiter une instruction FP:
· Si l'instruction est de 128 bit (AVX, SSE, FMUL, FADD, ou FMAC), le core #1 s'empare de la moitié du FPU.
· Si l'instruction est de 256 bit (AVX), le core #1 s'empare de la totalité du FPU.
· Le core #0 et le core #1 doivent traiter une instruction FP:
· Si les 2 instructions sont de 128 bit (AVX, SSE, FMUL, FADD, ou FMAC), chaque core s'empare d'une moitié du FPU.
· Si une des 2 instructions est de 256 bit (AVX), les 2 instructions FP s'exécutent en série.

Donc, si en tout temps chaque core doit traiter des instructions FP, alors chaque core aura à sa disposition un FPU de 128 bit, ce qui offre une puissance de calcul égale à l'archi "Stars".
Par contre, s'il n'y a qu'un thread, ou si les FP ne sont pas exécutés en même temps par les 2 cores d'un même module, alors les perfs sont doublés.

Le fait de partager le FPU ne ralentira l'exécution du code que si les 2 threads doivent traiter simultanément une instruction FP et qu'au moins une de ces 2 instructions est de 256 bit.

Étant donné qu'en moyenne un programme "FP heavy" ne contient qu'environ 40% d'instructions FP, et qu'aucun de ceux-ci n'utilise encore l'AVX, le ralentissement ne se produira qu'en de très rares occasions.

Nombre d'instruction FP dans une appli utilisant fortement les FP :
http://www.amdzone.com/phpbb3/download/file.php?id=394

Le ~40% en FP n'est pas anodin, loin de là.

En effet, s'il y a en moyenne moins de 50% d'instructions FP à exécuter, cela veut dire que le bloc FPU d'un core est occupé moins de 50% du temps.
Si un core est occupé moins de 50% du temps, qu'arriverait-il si 2 cores se partageaient le même bloc FPU ?
Réponse: Cela n'aurait pratiquement aucune incidence sur les performances réelles, mais ça ferait économiser énormément d'espace.

Citation :

Floating-Point Unit

The AMD Family 15h processor floating point unit (FPU) was designed to provide four times the raw
FADD and FMUL bandwidth as the original AMD Opteron and Athlon 64 processors. It achieves this
by means of two 128-bit fused multiply-accumulate (FMAC) units which are supported by a 128-bit
high-bandwidth load-store system. The FPU is a coprocessor model that is shared between the two
cores of one AMD Family 15h compute unit. As such it contains its own scheduler, register files and
renamers and does not share them with the integer units. This decoupling provides optimal
performance of both the integer units and the FPU. In addition to the two FMACs, the FPU also
contains two 128-bit integer units which perform arithmetic and logical operations on AVX, MMX
and SSE packed integer data.

A 128-bit integer multiply accumulate (IMAC) unit is incorporated into FPU pipe 0. The IMAC
performs integer fused multiply and accumulate, and similar arithmetic operations on AVX, MMX
and SSE data. A crossbar (XBAR) unit is integrated into FPU pipe 1 to execute the permute
instruction along with shifts, packs/unpacks and shuffles. There is an FPU load-store unit which
supports up to two 128-bit loads and one 128-bit store per cycle.

http://i624.photobucket.com/albums [...] o/FPUE.jpg

FPU Features Summary and Specifications:
• The FPU can receive up to four ops per cycle. These ops can only be from one thread, but the
thread may change every cycle. Likewise the FPU is four wide, capable of issue, execution and
completion of four ops each cycle. Once received by the FPU, ops from multiple threads can be
executed.
• Within the FPU, up to two loads per cycle can be accepted, possibly from different threads.
• There are four logical pipes: two FMAC and two packed integer. For example, two 128-bit
FMAC and two 128-bit integer ALU ops can be issued and executed per cycle.
• Two 128-bit FMAC units. Each FMAC supports four single precision or two double-precision ops.
• FADDs and FMULs are implemented within the FMAC's.
• x87 FADDs and FMULs are also handled by the FMAC.
• Each FMAC contains a variable latency divide/square root machine.
• Only 1 256-bit operation can issue per cycle, however an extra cycle can be incurred as in the case
of a FastPath Double if both micro ops cannot issue together.
• Two-way 128-bit wide floating-point execution
• Legacy single-instruction multiple-data (SIMD) instruction extensions, as well as support for
XOP, FMA4, VPERMILx, and Advanced Vector Extensions (AVX).
• Deep out-of-order floating-point execution
• Improved data transfer between floating-point registers and general purpose registers
• Improved floating-point register to floating-point register moves

Citation :

[:mrfreeze]

On peut voir ce que ça donne de concret tout ça ?

Accepte les Fakes de circonstance :jap:

---------------
該反思的是，往往有幫助

thevv27

Wirmish a écrit :

Bah oui on le saura.

Suffira de regarder le stepping/révision de la puce lors du lancement.

On ne saura rien de la cause était ce que je voulais dire.
Le stepping prouvera pas grand chose, si ce n'est éventuellement que Bulldo a été amélioré durant ces trois mois, ce qui peut avoir été fait qu'il ait ou pas eu un problème [:spamafote]

Wirmish a écrit :

T'es sûr ?

G.Skill Série Pi, DDR3-2000 MHz (PC3-16000 CAS 6-9-6-24.
G.Skill Série Pi, DDR3 2400 MHz (PC3-19200) CAS 8-11-8-28

[:double c]

Oué ben j'ai rapidement regardé ce que je trouvais en boutique, j'ai pas dit que j'étais exhaustif :lol:
La plupart des GSkill valide plus bas que leurs specs t'façon : GSkil ça roxe

Message édité par thevv27 le 02-06-2011 à 23:56:59

Darkad

Dark side only ...

[:al zheimer]

Fait gaffe avec tes post Wirmish car plus ils sont long et plus les pages passent vite ... :whistle:
.... 498 / 499 ... 500 !!!! Coucou Sandy !!!

Message cité 1 fois

---------------
[Topic unique] ASROCK /// Chipset 9xx /// AM3+ & Ma Config

Publicité

wolfflyter

Darkad a écrit :

[:al zheimer]

Fait gaffe avec tes post Wirmish car plus ils sont long et plus les pages passent vite ... :whistle:
.... 498 / 499 ... 500 !!!! Coucou Sandy !!!

Il a dit il ne veut pas du Bulldozer ........... on sait pourquoi

---------------
該反思的是，往往有幫助

thevv27

Darkad a écrit :

pour les RAM j'ai vu ça :

http://www.ldlc.com/fiche/PB00110239.html

et

http://www.materiel.net/barrette-m [...] 66824.html

Faut pas trop s'en faire, la GSkill 2000MHz doit pouvoir valider des specs au moins aussi mauvaise
Rien que sur le lien plus haut, il me semble qu'elle tient les 2133MHz en 9-9-9
Bon après c'est surtout une chasse des bonnes puces plutôt que des specs

abe7

les chiffres c'est bien beau, mais rien de tel que de la pratique :jap:

abw

Un petite foto...BD16C...l essentiel est ecrit dessus..

http://www.xbitlabs.com/news/cpu/d [...] Plans.html

Message cité 3 fois
Message édité par abw le 03-06-2011 à 00:12:41

Darkad

Dark side only ...

abw a écrit :

Un petite foto...BD16C...l essentiel est ecrit dessus..

http://www.xbitlabs.com/images/new [...] n_6100.jpg

http://www.xbitlabs.com/news/cpu/d [...] Plans.html

LOL j'avais pas vu avant et je trouve qu'elle est rectangulaire ... :whistle: ... c'est un opteron donc pas AM3+

---------------
[Topic unique] ASROCK /// Chipset 9xx /// AM3+ & Ma Config

MEI

|DarthPingoo(tm)|

Wirmish a écrit :

Je ne suis pas de ton avis... et voici pourquoi :

Exécution d'un ou de 2 threads dans un module :

1. Le core actif n'exécute que des instructions INT.
· Le FPU se met alors en mode repos, ne consommant plus que 2% de sa limite normale.

2. Le core actif exécute des instructions INT et des instructions FP.
· Si l'instruction FP à traiter est de type 128 bit (AVX, SSE, FMUL, FADD, ou FMAC), le FPU traite alors cette instruction normalement.
· Si l'instruction FP suivante est aussi de 128 bit, alors le FPU exécute ces 2 instructions en parallèle, doublant ainsi les perfs.
· Si une des instructions FP du pipeline est de 256 bit (AVX), alors le FPU combine les 2 FPUs de 128 bit, ce qui double les perfs vu qu'avant l'AVX cela nécessitait 2 instructions de 128 bit.

Si les 2 cores d'un module sont actifs, le Cache L2/Scheduler/Prefetch/etc est alors partagé entre les 2 threads.
Les performances diminuent alors de 10% par core (dans un même module).

Si les 2 cores sont actifs il peut se passer 4 choses pour le FPU:
· Les 2 cores n'ont pas d'instructions FP à traiter, ce qui endors le FPU.
· Le core #0 doit traiter une instruction FP:
· Si l'instruction est de 128 bit (AVX, SSE, FMUL, FADD, ou FMAC), le core #0 s'empare de la moitié du FPU.
· Si l'instruction est de 256 bit (AVX), le core #0 s'empare de la totalité du FPU.
· Le core #1 doit traiter une instruction FP:
· Si l'instruction est de 128 bit (AVX, SSE, FMUL, FADD, ou FMAC), le core #1 s'empare de la moitié du FPU.
· Si l'instruction est de 256 bit (AVX), le core #1 s'empare de la totalité du FPU.
· Le core #0 et le core #1 doivent traiter une instruction FP:
· Si les 2 instructions sont de 128 bit (AVX, SSE, FMUL, FADD, ou FMAC), chaque core s'empare d'une moitié du FPU.
· Si une des 2 instructions est de 256 bit (AVX), les 2 instructions FP s'exécutent en série.

Donc, si en tout temps chaque core doit traiter des instructions FP, alors chaque core aura à sa disposition un FPU de 128 bit, ce qui offre une puissance de calcul égale à l'archi "Stars".
Par contre, s'il n'y a qu'un thread, ou si les FP ne sont pas exécutés en même temps par les 2 cores d'un même module, alors les perfs sont doublés.

Le fait de partager le FPU ne ralentira l'exécution du code que si les 2 threads doivent traiter simultanément une instruction FP et qu'au moins une de ces 2 instructions est de 256 bit.

Étant donné qu'en moyenne un programme "FP heavy" ne contient qu'environ 40% d'instructions FP, et qu'aucun de ceux-ci n'utilise encore l'AVX, le ralentissement ne se produira qu'en de très rares occasions.

Nombre d'instruction FP dans une appli utilisant fortement les FP :
http://www.amdzone.com/phpbb3/download/file.php?id=394

Le ~40% en FP n'est pas anodin, loin de là.

En effet, s'il y a en moyenne moins de 50% d'instructions FP à exécuter, cela veut dire que le bloc FPU d'un core est occupé moins de 50% du temps.
Si un core est occupé moins de 50% du temps, qu'arriverait-il si 2 cores se partageaient le même bloc FPU ?
Réponse: Cela n'aurait pratiquement aucune incidence sur les performances réelles, mais ça ferait économiser énormément d'espace.

Citation :

Floating-Point Unit

The AMD Family 15h processor floating point unit (FPU) was designed to provide four times the raw
FADD and FMUL bandwidth as the original AMD Opteron and Athlon 64 processors. It achieves this
by means of two 128-bit fused multiply-accumulate (FMAC) units which are supported by a 128-bit
high-bandwidth load-store system. The FPU is a coprocessor model that is shared between the two
cores of one AMD Family 15h compute unit. As such it contains its own scheduler, register files and
renamers and does not share them with the integer units. This decoupling provides optimal
performance of both the integer units and the FPU. In addition to the two FMACs, the FPU also
contains two 128-bit integer units which perform arithmetic and logical operations on AVX, MMX
and SSE packed integer data.

A 128-bit integer multiply accumulate (IMAC) unit is incorporated into FPU pipe 0. The IMAC
performs integer fused multiply and accumulate, and similar arithmetic operations on AVX, MMX
and SSE data. A crossbar (XBAR) unit is integrated into FPU pipe 1 to execute the permute
instruction along with shifts, packs/unpacks and shuffles. There is an FPU load-store unit which
supports up to two 128-bit loads and one 128-bit store per cycle.

http://i624.photobucket.com/albums [...] o/FPUE.jpg

FPU Features Summary and Specifications:
• The FPU can receive up to four ops per cycle. These ops can only be from one thread, but the
thread may change every cycle. Likewise the FPU is four wide, capable of issue, execution and
completion of four ops each cycle. Once received by the FPU, ops from multiple threads can be
executed.
• Within the FPU, up to two loads per cycle can be accepted, possibly from different threads.
• There are four logical pipes: two FMAC and two packed integer. For example, two 128-bit
FMAC and two 128-bit integer ALU ops can be issued and executed per cycle.
• Two 128-bit FMAC units. Each FMAC supports four single precision or two double-precision ops.
• FADDs and FMULs are implemented within the FMAC's.
• x87 FADDs and FMULs are also handled by the FMAC.
• Each FMAC contains a variable latency divide/square root machine.
• Only 1 256-bit operation can issue per cycle, however an extra cycle can be incurred as in the case
of a FastPath Double if both micro ops cannot issue together.
• Two-way 128-bit wide floating-point execution
• Legacy single-instruction multiple-data (SIMD) instruction extensions, as well as support for
XOP, FMA4, VPERMILx, and Advanced Vector Extensions (AVX).
• Deep out-of-order floating-point execution
• Improved data transfer between floating-point registers and general purpose registers
• Improved floating-point register to floating-point register moves

Citation :

[:mrfreeze]

Ton truc c'est bien, c'est idéaliste, mais bon je ne suis pas sur que ce soit si simple. D'autant que Linpack en AVX c'est +80% de perf, donc le pipe FPU est utilisé à plus de 50%...

Message cité 1 fois

---------------
| AMD Ryzen 7 7700X 8C/16T @ 4.5-5.4GHz - 64GB DDR5-6000 30-40-40 1T - AMD Radeon RX 7900 XTX 24GB @ 2680MHz/20Gbps |

MEI

|DarthPingoo(tm)|

abw a écrit :

Un petite foto...BD16C...l essentiel est ecrit dessus..

http://www.xbitlabs.com/images/new [...] n_6100.jpg

http://www.xbitlabs.com/news/cpu/d [...] Plans.html

Un Bulldozer fabriqué en 2009 :??:

Message cité 1 fois
Message édité par MEI le 03-06-2011 à 00:22:17

---------------
| AMD Ryzen 7 7700X 8C/16T @ 4.5-5.4GHz - 64GB DDR5-6000 30-40-40 1T - AMD Radeon RX 7900 XTX 24GB @ 2680MHz/20Gbps |

Invite_Surprise

Racaille de Shanghaï

abw a écrit :

Un petite foto...BD16C...l essentiel est ecrit dessus..

http://www.xbitlabs.com/images/new [...] n_6100.jpg

http://www.xbitlabs.com/news/cpu/d [...] Plans.html

Y'a écrit Magny-Cours 12 Core dessus ...

abw

MEI a écrit :

Un Bulldozer fabriqué en 2009 :??:

Merd... :sleep:

C est un Magny Cours 12C...Et ca y ressemble a donf..

Je me disais bien que Xbitlabs , c est un site d escroqs... :fou:

Message cité 1 fois
Message édité par abw le 03-06-2011 à 00:27:48

mum1989

abw a écrit :

Merd... :sleep:

C est un Magny Cours 12C...Et ca y ressemble a donf..

Je me disais bien que Xbitlabs , c est un site d escroqs

+1

MC= Magny Cours.

Gigathlon

Quad-neurones natif

MEI a écrit :

Ton truc c'est bien, c'est idéaliste, mais bon je ne suis pas sur que ce soit si simple. D'autant que Linpack en AVX c'est +80% de perf, donc le pipe FPU est utilisé à plus de 50%...

Je ne vois aucune démonstration.

Si la FPU est utilisée 50% du temps en SSE, une augmentation de perfs de 80% en AVX représente une baisse de l'utilisation à seulement 40%.

Message cité 1 fois
Message édité par Gigathlon le 03-06-2011 à 00:43:27

MysterieuseX

Chieuse

C'est 'dredi les gens non ?
Bon Wirmish, plus que ... 132 pages et salut Sandy !

Joyeux 'dredi a tous !

MEI

|DarthPingoo(tm)|

Gigathlon a écrit :

Je ne vois aucune démonstration.

Si la FPU est utilisée 50% du temps en SSE, une augmentation de perfs de 80% en AVX représente une baisse de l'utilisation à seulement 40%.

Si tu passe de SSEx à AVX, tu doubles théoriquement les performances en calculs flottants.

Si tu passes de 100 à 180 en indice de performance, clairement c'est que ton pipe FPU était, au moins, utilisé à 90%... mais bon c'est pas grave...

Message cité 2 fois

---------------
| AMD Ryzen 7 7700X 8C/16T @ 4.5-5.4GHz - 64GB DDR5-6000 30-40-40 1T - AMD Radeon RX 7900 XTX 24GB @ 2680MHz/20Gbps |

Gigathlon

Quad-neurones natif

MEI a écrit :

C'est bien ce que je disais... le fait de prendre un parapluie n'implique pas qu'il pleuve car quand il pleut je prend mon parapluie.

chriskenoby

Que la force soit avec vous

oui mais tu ne prend pas de pepin, si tu est sur qu il ne va pas pleuvoir....

---------------
Les créateurs de l'Electro, c'est eux KRAFTWERK http://www.kraftwerk.com/concerts/ [...] _robo.html - Mes Cartes https://drive.google.com/drive/fold [...] 0-vZPkdfoi

Fouge

MEI a écrit :

Si tu passe de SSEx à AVX, tu doubles théoriquement les performances en calculs flottants.

Si tu passes de 100 à 180 en indice de performance, clairement c'est que ton pipe FPU était, au moins, utilisé à 90%... mais bon c'est pas grave...

Aucun rapport. Tout ce que tu peux en déduire que le taux d'occupation FPU baisse (de 50 à 40% par ex), ou que le doublage des perf théorique n'est que théorique (x0.8 en pratique).

Message édité par Fouge le 03-06-2011 à 10:22:09

Wirmish

¡sıɹdɹns zǝɹǝs snoʌ

moyen_moins

chat réincarné

Cool mais on veut déjà BD nous :sleep:

Message cité 1 fois

Zack38

Bon, je vais rajouter une petite règle.

Déjà que les posts mono-smilesques étaient proscrits, maintenant, les posts avec seulement une image le seront aussi. :sleep:

En vigueur dès maintenant.

thevv27

moyen_moins a écrit :

Cool mais on veut déjà BD nous :sleep:

Avec AMD, on a autant d'infos sur le futur à 3 ou 4 ans qu'à quelques mois... de là à dire qu'il y a un problème de comm' [:cosmoschtroumpf]

Message édité par thevv27 le 03-06-2011 à 13:38:09

dje5170

IL SORT QUAND LE PROCHAIN FAKE :fou: :fou: :fou: :fou: :fou:

[:f5 powa]

Message cité 1 fois

Darkad

Dark side only ...

dje5170 a écrit :

IL SORT QUAND LE PROCHAIN FAKE :fou: :fou: :fou: :fou: :fou:

[:f5 powa]

[:already 47:2]
ouai bien en cherchant un peu sur gogole.fr tu trouveras peut être un FX-8130P OC a 10Ghz avec 250 de TDP ... avec azote cooling quand même ... :whistle:

:hello:

---------------
[Topic unique] ASROCK /// Chipset 9xx /// AM3+ & Ma Config

moyen_moins

chat réincarné

AMD [H]ardOCP GamExperience - July 16
On va peut être avoir des leaks ? [:totoz]

edit: A propos de BD en ES : http://www.planet3dnow.de/vbulleti [...] count=2705
La vache, il montre haut en tension pour du 32nm

Message cité 1 fois
Message édité par moyen_moins le 03-06-2011 à 18:30:21

MEI

|DarthPingoo(tm)|

moyen_moins a écrit :

AMD [H]ardOCP GamExperience - July 16
On va peut être avoir des leaks ? [:totoz]

edit: A propos de BD en ES : http://www.planet3dnow.de/vbulleti [...] count=2705
La vache, il montre haut en tension pour du 32nm

Le pire c'est le 13x200 = 2600 @ 1,275V... Putain mon C2D X6800 B2 des premier batch faisait ces 2,93GHz @ 1,275V justement... en 65nm :'(

Mais bon rassuront nous, tout le monde dit que le 32nm de GloFo a pas de problème et est de loin supérieur à celui d'Intel...

Message cité 1 fois

---------------
| AMD Ryzen 7 7700X 8C/16T @ 4.5-5.4GHz - 64GB DDR5-6000 30-40-40 1T - AMD Radeon RX 7900 XTX 24GB @ 2680MHz/20Gbps |

moyen_moins

chat réincarné

Bah, c'est un ES, donc bon, ça peut être normal après tout.
Pis AMD et sa maladie de toujours survolter ses processeurs [:manust]
On verra bien avec Llano dans 2-3 semaines

Message cité 1 fois

MEI

|DarthPingoo(tm)|

moyen_moins a écrit :

Bah, c'est un ES, donc bon, ça peut être normal après tout.
Pis AMD et sa maladie de toujours survolter ses processeurs [:manust]
On verra bien avec Llano dans 2-3 semaines

C'est pas anormal (clairement j'avais un X6800 parmis les bas VID qu'on pouvais avoir...), mais ce n'est pas rassurant car a 3,6GHz @ 1,412V on est clairement au taquet de ce que supporte le process et donc ça peut expliqué le retard le temps d'ajuster pour pouvoir reduire la tension.

Parce que clairement faudrait qu'en Turbo @ 4,2Ghz on soit a 1,35V maxi. en 32nm si on veux avoir un TDP correct et tenir la distance niveau durée de vie...

Message cité 2 fois

---------------
| AMD Ryzen 7 7700X 8C/16T @ 4.5-5.4GHz - 64GB DDR5-6000 30-40-40 1T - AMD Radeon RX 7900 XTX 24GB @ 2680MHz/20Gbps |

moyen_moins

chat réincarné

Je suis d'accord.
Même si ça va aller en s'arrangeant avec le temps (le 45nm a quand même bien évolué)

Profil supprimé

MEI a écrit :

Mais bon rassuront nous, tout le monde dit que le 32nm de GloFo a pas de problème et est de loin supérieur à celui d'Intel...

Tu fais pas semblant le dredi :ange:

MEI a écrit :

Je pense qu'on verra des valeurs supérieures que chez INTEL comme actuellement
Autour d'1.4+ ne devrait pas lui faire trop bobo

Message cité 1 fois
Message édité par Profil supprimé le 03-06-2011 à 20:29:47

Invite_Surprise

Racaille de Shanghaï

3600@1.41v y'a clairement un souci là :pt1cable:

MEI

|DarthPingoo(tm)|

1,4V pour du 32nm quel que soit le fondeur, ça reste élevé.

Message cité 2 fois

---------------
| AMD Ryzen 7 7700X 8C/16T @ 4.5-5.4GHz - 64GB DDR5-6000 30-40-40 1T - AMD Radeon RX 7900 XTX 24GB @ 2680MHz/20Gbps |

Zack38

MEI a écrit :

1,4V pour du 32nm quel que soit le fondeur, ça reste élevé.

C'est pour ça que les processeurs AMD 32nm auront un voltage situé entre 0.8V et 1.3V.

Message cité 1 fois

Publicité

Page : 1 2 3 4 5 .. 367 368 369 .. 988 989 990 991 992 993

Page Suivante

Page Précédente

Haut de page

FORUM HardWare.fr

Hardware

Processeur

[Topic Unique] Processeurs AMD Bulldozer FX-8100/6100/4100 (32nm)

Sujets relatifs
[topic uniq] LanParty MI P55-T36 mini itx	[Topic unique] Crucial M225 (Version 64, 128, 256 Go)
AMD Athlon 64 FX-57 overclocké à 3.1ghz s/A8N32-SLI Deluxe+SLI 8800GTX	[Topic unique] Gigabyte GA-MA770T-UD3P
Erreur CRC WinRar Config AMD 3 Windows 7 64	[Topic Unique] Thermaltake Level 10
Plus de sujets relatifs à : [Topic Unique] Processeurs AMD Bulldozer FX-8100/6100/4100 (32nm)

Page générée en 0.076 secondes