Forum |  HardWare.fr | News | Articles | PC | S'identifier | S'inscrire | Shop Recherche
2768 connectés 

 

 

L'évolution de votre machine...




Attention si vous cliquez sur "voir les résultats" vous ne pourrez plus voter
Les invités peuvent voter

 Mot :   Pseudo :  
  Aller à la page :
 
 Page :   1  2  3  4  5  ..  12  13  14  ..  988  989  990  991  992  993
Auteur Sujet :

[Topic Unique] Processeurs AMD Bulldozer FX-8100/6100/4100 (32nm)

n°7247744
Zack38
Posté le 15-12-2009 à 16:44:33  profilanswer
 

Reprise du message précédent :
Je MàJ, merci ;)

mood
Publicité
Posté le 15-12-2009 à 16:44:33  profilanswer
 

n°7247838
boblion
Posté le 15-12-2009 à 17:49:06  profilanswer
 


Les P4 étaient bien moucraves quand même :/

n°7248800
Zack38
Posté le 16-12-2009 à 12:19:00  profilanswer
 

Je voudrais faire remarquer une incohérence avec Llano .
Aujourd'hui, les MB AM3 ne sont pas équipées nativement de sorties vidéo . Alors, comment fera le GPU du Llano ?
 
Tout ça, ça veut probablement dire qu'AMD sortira un chipset pour ses Fusion, et un chipset pour ses CPU normaux ... :/
Obligé .

n°7248863
Profil sup​primé
Posté le 16-12-2009 à 13:21:38  answer
 

plateforme AM3- pour les llano :D

n°7248891
Zack38
Posté le 16-12-2009 à 13:54:37  profilanswer
 


 
Ou AM3++ pour les Bulldozer :whistle:

n°7248925
Wirmish
¡sıɹdɹns zǝɹǝs snoʌ
Posté le 16-12-2009 à 14:17:54  profilanswer
 

Zack38 a écrit :

Je voudrais faire remarquer une incohérence avec Llano .
Aujourd'hui, les MB AM3 ne sont pas équipées nativement de sorties vidéo . Alors, comment fera le GPU du Llano ?
 
Tout ça, ça veut probablement dire qu'AMD sortira un chipset pour ses Fusion, et un chipset pour ses CPU normaux ... :/
Obligé .


Posté le 10-12-2009:

Citation :

Certaines infos laissent croire que le LIano sortirait comme prévu en 2011, en même temps que les chipsets de la série 900.


Posté le 11-12-2009:

Citation :

Tu veux un APU ? Alors prend un LIano et tu l'aura, mais un nouveau socket il te faudra.


:jap:

n°7249068
Zack38
Posté le 16-12-2009 à 15:46:03  profilanswer
 

Ok, ok ... :D  
J'avais mal lu et/ou oublié . :o


Message édité par Zack38 le 23-12-2009 à 11:12:35
n°7250676
gaulomer
Posté le 17-12-2009 à 18:19:29  profilanswer
 

Le dodécacore d'AMD prévu pour mars 2010  
 
http://www.comptoir-hardware.com/a [...] -2010.html

n°7251231
Wirmish
¡sıɹdɹns zǝɹǝs snoʌ
Posté le 18-12-2009 à 01:05:58  profilanswer
 

Et le Bulldozer d'AMD prévu pour ...
 
AMD to Start Production of First Bulldozer Processors in 1H 2011

Citation :

Advanced Micro Devices will initiate production of its first-processor based on Bulldozer micro-architecture in the first half of 2011, a source familiar with the plans of the world’s second largest supplier of microprocessors has revealed. Potentially, this may mean that the long-awaited micro-architecture from AMD will be available earlier than expected.

n°7251861
Zack38
Posté le 18-12-2009 à 15:57:16  profilanswer
 

gaulomer a écrit :

Le dodécacore d'AMD prévu pour mars 2010  
 
http://www.comptoir-hardware.com/a [...] -2010.html


 
Tout ça, c'est que deux K10.5 Hexacore placés en MCM sur le ^m bout de silicium . Et, à cause de leur gravure en 45nm, ils n'arrivent ^m pas à atteindre 2.50GHz ... :/
 

Wirmish a écrit :

Et le Bulldozer d'AMD prévu pour ...
 
AMD to Start Production of First Bulldozer Processors in 1H 2011

Citation :

Advanced Micro Devices will initiate production of its first-processor based on Bulldozer micro-architecture in the first half of 2011, a source familiar with the plans of the world’s second largest supplier of microprocessors has revealed. Potentially, this may mean that the long-awaited micro-architecture from AMD will be available earlier than expected.



 
Si AMD débute la production des premiers Bulldozer au premier trimestre 2011, on peut espérer les voir en boutique à la fin du Q1, donc en Mars s'il n'y a pas de retard .

mood
Publicité
Posté le 18-12-2009 à 15:57:16  profilanswer
 

n°7252244
regis183
Posté le 18-12-2009 à 19:48:51  profilanswer
 

1H ça veut dire mois de Mai et non premier trimestre 2011 (1Q).


Message édité par regis183 le 18-12-2009 à 20:39:39
n°7252267
Zack38
Posté le 18-12-2009 à 20:01:03  profilanswer
 

Ah, oui, j'ai encore confondu H1 et Q1 ...
Q1 = Janvier, Février, Mars
H1 = Janvier, Février, Mars, Avril, Mai, Juin
 
Donc ... on peut espérer les 1ers Bulldozer entre Mai et Juin .
M'enfin, aujourd'hui, c'est ^m pas du début de la production qu'on est loin, c'est de la finalisation du procédé de gravure ...
Donc, ça peut encore varier de 1 trimestre ou plus si IBM prend du retard ou que son procédé n'est pas assez performant .

n°7252607
Wirmish
¡sıɹdɹns zǝɹǝs snoʌ
Posté le 19-12-2009 à 02:36:42  profilanswer
 

Ma petite prédiction:
· Mars/Avril pour les Radeon 6000.
· Mai/Juin pour les CPU à base de Bulldozer.
· Même date pour les chipsets de la série 900.
 
2011 sera l'année du renouveau chez AMD.

n°7252636
Wirmish
¡sıɹdɹns zǝɹǝs snoʌ
Posté le 19-12-2009 à 03:56:23  profilanswer
 

Encore des news rumeurs sur le Bulldozer...
 
Bulldozer:
· 2x 4 instructions par clock
· jusqu'à 2x 4x 64-bit Int instructions par clock (Possibilité de 10 Int par clock avec la fusion de 2 instructions.)
· jusqu'à 4x 64-bit FP Multiplications et Additions par clock
 
Nehalem:
· 4 instructions par clock
· jusqu'à 4x 64-bit Int instructions par clock
· jusqu'à 4x 64-bit FP Multiplications ou Additions par clock
 
De plus, un module Buldozer serait non seulement capable de traiter 2x 128 bit ou 1x 256 bit FMAC par clock, mais il pourrait probablement traiter 2x128 bit ou 1x256 bit FADD et 2x128 ou 1x256 bit FMUL par cycle.
 
Étant donné que les rumeurs laissent croire que la taille d'un module DB sera similaire à celle d'un core de Westmere, je vous laisse deviner lequel des 2 architecture offrira le meilleur rapport perfs/mm². Naturellement, pour cela il faut que les rumeurs soient vraies...
 
 
EDIT: Encore un petit paragraphe parce que vous le valez bien.

Citation :

The Bulldozer architecture can provide up to 80% greater expected throughput when running 2 threads simultaneously compared to a single thread running on a single integer core.  Our engineers estimate that the amount of discrete circuitry that is added to each Bulldozer module in order to allow for a second integer thread to run only adds ~12% additional circuitry to each module, which translates into only ~5% of circuitry to the total Bulldozer die.  We believe this is an excellent balance of greater performance with a very small silicon cost. The goal of the shared components is to help drive down power consumption.  When you consider that our 16-core Interlagos is being designed to fit in the same power/thermal environment as a 12-core Magny Cours, it is clear that we’ve made some good choices around the power optimization – without sacrificing performance or features.


Lorsqu'un module exécute 2 threads on n'obtient pas 2x plus de puissance qu'avec 1 thread, mais jusqu'à 80% plus de puissance. Autrement dit le fait d'exécuter un 2e thread augmente la charge des unités qui sont partagés entre les 2 threads (ex: decoder, scheduler), mais ces unités ne peuvent traiter qu'un nombre X d'instructions à la fois, et on peut en déduire que ce nombre d'instructions n'est pas suffisant pour remplir les pipelines des 2 cores INT et du core FP/SIMD. On pourrait donc dire qu'un module BD est Scheduler ou Decoder limited.

Message cité 2 fois
Message édité par Wirmish le 19-12-2009 à 04:35:42
n°7252639
regis183
Posté le 19-12-2009 à 04:53:07  profilanswer
 

Les unités SSE utilisent effectivement beaucoup de transistors, et sont assez peu utilisées. AMD cherche donc à optimiser de ce coté là. Mais pourquoi alors rajoutent-t-ils leur propre sur-couche maison d'instructions SSE ? Qui utilisera ces instructions non compatibles INTEL? Y'a visiblement des ingénieurs qui ne tirent pas dans le m^me sens au sein de cette société ...

n°7252716
Zack38
Posté le 19-12-2009 à 10:23:14  profilanswer
 

Wirmish a écrit :

Encore des news rumeurs sur le Bulldozer...
 
Bulldozer:
· 2x 4 instructions par clock
· jusqu'à 2x 4x 64-bit Int instructions par clock (Possibilité de 10 Int par clock avec la fusion de 2 instructions.)
· jusqu'à 4x 64-bit FP Multiplications et Additions par clock
 
Nehalem:
· 4 instructions par clock
· jusqu'à 4x 64-bit Int instructions par clock
· jusqu'à 4x 64-bit FP Multiplications ou Additions par clock
 
De plus, un module Buldozer serait non seulement capable de traiter 2x 128 bit ou 1x 256 bit FMAC par clock, mais il pourrait probablement traiter 2x128 bit ou 1x256 bit FADD et 2x128 ou 1x256 bit FMUL par cycle.
 
Étant donné que les rumeurs laissent croire que la taille d'un module DB sera similaire à celle d'un core de Westmere, je vous laisse deviner lequel des 2 architecture offrira le meilleur rapport perfs/mm². Naturellement, pour cela il faut que les rumeurs soient vraies...
 
 
EDIT: Encore un petit paragraphe parce que vous le valez bien.

Citation :

The Bulldozer architecture can provide up to 80% greater expected throughput when running 2 threads simultaneously compared to a single thread running on a single integer core.  Our engineers estimate that the amount of discrete circuitry that is added to each Bulldozer module in order to allow for a second integer thread to run only adds ~12% additional circuitry to each module, which translates into only ~5% of circuitry to the total Bulldozer die.  We believe this is an excellent balance of greater performance with a very small silicon cost. The goal of the shared components is to help drive down power consumption.  When you consider that our 16-core Interlagos is being designed to fit in the same power/thermal environment as a 12-core Magny Cours, it is clear that we’ve made some good choices around the power optimization – without sacrificing performance or features.


Lorsqu'un module exécute 2 threads on n'obtient pas 2x plus de puissance qu'avec 1 thread, mais jusqu'à 80% plus de puissance. Autrement dit le fait d'exécuter un 2e thread augmente la charge des unités qui sont partagés entre les 2 threads (ex: decoder, scheduler), mais ces unités ne peuvent traiter qu'un nombre X d'instructions à la fois, et on peut en déduire que ce nombre d'instructions n'est pas suffisant pour remplir les pipelines des 2 cores INT et du core FP/SIMD. On pourrait donc dire qu'un module BD est Scheduler ou Decoder limited.


 
Bha, soit c'était ça, soit AMD devait faire deux cores séparés donc classiques .
Du coup, imaginons un X2 BD : il a un module et peut donc gérer 2 threads à 80% de sa puissance .
L'équivalent dualcore chez Intel, un SNB qui a deux cores séparés .
Qui va gagner le duel ? Le modèle Intel, parce que lui, en plus d'avoir l'Hyper-Threading, il pourra gérer 2 threads à 100% de sa puissance .
 
Si après on compare un core SNB à un module BD, l'avantage sera à l'architecture d'AMD, mais ce n'est pas vraiment valable puisque Intel ne nommera ses CPU qu'en fonction de leur nombre de cores réels et sans compter l'Hyper-Threading ...
 
Donc pour que vainc l'architecture Bulldozer, il faudra qu'AMD nomme ses processeurs en fonction de leur nombre de modules et pas de sous-core . Sinon, aux yeux du consommateur lambda, Intel aura considérablement l'avantage .
 

regis183 a écrit :

Les unités SSE utilisent effectivement beaucoup de transistors, et sont assez peu utilisées. AMD cherche donc à optimiser de ce coté là. Mais pourquoi alors rajoutent-t-ils leur propre sur-couche maison d'instructions SSE ? Qui utilisera ces instructions non compatibles INTEL? Y'a visiblement des ingénieurs qui ne tirent pas dans le m^me sens au sein de cette société ...


 
Euh ... ? Tu veux parler du SSE5 ? Je crois qu'AMD a décidé d'annuler son implémentation dans Bulldozer, au profit de l'implémentation de l'AVX d'Intel .

n°7252729
seth-01
Posté le 19-12-2009 à 10:41:19  profilanswer
 

Zack38 a écrit :


Donc pour que vainc l'architecture Bulldozer, il faudra qu'AMD nomme ses processeurs en fonction de leur nombre de modules et pas de sous-core . Sinon, aux yeux du consommateur lambda, Intel aura considérablement l'avantage .
 


+1, et un grand +1 même !  
 
Si j'ai bien suivi, un "module" peut gérer 2 sous core. C'est comme si on avait un processeur simple coeur mais pouvant gérer 2 thread c'est bien ca je pense ?! Alors oui AMD devra noter ses CPU en fonction de leur module ce qui signifie forcément qu'un dualcore de la génération Bulldozer pourra gérer 4 thread comme le fait le core "i" de Intel pour l'hyperthreading

n°7252732
Zack38
Posté le 19-12-2009 à 10:45:56  profilanswer
 

seth-01 a écrit :


+1, et un grand +1 même !  
 
Si j'ai bien suivi, un "module" peut gérer 2 sous core. C'est comme si on avait un processeur simple coeur mais pouvant gérer 2 thread c'est bien ca je pense ?! Alors oui AMD devra noter ses CPU en fonction de leur module ce qui signifie forcément qu'un dualcore de la génération Bulldozer pourra gérer 4 thread comme le fait le core "i" de Intel pour l'hyperthreading


 
Exactement . :jap:  
 
1 module Bulldozer = 2 sous-core alimentés par le ^m scheduler/decoder, qui limitera donc leur puissance à 80% de leur potentiel .
Un score vraisemblablement excellent comparativement à l'Hyper-Threading d'Intel, qui peut carrément avoir des performances négatives .
 
Donc, si AMD nomme ses CPU en fonction de leur nombre de modules, AMD piquera très facilement le leadership d'Intel, et en très peu de temps, pour peu que le procédé de gravure en 32nm d'IBM soit performant et rentable à temps .

n°7252745
seth-01
Posté le 19-12-2009 à 11:08:13  profilanswer
 

Zack38 a écrit :


 
Exactement . :jap:  
 
1 module Bulldozer = 2 sous-core alimentés par le ^m scheduler/decoder, qui limitera donc leur puissance à 80% de leur potentiel .
Un score vraisemblablement excellent comparativement à l'Hyper-Threading d'Intel, qui peut carrément avoir des performances négatives .
 
Donc, si AMD nomme ses CPU en fonction de leur nombre de modules, AMD piquera très facilement le leadership d'Intel, et en très peu de temps, pour peu que le procédé de gravure en 32nm d'IBM soit performant et rentable à temps .


oui .... ben je vois déjà le service marketing hyper foireux de chez AMD nommer un module Bulldozer comme un dualcore ......  :ange:  :o  :fou:

n°7252819
Zack38
Posté le 19-12-2009 à 12:29:37  profilanswer
 

Tu penses comme moi, ça serait une erreur monumentale que de faire ce choix-là de dénomination .
 
Par contre, un module Bulldozer coûtera près de deux coeurs séparés et complets, il ne serait donc pas étonnant que les prix bas d'AMD se retrouvent à la hauteur de ceux d'Intel (sauf qu'Intel continuera toujours à avoir plus de marge :whistle: ) .

n°7252829
seth-01
Posté le 19-12-2009 à 12:39:51  profilanswer
 

Zack38 a écrit :

Tu penses comme moi, ça serait une erreur monumentale que de faire ce choix-là de dénomination .
 
Par contre, un module Bulldozer coûtera près de deux coeurs séparés et complets, il ne serait donc pas étonnant que les prix bas d'AMD se retrouvent à la hauteur de ceux d'Intel (sauf qu'Intel continuera toujours à avoir plus de marge :whistle: ) .


c'est bien pour ca qu'ils vont le faire : c'est des incompétents ! :/

n°7252983
Wirmish
¡sıɹdɹns zǝɹǝs snoʌ
Posté le 19-12-2009 à 14:34:27  profilanswer
 

Faut pas faire de conclusion hâtives.
 
On sait que si un module n'exécute qu'un seul thread il offre 100% de perfs.
Et lorsqu'il doit partager 2 threads, chaque core INT n'offre que 90% des perfs maximales.
Sauf que ces perfs ne sont pas comparés entre le Bulldozer et le Phenom II.
Autrement dit le 90% de perfs du BD est peut-être plus élevé qu'un 100% de perfs sur un Phenom II.
 
 
 
@regis183: AMD avait choisi d'intégrer son SSE5 (le 30 août 2007) sur le Bulldozer... mais Intel a copié ces instructions en avril 2008. Intel a choisi de nommer ces instructions AVX et de les implémenter dans le Sandy-Bridge et dans ses futurs CPU. Étant donné que c'est Intel qui impose sa loi à tout le monde, AMD a été obligé de reprendre l'implémentation d'Intel. Sauf que ce dernier n'a pas repris la totalité des instructions SSE5. AMD a donc ajouté l'XOP et le FMA4, alors qu'Intel n'utilisera le FMA3 que sur son Haswell (en 2012) et fera l'impasse sur l'XOP. Le seul problème c'est qu'Intel n'intégrera sûrement pas les fonctions supplémentaires d'AMD dans son compilateur. Heureusement qu'il existe d'autres compilateurs -> Exemple
 
 
 
@Zack38 et seth-01: "Donc pour que vainc l'architecture Bulldozer, il faudra qu'AMD nomme ses processeurs en fonction de leur nombre de modules et pas de sous-core . Sinon, aux yeux du consommateur lambda, Intel aura considérablement l'avantage ."
 
En fait c'est plutôt l'inverse, car lorsque le consommateur lambda arrivera dans un commerce il aura le choix entre un CPU AMD à 8 cores ou un CPU Intel à 4 et peut-être même 6 cores. Et devinez ce que le consommateur lambda choisira si ces CPU sont offerts au même prix.

Message cité 3 fois
Message édité par Wirmish le 19-12-2009 à 14:41:18
n°7253021
regis183
Posté le 19-12-2009 à 15:03:15  profilanswer
 

Wirmish a écrit :

AMD avait choisi d'intégrer son SSE5 (le 30 août 2007) sur le Bulldozer... mais Intel a copié ces instructions en avril 2008. Intel a choisi de nommer ces instructions AVX et de les implémenter dans le Sandy-Bridge et dans ses futurs CPU. Étant donné que c'est Intel qui impose sa loi à tout le monde, AMD a été obligé de reprendre l'implémentation d'Intel. Sauf que ce dernier n'a pas repris la totalité des instructions SSE5. AMD a donc ajouté l'XOP et le FMA4, alors qu'Intel n'utilisera le FMA3 que sur son Haswell (en 2012) et fera l'impasse sur l'XOP. Le seul problème c'est qu'Intel n'intégrera sûrement pas les fonctions supplémentaires d'AMD dans son compilateur


 
OK merci, c'est plus claire comme ça  :jap:

n°7253022
chrisleurn
Hardcore Will Never Die !
Posté le 19-12-2009 à 15:04:22  profilanswer
 

Wirmish a écrit :


En fait c'est plutôt l'inverse, car lorsque le consommateur lambda arrivera dans un commerce il aura le choix entre un CPU AMD à 8 cores ou un CPU Intel à 4 et peut-être même 6 cores. Et devinez ce que le consommateur lambda choisira si ces CPU sont offerts au même prix.


Bin comme d'hab Intel [:spamafote]

n°7253030
Zack38
Posté le 19-12-2009 à 15:14:14  profilanswer
 

Wirmish a écrit :

Faut pas faire de conclusion hâtives.
 
On sait que si un module n'exécute qu'un seul thread il offre 100% de perfs.
Et lorsqu'il doit partager 2 threads, chaque core INT n'offre que 90% des perfs maximales.
Sauf que ces perfs ne sont pas comparés entre le Bulldozer et le Phenom II.
Autrement dit le 90% de perfs du BD est peut-être plus élevé qu'un 100% de perfs sur un Phenom II.
 
 
 
@regis183: AMD avait choisi d'intégrer son SSE5 (le 30 août 2007) sur le Bulldozer... mais Intel a copié ces instructions en avril 2008. Intel a choisi de nommer ces instructions AVX et de les implémenter dans le Sandy-Bridge et dans ses futurs CPU. Étant donné que c'est Intel qui impose sa loi à tout le monde, AMD a été obligé de reprendre l'implémentation d'Intel. Sauf que ce dernier n'a pas repris la totalité des instructions SSE5. AMD a donc ajouté l'XOP et le FMA4, alors qu'Intel n'utilisera le FMA3 que sur son Haswell (en 2012) et fera l'impasse sur l'XOP. Le seul problème c'est qu'Intel n'intégrera sûrement pas les fonctions supplémentaires d'AMD dans son compilateur. Heureusement qu'il existe d'autres compilateurs -> Exemple
 
 
 
@Zack38 et seth-01: "Donc pour que vainc l'architecture Bulldozer, il faudra qu'AMD nomme ses processeurs en fonction de leur nombre de modules et pas de sous-core . Sinon, aux yeux du consommateur lambda, Intel aura considérablement l'avantage ."
 
En fait c'est plutôt l'inverse, car lorsque le consommateur lambda arrivera dans un commerce il aura le choix entre un CPU AMD à 8 cores ou un CPU Intel à 4 et peut-être même 6 cores. Et devinez ce que le consommateur lambda choisira si ces CPU sont offerts au même prix.


 
Vu comme ça, certes, c'est très intéressant pour AMD, mais moi je me sentirais roulé en connaissance de cause .
 
Pour le FMA4, qu'est-ce que ça a de particulier par rapport au FMA3 ? Tu le présentes un peu comme une évolution majeure, peut-être des explications supplémentaires seraient-elles le bienvenue ? ^M chose pour le XOP ?
 
Et, question compilateur, Intel va se faire attaquer en justice, notamment parce que son compilateur abaisserait volontairement les perfs des processeurs concurrents ...

n°7253075
Wirmish
¡sıɹdɹns zǝɹǝs snoʌ
Posté le 19-12-2009 à 16:09:51  profilanswer
 

Zack38 a écrit :

Vu comme ça, certes, c'est très intéressant pour AMD, mais moi je me sentirais roulé en connaissance de cause .


Tu te sentirais roulé si un Phenom III 8 cores (4 modules Bulldozer) offrait plus de perfs qu'un Sandy-Bridge 6 cores (12 threads) ? Ah bon.  :whistle:  
 

Zack38 a écrit :

Pour le FMA4, qu'est-ce que ça a de particulier par rapport au FMA3 ? Tu le présentes un peu comme une évolution majeure, peut-être des explications supplémentaires seraient-elles le bienvenue ? ^M chose pour le XOP ?

Le FMA4 c'est ce que voulais implémenter Intel dans son futur CPU... sauf qu'ils ont dû revoir leurs plans et ont repoussé le FMA4 sur le Haswell en 2012... et ensuite ils ont de nouveau modifié les specs et ils ont limité l'implémentation au FMA3. Du côté d'AMD, les techs n'ont pas eu de problèmes et ont implémenté le FMA4 original dans le Bulldozer, même si au départ ils ne voulaient implémenter que le FMA3.
 
En fait le FMA est déja utilisé par AMD... dans le Cypress (RV870).
Les specs DX11 impose en effet le support du standard IEEE754-2008.
Naturelement le Fermi supportera aussi le FMA.
 
Pour plus d'info sur le FMA -> Wiki (anglais)

Citation :

This adds FMA (Fused Multiply Add) instruction support that, in contrast to the standard MAD (Multiply Add) instruction, allows you to retain the totality of the intermediary result of the multiplication and therefore gives higher precision. Given how floating point numbers function, this provides very efficient processing of other instructions. AMD has taken advantage of this by making the scalar product more efficient and adding a native SAD (Sum of Absolute Difference) instruction that greatly accelerates certain algorithms.


 
En ce qui concerne le XOP, voici encore une fois le Wiki -> LIEN

Citation :

· Horizontal integer add/subtract: Signed or unsigned add, or signed subtract, of adjacent byte, word, or dword elements in the source vector to word, dword or qword elements of the destination vector. 128-bit.
· Integer multiply/accumulate: Multiplies elements of two input vectors, adding the results to a third input vector. 128-bit.
· Shift/rotate with per-element counts: These use a vector of shift counts, allowing each element of the source vector to be shifted or rotated by a different amount. There is also a rotate instruction with an immediate-byte single count applied to all elements. 128-bit.
· Integer compare: Signed and unsigned comparison of byte, word, dword and qword elements, with predicate (mask) generation as in the various SSE compare instructions. The particular comparison to perform is specified in an immediate byte. 128-bit.
· Byte permute: A powerful operation which copies bytes from two 16-byte input vectors to a 16-byte destination vector, optionally performing a selected transformation on each, under the control of a third input vector. 128-bit.
· Bit-wise conditional move: Selects each bit of the destination vector from either of two input vectors, per a third input vector. 128- and 256-bit.
· Fraction extract: Extract the mantissa from floating point operands. Scalar and 128- or 256-bit vector, single and double precision.
· Half-precision convert: These convert between half-precision and single-precision formats while loading or storing a four- or eight-element vector. They provide dynamic control of rounding and denormalized operand handling.  These particular instructions form a separate extension called CVT16, with a distinct CPUID feature flag. (Ne sera pas implémenté dans la première version du Bulldozer.)


 
 

Zack38 a écrit :

Et, question compilateur, Intel va se faire attaquer en justice, notamment parce que son compilateur abaisserait volontairement les perfs des processeurs concurrents ...


Ça fait des années que je le dis, et je ne suis pas le seul :
 
-> PCMark aime Intel
 
Le 3e graph montre que lorsqu'on modifie le CPUID du Nano "CentaurHauls", par "GenuineIntel" ou par "AuthenticAMD", la bande passante mémoire du Nano n'est étrangement plus la même.
 
 
Autre exemple: Intel compiler and AMD processors  
 

Citation :

Here are the timings for simulating a 1024x1024 image with 23000 galaxies on an Athlon 64 X2 4400+ running Linux Mandriva 2006 x86_64 (64 bits):  
· gcc -03 -funroll-loops -fomit-frame-pointer: 36s  
· icc -O3 -axWP -ip -unroll: 31s  
· icc -O3 -axWP -ip -unroll (patched): 27s (Compilé pour Intel mais exécuté sur un Athlon.)
 
As can be seen, going from gcc to icc saves about 15% of computing time, and patching saves another 15%. This seems to confirm the claim that SSE optimisations in icc are deactivated on non-native INTEL processors, even in 64 bits. For comparison, the version compiled with icc runs in 19s on a 3GHz INTEL Core2 Duo system (also in 64 bits), which represents about the same performance per GHz as an Athlon 64.


Les résultats du mec indiquent qu'un Athlon 64 offre les même perfs qu'un Core2Duo à fréquence égale lorsque le compilateur exécute un code optimisé pour un CPU Intel... mais exécuté (grâce à un patch) sur un Athlon 64.

Message cité 1 fois
Message édité par Wirmish le 19-12-2009 à 16:13:23
n°7253089
NoradII
Il y a 17 ans naquit un PC
Posté le 19-12-2009 à 16:27:28  profilanswer
 

:fou: PUT*** :fou: c'est proprement scandaleux !! moi je dis PROCÈS !!

Message cité 1 fois
Message édité par NoradII le 19-12-2009 à 16:27:36

---------------
valid.x86.fr/575505 /842925 /902578
n°7253098
shenron67
Sure we can. We're Sega.
Posté le 19-12-2009 à 16:34:08  profilanswer
 

donc tout ceux qui disait que les core2duo poutraient les athlon x2 originaux n'étaient que des gens qui ont été trompés par le compilateur Intel? si c'est le cas ce n'est plus de l'ordre du scandale, et l'argent qu'AMD a obtenu d'Intel deviendrait une très bonne affaire....pour Intel

n°7253101
Profil sup​primé
Posté le 19-12-2009 à 16:42:42  answer
 

tu parles des C2D en 65nm ?

n°7253103
Zack38
Posté le 19-12-2009 à 16:42:57  profilanswer
 

Wirmish a écrit :


Tu te sentirais roulé si un Phenom III 8 cores (4 modules Bulldozer) offrait plus de perfs qu'un Sandy-Bridge 6 cores (12 threads) ? Ah bon.  :whistle:  
 
Le FMA4 c'est ce que voulais implémenter Intel dans son futur CPU... sauf qu'ils ont dû revoir leurs plans et ont repoussé le FMA4 sur le Haswell en 2012... et ensuite ils ont de nouveau modifié les specs et ils ont limité l'implémentation au FMA3. Du côté d'AMD, les techs n'ont pas eu de problèmes et ont implémenté le FMA4 original dans le Bulldozer, même si au départ ils ne voulaient implémenter que le FMA3.
 
En fait le FMA est déja utilisé par AMD... dans le Cypress (RV870).
Les specs DX11 impose en effet le support du standard IEEE754-2008.
Naturelement le Fermi supportera aussi le FMA.
 
Pour plus d'info sur le FMA -> Wiki (anglais)

Citation :

This adds FMA (Fused Multiply Add) instruction support that, in contrast to the standard MAD (Multiply Add) instruction, allows you to retain the totality of the intermediary result of the multiplication and therefore gives higher precision. Given how floating point numbers function, this provides very efficient processing of other instructions. AMD has taken advantage of this by making the scalar product more efficient and adding a native SAD (Sum of Absolute Difference) instruction that greatly accelerates certain algorithms.


 
En ce qui concerne le XOP, voici encore une fois le Wiki -> LIEN

Citation :

· Horizontal integer add/subtract: Signed or unsigned add, or signed subtract, of adjacent byte, word, or dword elements in the source vector to word, dword or qword elements of the destination vector. 128-bit.
· Integer multiply/accumulate: Multiplies elements of two input vectors, adding the results to a third input vector. 128-bit.
· Shift/rotate with per-element counts: These use a vector of shift counts, allowing each element of the source vector to be shifted or rotated by a different amount. There is also a rotate instruction with an immediate-byte single count applied to all elements. 128-bit.
· Integer compare: Signed and unsigned comparison of byte, word, dword and qword elements, with predicate (mask) generation as in the various SSE compare instructions. The particular comparison to perform is specified in an immediate byte. 128-bit.
· Byte permute: A powerful operation which copies bytes from two 16-byte input vectors to a 16-byte destination vector, optionally performing a selected transformation on each, under the control of a third input vector. 128-bit.
· Bit-wise conditional move: Selects each bit of the destination vector from either of two input vectors, per a third input vector. 128- and 256-bit.
· Fraction extract: Extract the mantissa from floating point operands. Scalar and 128- or 256-bit vector, single and double precision.
· Half-precision convert: These convert between half-precision and single-precision formats while loading or storing a four- or eight-element vector. They provide dynamic control of rounding and denormalized operand handling.  These particular instructions form a separate extension called CVT16, with a distinct CPUID feature flag. (Ne sera pas implémenté dans la première version du Bulldozer.)


 
 
 
Ça fait des années que je le dis, et je ne suis pas le seul :
 
-> PCMark aime Intel
 
Le 3e graph montre que lorsqu'on modifie le CPUID du Nano "CentaurHauls", par "GenuineIntel" ou par "AuthenticAMD", la bande passante mémoire du Nano n'est étrangement plus la même.
 
 
Autre exemple: Intel compiler and AMD processors  
 

Citation :

Here are the timings for simulating a 1024x1024 image with 23000 galaxies on an Athlon 64 X2 4400+ running Linux Mandriva 2006 x86_64 (64 bits):  
· gcc -03 -funroll-loops -fomit-frame-pointer: 36s  
· icc -O3 -axWP -ip -unroll: 31s  
· icc -O3 -axWP -ip -unroll (patched): 27s (Compilé pour Intel mais exécuté sur un Athlon.)
 
As can be seen, going from gcc to icc saves about 15% of computing time, and patching saves another 15%. This seems to confirm the claim that SSE optimisations in icc are deactivated on non-native INTEL processors, even in 64 bits. For comparison, the version compiled with icc runs in 19s on a 3GHz INTEL Core2 Duo system (also in 64 bits), which represents about the same performance per GHz as an Athlon 64.


Les résultats du mec indiquent qu'un Athlon 64 offre les même perfs qu'un Core2Duo à fréquence égale lorsque le compilateur exécute un code optimisé pour un CPU Intel... mais exécuté (grâce à un patch) sur un Athlon 64.


 
Je me sentirai surtout roulé si j'achète un octo-core (4 modules) Bulldozer qui ne pourra au final gérer ses 8 threads qu'à 80% de sa puissance . M'enfin, ça, c'est tout un débat ...
 
Ensuite, tu n'as pas vraiment répondu à ma question . Le FMA, c'est bien autre chose que le SSE, non ? C'est bien censé avoir un rôle particulier, puisque tu le sépares de la catégorie des simples jeux d'instructions ?
 

NoradII a écrit :

:fou: PUT*** :fou: c'est proprement scandaleux !! moi je dis PROCÈS !!


 

shenron67 a écrit :

donc tout ceux qui disait que les core2duo poutraient les athlon x2 originaux n'étaient que des gens qui ont été trompés par le compilateur Intel? si c'est le cas ce n'est plus de l'ordre du scandale, et l'argent qu'AMD a obtenu d'Intel deviendrait une très bonne affaire....pour Intel


 
En effet . Malgré l'accord signé entre AMD et Intel, la firme est actuellement poursuivie en justice par une organisation tierce (dont je ne me rappelle plus le nom, mais c'est un genre d'entreprise indépendante qui étudie les fourberies d'Intel depuis quelques temps, déjà) . La justice s'attaquera au dossier fin 2010 .

n°7253110
shenron67
Sure we can. We're Sega.
Posté le 19-12-2009 à 16:55:31  profilanswer
 

Zack38 a écrit :


 
En effet . Malgré l'accord signé entre AMD et Intel, la firme est actuellement poursuivie en justice par une organisation tierce (dont je ne me rappelle plus le nom, mais c'est un genre d'entreprise indépendante qui étudie les fourberies d'Intel depuis quelques temps, déjà) . La justice s'attaquera au dossier fin 2010 .


 
j'espère qu'ils auront alors une grosse, très grosse amende (dans le genre 15 milliards  :kaola: )
et que cette gentille organisation en passe 25% à AMD :D

Message cité 1 fois
Message édité par shenron67 le 19-12-2009 à 16:55:40
n°7253114
Profil sup​primé
Posté le 19-12-2009 à 17:02:36  answer
 

oui mais cela fera stagner intel et amd ne sera plus sous pression
on verra alors un ralentissement dans les progrès techniques de ces 2 firmes :ouch:


Message édité par Profil supprimé le 19-12-2009 à 17:02:51
n°7253126
Zack38
Posté le 19-12-2009 à 17:18:12  profilanswer
 

Pourquoi gagner plusieurs centaines de millions de dollars ralentira le rythme d'AMD ? :heink:  
Au rappel, Intel n'est pas sous pression, et pourtant le rythme du Tick-Tock est très rapide, avec une alternance chaque année d'une nouvelle architecture et d'un nouveau process de gravure . Donc, une fois qu'AMD aura de quoi financer plus sérieusement ses R&D, on peut justement espérer un rythme plus rapide . :p  
 
Quant à Intel, si leur amende leur fait perdre plusieurs milliards de dollars, ça ne réduira pas nécessairement leur investissement en R&D ... par contre, ça fera moins d'argent pour contraindre les OEM et autres intégrateurs à acheter plus d'Intel que d'AMD .

n°7253136
Profil sup​primé
Posté le 19-12-2009 à 17:28:05  answer
 

ouais c'est vrai
si amd rattrapait son retard financier, ça relancerait la machine encore + rapidement

 

et si nVidia s'incrustait dans le lot...serait-ce un concurrent sérieux ?


Message édité par Profil supprimé le 19-12-2009 à 17:28:22
n°7253139
NoradII
Il y a 17 ans naquit un PC
Posté le 19-12-2009 à 17:31:01  profilanswer
 

NVIDIA, en proco ??
je demande à voir
[:quardelitre dei]


---------------
valid.x86.fr/575505 /842925 /902578
n°7253140
Profil sup​primé
Posté le 19-12-2009 à 17:33:22  answer
 

ils ont juste besoin de la licence x86 non ?
après ils pourront peut-être s'allier avec AMD pour faire poids face à intel
nVidia pour l'entrée de gamme
AMD pour le reste
enfin bon c'est une hypothèse peu probable mais on peut tout imaginer :D

 

sinon ils font cavalier seuls mais il leur faudra qques années avant de pouvoir faire qque chose de potable (need money pour la recherche etc...)


Message édité par Profil supprimé le 19-12-2009 à 17:35:13
n°7253144
NoradII
Il y a 17 ans naquit un PC
Posté le 19-12-2009 à 17:37:33  profilanswer
 

perso je verrais bien un 20 core x86-64 nvidia, et AMD, comme toujours, sa place de bouche-trous [:hotcat], dans les plate-formes untel et admettons NVIDIA
 
EDIT: ya ka voir le classement des 132 proco pour s'en convaincre [:wardrone]


Message édité par NoradII le 19-12-2009 à 17:38:59

---------------
valid.x86.fr/575505 /842925 /902578
n°7253146
Wirmish
¡sıɹdɹns zǝɹǝs snoʌ
Posté le 19-12-2009 à 17:37:57  profilanswer
 

shenron67 a écrit :

j'espère qu'ils auront alors une grosse, très grosse amende (dans le genre 15 milliards  :kaola: )


Une amende de 15 milliards ?
 
Pas de problème pour Intel puisqu'ils ont près de 20 milliards en banque et qu'ils ont des revenus net d'environ 35 milliards par année.
 
 
Petite précision: L'Athlon est en général un peu moins puissant que le C2D, mais moins qu'on peut le croire.
Le test du mec montre qu'ils ont les mêmes perfs, mais ce n'est pas toujours le cas.

n°7253147
Gein
Posté le 19-12-2009 à 17:40:07  profilanswer
 

Oui comme avec super PI  ;)

n°7253148
seth-01
Posté le 19-12-2009 à 17:41:30  profilanswer
 

Wirmish a écrit :


Une amende de 15 milliards ?
 
Pas de problème pour Intel puisqu'ils ont près de 20 milliards en banque et qu'ils ont des revenus net d'environ 35 milliards par année.
 
 
Petite précision: L'Athlon est en général un peu moins puissant que le C2D, mais moins qu'on peut le croire.Le test du mec montre qu'ils ont les mêmes perfs, mais ce n'est pas toujours le cas.


donc les logiciels de tests ne sont pas adaptés à l'architecture d'AMD puisque compilés avec le compilateur d'Intel !!

n°7253153
Wirmish
¡sıɹdɹns zǝɹǝs snoʌ
Posté le 19-12-2009 à 17:46:40  profilanswer
 

Zack38 a écrit :

Ensuite, tu n'as pas vraiment répondu à ma question . Le FMA, c'est bien autre chose que le SSE, non ? C'est bien censé avoir un rôle particulier, puisque tu le sépares de la catégorie des simples jeux d'instructions ?


Le FMA n'est pas un jeu d'instruction mais plutôt une méthode de calcul permettant d'obtenir une plus grande précision après la virgule.  :jap:  
 
 

seth-01 a écrit :

donc les logiciels de tests ne sont pas adaptés à l'architecture d'AMD puisque compilés avec le compilateur d'Intel !!

C'est un peu comme si on faisait confiance à un bench créé par nVidia pour juger des perfs d'une Radeon...
Il est évident qu'Intel ne va pas optimiser son compilateur pour les chips du concurrent.
Sauf que la récente entente entre AMD et Intel prévoit qu'Intel cessera ce genre de pratique à l'avenir.
 

Message cité 1 fois
Message édité par Wirmish le 19-12-2009 à 17:49:39
mood
Publicité
Posté le   profilanswer
 

 Page :   1  2  3  4  5  ..  12  13  14  ..  988  989  990  991  992  993

Aller à :
Ajouter une réponse
 

Sujets relatifs
[topic uniq] LanParty MI P55-T36 mini itx[Topic unique] Crucial M225 (Version 64, 128, 256 Go)
AMD Athlon 64 FX-57 overclocké à 3.1ghz s/A8N32-SLI Deluxe+SLI 8800GTX[Topic unique] Gigabyte GA-MA770T-UD3P
Erreur CRC WinRar Config AMD 3 Windows 7 64[Topic Unique] Thermaltake Level 10
Plus de sujets relatifs à : [Topic Unique] Processeurs AMD Bulldozer FX-8100/6100/4100 (32nm)


Copyright © 1997-2025 Groupe LDLC (Signaler un contenu illicite / Données personnelles)