Le bus PCI Express est l'un des goulets d'étranglement principaux en calcul scientifique sur GPU. La raison est assez simple: la RAM (GDDR5) d'une Nvidia Tesla M2090 (la plus puissante des cartes de calcul) offre une bande passante de 177GB/s et le bus PCIE est limité à 6GB/s (8GB/s en théorie). Et dire que la RAM (mémoire globale dans le jargon CUDA) est la mémoire la plus lente sur les GPUs (sur un CPU la RAM est aux alentours de 20GB/s et le cache L1 approche les 110GB/s, IIRC)...
Message édité par jdemouth le 04-12-2011 à 18:39:40