AMD Radeon RX 5700 XT confirmé pour disposer de 64 ROPs: Résumé de l'architecture



AMD 'Navi 10' is a very different GPU from the 'Vega 10,' or indeed the 'Polaris 10.' The GPU sees the introduction of the new RDNA graphics architecture, which is the first big graphics architecture change on an AMD GPU in nearly a decade. AMD had in 2011 released its Graphics CoreNext (GCN) architecture, and successive generations of GPUs since then, brought generational improvements to GCN, all the way up to 'Vega.' At the heart of RDNA is its brand new Compute Unit (CU), which AMD redesigned to increase IPC, or single-thread performance.

Avant de plonger plus profondément, il est important de confirmer deux spécifications clés du GPU 'Navi 10'. Le nombre de ROP du silicium est de 64, le double de celui du silicium «Polaris 10», et le même que «Vega 10.» Le silicium a seize moteurs de rendu (RB), ceux-ci sont à quatre pompes, ce qui équivaut à un nombre de ROP de 64. AMD a également confirmé que la puce possède 160 TMU. Ces TMU sont repensées pour offrir un filtrage bi-linéaire 64 bits. La Radeon RX 5700 XT utilise au maximum le silicium, tandis que la RX 5700 désactive quatre unités RDNA CU, ce qui équivaut à 144 TMU. Le nombre de ROP sur le RX 5700 est inchangé à 64.

L'unité de calcul RDNA voit l'essentiel de l'innovation d'AMD. Des groupes de deux UC forment une «unité de calcul double» qui partage un fichier cahe de données scalaires, un cache d'instructions de shader et un partage de données local. Chaque CU est maintenant divisée entre deux unités SIMD de 32 processeurs de flux, un registre vectoriel et une unité scalaire, chacune. De cette façon, AMD a doublé le nombre d'unités scalaires sur le silicium à 80, doublant le nombre de CU. Chaque unité scalaire est similaire dans son concept à un cœur de processeur, et est conçue pour gérer de lourdes charges de travail indivisibles scalaires. Chaque unité SIMD possède son propre ordonnanceur. Quatre TMU font partie de chaque UC. Cette refonte massive de la hiérarchie SIMD et CU permet de doubler les taux d'instructions scalaires et vectorielles et de mettre en commun les ressources entre deux UC adjacentes. Des groupes de cinq unités de double calcul RDNA partagent une unité prim, un rasterizer, 16 ROP et un grand cache L1. Deux de ces groupes forment un moteur de shader, et les deux moteurs de shader se réunissent au niveau d'un processeur de commande graphique centralisé qui rassemble les charges de travail entre les différents composants, un processeur de géométrie et quatre moteurs de calcul asynchrone (ACE). La deuxième refonte majeure des fonctionnalités «Navi» par rapport aux générations précédentes est la hiérarchie du cache. Chaque RDNA dual-CU a un cache rapide local AMD appelé L0 (niveau zéro). Chaque unité L0 de 16 Ko est constituée de la mémoire SRAM la plus rapide et amortit les transferts directs entre les unités de calcul et le cache L1, contournant le cache I et le cache K de l'unité de calcul. Le cache L1 de 128 Ko partagé entre cinq CU doubles est un bloc à 16 voies de transferts d'amortissement SRAM rapides entre les moteurs de masquage et les 4 Mo de cache L2.

En tout, RDNA aide AMD à obtenir un gain de performances 2,3 fois par zone, un gain de performances 1,5 fois par Watt. Le silicium 'Navi 10' ne mesure que 251 mm² par rapport aux 495 mm² de la puce GPU 'Vega 10'. Beaucoup de ces gains spatiaux sont également attribuables au passage au nouveau procédé de fabrication du silicium à 7 nm à partir de 14 nm. AMD also briefly touched on its vision for real-time ray-tracing. To begin with, we can confirm that the 'Navi 10' silicon has no fixed function hardware for ray-tracing such as the RT core or tensor cores found in NVIDIA 'Turing' RTX GPUs. For now, AMD's implementation of DXR (DirectX Ray-tracing) for now relies entirely on programmable shaders. At launch the RX 5700 series won't be advertised to support DXR. AMD will instead release support through driver updates. The RDNA 2 architecture scheduled for 2020-21 will pack some fixed-function hardware for certain real-time ray-tracing effects. AMD sees a future in which real-time ray-tracing is handled on the cloud. The next frontier for cloud-computing is cloud-assist, where your machine can offload processing workloads to the cloud.