7 години AMD Graphics Core Next

7 години AMD Graphics Core Next

В раздел: Ревюта, статии и ръководства, Статии от на 5.09.2018, 7,207 показвания
Страница от ревюто: 1 2 3 4 5 6 7 8


Second generation GCN/GCN 1.1

GCN 1.1 оригинално се появи с модела от долния край на средния клас, а именно кристалът Bonaire, но върховият представител беше чипът Hawaii, който успешно съперничеше на GeForce GTX780/Ti и първият GTX Titan. Hawaii в голяма степен може да се разглежда като инкрементална надстройка над Tahiti, като графичните енджини са увеличени на 4 със съответстващото подобрение на геометричната производителност, като теселаторите освен като брой, са подобрени и като ефективност. Блоковете ACE са увеличени до цели 8, а общия брой на блоковете CU е 44 (2816 АЛУ /176 текстурника). Броят на дяловете ROP вече са 16 с общо 64 елемента, a шината на паметта е 512-битова. Заедно с това архитектурата има подобрения за увеличена изчислителна ефективност на ниво инструкции, като още една интересна добавка е появата на TrueAudio, което обещаваше да е революция от гледна точка на качеството на позиционния звук в игрите, но за съжаление остана в голяма степен неоползтоворено. Заедно с това в GCN1.1 се появи и нов алгоритъм за работа в CrossFire, като се използва шината PCI Express и вече нямаше нужда от допълнителни конектори. Това беше и първата версия която използваше общо адресно пространство с процесора, което би трябвало да позволява нови, по-ефективни реализации на хетерогенни изчисления на базата на Heterogeneous System Architecture. И накрая това беше първата графична архитектура, реализираща двойна точност със скорост ½ от производителността с единична точност (GCN 1.0 използва 1/3 максимална производителност). Това, заедно с 512-битовата шина, предопредели дългото използване на Hawaii сред професионалните модели на AMD.

GCN 1.1 не покри цялата гама на AMD, като се използваше само във върховия Hawaii, чипа от среден клас Bonaire и от нисък клас Oland. Помежду им останаха по-старите модели от GCN поколението 1.0, които бяха преименувани. Това беше и първата имплементация използвана във “вградената графика” на компанията, като се появи чиповете Kaveri  и Temash съответно за десктоп и икономични системи. Но това не е всичко, тъй като тази версия се използва и в оригиналните Playstaton 4 и Xbox One.

Third Generation GCN/GCN 1.2

Тази версия отново дебютира първо в средния клас с чипа Tonga, но след това се появи и във върховият модел Fiji. Като основна особеност на тази версия е появата на Delta Color Compression в блоковете ROP, което сериозно увеличава ефективността на използване на пропускателната способност на паметта. Заедно с това има (отново) някои подобрения при теселацията, ефективността при изчисленията и що се отнася до енергоефективността. В същото време в този вариант ефективната работа с двойна точност е елиминирана (1/16), за сметка на по-сериозно наблягане на гейминга.

amd_tonga_diag

amd_tonga_tess

amd_tonga_color_compress

fiji_chip_1

fiji_chip_2

fiji_chip_3

fiji_chip_4

Tonga повтаря по брой изчислителните блокове на Tahiti, но сега те са разпределени в 4, а не 2 геометрични клъстера и са налични отново 8 ACE и True Audio, както в Hawaii. Fiji на свой ред имаше амбицията да конкурира върховите модели от новата по това време серия Maxwell на NVidia. Чипът отново ползва 4 графични клъстера, но всеки от тях е с по 16 CU (64 CU общо, 4096 ALU, 256 текстуриращи блока) и с по 4 дялa ROP (общо 64 блока ROP). За първи път в този модел се използваше и новата прогресивна памет High Bandwidth Memory, използваща стекова компонировка от няколко кристала за памет във всеки чип и с невероятно широката, макар и относително нискочестотна, 1024-битова шина. Fiji използва общо 4 чипа памет, съответно разполага с 4096-битова шина с честота 500 МХц. За съжаление ограниченията на HBM оставиха тези модели със само 4 GB памет, което дори по това време почваше да изглежда леко недостатъчно. Заедно с това GCN1.2 беше вградена в ъпгрейдите Carriso и BristolRidge на интегрираните процесори на компанията, където технологията за компресия беше от полза, но вече сериозно остаряващата архитектура на централния процесор ги направи не твърде конкуренти.



Всички страници от статията:

  1. Tahiti и първата версия на GCN
  2. Hawaii, Tonga, Fiji: GCN 1.1 и 1.2
  3. Polaris и Vega: GCN 1.3 и 1.4
  4. Претендентите
  5. Тестова система
  6. Резултати
  7. Обобщения и разсъждения
  8. Консумация и заключение


Страница от ревюто: 1 2 3 4 5 6 7 8




Етикети: , , , , ,


10 коментара

  1. 1 craghack // 06.09.2018 в 08:30

    Таитито го пропуснах. Хавая и вегата ги видях ;)

  2. 2 Mustaka // 07.09.2018 в 18:04

    Аз сега и сега си ползвам 7970-ката на 1600 х 1200 играя си танковете и нямам грижи :-)
    Имах 7990, ама за съжаление нещо се прецака, иначе беше супер карта.

  3. 3 Комаро // 10.09.2018 в 14:50

    Еми колега така е 7970 си е супер карта, ама хора като мен видяха възможност, продадох си вярната ми R9 280X (на проклет копач) която също беше купена от копач ама малко ползвана за 400 лева в бума последния път, а я бях купил за 200 лева предните години, и малко след това изчаках промото на Emag черен петък и отнесох една RX580 8GB за малко над 500 лева, за какво да се занимавам със старата ми акрта, като мога да взема по нова.

  4. 4 Сашо // 10.09.2018 в 18:11

    единно адресиране на паметта, така и не стана реалност доколкото знам

    > безсмислено само по себе си дефиниране (SIMT)

    защо да е безсмислено?

  5. 5 Димитър Чизмаров (DeepBlue) // 10.09.2018 в 19:26

    @Сашо – единнота адресиране на паметта е факт отдавна в архитектурите на АМД, Мисля че от Hawaii нататък и от Kaveri се поддръжа на хардуерно ниво.
    А SIMT е безмислица, просто защото е. Нвидия са натворили купища маркетингови безмислици и това е една от тях. Както и желанието да дефинират отделните АЛУ елементи във SIMD блока като “ядра”, само за да се покажат колко по-напред са от Интел. При положение че ядро в най-дбория слyчай е SM-a.

  6. 6 Сашо // 11.09.2018 в 15:12

    Ако имаш предвид HBCC не мисля, че това може да се брои за единно адресиране. Единно адресиране би значило, че цялата памет на картата е достъпна като RAM за процесора, а аз такова нещо не съм видял (освен може би при някои интегрирани решения /GPU в CPU-то/).
    Имаш ли някаква друга информация?

  7. 7 Димитър Чизмаров (DeepBlue) // 11.09.2018 в 22:58

    Не изобщо нямам предвид HBCC, той е нещо съвсем друго. И изобщо не значи че цялата рам на графиката ще е достъпна за процесора. Между другото по начало има мапинг на видеопаметта към адресното пространво на процесора. Единното адресиране значи че видеокартата “вижда” директно цялото х86 адресно пространство без нужда от транслация, както в предходните модели и което е част от HSA. И да това го имат от доста време. Мисля че това е едно от нещата, които им помага да пускат ония безумни профи модели които имат по 2 ТБ памет (SSD).

  8. 8 Ico // 22.09.2018 в 21:29

    Никъде не пише при каква резолюция са направени тестовете!!!

  9. 9 Сашо // 27.09.2018 в 13:50

    Димитър, достъпът до оперативната памет не може да зависи само от видео картата, а и от останалия хардуер. Доколкото си спомням първоначалната идея на AMD е да има наистина единно адресно пространство, което доколкото знам не се реализира. Мапинг на паметта на картата в адресното пространство на процесора е друго нещо.
    Новите карти ползват PCIe atomic операции с оперативната памет, което е много добро, но според мен не е същото като първоначалната идея. Ето малко информация, как се ползват в момента:
    https://rocm.github.io/ROCmPCIeFeatures.html

  10. 10 Димитър Чизмаров (DeepBlue) // 28.09.2018 в 21:17

    Къде видя да обяснявам, че оперативната памет зависи само от видео картата?! И атомарните операции са нещо отделно, това са просто независими операции.

    Идеята по принцип е, че преди HSA видеокартата си оперира в нейно си адресно пространство (оперативната й памет), процесора си оперира в неговото си адресно пространство. Ако се наложи някаква междупроцесна комуникация, това означва че всеки път трябва да се “превежда” от едното пространство в другото, което отнема време и ако има някакви данни, които се намират примерно в GPU-то, а трябват на процесора, то те трябва да се копират в системната памет.

    Модерните адаптери обаче “разбират” Х86 адресациията и могат да работят с адресното пространство на х86 модела, а паметта на графичният адаптер влиза в общото адресно пространство. По този начин няма нужда от транслация и при нужда както процесора може да чете директно в паметта на картата, така и картата може да чете директно от паметта на процесора, без да се налага преди това да се копират данните локално. Отделно това позволява да се поддържа и кеш кохерентност. Именно това позволява на HBCC да работи (по същество използва оперативната памет, а локалната памет работи като кеш, което няма как да стане с различни адресни пространства) и разни други шукаритети. Нвидия вече също поддържат общо адресно пространство с процесора.

    Ако все още не разбираш какво имам предвид – https://en.wikipedia.org/wiki/Heterogeneous_System_Architecture , http://www.mpsoc-forum.org/previous/2013/slides/8-Hegde.pdf