7 години AMD Graphics Core Next

7 години AMD Graphics Core Next

В раздел: Ревюта, статии и ръководства, Статии от на 5.09.2018, 7,208 показвания
Страница от ревюто: 1 2 3 4 5 6 7 8


Сравнение на развитието на GCN

След това обширно припомняне на историята на GCN, нека кажем и най-накрая за какво ще става дума в тази статия. А именно – ще тестваме топмоделите от различни поколения на архитектурата в съвременните игри. За целта събрах адаптери на базата на Tahiti, Hawaii, Fiji и Vega. Липсващият елемент са може би моделите от серията Polaris, но реалните им разлики с Fiji не са чак толкова големи, а и формално преди Vega, топмоделът си оставаше Fiji. Ето и конкретните екземпляри събрани за тестването:

Sapphire Radeon HD 7970 Dual-X – не правете грешката да сравнявате този модел с последващите Radeon R9 R280/X Dial-X версии, разликата в качеството на изпълнението е сериозна. Охлаждането е 2,5-слотово с масивен радиатор, покриващ и паметите и цели 5 топлопровода. Качеството на платката е на изключително високо ниво, като дадения екземпляр е постигал честоти от 1200/1800 МХц. След дълго обмисляне, реших да заложа за тестовете на типичната честота за Radeon HD 7970 GHz Edition, 1050 МХц за ядрото и 1500 МХц на паметта, тъй като Hawaii и Fiji имат също модели на сходна честота. За да се подсигуря със стабилността, повиших напрежението до 1,2 В.

Sapphire Radeon R9 290Х Tri-X, 4 и 8 ГБ – отново отлично изпълнение на охлаждането от Sapphire, но с използване на референтната платка, която както повечето модели на AMD във високия клас е създадена със запас. Двата варианта използваха различни честоти, като 4 GB версията оригинално беше на 1040/1300 МХц, а 8 GB на 1020/1375 МХц. Тъй като Radeon R9 390X моделите са по същество ребрандирани версии на Hawaii и работят на 1050/1500 МХц, овърклокнах и двата адаптера до тази честота, като увеличих с 24 и 37 мВ напрежението и с +10% PowerTune лимит, за да постигна постоянна работа на 1050 МХц. Използвах двата модела за сравнение какъв ефект има от разликата в обема на паметта. Spoiler аlert – минимален.

XFX R9 Nano 4 GB –  тъй като за съжаление тестовият Radeon R9 Fury X го е хванала липсата при преместването на офиса, се наложи да използвам този графичен адаптер, за да симулирам производителността на Fiji чипа. За целта го овърклокнах на 1050/500 МХц с повишен +50% Power Limit. За съжаление и това не се оказа достатъчно за постигане на постоянн работа на тази честота, тъй като турбо алгоритъма на картата почваше да понижава честота при преминаване на 80 градуса. Този проблем се разреши със задаване на 100% скорост на вентилатора, махането на страничният капак на кутията и инсталирането на NF-F12 INDUSTRIALPPC-2000 PWM вентилатор на пълни обороти отстрани на картата. Благодарение на това 98-99% от времето картата работеше на 1050 МХц.

Radeon RX Vega 64 8 ГБ – референтното изпълнение на картата. Беше тествана както на стандартни настройки, но с „пипнат“ профил на вентилатора, за да поддържа относително стабилни ~1475 МХц, така и с намалена до около 1050 МХц честота на ядрото и повишена скорост на паметта до 1000 МХц. Тъй като за разлика от всичките останали адаптери бууст технологията на Vega не позволява установяване на напълно стабилни честоти, реално графичният адаптер работеше между 1046 и 1056 МХц, но ще го борим средно за 1050 МХц. Паметта беше овърклокната, тъй като на 1000 МХц отговаря точно на пропускателна способност на паметта на Radeon Fury (двойно по-тясна шина, но двойно по-висока честота), а и на хипотетична 512-битова GDDR5 8 GT/s памет за сравнение с Hawaii. Заедно с това напрежението беше намалено на 0,95 В, колкото е стандартно за нивото от 1084 МХц.

Имайте предвид, че даденият материал няма за цел да сравни самите графични адаптери, колкото да предложи сравнителен поглед на архитектурите на 4-те чипа. Така че не търсете пълна реалистичност между наличните на пазара модели.



Всички страници от статията:

  1. Tahiti и първата версия на GCN
  2. Hawaii, Tonga, Fiji: GCN 1.1 и 1.2
  3. Polaris и Vega: GCN 1.3 и 1.4
  4. Претендентите
  5. Тестова система
  6. Резултати
  7. Обобщения и разсъждения
  8. Консумация и заключение


Страница от ревюто: 1 2 3 4 5 6 7 8




Етикети: , , , , ,


10 коментара

  1. 1 craghack // 06.09.2018 в 08:30

    Таитито го пропуснах. Хавая и вегата ги видях ;)

  2. 2 Mustaka // 07.09.2018 в 18:04

    Аз сега и сега си ползвам 7970-ката на 1600 х 1200 играя си танковете и нямам грижи :-)
    Имах 7990, ама за съжаление нещо се прецака, иначе беше супер карта.

  3. 3 Комаро // 10.09.2018 в 14:50

    Еми колега така е 7970 си е супер карта, ама хора като мен видяха възможност, продадох си вярната ми R9 280X (на проклет копач) която също беше купена от копач ама малко ползвана за 400 лева в бума последния път, а я бях купил за 200 лева предните години, и малко след това изчаках промото на Emag черен петък и отнесох една RX580 8GB за малко над 500 лева, за какво да се занимавам със старата ми акрта, като мога да взема по нова.

  4. 4 Сашо // 10.09.2018 в 18:11

    единно адресиране на паметта, така и не стана реалност доколкото знам

    > безсмислено само по себе си дефиниране (SIMT)

    защо да е безсмислено?

  5. 5 Димитър Чизмаров (DeepBlue) // 10.09.2018 в 19:26

    @Сашо – единнота адресиране на паметта е факт отдавна в архитектурите на АМД, Мисля че от Hawaii нататък и от Kaveri се поддръжа на хардуерно ниво.
    А SIMT е безмислица, просто защото е. Нвидия са натворили купища маркетингови безмислици и това е една от тях. Както и желанието да дефинират отделните АЛУ елементи във SIMD блока като “ядра”, само за да се покажат колко по-напред са от Интел. При положение че ядро в най-дбория слyчай е SM-a.

  6. 6 Сашо // 11.09.2018 в 15:12

    Ако имаш предвид HBCC не мисля, че това може да се брои за единно адресиране. Единно адресиране би значило, че цялата памет на картата е достъпна като RAM за процесора, а аз такова нещо не съм видял (освен може би при някои интегрирани решения /GPU в CPU-то/).
    Имаш ли някаква друга информация?

  7. 7 Димитър Чизмаров (DeepBlue) // 11.09.2018 в 22:58

    Не изобщо нямам предвид HBCC, той е нещо съвсем друго. И изобщо не значи че цялата рам на графиката ще е достъпна за процесора. Между другото по начало има мапинг на видеопаметта към адресното пространво на процесора. Единното адресиране значи че видеокартата “вижда” директно цялото х86 адресно пространство без нужда от транслация, както в предходните модели и което е част от HSA. И да това го имат от доста време. Мисля че това е едно от нещата, които им помага да пускат ония безумни профи модели които имат по 2 ТБ памет (SSD).

  8. 8 Ico // 22.09.2018 в 21:29

    Никъде не пише при каква резолюция са направени тестовете!!!

  9. 9 Сашо // 27.09.2018 в 13:50

    Димитър, достъпът до оперативната памет не може да зависи само от видео картата, а и от останалия хардуер. Доколкото си спомням първоначалната идея на AMD е да има наистина единно адресно пространство, което доколкото знам не се реализира. Мапинг на паметта на картата в адресното пространство на процесора е друго нещо.
    Новите карти ползват PCIe atomic операции с оперативната памет, което е много добро, но според мен не е същото като първоначалната идея. Ето малко информация, как се ползват в момента:
    https://rocm.github.io/ROCmPCIeFeatures.html

  10. 10 Димитър Чизмаров (DeepBlue) // 28.09.2018 в 21:17

    Къде видя да обяснявам, че оперативната памет зависи само от видео картата?! И атомарните операции са нещо отделно, това са просто независими операции.

    Идеята по принцип е, че преди HSA видеокартата си оперира в нейно си адресно пространство (оперативната й памет), процесора си оперира в неговото си адресно пространство. Ако се наложи някаква междупроцесна комуникация, това означва че всеки път трябва да се “превежда” от едното пространство в другото, което отнема време и ако има някакви данни, които се намират примерно в GPU-то, а трябват на процесора, то те трябва да се копират в системната памет.

    Модерните адаптери обаче “разбират” Х86 адресациията и могат да работят с адресното пространство на х86 модела, а паметта на графичният адаптер влиза в общото адресно пространство. По този начин няма нужда от транслация и при нужда както процесора може да чете директно в паметта на картата, така и картата може да чете директно от паметта на процесора, без да се налага преди това да се копират данните локално. Отделно това позволява да се поддържа и кеш кохерентност. Именно това позволява на HBCC да работи (по същество използва оперативната памет, а локалната памет работи като кеш, което няма как да стане с различни адресни пространства) и разни други шукаритети. Нвидия вече също поддържат общо адресно пространство с процесора.

    Ако все още не разбираш какво имам предвид – https://en.wikipedia.org/wiki/Heterogeneous_System_Architecture , http://www.mpsoc-forum.org/previous/2013/slides/8-Hegde.pdf