Nvidia Turing – детските болести на една потенциална революция

Nvidia Turing – детските болести на една потенциална революция

В раздел: Ревюта, Ревюта, статии и ръководства от на 29.11.2018, 6,170 показвания
Страница от ревюто: 1 2 3 4 5 6 7 8 9 10 11 12 13 14


Nvidia Turing, архитектура I

За да реализира ускорението на рейтрейсинг, новата фамилия Nvidia Turing добавя още цели 2 вида елементи в ядрото си – Raytracing cores (рейтрейсинг ядра) и Tensor processors (тензорни процесори).

Рейтрейсинг ядрата мисля, че са ясни от името си – те служат за директно ускорение на проверките за пресичане на лъчите с обектите. Изпълняват основно 2 задачи – проверка за пресичане на включващ обем (Bounding volume) с обхождане на йерархия от включващи обеми (bounding volume hierarchy traversal) и проверка за пресичане с триъгълник. Йерархията от включващи обеми е метод за ускоряване на изпълнението на рейтресинг, като целите обекти и в последствие отдели техни части се включват в лесни за описване обекти (паралелепипед, сфера), за които много лесно и бързо може да се установи дали дадения лъч преминава през него или не, като при последното директно се изключва проверката на целия обект. Ако обаче има пресичане се преминава към проверка на обемите от по-ниско ниво, докато накрая се стигне до проверка на пресичане с отделни полигони. Това спестява огромна част от работата, тъй като не се налага тестване триъгълник по триъгълник.

 

Ядрата RT според NVidiа могат да се ползват не само за целите на графичния рейтрейсинг, но също и при изчисление на позиционно аудио, което в известен смисъл работи на същия принцип.

Тензорните процесори на свой ред са нещо доста различно и интересно – те служат за ускорение на работата на невронни мрежи и респективно изкуствен интелект. По съществото си те преставляват прости умножители на 4х4х4 матрици, като поддържат Int4, Int8 и FP16 (целочислен 4- и 8-битов и 16-битов с плаваща запетая) формат на данните като дори в FP16 режим се използва смесен формат, като междинните стойности са с 32-битова разредност. За първи път тези блокове се появиха в професионалните процесори на Nvidia, но явно вече е време да стигнат и до масовия пазар.

 

 

Но каква би била ползата от ускорение за ИИ на декстопа? От една страна това увеличава базата, която може да се използва за програмиране и развитие на ИИ. От друга страна ИИ има различни сфери на приложение, но една от най-интересните и свързани именно с графиката е обработката на изображения. Както говорихме по-горе, при рейтрейсинга се използват множество лъчи и то не само от пикселите, но дори от субпикселите, като колкото повече – толкова по-добре. Един от начините да се намали броя на нужните семпли и съответно да се ускори работата е, да се използва т.нар. денойз (de-noise) филтър (филтър за намаляване на шума в изображението), който по същество намалява резките честотни преходи в изображението, например между вече изчислени семпли, и такива които тепърва предстои да се смятат, като го изглажда и доближава до нужния краен резултат. Използването на обучена невронна мрежа за целта е един от ефективните начини за прилагането му, като в случая на GPU като Turing изпълнението върху тензорните процесори позволява прилагането му без да се натоварват ядрата CUDA и да се губи производителност за други задачи.

Друга интересна възможност, която сега се предлага от Nvidia за приложение с Turing, е Deep Learning Super Sampling. На пръв поглед името говори по-скоро за нов метод за антиалайзинг, и това донякъде е така. По същество, обаче, DLSS e метод за ъпсемплинг (повишаване на резолюцията на изображението от по-ниска такава), който между другото премахва и алайзинга. Идеята е, че компанията разполага с мощни суперкомпютри, които могат да се използват за обучение на невронни мрежи да сравняват базовото изображение с по-ниска резолюция и с 8К изображение с 64х суперсемплинг, като генерирането на последното би било изключително тежка задача за нормален графичен адаптер. След като мрежата е обучена, тя се доставя като част от драйвера и след това се изпълнява от тензорните процесори, като би следвало да може да преобразува изображението с по-ниска резолюция до такова с по-висока с минимална загуба на качество спрямо рендирането в нативен режим. На практика би следвало да се получи обратното на използването на dynamic super resolution, наличен в момента, който рендира изображението в по-висока резолюция и след това го смалява до по-малката, нативна за екрана такава, като по този начин изглажда и изображението.

 

 

Как това помага за използването на рейтрейсинг? Ами просто – вместо да се обработва пълната резолюция на дисплея, се работи в по-ниска, която се ъпскейлва с DLSS. Като комбинирате това с денойзинг и ускорениетo от RT ядрата се получават доста сериозен сбор от заобиколни пътища за ефективно изпълнение на рейтрейсинг. На теория. Проблемът с DLSS обаче е, че се изисква индивидуално обучение за всяко приложение, поне засега.

Нека обаче да подчертаем нещо много важно – Nvidia Turing само ускорява рейтрейсинга, не заменя изцяло растеризиращия конвейер с рейтрейсинг такъв. Защото все пак реастеризацията все още прави много неща по-бързо и ефективно. Предложението на Nvidia e хирбриден режим, в който основата на сцената се създава чрез растеризация, докато рейтрейсинга се използва основно за изчисление на осветление, отражения, сенки и т.н.



Всички страници от статията:

  1. Растеризация и рейтрейсинг
  2. Nvidia Turing, архитектура I
  3. Nvidia Turing, архитектура II
  4. Гамата на Turing
  5. Противоречия
  6. Моделите от MSI
  7. Тестова система
  8. Резултати – 2560х1440
  9. Резултати – 3840х2160
  10. Резултати – eSports@1080p
  11. Battlefield 5 - визуално сравнение
  12. Battlefield 5 - производителност
  13. Резултати - GPU рендъринг, криптомайнинг, консумация, температури
  14. Заключениe


Страница от ревюто: 1 2 3 4 5 6 7 8 9 10 11 12 13 14




Етикети: , , , , , , , , ,


3 коментара

  1. 1 Capcom // 30.11.2018 в 18:05

    Като се знае какъв скандал стана, и че е пълно с прецакани или нацяло умрели RTX карти, изобщо не виждам AMD за какво да се притесняват, а и те правят със Vega пари на съвсем друго място, щото игрите не са всичко и във compute Vega троши 1080TI..
    RTX the way nVIDIA is meant to be RMA`ed…

  2. 2 Konami // 03.12.2018 в 11:25

    Този ефект коства едни 50-60 кадъра, което не е никак малко.И с карта под 2080 ti нещата стават плачевни.По-добре да си кътам 1080-тката

  3. 3 BGRS // 13.12.2018 в 02:39

    Доколкото четох, производителността при Batlefield 5 с използване на DXR е вдигната доста с нов драйвер. Споменават се 50% повече кадри.

    Като всяко ново нещо и това си има големи кусури. Но пък вчера се наложи да търся нова видеокарта и…не видях вече да се продават 1080Ti, а и тия, дето се продават, са на цената на 2080. Това ми напомня за 2011 година, когато си купувах нова кола и се чудех, дали да взема модел, спрян вече от производство, но наличен в магазина или нов модел, който е на мода, по-съвременен и всичко по-по, включително и новите дефекти :) Все пак се спрях на новот, щото дет се вика, старото ще спрат да го поддържат след няколко години. Особено NVIDIA правят тия нмомерца с не толкова старите си видеокарти.

Коментари: