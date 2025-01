AMD RDNA3 е зад ъгъла и чуваме все повече информация за предстоящата архитектура. Погледнато назад във времето, с усъвършенстването на графичните процесори, не е изненадващо компаниите да добавят специални хардуерни блокове, за да ускорят конкретна задача.

Сега инженерите на AMD актуализираха бекенда на LLVM компилатора, за да включват нова инструкция, наречена Wave Matrix Multiply-Accumulate (WMMA). Тази инструкция ще присъства в GFX11, която е архитектурата RDNA3. С инструкцията WMMA, AMD ще предложи поддръжка за обработка на тензори в прецизни формати FP16 и BF16, с размери 16x16x16.

// WMMA (Wave Matrix Multiply-Accumulate) intrinsics

//

// These operations perform a matrix multiplication and accumulation of

// the form: D = A * B + C

С тази инструкция AMD добавя нови механизми за поддръжка на операции за умножение с натрупване на матрици. Това до голяма степен прилича на работата, която вършат тензорните ядра на NVIDIA.

Актуализацията на API на AMD ROCm 5.2 изброява случаите на използване на този тип инструкция, които са дадени отдолу:

“rocWMMA предоставя C++ API за улесняване на разбиването на фрагменти на проблемите при умножение с натрупване на матрици и използването им в блокови операции, които се разпределят паралелно по вълновите фронтове на GPU. API е хедър библиотека на кода за GPU, което означава, че ускорението на ядрото на матрицата може да бъде компилирано директно в кода на вашия кернъл. То може да се възползва от оптимизацията на компилатора при генерирането на кернъл кода и не води до допълнителни ресурсни разходи за свързване с външни библиотеки по време на изпълнение, или необходимост от стартиране на отделни кернъли.

rocWMMA е реализирана като хедър библиотека и включва тестови и примерни проекти за валидиране и илюстриране на примерни употреби на C++ API. GEMM матричното умножение се използва като първична валидация предвид тежкия прецедент за библиотеката. Въпреки това портфолиото за използване нараства значително и демонстрира различни начини, по които rocWMMA може да бъде консумиран.”

Източник: Videocardz