Results 1 to 10 of 10
Hybrid View
-
8th January 2011 19:59 #1Banned
Join Date: Oct:2003
Location: Ñîôèÿ
Posts: 5,259
Âàðèàíò äà âïðåãíà â èç÷èñëåíèÿ GPU
Èíòåðåñóâà ìå ñ êàêâè ïðîãðàìíè åçèöè (èëè èíñòðóìåíòè) ìîãà äà íàêàðàì âèäåî ïðîöåñîðà äà ïîåìå ÷àñò îò èç÷èñëåíèÿòà íî íå çà ãðàôèêà, à íàïðèìåð çà èç÷èñëÿâàíå íà ñëîæíè ìàòåìàòè÷åñêè îïåðàöèè.
-
8th January 2011 20:03 #2
Êàêâè ìàòåìàòè÷åñêè îïåðàöèè èñêàø äà èç÷èñëèø?
Have no fear ike iz here.
CPU Cx486DLC@40MHz, RAM 4MB, VGA Trident 512KB, HDD Conner 160MB, Monitor 14" Color
-
8th January 2011 20:08 #3Banned
Join Date: Oct:2003
Location: Ñîôèÿ
Posts: 5,259
-
8th January 2011 20:11 #4_
Join Date: Apr:2006
Location: _
Posts: 1,128
Ïî-äîáðå ñè êóïè powerpc èëè Sparc. Èíà÷å è â äâàòà ñëó÷àÿ òè òðÿáâà äà çíàåø C èëè àñåìáëåð
ìîæåáè íàé-äîáðå åäíà ìîëáà äà íàïèøåø
http://www.scfbio-iitd.res.in/biogrid/download.htm
-
8th January 2011 20:18 #5Registered User
Join Date: Aug:2006
Location: Ïëîâäèâ
Posts: 4,052
-
8th January 2011 23:10 #6
-
9th January 2011 10:37 #7Registered User
Join Date: Sep:2003
Location: Where you live
Posts: 976
http://en.wikipedia.org/wiki/CUDA
http://developer.nvidia.com/object/cuda_3_2_downloads.html
íî cuda å íàñî÷åíî îñíîâíî êúì nvidia âèäåîêàðòè.
-
9th January 2011 11:07 #8
Äîáðå äå, ñàìî àç ëè íå âèæäàì ñìèñúë îò öÿëîòî óïðàæíåíèå? Ðåçóëòàòúò îò ñìåòêèòå çà áðîÿ êîìáèíàöèè 6/XXX ñå ñâåæäà äî óìíîæåíèå íà 6 îãðîìíè ÷èñëà (ïî 5-6 ìèëèîíà öèôðè) + äåëåíèå íà 720, êîåòî íå å ÷àê òîëêîâà òåæêî âñå ïàê. Ïî-ñêîðî õâàíè íÿêîÿ áèáëèîòåêà çà äúëãà àðèòìåòèêà (GMP äà ðå÷åì) è ñè èçêîâè çàäà÷àòà â 20-íà ðåäà êîä íà C++.
Óìíîæåíèÿòà ñ äúëãè ÷èñëà ïðèíöèïíî ãè ïðàâÿò ñ FFT-òà, ò.å. âúðâÿò âúâ N * log(N) ñëîæíîñò, çà çàäàäåíèòå ãîëåìèíè ùå ìèíàò çà ñåêóíäè âúðõó CPU.
Âå÷å àêî èñêàø äà ïèøåø Î(N²
óìíîæåíèå çà äà âèäèø êîëêî å "ÿêà" êàðòàòà è äà ñè îòîïëÿâàø ïî-åôåêòèâíî êúùàòà - âå÷å õâàùàé CUDA èëè OpenCL êàêòî êàçàõà êîëåãèòå.
Last edited by anrieff; 11th January 2011 at 10:16. Reason: QMP → GMP
Åòî òàêà ñå ïëîäÿò òå, êàçâàì ñè àç. Ïîä íîñà òè.
"640K îught to be enough for anybody" - Bill Gates, 1981
Òåñòîâå íà áàòåðèè::Machine specs::Fract::AGG::ÍåÑåÑúðäè×îâå÷å::Baileys::blog::YouTube channel
-
10th January 2011 23:28 #9Modderhead
Join Date: Nov:2005
Location: Ñîôèÿ
Posts: 4,469
GPU-òî ìè ñå ñòðóâà äîáðî çà íåùà, êàòî òðèãîíîìåòðè÷íè ôóíêöèè, â ò.÷. òðàíñôîðìàöèè íà Ôóðèå; äðóãîòî - àêî ìîæåø äà ïîëçâàø ïî-áúðçàòà DDR5 (ïðèìåðíî) ïàìåò, âåðîÿòíî çà íÿêàêâè áðóòàëíè äèíàìè÷íè ãðàôè è íåâðîííè ìðåæè ùå å ïóøêà. Çà öåëî÷èñëåíè îïåðàöèè - ìàé íÿìà îñîáåí ñìèñúë.
Íàâðåìåòî åäèí áðóòàëèøå äàñêàë ïî ôèçèêà ðàçïðàâÿøå, ÷å ìîäåðíèòå ïðîãðàìèñòè ñà êóöè, îòè ãðàì íå îòáèðàò îò àðõèòåêòóðà è ïèøàò òåæêè ãëóïîñòè. Àìà ïúê îò äðóãà ñòðàíà â ìîìåíòà èìàø ãîëÿì øàíñ êîìïèëàòîðúò ñàì äà òè ïîîïðàâè ãëóïîñòèòå è äà òè âêàðà ÿ íÿêîÿ îïòèìèçàöèÿ, ÿ íÿêîÿ èíñòðóêöèÿ... Àêî îòèäåø íà GPU, íàëè ñå ñåùàø, ÷å îñòàâàø ñàì è òðÿáâà äà ñè ìíîîîîîîãî äîáúð â îïòèìàëíîòî ñúñòàâÿíå íà àëãîðèòìè...
Íà ìåí ìè å íàé-ëåñíî, ùîòî åæåäíåâíî ñúì íà excel... Îíçè äåí ïèñàõ åäíè ãëóïîñòè íà Delphi... ëåëå êàê ëåòåøå... è âñè÷êî ãîòîâî íàïèñàíî - êëàñîâå áîë, ñàìî ïèøåø a=b+c; <3
-
12th January 2011 17:01 #10Registered User
Join Date: Nov:2010
Location: -
Posts: 448
knobel, êàòî ãëåäàì êàêâè ñè ãè ïèñàë, ñå óáåæäàâàì ÷å íèêîãà íå ñè íàïèñàë íèòî åäèí ðåä OpenCL/CUDA êîä.
Ïúðâî, GPU-òàòà ìîæå è äà ñà äîáðè, ìîæå è äà íå ñà äîáðè ïðè òðèãîíîìåòðè÷íè îïåðàöèè, FFT íåùà è ò.í. Çàâèñè îò ìíîãî íåùà, ïðèìåðíî äàëè òå óðåæäà single-precision èëè double-precision floats. Ïúðâèòå ñà áúðçè, íî íÿìàò ãîëÿìà ïðåöèçíîñò, çàùîòî ñà 32-áèòîâè, âòîðèòå ñà äàëå÷ ïî-áàâíè è íå ñå ïîäúðæàò îò âñè÷êè âèäåîêàðòè (ïðèìåðíî ïðè ATI, ñàìî âèñîêèÿ êëàñ êàðòè êàòî 5870 èëè 5970 ãî ïîäúðæàò).
Âòîðî, "áúðçàòà" DDR5 ïàìåò äàëå÷ íå å áúðçà è âúâ âñÿêî ðúêîâîäñòâî èëè äîêóìåíò, êúäåòî ñòàâà âúïðîñ çà îïòèìèçèðàíå íà OpenCL/CUDA kernel-è, åäíà îò ïúðâèòå ïðåïîðúêè å äà ñå ìèíèìèçèðà äîñòúïà äî "áúðçàòà" DDR5 âèäåîïàìåò. Íå çà äðóãî, à çàùîòî â ñðàâíåíèå ñ ðåãèñòðèòå èëè on-chip local (a.k.a shared) ïàìåòòà, ëàòåíòíîñòòà å ñòîòèöè ïúòè ïî-ãîëÿìà è bandwidth-à å äàëå÷ ïî-íèñúê.  îáùèÿò ñëó÷àé, CPU-òàòà äîñòúïâàò ïî-áúðçî ôèçè÷åñêàòà ïàìåò, îòêîëêîòî GPU-òàòà äîñòúïâàò âèäåîðàì-òà. Ïîðàäè ðåä ïðè÷èíè. Îñâåí êîåòî, CPU-òàòà èìàò â ïúòè ïîâå÷å L1/L2 êåø.
Òðåòî - òî÷íî çà öåëî÷èñëåíè îïåðàöèè èìà ìíîãî ñìèñúë. Òå ñà òî÷íî òîëêîâà áúðçè íà ïîâå÷åòî êàðòè, êîëêîòî è single-precision FP. Äîñòà çàäà÷êè, êîèòî óñïåøíî ñå ðåàëèçèðàò îò GPU-òà ñå ñúñòîÿò ïî÷òè åäèíñòâåíî îò öåëî÷èñëåíè îïåðàöèè. Ïðèìåðíî MD5 èëè SHA1 àëãîðèòìèòå èçïîëçâàò ñàìî öåëî÷èñëåíè 32-áèòîâè àðèòìåòèêè è ïîáèòîâè îïåðàöèè.
×åòâúðòî - òîâà êîëêî áðóòàëíî ñëîæåí å àëãîðèòúìà èëè ïúê êîëêî áðóòàëíî ìíîãî èç÷èñëèòåëíî âðåìå èçèñêâà, íÿìà îòíîøåíèå êúì òîâà êîå å ïîäõîäÿùî è êîå íå å äà ñå èçïúëíÿâà â/ó GPU. Âúðõó GPU-òà èìà ñìèñúë çà àëãîðèòìè, êîèòî ïîçâîëÿâàò äà ñå ïàðàëåëèçèðàò, äåìåê íÿìà ñåðèàëèçàöèÿ, íÿìà è çàâèñèìîñòè. Òàêà ÷å ðåêóðñèâíîòî îáõîæäàíå íà åäèí ãðàô ïðèìåðíî å ñèëíî íåïîäõîäÿùà çàäà÷à çà GPU-òà.
È íàêðàÿ - GPU êîäà è ïðè CUDA è ïðè OpenCL ñå êîìïèëèðà îò îïòèìèçèðàù êîìïèëàòîð, òàêà ÷å ïîíå î÷åâèäíèòå íåùà áèâàò îïòèìèçèðàíè óñïåøíî. Óñïåøíîòî îïòèìèçèðàíå íà òàêúâ ñîôòóåð èíà÷å èçèñêâà äà ñå ñúîáðàçÿâàø ñ îñîáåíîñòèòå íà õàðäóåðà, ïðèìåðíî ïðè ATI âåêòîðèçàöèÿòà å âàæíà, ïðè NVIDIA - coalesced ÷åòåíåòî/ïèñàíåòî. Pattern-à â êîéòî ÷åòåø îò ëîêàëíàòà ïàìåò å âàæíà, çà äà èçáÿãâàø êîíôëèêòè ñ êàíàëè/áàíêè. Èçáÿãâàíå íà óñëîâíè ïðåõîäè, íà ïèñàíå è ÷åòåíå â/îò âèäåîðàìòà, òàêèâà íåùà.




Reply With Quote

Lenovo ThinkPad 15 èëè IdeaPad 15
5th May 2023, 22:16 in Ìîáèëíè êîìïþòðè