Performance analysis and autotuning setup of the cuFFT library
Název česky | Analýza výkonu a autotuning nastavení knihovny cuFFT |
---|---|
Autoři | |
Rok publikování | 2018 |
Druh | Článek ve sborníku |
Konference | ACM International Conference Proceeding Series |
Fakulta / Pracoviště MU | |
Citace | |
www | https://dl.acm.org/citation.cfm?id=3295817 |
Doi | http://dx.doi.org/10.1145/3295816.3295817 |
Klíčová slova | cuFFT; GPU; autotuning; performance analysis; cuFFTAdvisor |
Popis | Rychlá Fourierova transformace (FFT) má mnoho aplikací. Často je jedním z výpočetně nejnáročnějších kernelů, proto bylo investováno mnoho úsilí do tuningu jejího výkonu na mnoha hardwareových zařízeních. FFT knihovny mají nicméně mnoho možných nastavení a není vždy jasné, jaké z nich použít pro optimální výkon. V praxi můžeme nastavení FFT knihovny často měnit, například můžeme doplnit či oříznout vstupní data. Většina současných prací se překvapivě zaměřuje na otázku jak implementovat rychlou FFT s daným nastavením, ale nevěnuje pozornost otázce jaké nastavení umožní nejrychlejší výpočet. V tomto článku se zaměřujeme na populární knihovnu pro FFT na GPU akcelerátorech -- cuFFT. Analyzujeme chování a výkon cuFFT knihovny s ohledem na velikost vstupu a nastavení plánu. Představujeme také nový nástroj, cuFFTAdvisor, který navrhuje a pomocí autotuningu vyhledává nejlepší nastavení knihovny s danými omezeními na velikost vstupu a nastavení plánu. Experimentálně dokazujeme, že náš nástroj je schopen nabídnout odlišné nastavení transformace, které vede v průměru k 6x zrychlení při použití rychlé heuristiky a 6.9x zrychlení při použití autotuningu. |
Související projekty: |