NVidia GK 110 čip a CUDA computing (01 - představení, technologie)

23.5.2014· Autor: Pavel Zoch, Ph.D.· Počet komentářů: 1

V oblasti GPU se komunita uživatelů vždy štěpila. Na jedné straně tábor červených příznivců ATI, respektive AMD, na straně druhé zelených příznivců NVidia. A ani sami výrobci nedělají uživatelům situaci snadnou. V tom vládne ten, v tamtom onen. A jsou oblasti, ve kterých jsou vody velmi poklidné a pod výsostní vlajkou jedné z barev. V případě AMD je to bezesporu OpenCL, tam však občas může NVidia zabrousit. V případě NVidia je to CUDA. CUDA, kde vítr vane silně, ale vždy jistě a jedním směrem. CUDA je odpověď. A když CUDA, pak čipy Kepler GK 110. Pojďme se podívat na to, jak se těmto verkrze výpočetním kartám daří v oblasti, pro kterou byly zrozeny...

Historie

Pojďme nejdříve trochu do historie. Historie z pohledu vývoje hardware dost dávné, protože dva roky jsou opravdu hodně. A co více, když se podíváme na roadmapy Nvidie, pak jsme na konci produkční živnosti celé řady Kepler. Přesto pořád jsou čipy GK 10 tím nejlepším co NVidia nabízí a navíc jsou opravdu velmi výkonné. Tak, že naplňují i velmi optimistické předpoklady, které se kdysi při příchodu celé řady vyrojily.

Také jsem se nechal nachytat. Při prvním schlédnutí parametrů karet Kepler jsem lapal po dechu. Představa až tisíců výpočetních stream jader mne nenechávala klidnou a věštil jsem sladkou budoucnost unbias GPU výpočtů takřka v reálném čase. Jenže situace byla jiná.

A to proto, že valná většina čipů GK není ve výpočtech efektivní. Důvodů je mnoho, zejména ale malá průchodnost (šíře sběrnice a pod). To může být částečně nahrazeno množstvím stream procesorů, ale obecně je tento limit klíčový. A tak se očekávání nenaplnilo. Až do, až do chvíle, kdy přišel čip GK 110.

Čip GK 110 byl ale nejdříve vyhrazen jen a pouze výpočetním kartám Tesla, a to kartám s označením Tesla K20X a Tesla K20. A tyto karty jsou, jak jinak, velmi luxusním zbožím.

http://www.nvidia.co.uk/object/tesla-server-gpus-uk.html

Uživatelé CUDA technologií tak museli dále čekat. A čekali tak, že používali staré karty GF580 a 590, které plnily kapsy ČEZu. Výkonu měly poměrně dost, ale ta spotřeba byla opravdu příšerná.

Situace se změnila ve chvíli, kdy NVidia přeznačila a mírně aktualizovala svou produční řadu a přišla s označením 7xx. V té chvíli totiž uvedla čipy GK 110 v kartách, které tvoří špičku, high end, celé rodiny GeForce. V ten okamžik se tedy dostaly opravdu výkonné výpočetní nástroje CUDA všem, kteří je potřebovali. A to bez ohledu na cenu, o které se často diskutuje...

Proč? Možná se vám situace může jevit poněkud jiná, ale nikdy dříve nebyla hranice mezi AMD a Nvidia tak ostře vymezená jako dnes. Obě řešení mají i opravdu ultimativní produkty a jen velmi těžce se zvažuje, které řešení je obecně lepší. Pravdou je, že AMD má obrovský náskok (obecný) v OpenCl, na stranu druhou, CUDA je devizou NVidia. CUDA a NVidia jedno jest, do této sféry nemůže nikdy AMD proniknout.

Pravdou však je i to, že množství společností zabývajících se grafickými programy již nabízí OpenCl a to i tehdy, kdy dříve nabízely jen CUDA (Adobe Premiere Mercury player například), u jiných to neplatí a to i přes proklamovanou podporu (jako tomu je například v případě aplikací The Foundry, které případnou akceleraci OpenCl nenabízí). Hraniční spory mohou být velmi ostré...

Porovnání

Můj názor? Opravdu názor. Ale obecně lze asi tvrdit, že NVidia má obecně poněkud nižší spotřebu (nikoliv zásadně), pokud je aplikace pouze CUDA, pak CUDA mívá vyšší efektivitu než OpenCL, tvrdí se, to však například v CINEMA 4D nemohu až tak potvrdit, že má Nvidia lepší ovladače. V současné chvíli ale AMD v CINEMĚ 4D rozhodně nechá NVidii za sebou, má vynikající výkon OpenCl, kdy karta středního segmentu překonává high end NVidia, nižší cenu v porovnání ve stejném segmentu a to často velmi zásadně. Jednoduše, pro mne osobně, v současné chvíli, na konci životnosti řady Kepler, je hlavní a neotřesitelnou pevností NVidia CUDA. Díky GK 110 extrémně výkonná.

Grafické karty s čipem GK 110

Jaká je tedy nabíkda karet osazených čipem GK 110? Poměrně pestrá, pojďme si to projít...

GeForce GTX 780 (bez přídomku), neupravená referenční karta:

01

Otevřít v novém okně

02

Otevřít v novém okně

03

Otevřít v novém okně

04

Otevřít v novém okně

05

Otevřít v novém okně

 

Počet stream procesorů: 2304 CUDA

Základní frekvence: 863 (MHz)

Boost: 900 (MHz)

Specifikace pamětí

Frekvence pamětí: 6.0 Gbps

Kapacita: 3072 MB DDR5

Sběrnice: 384-bit

Datová propustnost: 288.4(GB/sec)

 

Orientační cena: od cca 11.800 s DPH

GeForce GTX 780 Ti (referenční karta):

Počet stream procesorů: 2880 CUDA

Základní frekvence: 875 (MHz)

Boost: 928 (MHz)

Specifikace pamětí

Frekvence pamětí: 7.0 Gbps

Kapacita: 3072 MB DDR5

Sběrnice: 384-bit

Datová propustnost: 336(GB/sec)

 

Orientační cena: od cca 15.200 s DPH

GeForce GTX TITAN:

Počet stream procesorů: 2688 CUDA

Základní frekvence: 837 (MHz)

Boost: 876 (MHz)

Specifikace pamětí

Frekvence pamětí: 6.0 Gbps

Kapacita: 6144 MB DDR5

Sběrnice: 384-bit

Datová propustnost: 288.4 (GB/sec)

 

Orientační cena: od cca 21.700 s DPH

GeForce GTX TITAN Black:

Počet stream procesorů: 2880 CUDA

Základní frekvence: 889 (MHz)

Boost: 980 (MHz)

Specifikace pamětí

Frekvence pamětí: 7.0 Gbps

Kapacita: 6144 MB DDR5

Sběrnice: 384-bit

Datová propustnost: 336 (GB/sec)

 

Orientační cena: od cca 24.200 s DPH

 

Uvedený seznam ale není konečný, ještě si jej můžeme doplnit a to následující informaci. Není to tak dávno, co NVidia ohlásila duální řešení založené na Titanech. Prozatím není tato karta k dispozici, bude velmi exkluzivním a drahým zbožím, ale také velmi výkonná (jedná se o dvě karty spojené do jednoho boxu. Předpokládané specifikace jsou následující:

GeForce GTX Titan Z

Jak jsme zmínili, tato karta prozatím není v prodeji. Očekávaná cena je 2999 USD (očekávaná, zda skutečně je otázka, protože obdobné AMD řešení je výrazně levnější a je otázkou, jak bude NVidia, a zda vůbec, reagovat).

Jedná se de facto o dvě karty Titan spojené do jednoho boxu, pokaždé s 6 GB RAM. Celkově je celé řešení 2,5 slotové. Celkově se sice bude uvádět 12 GB paměti, to ale není v případě výpočtů relevantní, protože tam je klíčem nejnižší potenciál a paměti nejsou pomocí. Obecně tedy, není pro výpočet vhodné, aby byly vaše karty propojené pomocí SLI můstku (stejně jako v případě Opencl není žádoucí propojení CrossFire u AMD).

GeForce GTX 780 (+780 Ti) 6 GB Ram

Nejvýhodnější možností se zdá koupě přicházejících nereferenčních modelů karet 780 a 780 Ti, které budou nově osazené 6 GB Ram. Dostaneme tak opravdu velmi zajimavý výpočetní nástroj s velkým potenciálem. Cena takových řešení také není až tak drastická, první taková vlašťovka od EVGA má cenovku 570 USD, což není cena nikterak dramatická. Můžeme si tak představit stanici se dvěmi, třemi kartami, které ve výsledku dají opravdu obrovský výkon. A cena nebude až tak strašná, pokud bychom předpokládali tři karty 780 s cenou okolo 600 USD (v České republice), pak je cena tří karet 1800 usd, což je řekněme 36.000. Pokud připočteme slušný podvozek v podobě i7 4930, pak stanice s rozpočtem okolo 50-55.000 dá takový výkon, který skutečně dostává termín realtime do života.

http://www.evga.com/products/product.aspx?pn=06g-p4-3787-kr

Nereferenční modely

Nereferenční modely jsou dnes alfou a omegou u obou výrobců. Jak AMD tak NVidia používá, a já se za toto tvrzení omlouvám, mizerné referenční chladiče. K dispozici máme kartu referenční (780, bez brandingu nějakého poskytovatele, jedná se o pure sample) a zde je chlazení opravdu schodné s AMD.

Tedy v zadní části je větráček, který lopatkami vhání vzduch přes blok plátkových žeber ven. Potíž je s účinností tohoto systému. Ta je poměrně nízká (blok s hliníkovými žebírky je de facto přímo na jádru), ve výsledku se tedy čip rychle zahřívá, to vede k vyšším otáčkám větráčku, to vede k vyšší hlučnosti, s vyšší teplotou se zvyšuje odpor a tím i teplota a je to začarovaný kruh. Referenční chladič kartu uchladí, ale rozhodně bych doporučoval nereferenční chlazení. To poskytují vlastně všichni výrobci, například je poměrně dobře hodnocený Phenom od Gainwardu. Tedy rozhodně se, v jakémkoliv případě, rozhlížejte po nereferenčním chlazením. To platí jen pro karty 780 a 780 Ti, protože na Titan si NVidia nenechá šáhnout a prodává se jen a pouze s referenčním chlazením.

http://www.vortez.net/articles_pages/gainward_gtx_780_phantom_glh_review,25.html

Nereferenční karty mají většinou vyšší takty a případně jinak akcelerované parametry, ale obecně pro výpočet není toto navýšení až tak významné.

Mimo to, jen poznámka pod čarou, je vhodné použít tyto karty namísto profi? To je trochu potíž s výstupem, protože výstupy těchto karet jsou striktně 8-bitové, tedy nepodporujjí 10-bit panel. Pokud ale takový panel nemáte, není co řešit!

Aplikace, které využívají CUDA

Vím, že to není otázka pro uživatele grafických aplikací, ale přesto se často na různých, pravda zejména hardwarových serverů, objevují dotazy, k čemu že ta CUDA vlastně je. Pojďme si to znova projít. Nedávám si přitom patent na to, že se jedná o výčet úplný. Jedná se o výčet z hlavy, aplikací, které jsou běžně známé.

Rendering

Octane render (Otoy): http://render.otoy.com

NVidia Iray (včetně různých klonů a odvozených aplikací): http://www.nvidia-arc.com/iray.html

Thea render, engine Presto (SolidIris technologies): http://www.thearender.com/cms/

Blender Cycles (CUDA verze): www.blender.org

Indigo renderer (pouze jeden režim, jen některé technologie, Glare technologies): http://www.indigorender.com/

Furyball (AAA Studio): http://furryball.aaa-studio.eu

Simulace

Marvelous designer, simulace látek (Virtual Fashion Inc.): http://www.marvelousdesigner.com/

Turbulence4D, simulace fluidních jevů (Jawset Visual Computing): http://www.jawset.com/

Post produkce a video

Nuke (The Foundry): http://www.thefoundry.co.uk/products/nuke-product-family/

Adobe Premiere – Mercury player (Adobe): http://www.adobe.com/products/creativecloud.html?promoid=JQPEQ

Adobe After Effects – některé prvky a pluginy (Adobe): http://www.adobe.com/products/aftereffects.html

Mimo zmíněných technologiích je možné karty s čipem GK 110 využít i v případě OpenCL technologie. Není to sice tak výkonné řešení, ale přesto jsou zde tyto karty již velmi dobře upotřebitelné:

Rendering

Luxrender: http://www.luxrender.net/

Video

Sony Vegas (Sony): http://www.sonycreativesoftware.com/vegassoftware

Na konci úvodu...

Jak vidno, výpočet není ani v případě klasické grafiky otázkou ojedinělou a může být zásadní otázkou v případě nákupu grafické karty. Jak se chová GeForce 780 v praxi se podíváme příště. V praktických testech.

Pavel Zoch, Ph.D. Úplnej a naprostej .....

E-mail: pzdm(zavinac)digitalmedia.cz | Web: www.3dsoftware.cz | ICQ: 248707187 |

Motto: "Co ve věčnosti leží, mrtvé není, v záhadě věků i smrt se ve smrt změní." (H.P.L.)

Komentáře k článku  
... bezo | 24.5.2014 19:25

Přihlášení uživatele