Profesionální grafické karty FirePro řady W, W7000, Pitcairn v plné síle

16.10.2013· Autor: Pavel Zoch, Ph.D.· Přidat komentář

Minule jsme si představili pilotní a tedy nejslabší profesionální grafickou kartu od AMD FirePro W5000. Karta vynikala výborným provozem a velmi slušnou výbavou. Pokud jsme se ale podívali na její rodokmen nemohlo nám ujít, že by jistě mohla být i silnější, protože nebyl využitý celý potenciál čipu. Ten využívá dnes recenzovanný model, W7000. Karta s dobrým provozem, 4 Gb pamětí, 4 výstupy DisplayPort a slušným OpenCL výkonem. Skoro by se dalo říci, že se jedná o idální kartu. A pořád s příjemnou cenou (na profesionální grafické karty). A mimochodem, je nový Cinebench R15 a mám i nové informace, tedy změníme některé části metodiky testu (i zpětně).

Minule recenzovaná karta mne velmi mile překvapila. Výborně se chovala v editoru (OpenGL) a i rendereru, při dobrém provozu a slušném potenciálu RAM. A ani cena není špatná. Možná bychom mohli připomenotu specifikace této karty (jinak uvádím odkaz na pilotní díl seriálu popisjící tytpu GPU zde:

Specifikace W5000

AMD FirePro W5000, 2GB GDDR5, PCIe x16, 768 stream jader, jádro Pitcairn, 1xDVI, 2xDisplayPort, cena okolo 11.000 s DPH

Dnešní karta je W5000 velmi blízce příbuzná, ale přeci jen se v něčem liší. W5000 zcela nevyužívá potenciálu čipu Pitcairn, který může obsahovat (mít aktivních) až 1280 stream jader. To W7000 je využívá zcela a tak tím v některých úlohách logicky roste výkon. A to dramaticky, jindy je zase otázkou, zda dokáže aplikace kartou poskytovaný potenciál využít. To nechme ale na článku.

Mimochodem. Nikdo učený z nebe nespadl. Nebyl jsem si jistý výsledky, respektive vhodností scén v Indigu a tak jsem pátral a pátral (a také se ptal). Změnil jsem systém testu a to proto, že Indigo zatím neumí využívat kartu vždy. Našel jsem situaci, kdy ji využít umí a to zásadně a na této situaci je výkon v Indigu podstatně směrodatnější, než kde jinde. Máte se na co těšit!.

Ještě než začneme, zopakujme si základní specifikace.

Specifikace W7000

AMD FirePro W7000, 4GB GDDR5, PCIe x16 3.0 , 1280 stream jader, jádro Pitcairn, 4xDisplay port, cena okolo 14.600 s DPH

01

Jak jsme řekli, cena není ještě nějak závratná a za své peníze uživatel získá 4x výstup DisplayPort což může být pro profesionální řešení opravdovou výhodou a zásadním klíčem pro případné užití této karty. Ono ty tři-čtyři panely nemusí být až takové sci-fi. Řekněme dva profi desetibitové panely + jeden desetibitový Cintiq od Wacomu, vše na DisplayPortu a ejhle, máme ¾ v provozu a opravdu se nejedná o nereálně navrženou situaci. Navíc má karta 4 GB GDDR5, což umožňuje využití vysokého rozlišení. Ve výsledku, osobně z mého pohledu, za dané peníze vlastně není karta drahá (z pohledu výstupů + potenciálu GDDR5) ani v porovnání s kartami herního segmentu. Ukažte mi kartu z herního segmentu, která umí totéž (když pominu 10-bit a některé další technologie). Jistě bude karta běžet na vyšších frekvencích a podobně, vlastní přínos ale bude, podle mého, v pracovní oblasti proti této kartě dost malý. A opakuji, možnosti výstupu jsou z mého pohledu skoro jedinečné (za danou cenu).

02

Je pravda, a řeknu to rovnou, že mi přijde poměrem cena/výkon toto řešení jako asi momentálně nejvýhodnější na trhu. Jistě platí všechno to, co jsme již napsali minule. AMD FirePro má smysl tehdy, když chybí ve vašem portfoliu CUDA a vystačíte si s OpenCL. Pokud tomu tak je, asi není momentálně výhodnější profi karty než této. Zní to jako reklama, ale podívejte se po ostatních a asi vám vyjde totéž.

Mimochodem, opět, jaká karta stojí proti této W7000 v zeleném táboře? Je to, ve schodě s minulým článkem, Quadro K4000. Její specifikace jsou zde:

NVIDIA Quadro K4000, 3GB GDDR5, PCIe x16, 768 CUDA jader, jádro GK 106, 1xDVI, 2xDisplayPort, cena okolo 19.300 s DPH

Jedná se tedy o cenově dražší řešení mající o 1 GB Ram méně a kontrující jen dvěmi DisplayPorty a jedním DVI. Výhodou, zakrýt to nelze, je CUDA, ale na druhou stranu jsou všechny Keplery vyjma jádra GK110 v CUDA dost pomalé a OpenCL jim nesvědčí. Většinou má konkurence lepší provoz (K4000 má de facto poloviční příkon) a obecně vyšší úroveň ovladačů... Více v odkazu uvedeném níže.

Poznámka:

Tohle je pod čarou, ale mám z toho trochu pocit, že NVidia usnula na vavřínech. A to ze dvou důvodů (jakkoliv i AMD má také své problémy a tím netvrdím, že je lepší). Vydáním Keplera s jeho nízkým výpočetním výkonem myslím dost nazlobila nezávislé vývojáře i uživatele. Hodně lidí investovalo do vývoje aplikací podporující CUDA, a dost lidí by rádo tyto aplikace využívalo, protože zásadně zrychlují některé procesy (rendering, simulace). Jenže dlouho nebyla k dispozici dostupná karta (Kepler), kterou by bylo možné na výpočty použít a do příchodu Titana a GF 780 zůstávali na starých (a žravých) Fermi, většinou násobených GF580.

Druhým problémem podle mého byla oblast MacOS. Ono právě v grafické oblasti je Mac prostě často užívanou platformou a také platformou, která je primárně obsazená AMD. Z toho plynul tlak (například na Adobe) na podporu OpenCL (vedle CUDA pro Win). A když už bylo OpenCL pro Mac, asi byla jen otázka času, kdy bude i pro Win.

Výsledkem zatím je, že vnímám mírný posun ve prospěch OpenCL proti CUDA (hlavně z pohledu Adobe CC pro Win), jakkoliv je pozice CUDA zatím dost neotřesitelná a míra i množství implementace CUDA je podstatně vyšší než OpenCL. Kam to půjde dál je podle mého na společnosti NVidia. Pokud bude pokračovat i Maxwell ve stávajících šlépejích je otázkou, zda se i vývojáři časem neohlédnou po OpenCL jako více univerzální platformě (jakkoliv je prý implementace OpenCL náročnější).

Výhody pro rozvoj OpenCL implementace by byly jasné. Mac komunita (což je v naší branží dost podstatná část) obvykle stojí mimo možnost využití CUDA (mimo některých výjimek jako Quadra pro Mac – ale v současné době nikoliv na jádře GK110), a za druhé v této chvíli velmi vysoký výkon karet AMD v oblasti OpenCL a možnost užití i NVidia karet – tedy univerzálnost. Uvidíme... Jsem na to velmi zvědav. Osobně, jako uživateli CUDA aplikací, bych si přál, aby byla nová generace čipů Nvidia stejně univerzální (jako celek, nejenom nejvyšší čip), jako bylo Fermi. A nebo, a to je kacířská myšlenka, aby se OpenCL masivně prosadilo a dokázalo upoutat vývojáře všech možných rendererů a spol.

FirePro W7000

Předchodce této karty byla karta označená jako V7900, což byla podobně velká karta osazená 2 GB GDDR5, čtyřmi DisplayPorty (max rozlišení 2560x1600). Karta byla vyrobena starším 40 nm procesem a patřila svou architekturou mezi čipy Cayman Pro GL, tedy odvozena byla od řady 6900. Nabízela shodně 1280 stream procesorů a poskytovala na svou dobu velmi dobrý výkon i provoz. Více o této kartě najdete v odkazu: http://hothardware.com/Reviews/AMD-FirePro-V7900-and-V5900-Professional-Graphics-/?page=10. Jednalo se tedy, na rozdíl od zde recenzované V5900, o vyvážený kus hardware širokého spektra použití a dobré výbavy (na svou dobu, tedy rok 2011).

FirePro W7000 ale přeci jen nabízí o dost více než předchůdce. Dvojnásobná kapacita RAM je první bonus. Dalším je cena, která je nižší o cca ¼ a následovat vyšší výkon a hlavně podstatně vyšší maximální rozlišení (DisplayPort 2). Ostatní pozitiva zůstala a tak se máme určitě na co těšit.

Balení

Balení karty je již klasické ve smyslu AMD (ale ono to není úplně pravidlem, což ostatně uvidíme příště). Bílý o něco větší box s označením karty AMD FirePro workstation graphics W7000). Na obalu je vyvedené auto se stojícím designerem sledujícím tři panely. Myslím, že je návrh potisku o něco lepší než v případě W5000, přesto mi přijde trochu alibistický. Ono to ale asi je normální a když si vzpomenu na obal Quadra 4000 tak to vlastně nevybočuje z designu celého segmentu trhu :)).

03

Zpět k balení. Zadní strana boxu je opět potištěna informacemi o kartě a také jejím vyobrazením. Azase lze říci, obsah je důležitější než obal. Box je o něco větší než v případě W5000, rozměry se pohybují 38,5x24,5x7,5, ale ani tak není krabice nějak zbytečně veliká. Je přesně taková, aby ochránila to dobré uvnitř (nepřipomíná vám to tetrapak)?

Bílý karton je jen obalem vlastního balení, které je kartonové. Uvnitř jsou polyuretanové výplně a v nich v antistatickém pytlíku karta. Její rozměry jako by z oka vypadly starému Quadru 4000, dal jsem je na sebe a skoro přesně se shodují. Zajímavé. Délka karty je tedy okolo 24,5 cm a jak je asi zřejmé z obrázku, je pouze jednoslotová. To je skvělé...

Karta je shodně doplněná Crossfire můstkem, dvě mi redukčními kabely DisplayPort – DVI, což je podle mého stav, jaký má být. Mimochodem, karta má standardní DisplayPort (nikoliv mini). Dalším shodným rysem je výstup na stereo umístěný do separátního panýlku montovaného samostatně...

Dále je vše doplněno univerzálním quick startem a to je opravdu všechno.

Skoro doslova se mohu v některých větách opakovat, vím :)).

Základní specifikace

Z minulého článku již víme, že je karta vyráběna v současné době standardním 28 nm procesem a patří do stejné rodiny jako Radeon HD 7850 a HD 7870 GHz Edition. Proti dříve uvedené W5000 dosponuje plným potenciálem 1280 stream jader. Tedy stejně, jako Radeon HD 7870. Karta bez zátěže běží na 450 Mhz (proti 300 W5000), v případě maximální zátěže na 950 Mhz. Paměti běží na 1200 Mhz. Bylo již řečeno, karta je osazena 4 GB paměťmi GDDR5, šířka sběrnice je 256 bitů a propustnost 153.6 GB/s (podstatně vyšší než v případě W5000). Často by nás mohlo u těchto karet zajímat výkon v OpenCL (již víme že Adobe rendering videa, Luxrender/resp. Luxmark, částečně Indigo – to si ještě více rozebereme – tedy ještě více než minule) a další.

Tedy k výkonu ve výpočetch. Hodnota Single Precission výkonu je a Double Precision (podstatné zejména pro oblast výpočtů, jakkoliv se podle informací vývojářů – Indigo – většinou stejně využívá zejména Single precision). Hodnota SP je – 2.4 TFLOP (proti 1,3 W5000) a 152 GFLOP (giga) proti 79.2 GFLOPs W5000 výkonu na plovoucí čárce. Stejná je hodnota nejvyššího rozlišení na DisplayPortu 1.2, která je 4096x2160, v případě DP 1 2560x1600. Více o standardech DisplayPort zde: http://en.wikipedia.org/wiki/Displayport

I když možná bude jedna nejmenovaná korejská automobilka popotahovaná za srovnávací reklamu, tak snad můžeme porovnat W7000 s K4000. Opět je to jen papírové srovnání, bohužel jsem neměl K4000 v ruce.

Quadro K4000 je primárně o zobrazení, nikoliv výpočtu (není to GK110), srovnání tedy není zcela korektní, ale v oblasti výpočtů nabízí tento konkurent 1,246 GFLOP v Single precision. Tedy poloviční hodnotu. I maximální rozlišení je u K4000 nižší (3840 x 2160 při 60Hz). Na stranu druhou, je K4000 podstatně úspornější kartou (max 80W proti 150 W) a není úplně objektivní tvrdit, že slabší. To zejména díky velmi kvalitním ovladačům, které mohou být pro některé aplikace skutečně výborně odladěné a tím dosahovat vynikajících výsledků.

Koho by zajímaly komplexní informace o porovnání výkonů těchto karet v mnoha profi aplikacích, mohu jen doporučit tento článek, který vše co je napsané zde výborně doplňuje. Chci ale zdůraznit několik věcí:

  1. výkon karet se může dramaticky měnit v závislosti na ovladačích, ty mohou být upraveny podle nové verze aplikací čo obecně lépe odladěné a výsledek bude dramaticky jiný!

  2. Výkon se také může měnit podle náročnosti scény (viz výsledky v Maya) a rozlišení.

  3. V případě absence PCIEx16 3.0 (například já mám jen 2.0) se může snížit rychlost zobrazení o pár procent.

Ještě k odkazu. Vynikající je pozorovat, jak se skutečně profi segment doplňuje a není snadné říci, kdo kde má navrh. Snad jen, že člověk neudělá až tak moc chybu u obou, což je příjemné zjištění.

Skutečně v závěru této poznámky, všimněte si doporučení. Doporučeny jsou v závěru karty Quadro K4000 (hlavně pro skvělé odladění v oblasti profi aplikací jako Solidworks a spol) a W7000 pro vynikající poměr cena/výkon a OpenCL. Platí pořád to, co jsme již kdysi řekli. AMD mívá slabší ovladače a horší ladění a možná systémově o něco lepší podvozek (ve smyslu výkonnější za danou cenu), což ale krotí právě ovladače. Jakkoliv je nyní lepší situace ovladačů v C4D a to dramaticky, tak jinde se to může projevit obráceně. Je opravdu úžasné, jak lze dvě věci dělat jinak a výsledek může být v obou případech podobný při naprosto odlišné cestě, jak výsledku dosáhnout.

04

Odkaz: http://www.tomshardware.com/reviews/best-workstation-graphics-card,3493-33.html

Další parametry:

Výstup

  • DisplayPort: 4x

  • Max DisplayPort 1.2 rozlišení: 4096x2160

  • Max DisplayPort 1.1 rozlišení: 2560x1600

Systémová podpora technologií

  • DirectX® 11.1

  • OpenGL 4.2

  • OpenCL™ 1.2

  • Shader Model: 5.0

  • AMD Eyefinity Technology

  • AMD CrossFire™ Pro

  • AMD HD3D: (pomocí stereoscopického 3-pin mini DIN)

  • Systémová podpora: Microsoft® Windows® 8, Windows® 7, Windows® XP, Windows Vista® a Linux® (32/64-bit)

Napájení, chlazení

  • Max příkon: <150W

  • Počet slotů: Jeden

  • Form Factor: plná výška/délka

  • Rozhraní: PCIe® x16, 3.0 pro optimální výkon

  • Chlazení: aktivní

Systémové požadavky

  • PCI® Express x16 (jeden slot), pro optimální výkon je vhodné použití standardu 3.0

  • Zdroj s jedním volným 6-pinovým napájením

  • 2GB paměti

  • Microsoft® Windows® 8, Windows® 7, Windows® XP, Windows Vista® či Linux® (32/64-bit)

  • Internetové připojení pro instalaci driveru

    fp_01

    fp_02

K závěru technického popisu

S kartou jsem opět strávil asi jedne měsíc. Měsíc velmi příjemný, pro mne je to momentálně (mimo využití CUDA) asi nejlepší karta, se kterou jsem se potkal (cena/výkon). Slušný provoz, nízká hlučnost, větrák pernamentně na cca 25-35%, teplota jádra okolo 50 stupňů. O kartě skoro nevím a to je dobře. Tak to má být.

Kartu jsou velmi intenzivně používal v CINEMĚ 4D R15 a R14, pro testování nového systému Cinebench R15 a srovnáváním s Cinebench R11,5. Dále klasicky s renderery, které budeme testovat. Tedy Luxmark/Luxrender (rozhraní Blender) a Indigo, jak standalone, tak Cindigo. Mimo to ještě Adobe Premiere.

Všechny testy probíhají na stále stejné stanici, tedy na procesoru AMD FX 8350 přetaktovaném na 4,4 GHz (deska je Asus Crossfire Formula V) a s 16 GB Ram. Jak jsme slíbili, stanici nebudeme během testů měnit, ale možná se podaří otestovat karty i na jiné stanici s i74930 na PCIEx16 3.0, čímž by nám vyšla komparace pro toto rozhraní (mezi kartami, nikoliv absolutní).

CINEBENCH R11,5

Cinebench je mrtev, ať žije Cinebench! Již dlouho jsem kritizoval to, že je daný systém zastaralý. A to jak verzí OpenGL, tak v oblasti optimalizace výpočtů. Nová verze je tedy podstatně směrodatnější než stará a také poskytuje odlišné výsledky! Všimněte si, W7000 se takřka kryje (o náhodnou odchylku) s W5000 i se silnější W9000. Stará CINEMA 4D R11,5 s OpenGL OpenGL 2.0 při využití jen 128 MB RAM prostě nebyla již moderním kritériem (nemluvě optimalizacích, které i u OpenGL v C4D proběhly). Cinebench 11,5 využíval OpenGL 2.0 a potřeboval jen 128 MB na RAM (grafické karty). Zejména ale jsou ale patrné značné nedostatky v kompilaci. Tedy, výsledky nejsou až tak směrodatné (pro stávající verzi CINEMY 4D R15).

Pro srovnání jako výchozí etalon uvádím i své staré dobré Quadro 4000. Výkon nelze s touto starou kartou srovnávat, jakkoliv je její výkon často stále velmi dobrý (viz praktické testy).

11,5

Cinebench R11,5 AMD FirePro W7000 + CPU FX 8350 4,4 GHz, 77,53 fps max

Testy minulé

Cinebench R11,5 AMD FirePro W5000 + CPU FX 8350 4,4 GHz, 77,53 fps max
Cinebench R11,5 Nvidia Quadro 4000 + FX 8350 4,4 GHz 61,52 fps max.

CINEBENCH R15

Scény nejsou až tak odlišné, ale odlišná je míra kompilace OpenGL 2.1 a také míra využití pamětí. Přesto ani Cinebench R15 neumí využít kartu dosytosti (GPU-Z to umí hezky ukázat). Přesto jsou výsledky zcela odlišné. W7000 odskakuje W5000 o 20 fps! To je opravdu obrovský rozdíl!

15

Cinebench R15 AMD FirePro W7000 + CPU FX 8350 4,4 GHz, 111,11 fps max

Cinebench R15 AMD FirePro W5000 + CPU FX 8350 4,4 GHz, 91,93 fps max

cb_15

A to opakuji, není potencál karty stále využitý. Je otázkou, čím to je způsobené. Naskytají se mi (jako de facto laikovi v tomto směru) tři základní otázky. Jisté zrychlení (a vyšší využití?) by bylo možné s osazením karty do PCIEx16 3.0. Další možností je otázka kompilace samotného Cinebenche (je schopen podat ještě vyšší frekvenci, nezdržuje to procesor – protože ten je také v pernamenci) a nakonec i otázka ovladačů karty. Pokud by měl daný problém nějaké řešení, je otázkou, kam až by bylo možné výkon grafiky posunout. Protože průměrné využití karty je jen někde okolo 75%.

Tak jako tak je výsledek řádově odlišný od staré verze Cinebenche. A to výrazně. Výrazně se posouvá k tomu, co Maxon tvrdil, že zásadně zrychlil editor. Však porovnejme původní hodnoty a dnešní, jakkoliv to není komparativní z pohledu testu. Z pohledu uživatele systému však ano. Na podobné scéně nám dala W7000 o skoro 35 fps vyšší rychlost! To je opravdu výborná hodnota.

Adobe Premiere Pro CC

Již víme, že Adobe Premiere Pro CC, na rozdíl od starších verzí, podporuje mimo technologie CUDA i OpenCL. Tato podpora se odehrává v případě přehrávače Mercury player, který je použit pro náhled videa, ale lze dané nastavení použít i pro výpočet. Pokud máte ativní v Mercury playeru grafickou kartu, pak je tento stav znázorněn žlutou barvou nad časovou stopou, pokud jen procesor, je barva červená.

V úvodním testu jsem si vyexportoval zafiltrované rodinné video, které jsem zkrátil na 1500 snímků při framerate 25 fps. Rozlišení bylo 1920x1080 a export byl jako zdroj (bez půlsnímků). Časy jsou velmi zajímavé:

Původní test s jedním videem a množstvím filtrů

AMD FirePro W7000+ FX 8350 4,4 GHz 0:02:58

FX 8350 4,4 GHz 00:19:35

AMD FirePro W5000+ FX 8350 4,4 GHz 0:03:05

Nvidia Quadro 4000 CUDA + FX 8350 4,4 GHz 0:03:02

W7000 je o chloupek rychlejší (což o to, ona je rychlejší o hodně), ale využití karty je jen okolo 37%. Výsledek tedy tomu odpovídá, jen decentní zrychlení. Situace by ale byla jiná, pokud....

Pokročilý test s množstvím filtrů

Při zpětném ohledání jak se karta chová jsem zjistil, že její výkon je jen dílčí. Respektive, její zatížení je poměrně malé (u W5000 max 50%, většinou méně). Zkusil jsem tedy připravit ještě jeden test, který je poněkud odlišný.

Abychom zatížli kartu podstatně více, zkusil jsem hned tři importovaná videa přes sebe, mající upravenou velikost a množství filtrů včetně dvou směrových rozostření přes sebe (každé video je filtrované zvlášť). Výsledky jsou ještě zajímavější než dříve, protože více využívají GPU a jejich výkon. V případě W7000 cca 80% potenciálního využití grafické karty. A to už je podstatně více relevantní v praxi, než předchozí test. Video je kratší než dříve, délka sekvence je 600 snímků při 25,00 fps. Rozlišení FullHD.

premiere

AMD FirePro 7000+ FX 8350 4,4 GHz 0:02:05

FX 8350 4,4 GHz 00:29:50

AMD FirePro 5000+ FX 8350 4,4 GHz 0:02:57

Nvidia Quadro 4000 CUDA + FX 8350 4,4 GHz 0:02:38

Výsledek je zajímavý a již ukazuje možnosti akcelerace v praxi. Pokud spojíme s potenciálem W7000 i 4 GB na RAM vychází pro tyto účely velmi relevantně. Karta je o více než 50 vteřin rychlejší než W5000 a o více než půlminutu před Q4000 s CUDA. Na druhou stranu mne mile těší, jak stále statečná je stará Fermi Quadro 4000. Premiere si s CUDOU prostě rozumí a starší věk CUDA poměrně smazává (ne zcela, ale přesto je výkon opravdu stále slušný). Jen ten provoz a hlavně teploty Q4000. Celkově je ale již tento test velmi průkazný. Je opravdu zásandí rozdíl, zda se video renderuje skoro tři minuty, či něco málo přes dvě.... S délkou videa se samozřejmě dostáváme do oblasti výrazných časových úspor.

CINEMA 4D – Indigo renderer – Cindigo

V tomto oddíle jsme orvedl změnu metodiky. Ostatně jsem to již zmínil v samotném úvodu. Podobné výsledky mi přišly velmi podezřelé vzhledem ke komparaci možností pomocí testu LuxMark (Luxrender), tedy hledal jsem důvody, proč tomu tak je. Indigo totiž není (jak prohlašují tvůrci) skutečný hybrid. Leckde se snaží výpočtu kartou pomoci, leckdy ale není karta využita vůbec naplno, protože jsou akcelerované pouze dílčí části výpočtů. Jindy zase karta převezme skoro celou úlohu a procesory jsou nechány ladem, výsledkem čehož může být (pokud je karta v dané úoze slabší), že je výpočet delší, než v případě, že by probíhal na samotném procesoru.

Jak z lesa ven? Zatím těžce. Snad se to změní, ale přesto lze nasimulovat opravdu plnohodnotný test. Test, ve kterém je procesor takřka nechán ladem a počítá jen a pouze karta. A výsledky jsou v takomvém případě velmi průkazné, jakkoliv nejsou příliš potěšitelné pro stávající výpočetní algoritmus Indiga.

Pro komparaci s výsledky minulými ale uvedeme všechny testy, jakkoliv mají velmi malou vypovídací hodnotu. V závěru je pak skutečný zátěžový test, který využívá kartu i na takřka 100% (což povrzuje i GPU-Z).

Scéna s teploměry

Tento test probíhal při využití renderovacího enginu Indigo přímo implementovaného jako plugin do CINEMY 4D. Jednalo se o verzi 3.4.19. Ve scéně jsou dva různě barevné high poly teploměry, scéna je bez textur (jen barvy), osvětlená dvěmi plošnými světly. Pro možnost odečtu jsem nastavil koncovou hodnotu Halt samples per pixel na 300.

teplomer

Délka výpočtu

AMD FirePro W7000 + FX 8350 4,4 GHz 00:03:29

FX 8350 4,4 GHz 00:04:48

AMD FirePro W5000 + FX 8350 4,4 GHz 00:03:27

Nvidia Quadro 4000 CUDA + FX 8350 4,4 GHz 0:03:34

Nvidia Quadro 4000 OpenCl + FX 8350 4,4 GHz 0:03:38

Potvrzuje se to, co jsme již předeslali. Není to vhodně postavený test a výsledek tomu odpovídá. Je na úrovni W5000 a před referenční Q4000. Jenže karta je využitá jen z 20%. A to je velmi, velmi málo...

Indigo renderer (standa alone) – květina

I tento test je bez textur, jen s HDRi mapou a pak opět plošnými světly. Tématem je „sklo“, respektive kapalina. Pro odečet jsem nastavil koncovou hodnotu Halt samples per pixel na 300.

flower

AMD FirePro W7000 + FX 8350 4,4 GHz 00:02:01

FX 8350 4,4 GHz 00:03:05

AMD FirePro W5000 + FX 8350 4,4 GHz 00:02:01

Nvidia Quadro 4000 CUDA + FX 8350 4,4 GHz 0:02:12

Nvidia Quadro 4000 OpenCl + FX 8350 4,4 GHz 0:02:08

Vypadá to jako omyl, ale dosáhl jsem stejného času (a to včetně další popisované karty, kterou si ukážeme příště!). Ono se nelze divit, karta je využita jen z 32/33%. Tedy opět, není to průkazný test.

Interiér“

A ještě pro úplnost onen „interér, jakkoliv asi tušíte závěr. Jistě, jen ten nový test je relevantní...

indoor

AMD FirePro W7000 + FX 8350 4,4 GHz 00:02:23

FX 8350 4,4 GHz 00:03:00

AMD FirePro W5000 + FX 8350 4,4 GHz 00:02:31

Nvidia Quadro 4000 CUDA + FX 8350 4,4 GHz 0:02:26

Nvidia Quadro 4000 OpenCl + FX 8350 4,4 GHz 0:02:27

W7000 je sice o pár vteřin nejrychlejší, ale nic naplat. Všechny testy mi daly vlastně jedinou odpověď, nejsou vhodně nastavené. Představují sice reálné zrychlení, ale nikoliv potenciál jednotlivých karet. Zkusme tedy něco jiného...

Indigo – instance komplexního objektu

Z knihovny produktu XFrog jsem si vypůjčil strom (jedli kavkazkou) a z ní pomocí Mgraphu CINEMY 4D vygeneroval les. Stromy jsou generované jako instance!!! To je velmi podstatné, a exportoval do Indiga. Výsledek je velmi zajímavý. Instance mají tu vlastnost, že šetří výpočetní výkon a to se projevuje ve výpočtu s procesorem (exkluzivně) na velmi dobrém výkonu v CPU. Ale stejně tak dobře testují GPU, kde je asi otázkou správná opatimalizace algoritmu Indiga. Nám to ale nevadí, protože i když asi není optimální, jsou výsledky testů velmi průkazné (vyjma odkočivšího procesoru).

instance

Pojďme na to. Render probíhal v Indigu standalone v rozlišení 960x540 při hodnotě Halt samples per pixel na 100.

Časy testů byly následující:

AMD FirePro W7000 + FX 8350 4,4 GHz 00:11:02

FX 8350 4,4 GHz 00:09:16

AMD FirePro W5000 + FX 8350 4,4 GHz 00:20:32

Quadro 4000 CUDA + FX 8350 4,4 GHz 00:17:16

Quadro 4000 OpenCL + FX 8350 4,4 GHz 00:14:56

Rozdíl ve výkonu mezi W5000 a W7000 je obrovský. Navíc důkaz, že v případě tohoto typu výpočtu pracuje takřka výhradně grafická karta/a nebo CPU podle nastavení a druhé zařízení je takřka zcela ladem. Průkaznost v rámci posouzení GPU je tedy velmi vysoká.

Tento test je podle mého soudu vlastně jediný relevantní na posouzení výpočetního potenciálu grafické karty v Indigu. Její přínos evidentně závisí na typu scény, instance ale prověřily jen karty jako takové a to je velmi dobře. Výkon W7000 je velmi vysoký (i v porovnání s W5000). Co mne vlemi zarazilo je, jak dobře si vedla stará Q4000 v OpenCL. Zdá se, a to je závěr který se týká Indiga, že má lépe v tomto směru kompilované OpenCL pro Nvidii než pro AMD. Mimochodem, interní dotaz byl zodpovězen „je to možné“...

Luxmark

Možná nejlepším testem pro měření výkonu grafické karty v OpenCL je Luxmark, který stojí jen a pouze na tomto systému. Respektive Luxrender, samozřejmě. Mimochodem, mrzí mne absence pluginu pro nové verze CINEMY 4D, protože jinak se Luxrender dá například v Blenderu docela dobře používat (a dokonce jsem našel to správné tlačítko :)).

sala

Scéna Sala (střední)

AMD FirePro W7000: 1332

AMD FirePro W5000: 785

NVidia Quadro 4000: 293

Jen pro zajímavost, náročnější scéna Room výsledek:

room

AMD FirePro W7000: 754

Pro Luxrender je AMD prostě stavěné a tady mu svědčí i tento plně vybavený Pitcairn. Pro výpočet je skoro i díky svým 4 GB na Ram předurčena při stále slušném provozu, prostorové nenáročnosti a jednoslotovému provedení. Jinými slovy, povedené...

Závěr

Nebudu obcházet okolo horké kaše. Nejsem určitě recenzent hardware v pravém smyslu slova, ale hardware jako mnozí z nás používám a testuji na věcech, které mi jsou blízké. To samozřejmě dělá výsledek subjektivní. Přesto, i přes tuto subjektivitu jsem došel ke stejnému závěru, k jakému došli na tomshardware.com. A to, že FirePro W7000 je výborná karta. Pro mne osobně skoro nejlepší, kterou můžete (momentálně) pro CINEMU 4D a rendering v OpenCL pořídit.

Vzpomeňte brutálního výkonu v OpenGL v CINEMA 4D R15 (Cinebench R15). 111 fps je úchvatná rychlost a karta je v editoru opravdu razantně znát. Stávající verze ovladačů v této verzi CINEMY 4D funguje perfektně. A budu se opakovat, ale i pro zpracování a rendering videa je karta výborná. Připočítáme-li 10-bit například pro Photoshop a obecně zpracování obrazu, jedná se o ideální grafické železo. Pokud nepotřebujete CUDU, samozřejmě. Ale s tím nikdo asi nehne.

Slabinou (a to pěkně ukazuje zmíněný server) ve vaší! aplikaci mohou být ovladače, ale to může být oboustranné, jakkoliv se to mne (CINEMY 4D) momentálně netýká.

Pro mne osobně výborná karta. Vhodnější jsem pro editor C4D a OpenCL zatím v ruce neměl.

Za zapůjčení děkuji společnosti Asbis, www.asbis.cz

Pavel Zoch, Ph.D. Úplnej a naprostej .....

E-mail: pzdm(zavinac)digitalmedia.cz | Web: www.3dsoftware.cz | ICQ: 248707187 |

Motto: "Co ve věčnosti leží, mrtvé není, v záhadě věků i smrt se ve smrt změní." (H.P.L.)

Komentáře k článku  

Přihlášení uživatele