V roce 2008 se na trhu objevil grafický adaptér Nvidia GeForce 9800 GT s pamětí 512 MB, který nahradil předchozí model. Pozdější verze byly vydány s 1 GB GDDR5 a vylepšenými herními schopnostmi. Všechny varianty karet byly v cenovém rozpětí rozpočtu a byly určeny pro montáž levných herních počítačů.

Parametry grafického adaptéru jsou zcela v souladu s požadavky herních aplikací v letech 2008-2009. Hlavní vlastnosti Nvidia GeForce 9800 GT jsou následující:

  • GPU G92-270;
  • Frekvence GPU - od 550 do 600 MHz;
  • Frekvence paměti - 1400-1800 MHz;
  • Bitová hloubka - 256 bitů;
  • Maximální rychlost přenosu dat - 57,6 GB / s;
  • Podporované rozlišení obrazu - až 2560x1600.

Grafická karta podporuje technologii Nvidia SLI pro zvýšení výkonu, HybridPower pro automatické přepínání na integrovanou grafiku a PhysX pro maximální realističnost hraní. Funguje také s balíčky DirectX 10 a OpenGL 2.0 a poskytuje vysoce kvalitní 3D grafiku. Modernější sady funkcí API nejsou podporovány.

Recenze GeForce 9800 GT

Spotřeba energie modelu 9800 GT je při 105 W poměrně vysoká, takže k provozu je zapotřebí silné napájení. Výrobce doporučuje použít minimálně 450 wattů. Chcete-li provozovat moderní hry, měli byste zvolit produktivnější napájecí zdroj - 500 nebo 600 wattů.

Aby se udržela normální teplota grafické karty GeForce 9800 GT, jsou všechny úpravy vybaveny aktivními chladicími systémy - zpravidla s jedním chladičem.

V normálním režimu se karta zahřeje na maximálně 77 stupňů. Maximální hodnota je 105 stupňů.

Pro připojení periferních zařízení má grafický adaptér následující konektory:

  • 2 DVI, ke kterým lze pomocí adaptérů připojit běžné kabely VGA a HDMI;
  • TV-Out pro výstup analogového signálu;
  • MIO, se kterým můžete kombinovat dvě karty.

Maximální hodnota efektivní frekvence grafické karty je 2 000 MHz, což umožňuje její přetaktování o 11–30%, v závislosti na modelu. Stojí za zvážení, že znatelné zvýšení výkonu může vést k vážnému přehřátí.

Jak přetaktovat grafickou kartu Nvidia GeForce 9800 GT

Přetaktováním Nvidia GeForce 9800 GT můžete zvýšit jeho frekvenci. Výsledkem je zvýšení výkonu karty a fps během hraní. I když nebudete moci provozovat hry, které nesplňují minimální požadavky.

Speciální nástroje jako MSI Afterburner nebo Nvidia Inspector vám pomohou přetaktovat grafickou kartu Nvidia GeForce 9800 GT.

Maximální frekvence přetaktovaného grafického adaptéru by neměla překročit 2 000 MHz. Přetaktovaná karta je rychlejší, ale spotřebuje až 120-125 wattů.

Po přetaktování je těžba na 9800 GT možná, ale nedoporučuje se to. I když se objeví nová kryptoměna Bitcoin Gold, kterou lze těžit pomocí GPU, bude výkon stále příliš nízký i na zpětné získání elektřiny, zejména s tak vysokým TDP.

Jaké hry Nvidia GeForce 9800 GT vytáhne

Test provedený najednou ve hrách GeForce 9800 GT ukázal možnost použití grafické karty pro levné herní počítače. Minimální požadavky na počítač odpovídající kartě jsou základní deska s 16x sloty PCI-Express, 512-1024 MB RAM a 500 W napájením. Doporučuje se také instalace balíčku DX10.

Výsledky ověření jsou následující:

  1. Ve hře Crysys (2009) s rozlišením 1280 × 1024 pixelů. Model 512 MB poskytuje 22 až 30 fps - přibližně na úroveň grafické karty HD 4770.
  2. Při spuštění hry Stalker (rozlišení 1680x1050 pixelů) dosáhne frekvence měnících se obrázků 13-25 snímků za sekundu, pokud použijete adaptér s 512 MB GDDR5, a až 30, pokud nainstalujete do počítače gigabajtovou verzi.
  3. Hra Skyrim s kartou 512 MB se vůbec nespustí a gigabajtová modifikace ukáže při minimálním nastavení až 65 fps.

Nedoporučuje se spouštět hry vydané po letech 2011–2012 s GeForce 9800 GT 512 MB. Většina z nich nebude zobrazovat více než 20 snímků za sekundu, zbytek nebude fungovat. Verze s 1 GB paměti to udělá, ale je také nepravděpodobné, že by poskytla přijatelnou kvalitu hry.

Srovnání výrobců

Na samém začátku prodeje byla cena Nvidia GeForce 9800 GT asi 2700-3000 rublů u verzí s 512 MB a asi 3,5 tisíce rublů. pro úpravy gigabajtů. Výrobky od známějších výrobců, jako jsou MSI, Palit a Asus, získaly paměťovou frekvenci 1 800 MHz a vyšší cenu. Nyní je možné jej koupit na sekundárním trhu pouze za 600-700 rublů.

ZnačkaPaměť, MBFrekvence procesoru, MHzFrekvence paměti, MHzNáklady, rub.
Gigabyte1024 600 1800 3600
Gigabyte512 600 1500 2900
Gigabyte512 550 1800 2800
ECS512 550 1800 2600
MSI512 550 1800 2900
Asus512 600 1800 3000
Inno3D1024 600 1800 3500
Club 3D1024 550 1400 3300
Gainward1024 550 1800 3500
Zotac1024 550 1600 3400
Palit512 600 1800 2700
Palit1024 550 1800 3400

Lukrativnější značky Zotac, Club 3D a Gigabyte byly levnější, ale také pomalejší. Frekvence těchto grafických adaptérů se pohybovala v rozmezí 1400-1600 MHz. Nyní je jejich cena přibližně stejná jako u modelů, které kdysi stály více - ne více než 1000 rublů.

Jak přeinstalovat ovladač videa pro GeForce 9800 GT

Pro normální provoz grafického adaptéru je nutná přítomnost správně fungujících řídicích programů. Existují tři způsoby, jak stáhnout a nainstalovat nové ovladače do počítače s kartou 9800 GT:

  1. Stahování z oficiálního zdroje výrobce. Jediná možnost, která zaručuje správný provoz a bezpečnost počítače.
  2. Stahování ze zdrojů třetích stran. Metoda, při které si můžete nejen stáhnout ovladač pro Nvidia GeForce 9800 GT, ale také infikovat váš počítač virem.
  3. Pomocí speciálních nástrojů, jako je DriverPack Solution, DriverHub nebo Driver Booster Free. V takovém případě může být ovladač zastaralý.

Na oficiálních stránkách společnosti Nvidia najdete nové verze řídicích programů pro grafickou kartu určené pro různé operační systémy. Seznam platforem podporovaných kartou zahrnuje Windows 7 32 a 64 bit, Windows 10 a Linux. Na dalších zdrojích najdete ovladače pro takové vzácné operační systémy jako Solaris.

Grafická karta 9800 GT od NVIDIA je logickým pokračováním modelu 8800GT. Dva technologické produkty mají téměř identické parametry. Hlavním rozdílem mezi modelem 9800GT a předchozím modelem je podpora technologie HybridPower. Neexistují žádná další vylepšení. Grafický procesor karty je označen G92-270. Podobný model vlastnil model 8800. Mikročip má revizi A2, stejně jako dříve. Vlastnosti taktovací frekvence grafické karty 9800 GT zůstaly stejné: 601/1512 MHz.

Specifikace 9800 GT

Technicky vzato, 9800 GT neprošel od 8800 žádnými zásadními změnami.

Parametry grafické karty:

  • GPU: G92.
  • Video paměť: 512 MB.
  • Paměťová sběrnice: 256 bitů.
  • Frekvence GPU: 601/1512 MHz.
  • Texturové bloky: 56.
  • ROP bloky: 16.
  • Efektivní frekvence, při které pracuje paměť grafické karty: 1 800 MHz.
  • Univerzální procesory (jádra): 112.
  • Podporované jedinečné technologie: Hybridní výkon.
  • Systémová sběrnice a další komunikační rozhraní: PCI-E 2.0x16 / 2xDVI / S-Video. HDMI je podporováno pomocí adaptéru.

Jaké úkoly může grafická karta 9800 GT vyřešit?

Prezentovaná grafická karta se dobře vyrovná s hrami předchozí generace. Pokud uživatel nestíhá za novými položkami, pak je pro něj model 9800 GT nepochybně vhodný. Vlastnosti karty vám umožní snadno spouštět hry jako The Witcher 2, S.T.A.L.K.E.R, Crysis 2, Dead Space 3 a další. Mimochodem, Fallout New Vegas také přichází s touto deskou bez problémů. Čtvrtou verzi legendárního projektu ale nelze spustit.

Moderní střílečky a automobilové simulátory vydané po roce 2013 nebudou fungovat ani grafická karta. Existují výjimky, ale velmi zřídka. Uživatel se při práci s grafickými a video informacemi cítí celkem pohodlně a sleduje filmy ve vysokém rozlišení. Pokud člověk není profesionálním fotografem nebo 3D designérem, který potřebuje maximální rychlost práce, pak je pro něj grafická karta 9800 GT docela vhodná.

Výhody a nevýhody grafické karty

Dotyčná deska má řadu výhod, díky nimž je její použití stále relevantní. I když toto řešení má také nevýhody.

Jaké jsou výhody modelu 9800 GT? Charakteristiky modelu naznačují, že je jich mnoho.

  • Grafická karta podporuje režim SLI. Můžete si koupit 4 desky najednou a spojit je do skupiny, čímž dosáhnete významného zvýšení výkonu.
  • Deska poskytuje podporu pro technologii PhysX. Slouží k reprodukci dalších speciálních efektů ve hrách. Je třeba poznamenat, že celkový výkon grafické karty znatelně klesá. Aby se tento účinek zmírnil, doporučuje výrobce použít k doplnění hlavní desky volitelný vyhrazený akcelerátor PhysX.
  • Pomocí speciálních nástrojů můžete vylepšit nominální výkon Nvidia 9800 GT zvýšením o 5-15%. Specifický indikátor závisí na přání uživatele a schopnostech chladicího systému karty. Během přetaktování musíte pečlivě sledovat provozní teplotu zařízení, abyste zabránili nadměrnému přehřátí a následnému poškození.

Nevýhody:

  • je zastaralé řešení;
  • má omezenou účinnost v univerzálních počítačích;
  • plynulost přehrávání disků Blu-Ray a HD klipů zveřejněných na internetu bude výrazně ovlivněna výkonem centrálního procesoru (kromě procesoru grafické karty);
  • slabý výkon 9800 GT, specifikace desky neumožňují spuštění hry vydané po roce 2013;
  • relativně vysoká spotřeba energie;
  • nedostatečný výkon grafické karty při práci s dalšími efekty PhysX.
Řada NVIDIA GeForce 9000
Krycí jménoG92, G92b, G94, G94b, G96, G98
Vstupní GPUGeForce 9300GS, GeForce 9400GT, GeForce 9500GT
GPU střední třídyGeForce 9600
Nejlepší GPUGeForce 9800
Verze Direct3D a shaderyDirect3D 10
Shader Model 4.0
Verze OpenGLOpenGL 3.3
Verze OpenCLOpenCL 1.1
PředchůdceGeForce 8
NástupceGeForce 100

NVIDIA GeForce 9800 GX2

Gigabyte GeForce 9500 GT

Specifikace řady GeForce 9

Modelka 9800 9600 9500 9400 9300
GX2 GTX + GTX GT GT Green GT GT Green GSO 512 GSO GT GT GS
datum vydání 18.03.08 18.07.08 01.04.08 18.07.08 - 21.02.08 - - 29.04.08 18.07.08 26.08.08 -
GPU 2 x G92 G92b G92 G92b G94 G94b G94 G92 G96 G98
Počet tranzistorů, miliony 2 x 754 754 505 754 314 -
Technologický proces, nm 65 55 65 65 / 55 55 65 / 55 55 65 55 65
Frekvence jádra, MHz 600 738 675 600 550 650 600 650 550 567
Frekvence jednotky shaderu, MHz 1500 1836 1688 1512 1375 1625 1500 1625 1375 1400
Počet stream procesorů 2 x 128 128 112 64 48 96 32 16 8
Počet jednotek textury 2 x 64 64 56 32 24 48 16 8
Počet jednotek ROP 2 x 16 16 12 8 4
Výkon, GFLOPS 2 x 576 705 648 504 462 312 288 234 396 134,4 67,2 33,6
Vyplňování scény, miliardy pixelů / 2 x 9.6 11,8 10,8 9,6 8,8 10,4 9,6 7,8 6,6 4,4 2,2
Naplnění scény, miliardy tex / 2 x 38,4 47,2 43,2 33,6 30,8 20,8 19,2 15,6 26,4 8,8 4,4 4,5
Standard videopaměti GDDR3 DDR2
Šířka sběrnice video paměti, bit 2 x 256 256 192 128 64
Frekvence videopaměti, MHz 1000 1100 900 800 500
Šířka pásma paměti, GB / 2 x 64,0 70,4 57,6 38,4 16,0 8,0
Velikost videopaměti, MB 2 x 512 512 / 1024 512 384 512 256
Příkon, W 265 140 165 105 75 95 60 90 100 50 30
Rozhraní PCI Express 2.0 x16
Podpora verze API Direct3D 10, OpenGL 3.3, OpenCL 1.1
Podpora verze Shader Model Shader Model 4.0

Řada GeForce 9800

NVIDIA GeForce 9800GX2

  • Sběrnice PCI Express 2.0;
  • Dvě grafická jádra G92-450 (65nm) pracující na 600 MHz;
  • 256 (2 × 128) stream procesorů běžících na 1 500 MHz;
  • 1024 MB (2 × 512 MB) grafická paměť GDDR3 s 256bitovým rozhraním a frekvencí 1000 MHz;
  • Spotřeba energie je 265 W;
  • DirectX 10.0 Shader Model 4.0 OpenGL 3.3 kompatibilní;
  • Podpora Quad SLI.

Ve skutečnosti jde o duální kartu založenou na dvojici 8800 GTS 512 MB. Tato grafická karta je pokračováním konceptu akcelerátorů dual-GPU GX2, které byly nalezeny v řadě NVIDIA GeForce 7900.

NVIDIA GeForce 9800GTX +

  • Sběrnice PCI Express 2.0;
  • Grafické jádro G92b-400 (55 nm), pracující na 738 MHz;
  • 128 stream procesorů běžících na 1836 MHz;
  • 1024 MB nebo 512 MB GDDR3
  • Spotřeba energie je 140 W;
  • Podpora pro 3-Way SLI.

Jedná se o verzi GeForce 9800GTX na 55nm procesní technologii se zvýšenými frekvencemi a nižší spotřebou energie. Výkonem mírně předčí AMD / ATI Radeon 4850. Později byl přejmenován na GeForce GTS 250.

NVIDIA GeForce 9800GTX

  • Sběrnice PCI Express 2.0;
  • Grafické jádro G92-400 (65nm), pracující na 675 MHz;
  • 128 stream procesorů běžících na 1688 MHz;
  • 1024 MB nebo 512 MB GDDR3 videopaměti s 256bitovým rozhraním a frekvencí 1100 MHz;
  • Spotřeba energie je 168 W;
  • DirectX 10.0 Shader Model 4.0 OpenGL 3.3 kompatibilní;
  • Podpora pro 3-Way SLI.

Analogový NVIDIA GeForce 8800GTS 512 MB se zvýšenými frekvencemi. Model 9800GTX +, který byl naléhavě vydán v reakci na vydání AMD / ATI Radeon 4850/4870, který měl vyšší výkon, rychle ztratil své místo na trhu.

NVIDIA GeForce 9800GT

  • Sběrnice PCI Express 2.0;
  • Grafické jádro G92-400 (65nm / 55nm), pracující na 600 MHz;
  • 112 stream procesorů;
  • 1024 MB nebo 512 MB GDDR3
  • Spotřeba energie je 105 W;
  • DirectX 10.0 Shader Model 4.0 OpenGL 3.3 kompatibilní;
  • Podpora 2-Way SLI.

Analogový NVIDIA GeForce 8800GT 512 MB.

NVIDIA GeForce 9800GT zelená

  • Sběrnice PCI Express 2.0;
  • Grafické jádro G92-400 (55 nm), pracující na 550 MHz;
  • 112 stream procesorů;
  • 1024 MB nebo 512 MB GDDR3 grafické paměti s 256bitovým rozhraním;
  • Spotřeba energie je 75 W;
  • DirectX 10.0 Shader Model 4.0 OpenGL 3.3 kompatibilní;
  • Podpora 2-Way SLI.

Před vydáním grafické karty 9800 GT se mnoho analytiků a novinářů domnívalo, že zprávy o vzhledu tohoto grafického adaptéru jsou fiktivní. Po oficiálním vydání byly informace jasné. Mnozí předem dali této grafické kartě vavříny jako vlajkové lodi, ale inženýři NVIDIA opět přiřadili starým architektonickým řešením nové číslo.

GeForce 9800 GT. Specifikace grafické karty

Grafický akcelerátor je téměř úplnou kopií svého předchůdce - A některé testy ukazují, že předchozí generace zůstává produktivnější. Nový produkt je vybaven stejným procesorem - G92, dokonce ani technický proces se nezměnil. Zůstal na 65 nm, ačkoli mnozí věřili, že 9800 GT použije 55 nm. Frekvence GPU se nezměnily.

Na stránce oficiálního webu představujícího GeForce 9800 GT jsou vlastnosti uvedeny následovně:

  • GPU: G92. 112 univerzálních procesorů, 64 texturovacích jednotek.
  • Video paměť: GDDR3, její objem je 512 MB.
  • Šířka paměťové sběrnice: 256 bitů.
  • Frekvence GPU: 600 MHz.
  • Frekvence jednotky shaderu: 1 500 MHz.
  • Frekvence paměti: 1800 (900) MHz.
  • Porty: 2xDVI-I, TV-Out.

Jedinou věcí, která odlišuje tuto grafickou kartu od 8800 GT, je podpora technologie HybridPower. Umožňuje přepínat mezi integrovanou grafikou a diskrétní grafikou v automatickém režimu, což umožňuje snížit spotřebu energie a

Tuto aktualizaci nelze považovat za důležitou pro GeForce 9800 GT, nemění vlastnosti, kromě toho HybridPower nemůže fungovat bez dodržení jedné podmínky. Základní deska musí také podporovat tuto technologii a současně nést integrované grafické jádro.

Zařízení

Grafická karta je dodávána v poměrně velké krabici, která je zdobena převahou modrých barev.

Uvnitř najdete následující:

  • Samotná grafická karta.
  • Sada tulipánů S-Video.
  • Dodatečný napájecí vodič.
  • Laserový disk s ovladači a programy.
  • Některé revize obsahují Civilization IV v jejich sadě.
  • Uživatelská příručka.

Texty vytištěné na obalu představují převážně reklamy. Mezi pochvalou za technologie použité v produktu GeForce 9800 GT však technické specifikace přímo naznačují, že grafický akcelerátor je založen na 8800 GT. Taková poctivost je záviděníhodná.

Přítomnost velkého počtu adaptérů a napájecích vodičů naznačuje, že NVIDIA se stará o své zákazníky. Pokud potřebujete připojit nestandardní vybavení nebo více monitorů, nemusíte kupovat další komponenty, stačí je dostat z krabice.

Design

Je možné poznamenat, že při porovnání GeForce 8800 GT a GeForce 9800 GT se jejich vlastnosti shodují mnohem více než design. Obecně se samozřejmě jedna deska podobá druhé, ale nemůžeme říci, že jsou identické.

Obě grafické karty mají stejné rozměry, umístění napájecího konektoru, kontakty SLI pokryté gumovou zarážkou a také polohu GPU a paměťového IC. Čipy vyrábí společnost SAMSUNG a přístupová doba je 1 ns.

Umístění zbývajících řetězů se zcela liší. Inženýři se navíc rozhodli nešetřit peníze a používali zařízení nejvyšší kvality. Na grafické kartě jsou vidět pevné kondenzátory. Životnost těchto výrobků je mnohem delší než u tradičních elektrolytických. Tlumivkové cívky s feritovými jádry mají také výhodu z hlediska provozní doby oproti standardním tlumivkám.

Pokud se odborníci pokusili instalovat polovodiče, pak počet portů pro připojení výstupních zařízení zjevně nedosahuje špičkových představitelů. Jsou zde dva konektory DVI-I a jeden TV-Out. Tuto nevýhodu však kompenzují všechny potřebné adaptéry.

Chladící systém

Při bližším pohledu se specifikace modelu 9800 GT nezdají působivé. Na grafickém akcelerátoru však existuje prvek, který může dát šanci mnoha dalším grafickým kartám - jedná se o chladič. Nejprve je třeba poznamenat, že instalovaný chladicí systém vyrobila známá německá společnost Zalman, která je jedním z lídrů na trhu.

Je to co nejjednodušší, ale funguje to velmi tiše a co nejúčinněji. Jádro se dotýká povrchu GPU, na který se nanáší tepelná pasta. Prochází ním dvojice 6mm trubek, jejichž tvar je podobný písmenu „U“. Jsou vyrobeny z mědi. Na horní straně trubek jsou tenké hliníkové desky.

Celý tento design logicky završuje nízkorychlostní vrtule o průměru 8 cm, jejíž rychlost otáčení se volí automaticky v závislosti na úrovni zatížení grafického jádra. Jedinou věcí, kterou lze připsat nedostatkům chladicího systému, je to, že zakrývá druhý slot PCI EXPRESS. Pokud bude nutné do počítače vložit dvě grafické karty najednou, budete muset přemýšlet o výměně chladiče.

Přetaktování

GT, jehož vlastnosti jsou poměrně skromné, lze přetaktovat pomocí softwaru obsaženého v jeho balíčku. GamerHUD může měnit frekvence, zatímco běží operační systém, bez zbytečných restartů. Program navíc umožňuje manipulovat s napětím dodávaným do GPU, ale nedoporučuje se používat tuto funkci, aby nedošlo k selhání video procesoru.

Po přetaktování grafická karta GeForce 9800 GT pokračuje ve stabilním provozu, jehož frekvenční charakteristiky byly zvýšeny na 700 MHz pro GPU, 1700 MHz pro shaderovou jednotku a 2000 MHz pro paměť. Teplota po přetaktování mírně stoupne, za což je třeba poděkovat systému chlazení.

technologie (nm)90 80 65/55 tranzistory (M)681 289 210 754 505 314 univerzální procesory128 32 16 128 64 32 texturové bloky32 16 8 64 32 16 míchací bloky24 8 16 8 paměťová sběrnice384 (64x6)128 (64x2)256 (64x4)128 (64x2) typy pamětiDDR, GDDR2, GDDR3, GDDR4 sběrnice čipového systémuPCI-Express 16xPCI-Express 2.0 16x RAMDAC2 x 400MHz rozhraníTV-Out
TV-In (vyžaduje snímací čip)
2 x DVI Dual Link
HDTV výstupTV-Out
TV-In (vyžaduje snímací čip)
2 x DVI Dual Link
HDTV výstup
HDMITV-Out
TV-In (vyžaduje snímací čip)
2 x DVI Dual Link
HDTV výstup
HDMI
DisplayPort shadery vrcholů4.0 shadery pixelů4.0 přesnost pixelůFP32 přesnost vrcholuFP32 formáty texturFP32)
FP16
I8
DXTC, S3TC
3Dc formáty vykreslování FP32
FP16
I8
10
ostatní MR Ttady je Anti aliasingTAA (AA transparentní polygony)
CSAA 2x-16x
generace Z2x v žádném barevném režimu vyrovnávací paměť šablonybilaterální stínová technologiehardwarové stínové mapy
optimalizace geometrických stínů

Specifikace referenčních karet založených na rodině G8X

mapačip
pneumatika
Jednotky ALU / TMUfrekvence jádra (MHz)frekvence paměti (MHz)velikost paměti (MB)Šířka pásma paměti (GB)rychlost texelů (mtex)phill
rychlost (Mpix)
GeForce 8500 GTG86
PEG16x
16/8 450 400(800) 256 DDR212.8
(128)
3600
GeForce 8600 GTG84
PEG16x
32/16 540 700(1400) 256 GDDR322.4
(128)
8600 4300
GeForce 8600 GTSG84
PEG16x
32/16 675 1000(2000) 256 GDDR332.0
(128)
10800 5400
GeForce 8800 GTS 320 MBG80
PEG16x
96/24 500 800(1600) 320 GDDR364.0
(320)
12000 10000
GeForce 8800 GTS 640 MBG80
PEG16x
96/24 500 800(1600) 640 GDDR364.0
(320)
12000 10000
GeForce 8800 GTXG80
PEG16x
128/32> 575 900(1800) 768 GDDR386.4
(384)
18400 13800
GeForce 8800 UltraG80
PEG16x
128/32 612 1080(2160) 768 GDDR3104.0
(384)
19600 14700
GeForce 8800 GT 256 MBG92
PEG16x
112/56 600 700(1400) 256 GDDR344.8
(256)
33600 9600
GeForce 8800 GT 512 MBG92
PEG16x
112/56 600 900(1800) 512 GDDR357.6
(256)
33600 9600
GeForce 8800 GTS 512 MBG92
PEG16x
128/64 650 1000(2000) 512 GDDR364.0
(256)
41600 10400
GeForce 8800 GSG92
PEG16x
96/48 550 800(1600) 384 GDDR338.4
(192)
26400 6600
GeForce 9400 GTG96
PEG16x
16/8 550 800(1600) 256/512 GDDR225.6
(128)
4400 4400
GeForce 9500 GTG96
PEG16x
32/16 550 800(1600) 256/512 GDDR2 / GDDR325.6
(128)
8800 4400
GeForce 9600 GSOG92
PEG16x
96/48 550 800(1600) 384 GDDR338.4
(192)
26400 6600
GeForce 9600 GTG94
PEG16x
64/32 650 900(1800) 512 GDDR357.6
(256)
20800 10400
GeForce 9800 GTG92
PEG16x
112/56 600 900(1800) 512 GDDR357.6
(256)
33600 9600
GeForce 9800 GTXG92
PEG16x
128/64 675 1100(2200) 512 GDDR370.4
(256)
43200 10800
GeForce 9800 GTX +G92
PEG16x
128/64 738 1100(2200) 512/1024 GDDR370.4
(256)
47200 11800
GeForce 9800 GX22xG92
PEG16x
2x (128/64)600 1000(2000) 2x512 GDDR32x64,0
(2x256)
76800 19200
GeForce GTS 250G92
PEG16x
128/64 738 1100(2200) 512/1024 GDDR370.4
(256)
47200 11800
mapačip
pneumatika
Jednotky ALU / TMUfrekvence jádra (MHz)frekvence paměti (MHz)velikost paměti (MB)Šířka pásma paměti (GB)rychlost texelů (mtex)phill
rychlost (Mpix)

Podrobnosti: Rodina G80, GeForce 8800

Specifikace G80

  • Oficiální název čipu je GeForce 8800
  • Kódové označení G80
  • 90 nm technologie
  • 681 milionů tranzistorů
  • Sjednocená architektura s řadou sdílených procesorů pro streamování zpracování vrcholů a pixelů a dalších možných druhů dat
  • Hardwarová podpora pro nejnovější inovace DirectX 10, včetně nového modelu shaderu - Shader Model 4.0, generování geometrie a nahrávání mezilehlých dat ze shaderů (výstup streamu)
  • 384 bitová sběrnice paměti, 6 nezávislých řadičů, šířka 64 bitů, podpora GDDR4
  • Takt jádra 575 GHz (GeForce 8800 GTX)
  • 128 skalárních ALU s plovoucí desetinnou čárkou (celé číslo a formáty s plovoucí desetinnou čárkou, podpora 32bitové přesnosti FP v rámci standardu IEEE 754, MAD + MUL bez ztráty času)
  • ALU běží na více než dvojnásobné frekvenci (1,35 GHz u 8800 GTX)
  • 32 texturových jednotek, podpora komponentů FP16 a FP32 v texturách
  • 64 bloků bilineárního filtrování (tj. Je možné bezplatné poctivé trilineární filtrování, stejně jako anizotropní filtrování s dvojnásobnou účinností v rychlosti)
  • - velikost plánovacího bloku - 8x4 (32) pixelů.
  • 6 širokých bloků ROP (24 pixelů) s podporou režimů vyhlazování až 16 vzorků na pixel, včetně formátu vyrovnávací paměti rámců FP16 nebo FP32 (tj. Jsou možné HDR + AA). Každý blok se skládá z řady flexibilně konfigurovatelných ALU a je zodpovědný za generování a porovnávání míchání Z, MSAA. Špičkový výkon celého subsystému je až 96 vzorků MSAA (+ 96 Z) za cyklus, v režimu pouze Z - 192 vzorků za cyklus.
  • Všechna rozhraní jsou umístěna na externím přídavném čipu NVIO (2 RAMDAC, 2 Dual DVI, HDMI, HDTV)
  • Velmi dobrá škálovatelnost architektury, můžete blokovat nebo odebírat paměti a řadiče ROP (celkem 6), shaderové jednotky (celkem 8 TMU + ALU) jeden po druhém

Specifikace referenční karty GeForce 8800 GTX

  • Frekvence jádra 575 MHz
  • Frekvence univerzálních procesorů 1350 MHz
  • Počet jednotek textury - 32, míchacích jednotek - 24
  • Kapacita paměti 768 MB
  • Šířka pásma paměti 86,4 gigabajtů za sekundu.
  • Maximální teoretická rychlost plnění 13,8 gigapixelů za sekundu.
  • Teoretická vzorkovací frekvence textury 18,4 gigatexelů za sekundu.
  • SLI konektor
  • Sběrnice PCI-Express 16x
  • MSRP 599 $

Specifikace referenční karty GeForce 8800 GTS

  • Frekvence jádra 500 MHz
  • Frekvence univerzálních procesorů 1200 MHz
  • Počet univerzálních procesorů 96
  • Počet jednotek textury - 24, míchacích jednotek - 20
  • Typ paměti GDDR3, 1,1 ns (jmenovitá frekvence 2 * 900 MHz)
  • Kapacita paměti 640 MB
  • Maximální teoretická rychlost plnění 10,0 gigapixelů za sekundu.
  • Teoretická vzorkovací frekvence textury 12,0 gigatexelů za sekundu.
  • Dva konektory DVI-I (Dual Link, podporuje výstup v rozlišení až 2560x1600)
  • SLI konektor
  • Sběrnice PCI-Express 16x
  • TV-Out, HDTV-Out, podpora HDCP
  • Doporučená cena 449 $

Architektura

Dlouho jsme čekali na přechod k unifikovaným grafickým architekturám. Nyní můžeme konstatovat skutečnost - s příchodem GeForce 8800 došlo k tomuto přechodu a kritický vrchol již byl překonán. Poté bude následovat postupný sestup těchto architektur do středního a rozpočtového segmentu a jejich další vývoj, až k dlouhodobému sloučení s vícejádrovými architekturami procesorů. Pojďme se tedy seznámit s první jednotnou architekturou od NVIDIA:

Toto je celý čipový diagram. Čip se skládá z 8 univerzálních výpočetních jednotek (shaderových procesorů), a ačkoli NVIDIA hovoří o 128 procesorech s tím, že každá ALU je taková, je to poněkud nesprávné - jednotka provádění instrukcí je taková procesorová jednotka, ve které jsou seskupeny 4 TMU a 16 ALU. Celkově tedy máme 128 ALU a 32 TMU, ale granularita provedení je 8 bloků, z nichž každý v jednom okamžiku může dělat své vlastní věci, například provést část vrcholu, pixelu nebo shaderu geometrie přes blok 32 pixelů (nebo blok odpovídajícího počtu vrcholů a dalších primitiv). Všechny pobočky, přechody, podmínky atd. jsou aplikovány zcela na jeden blok, a proto je nejlogičtější nazývat jej shaderovým procesorem, i když velmi širokým.

Každý takový procesor je vybaven vlastní mezipamětí první úrovně, která nyní ukládá nejen textury, ale také další data, která mohou být požadována procesorem shaderu. Je důležité si uvědomit, že hlavní datový proud, například pixely nebo vrcholy, které se zpracovávají a pohybují se v kruhu pod kontrolou šedého kardinála (blok označený na diagramu procesoru vlákna), se neukládají do mezipaměti, ale tok, což je hlavní kouzlo dnešní grafiky architektury - absence zcela náhodného přístupu na úrovni zpracovaných primitiv.

Kromě řídicí jednotky a 8 výpočetních shaderových procesorů existuje 6 ROP, které provádějí detekci viditelnosti, zapisují do vyrovnávací paměti rámců a MSAA (modrá, vedle bloků mezipaměti L2) seskupené s řadiči paměti, frontami pro zápis a mezipamětí L2.

Tak jsme dostali velmi širokou architekturu (8 bloků, každá zpracovávající části po 32 pixelech), která může plynule měnit měřítko v obou směrech. Přidáním nebo odebráním řadičů paměti a procesorů shaderu se odpovídajícím způsobem změní šířka pásma celého systému, aniž by došlo k narušení rovnováhy nebo vytvoření úzkých míst. Jedná se o logické a krásné řešení, které implementuje hlavní výhodu jednotné architektury - automatické vyvážení a vysokou efektivitu využívání dostupných zdrojů.

Kromě shaderových jednotek a ROP existuje sada řídicích a administrativních jednotek:

  • Bloky, které spouštějí data různých formátů (Vertex, Geometry a Pixel Thread Issue) pro provedení, jsou jakýmsi vrátnými, kteří připravují data pro rozdrcení počtu v shader procesorech v souladu s formátem dat, aktuální shader a jeho stav, podmínky větvení atd.
  • Setup / Raster / ZCull - blok, který mění vrcholy na pixely - zde se provádí nastavení, rastrování trojúhelníku na bloky po 32 pixelech, předběžný blok HSR.
  • Input Assembler je blok, který vybírá geometrická a další zdrojová data ze systémové paměti nebo lokální paměti a shromažďuje struktury zdrojových dat ze streamů, které budou směřovat zvenčí na vstup našeho „kolotoče“. A na výstupu, po mnoha kruzích pod kontrolou nastavení vrcholu, geometrie, shaderu pixelů a prolínání, získáme (a v případě potřeby vyhladíme) pixely z ROP bloků.

Mimochodem, malá odbočka: je jasně vidět, že v budoucnu tyto bloky získají obecnější charakter a nebudou tak vázány na konkrétní typy shaderů. Ty. se jednoduše změní na univerzální bloky, které spouští data pro výpočet a převod formátu - například z jednoho shaderu do druhého, z vrcholu na pixel atd. Tím nedojde k žádným zásadním změnám v architektuře, diagram bude vypadat a fungovat téměř stejně, s výjimkou menšího počtu speciálních „šedých“ bloků. Již nyní jsou všechny tři bloky Thread Issue (Pravděpodobně) jeden blok se společnými funkcemi a kontextovými doplňky:

Procesor shaderu a jeho TMU / ALU

Takže v každé z 8 shaderových jednotek je 16 skalárních ALU. Což nám opět dává potenciál zvýšit účinnost jejich zatížení až o 100%, bez ohledu na kód shaderu. ALU fungují na dvojnásobné frekvenci a odpovídají tedy nebo překračují (v závislosti na operacích ve shaderu) 8 staromódních čtyřkomponentních vektorových ALU (G70) na stejné základní frekvenci jádra. NVIDIA poskytuje následující výpočet špičkového výkonu:

Platí to však pro nejnevýhodnější variantu pro ostatní, když nastanou dvě násobení. V reálném životě stojí za to tuto výhodu rozdělit asi na polovinu. Ale v každém případě tyto skalární ALU kvůli vyšší frekvenci hodin a jejich počtu předběhnou všechny dříve existující čipy. S výjimkou konfigurace SLI G71, v případě shaderů, které nejsou pro novou architekturu nejvýhodnější.

Zajímavé je, že přesnost všech ALU je FP32 a vzhledem k nové architektuře nepředpokládáme žádné výhody pro shadery FP16 se sníženou přesností. Dalším zajímavým bodem je podpora výpočtů v celočíselném formátu. Tato položka je vyžadována pro implementaci SM4. Při implementaci aritmetiky je dodržován standard IEEE 754, který jej činí vhodným pro seriózní výpočty mimo hru - vědecké, statistické, ekonomické atd.

Nyní o interakci jednotek textury a ALU v rámci jedné jednotky shaderu:

Provoz vzorkování a filtrování textur nevyžaduje prostředky ALU a lze jej nyní provádět zcela paralelně s matematickými výpočty. Generování souřadnic textury (na obrázku - A) stále zabírá část času ALU. To je logické, pokud chceme použít tranzistory čipu na 100%, protože generování souřadnic textury vyžaduje standardní plovoucí operace a bylo by nerozumné spouštět pro něj samostatné ALU.

Samotné texturové jednotky mají následující konfiguraci:

K dispozici jsou 4 moduly pro adresování textur TA (určování souřadnic přesné adresy pro vzorkování) a dvakrát tolik modulů pro bilineární filtrování TF. Proč? To umožňuje při mírné spotřebě tranzistorů zajistit bezplatné poctivé trilineární filtrování nebo snížit rychlost na polovinu pomocí anizotropního filtrování. Rychlost při běžném rozlišení, s běžným filtrováním a bez AA už dávno nedávala smysl - a předchozí generace urychlovačů si v takových podmínkách poradí dobře. Nový čip podporuje také texturní formáty FP16 / FP32 a také SRGB gamma korekce na vstupu (TMU) a výstupu (ROP).

Zde jsou specifikace shader modelu nových procesorů, které splňují požadavky SM4:

Existují významné kvantitativní a kvalitativní změny - méně a méně omezení pro shadery, stále více společného s CPU. Zatím bez velkého náhodného přístupu (taková operace se objevila v SM4, položka Load Op v diagramu, ale její efektivita pro obecné účely je stále diskutabilní, zejména v prvních implementacích), ale není pochyb o tom, že tento aspekt bude brzy vyvinut jako Během těchto 5 let byla vyvinuta podpora pro formáty FP - od prvních vzorků v NV30 až po celkový, kompletní end FP32 pipeline ve všech režimech - v G80.

Jak si pamatujeme, kromě 8 shaderových jednotek existuje 6 ROP jednotek:

Diagram ukazuje dvě samostatné cesty pro Z a C, ale ve skutečnosti se jedná pouze o jednu sadu ALU, které jsou při zpracování barevných pixelů rozděleny do dvou skupin, nebo při zpracování v režimu Z-Only fungují jako jedna skupina, čímž se zdvojnásobí propustnost. V dnešní době nemá smysl počítat jednotlivé pixely - je jich již dost, je důležitější spočítat, kolik vzorků MSAA lze zpracovat za cyklus. V souladu s tím může čip MSAA 16x produkovat 6 plných pixelů na hodiny, 8x - 12 atd. Je zajímavé, že škálovatelnost práce s rámcovou vyrovnávací pamětí je nejlepší - jak si pamatujeme, každá ROP jednotka pracuje s vlastním řadičem paměti a nezasahuje do sousedních.

A konečně existuje plná podpora formátů framebufferů FP32 a FP16 spolu s vyhlazováním, nyní neexistují žádná omezení pro představivost vývojářů a HDR v celém potrubí nevyžaduje změnu celkové sekvence rámců ani v režimu AA.

CSAA

K dispozici je také nová metoda vyhlazování - CSAA... Podrobná studie bude brzy na webu, ale zatím si všimneme, že tato metoda je v mnoha ohledech podobná přístupu ATI a zabývá se také pseudostochastickými vzory a šířením počtů do sousedních geometrických zón (dochází k rozmazání pixelů, pixely nemají ostrou hranici, ale jako by jeden do druhého s tzv. AA, pokrývající určitou oblast). Kromě toho jsou barvy vzorků a hloubka uloženy odděleně od informací o jejich umístění, a tak na jeden pixel může spadnout 16 vzorků, ale například pouze 8 vypočítaných hodnot hloubky - což navíc šetří šířku pásma a hodinové cykly.

Je známo, že klasický MSAA v režimech větších než 4x se stává velmi náročným na paměť, zatímco kvalita roste čím dál méně. Nová metoda to napravuje a umožňuje získat 16násobný režim vyhlazování, který je znatelně lepší než 16násobek MSAA, s výpočetními náklady srovnatelnými se 4x MSAA.

NVIO

Další novinkou v G80 jsou rozhraní mimo hlavní akcelerační čip. Nyní je za ně zodpovědný samostatný čip s názvem NVIO:

Tento čip integruje:

  • 2 * 400 MHz RAMDAC
  • 2 * Dual Link DVI (nebo LVDS)
  • HDTV výstup

Výstupní subsystém vypadá takto:

Přesnost je vždy 10 bitů na komponentu. Samozřejmě ve středním segmentu, a ještě více v rozpočtových řešeních, samostatný externí čip nemusí zůstat, ale u drahých karet má toto řešení více výhod než nevýhod. Rozhraní zabírají významnou oblast čipu, jsou vysoce závislé na rušení a vyžadují speciální napájení. Odstraněním všech těchto problémů s externím čipem můžete získat kvalitu výstupu a flexibilitu konfigurace a současně zachovat jednodušší design již složitého čipu zvážením optimálních režimů pro integrované RAMDAC.

Podrobnosti: rodiny G84 / G86, GeForce 8600 a 8500

Specifikace G84

  • Oficiální název čipu je GeForce 8600
  • Kódové označení G84
  • 80 nm technologie
  • 289 milionů tranzistorů
  • Frekvence jádra až 675 MHz (GeForce 8600 GTS)
  • ALU pracují na více než dvojnásobné frekvenci (1,45 GHz u GeForce 8600 GTS)
  • 16 texturových jednotek, podpora komponentů FP16 a FP32 v texturách
  • 16 bloků bilineárního filtrování (ve srovnání s G80 neexistuje možnost volného trilineárního filtrování a efektivnější anizotropní filtrování z hlediska rychlosti)
  • Možnost dynamického větvení v shaderech pixelů a vrcholů
  • Zaznamenávejte výsledky až s 8 vyrovnávacími paměťmi snímků současně (MRT)

Specifikace referenční karty GeForce 8600 GTS

  • Frekvence jádra 675 MHz
  • Frekvence univerzálních procesorů 1450 MHz
  • Typ paměti GDDR3
  • Kapacita paměti 256 MB
  • Šířka pásma paměti 32,0 gigabajtů za sekundu.
  • Maximální teoretická rychlost plnění 5,4 gigapixelů za sekundu.
  • Teoretická vzorkovací frekvence textury 10,8 gigatexelů za sekundu.
  • Příkon až 71 W.
  • SLI konektor
  • Sběrnice PCI-Express 16x
  • TV-Out, HDTV-Out, podpora HDCP
  • Doporučená cena 199-229 USD

Referenční specifikace GeForce 8600 GT

  • Frekvence jádra 540 MHz
  • Frekvence univerzálních procesorů 1180 MHz
  • Počet univerzálních procesorů 32
  • Počet jednotek textury - 16 (viz syntetika), jednotek míchání - 8
  • Typ paměti GDDR3
  • Kapacita paměti 256 MB
  • Šířka pásma paměti 22,4 gigabajtů za sekundu.
  • Maximální teoretická rychlost plnění 4,3 gigapixelu za sekundu.
  • Teoretická rychlost vzorkování textury 8,6 gigatexelů za sekundu.
  • Příkon až 43 W.
  • SLI konektor
  • Sběrnice PCI-Express 16x
  • Doporučená cena $ 149-159

Specifikace G86

  • Oficiální název čipu je GeForce 8500
  • Kódové označení G86
  • 80 nm technologie
  • 210 milionů tranzistorů
  • Sjednocená architektura s řadou sdílených procesorů pro streamování vrcholů, pixelů a dalších typů dat
  • Hardwarová podpora DirectX 10, včetně nového modelu shaderu - Shader Model 4.0, generování geometrie a záznam mezilehlých dat ze shaderů (výstup streamu)
  • 128bitová paměťová sběrnice, dva nezávislé 64bitové řadiče
  • Základní frekvence až 450 MHz (GeForce 8500 GT)
  • ALU fungují na dvojnásobné frekvenci (900 MHz u GeForce 8500 GT)
  • 16 skalárních ALU s plovoucí desetinnou čárkou (celé číslo a formáty s plovoucí desetinnou čárkou, podpora 32bitové přesnosti FP v rámci standardu IEEE 754, MAD + MUL bez ztráty času)
  • 8 jednotek textury, podpora komponentů FP16 a FP32 v texturách
  • 8 bloků bilineárního filtrování (ve srovnání s G80 neexistuje možnost volného trilineárního filtrování a efektivnější anizotropní filtrování z hlediska rychlosti)
  • Možnost dynamického větvení v shaderech pixelů a vrcholů
  • 2 široké ROP (8 pixelů) s podporou režimů vyhlazování až 16 vzorků na pixel, včetně formátu FP16 nebo FP32 framebuffer. Každý blok se skládá z řady flexibilně konfigurovatelných ALU a je zodpovědný za generování a porovnání Z, MSAA, míchání. Špičkový výkon celého subsystému až 32 vzorků MSAA (+ 32 Z) za cyklus, pouze v režimu Z - 64 vzorků za cyklus
  • Zaznamenávejte výsledky až s 8 vyrovnávacími paměťmi snímků současně (MRT)
  • Všechna rozhraní (dvě RAMDAC, dvě Dual DVI, HDMI, HDTV) jsou integrována na čipu (na rozdíl od externího čipu NVIO v GeForce 8800)

Referenční specifikace GeForce 8500 GT

  • Frekvence jádra 450 MHz
  • Frekvence univerzálních procesorů 900 MHz
  • Efektivní frekvence paměti 800 MHz (2 * 400 MHz)
  • Typ paměti DDR2
  • Kapacita paměti 256/512 MB
  • Šířka pásma paměti 12,8 gigabajtů za sekundu.
  • Maximální teoretická rychlost plnění 3,6 gigapixelů za sekundu.
  • Teoretická vzorkovací frekvence textury 3,6 gigatexelů za sekundu.
  • Příkon až 40 W.
  • Dva konektory DVI-I Dual Link, podporuje výstup v rozlišení až 2560x1600)
  • SLI konektor
  • Sběrnice PCI-Express 16x
  • TV-Out, HDTV-Out, volitelná podpora HDCP
  • Doporučená cena 89-129 $

Architektura G84 a G86

Specifikace ukazují, že G84 je někde mezi čtvrtinou a třetinou vlajkové lodi řady G80. Z hlediska počtu univerzálních procesorů je to čtvrtina a z hlediska počtu ROP a řadiče paměti - třetina. S texturovými jednotkami je to obtížnější, zdá se, že to není ani čtvrtina, ale ani polovina, o tom si povíme níže. G86 je zase obecně něco zajímavého - z hlediska výpočetního výkonu je to pouze 1/8 oproti G80 a z hlediska ROP je to stále stejná 1/3. Je zřejmé, že NVIDIA nijak nespěchá s vydáváním čipů, které jsou výpočetně rychlé do low-endu.

Hlavní otázka zde - bude toto čtvrtletí a 1/8 dost na to, aby konkurovalo současným řešením a budoucím čipům AMD? Snížila NVIDIA příliš mnoho bloků? Navíc nemluvě o tom, že oba čipy jsou příliš malé počtem tranzistorů ... V G84 je téměř polovina z tranzistorů G80, v G86 - téměř třetina. Zdá se, že řešení je kompromisem, pokud by si ponechali polovinu jednotek G80, výroba čipu by byla příliš nákladná a dokonce by úspěšně konkurovala vlastní GeForce 8800 GTS.

V blízké budoucnosti bude s největší pravděpodobností na základě 65 nm technologie možné vyrábět efektivnější čipy pro střední a nižší cenové rozpětí, ale nyní to tak dopadlo. Budeme uvažovat o výkonu nových čipů v syntetických a herních testech, ale již nyní můžeme říci, že G84 a G86 nemusí být velmi rychlé kvůli malému počtu ALU, budou s největší pravděpodobností na stejné úrovni jako současná řešení podobné ceny.

Nebudeme se příliš zabývat architekturou G84 a G86, ve srovnání s G80 není mnoho změn, vše, co bylo řečeno v recenzi GeForce 8800, zůstává v platnosti, upravené pro kvantitativní charakteristiky. Ale přesto popíšeme hlavní body, které stojí za naši pozornost, a uvedeme několik snímků věnovaných architektonickým specifikacím nových čipů.

G80 se skládá z osmi univerzálních výpočetních jednotek (shaderových procesorů), NVIDIA preferuje hovořit o 128 procesorech. Jednotkou provedení instrukce je zjevně celá procesorová jednotka, ve které jsou seskupeny 4 TMU a 16 ALU. Každý z bloků v jednom okamžiku může provádět část shaderu vrcholů, pixelů nebo geometrie na bloku 32 pixelů, vrcholů nebo jiných primitiv a může také provádět fyzické výpočty. Každý procesor má svou vlastní mezipaměť první úrovně, která ukládá textury a další data. Kromě řídicí jednotky a výpočetních shaderových procesorů existuje šest ROP, které provádějí detekci viditelnosti, zápis do vyrovnávací paměti rámců a MSAA, seskupené s řadiči paměti, frontami pro zápis a mezipamětí druhé úrovně.

Tato architektura je schopná škálovat v obou směrech, což bylo provedeno v nových řešeních. Toto krásné řešení, které implementuje hlavní výhodu jednotné architektury - automatické vyvážení a vysokou efektivitu využívání dostupných zdrojů, jsme již zmínili v článku o GeForce 8800. Předpokládalo se také, že řešení střední úrovně bude sestávat z poloviny výpočetních jednotek a řešení založené na dvou shader procesorech a jeden ROP bude rozpočtový. Bohužel, pokud měla GeForce 8800 osm procesorů obsahujících 32 TMU a 128 ALU, jejich počet v nových čipech byl snížen více, než jsme původně očekávali. Okruh G84 podle všeho vypadá takto:

To znamená, že všechno zůstalo nezměněno, kromě počtu bloků a řadičů paměti. Na tomto obrázku jsou patrné malé změny související s jednotkami textury, ale o tom si povíme později. Zajímavé je, kam se dostalo tolik tranzistorů, kdyby v G84 zůstalo jen 32 procesorů? G84 má téměř polovinu tranzistorů ve srovnání s G80, s výrazně sníženým počtem paměťových kanálů, ROP a shaderových procesorů. A G86 má také spoustu tranzistorů, pouze s 16 procesory ...

Je také zajímavé, jak dobře bude v reálných aplikacích vyváženo zatížení mezi prováděním shaderů vrcholů, pixelů a geometrie, protože počet univerzálních prováděcích jednotek je nyní mnohem menší. Samotná sjednocená architektura navíc pro vývojáře představuje nové výzvy; při jejím používání budete muset přemýšlet o tom, jak efektivně využít celkovou sílu mezi shadery vrcholů, pixelů a geometrie. Uveďme jednoduchý příklad - zaměřte se na pixelové výpočty. V tomto případě zvýšení zatížení vertexových bloků v tradiční architektuře nepovede k poklesu výkonu, zatímco v unifikované architektuře to změní vyvážení a sníží množství zdrojů pro pixelové výpočty. Rozhodně se budeme zabývat otázkou výkonu a nyní budeme pokračovat ve studiu změn v architektuře G84 a G86.

Procesor shaderu a TMU / ALU

Schéma shaderových jednotek a hodnocení jejich špičkového výpočetního výkonu G80 jsou uvedeny v příslušném článku, pro G84 a G86 se schéma nezměnilo a jejich výkon lze snadno přepočítat. ALU v čipech také pracují na dvojnásobné frekvenci a jsou skalární, což umožňuje vysokou účinnost. Neexistují ani rozdíly ve funkčnosti, přesnost všech ALU je FP32, podpora výpočtů v celočíselném formátu a implementace je v souladu se standardem IEEE 754, který je důležitý pro vědecké, statistické, ekonomické a další výpočty.

Jednotky textury se ale změnily ve srovnání s jednotkami používanými v modelu G80. NVIDIA zajišťuje, že v nových čipech byly provedeny architektonické změny, které zvýšily výkon sjednocených procesorů. V G80 mohla každá jednotka textury vypočítat čtyři adresy textury a provádět osm operací filtrování textury za cyklus. Tvrdí se, že v nových čipech bylo zdvojnásobeno první číslo a je schopné zdvojnásobit počet vzorků textury. To znamená, že texturovací jednotky G84 a G86 mají následující konfiguraci (pro srovnání je diagram bloku G80 zobrazen vlevo):

Podle NVIDIA má nyní každý z bloků osm modulů adresování textury (určení pomocí souřadnic přesné adresy pro vzorkování) TA a přesně stejný počet bilineárních filtrujících modulů (TF). G80 měl čtyři TA a osm TF modulů, které umožňovaly poskytnout „bezplatné“ trilineární filtrování se sníženou spotřebou tranzistoru nebo snížit rychlost na polovinu pomocí anizotropního filtrování, což je užitečné zejména pro špičkové akcelerátory, kde je anizotropní filtrování téměř vždy používáno uživateli. V praktické části zkontrolujeme správnost těchto informací, nezapomeňte se podívat na analýzu odpovídajících syntetických testů, protože jsou v rozporu s těmito údaji.

Všechny ostatní funkce jednotek textury jsou stejné, jsou podporovány formáty textury FP16 / FP32 atd. Pouze pokud bylo na G80 FP16 filtrování textury také na plnou rychlost kvůli zdvojnásobenému počtu filtračních jednotek, již to není v řešeních střední a nižší úrovně (opět s za předpokladu, že výše uvedené změny jsou skutečně k dispozici).

Bloky ROP, zápis do vyrovnávací paměti rámce, vyhlazování

ROP, které byly v G80 šest a dva v nových čipech, se nezměnily:

Každý z bloků zpracovává čtyři pixely (16 subpixelů) pro celkem 8 pixelů na hodiny pro barevný a Z. V režimu Z-only je na hodiny zpracováno dvakrát tolik vzorků. S MSAA 16x může čip dodat dva pixely na hodiny, s 4x - 8 atd. Stejně jako v G80 existuje plná podpora formátů framebufferu FP32 a FP16 spolu s vyhlazováním.

Je podporována nová metoda antialiasingu známá z GeForce 8800 - Coverage Sampled Antialiasing (CSAA), která byla podrobně popsána v příslušném materiálu:

Stručně řečeno, podstata metody spočívá v tom, že barvy vzorků a hloubka jsou uloženy odděleně od informací o jejich umístění, může existovat 16 vzorků na pixel a pouze 8 vypočítaných hodnot hloubky, což šetří šířku pásma a hodinové cykly. CSAA eliminuje potřebu přenášet a ukládat jednu barvu nebo hodnotu Z na subpixel a vylepšuje průměrnou hodnotu pixelu obrazovky s podrobnějšími informacemi o tom, jak tento pixel překrývá okraje trojúhelníků. Výsledkem je, že nová metoda umožňuje získat 16x režim vyhlazování, který je znatelně lepší než MSAA 4x, s výpočtovými náklady srovnatelnými s ním. A ve vzácných případech, kdy metoda CSAA nefunguje, se získá obvyklá MSAA v menší míře, a ne úplná absence antialiasingu.

PureVideo HD

Pojďme k nejzajímavějším změnám. Ukazuje se, že G84 a G86 mají inovace, které je příznivě odlišují dokonce i od G80! Jedná se o integrovaný video procesor, který v nových čipech získal rozšířenou podporu pro PureVideo HD. Uvádí se, že tyto čipy zcela snižují zátěž centrálního procesoru systému při dekódování všech typů běžných video dat, včetně nejvíce „těžkého“ formátu H.264.

Modely G84 a G86 používají nový model programovatelného video procesoru PureVideo HD, který je výkonnější než ten, který se používá u modelů G80, a obsahuje takzvaný modul BSP. Nový procesor podporuje dekódování formátů H.264, VC-1 a MPEG-2 s rozlišením až 1 920 a datovým tokem až 30 až 40 Mb / s, provádí veškerou práci s dekódováním dat CABAC a CAVLC v hardwaru, což vám umožňuje přehrávat všechny existující HD-DVD a disky Blu-ray dokonce i na jednojádrových počítačích střední třídy.

Video procesor v G84 / G86 se skládá z několika částí: samotný video procesor druhé generace (VP2), který provádí úkoly IDCT, kompenzace pohybu a odblokování pro formáty MPEG2, VC-1 a H.264, což podporuje hardwarové dekódování druhého proudu; stream procesor (BSP), který provádí statistické dekódovací úlohy pro CABAC a CAVLC pro formát H.264, což je jeden z časově nejnáročnějších výpočtů; Dekódovací modul chráněný AES128, jehož účel je jasný již z jeho názvu - dešifruje video data použitá v ochraně proti kopírování na discích Blu-ray a HD-DVD. Zde jsou rozdíly ve stupni hardwarové podpory pro dekódování videa na různých video čipech:

Úkoly prováděné video čipem jsou zvýrazněny modře a centrální procesor zeleně. Jak vidíte, pokud předchozí generace pomohla procesoru pouze v některých úkolech, nový video procesor používaný v nejnovějších čipech provádí všechny úkoly sám. Efektivitu řešení v budoucích materiálech budeme zkoumat při studiu efektivity hardwarového dekódování videa, zatímco NVIDIA uvádí v materiálech následující čísla: při použití moderního dvoujádrového procesoru a softwarového dekódování dat hraje přehrávání disků Blu-ray a HD-DVD až 90-100% času procesoru, s hardwarovým dekódováním na video čipu předchozí generace ve stejném systému - až 60-70% a s novým motorem, který vyvinuli pro G84 a G86 - pouze 20%. To samozřejmě nevypadá jako deklarované plně hardwarové dekódování, ale stále velmi, velmi efektivní.

V době oznámení fungují nové funkce PureVideo HD pouze ve 32bitové verzi systému Windows Vista a podpora PureVideo HD ve Windows XP se objeví až v létě. Co se týče kvality přehrávání videa, následného zpracování, odstraňování prokladu atd., NVIDIA s tím vylepšila věci dokonce i v GeForce 8800 a nové čipy se v tomto ohledu nijak neliší.

CUDA, výpočty mimo hru a fyziku

Článek o GeForce 8800 zmínil, že zvýšený špičkový výkon plovoucí aritmetiky v nových akcelerátorech a flexibilita jednotné architektury shaderu se staly dostatečnými pro výpočet fyziky v herních aplikacích a ještě závažnější problémy: matematické a fyzikální modelování, ekonomické a statistické modely a výpočty, rozpoznávání vzorů , zobrazování, vědecká grafika a další. K tomu bylo vydáno speciální výpočetně orientované API, které je vhodné pro přizpůsobení a vývoj programů, které přenášejí výpočty do GPU - CUDA (Compute Unified Device Architecture).

Další informace o CUDA najdete v článku o G80, v poslední době se zaměříme na další trendový směr - podporu fyzikálních výpočtů na GPU. NVIDIA nazývá tuto technologii Kvantové efekty. Deklaruje se, že všechny video čipy nové generace, včetně dnes uvažovaných G84 a G86, jsou velmi vhodné pro výpočty tohoto druhu, které umožňují přenášet část zátěže z CPU na GPU. Jako konkrétní příklady jsou uváděny simulace kouře, ohně, výbuchů, dynamiky vlasů a oděvů, vlny a kapalin a mnoho dalšího. Ale teď chci psát více o něčem jiném. Skutečnost, že se nám zatím zobrazují pouze obrázky z testovacích aplikací s velkým počtem fyzických objektů vypočítaných pomocí video čipů, a zatím to vůbec necítí vůni her s takovou podporou.

Podpora externího rozhraní

Jak si pamatujeme, v GeForce 8800 nás poněkud překvapila další nečekaná inovace - další čip podporující externí rozhraní mimo hlavní. V případě špičkových grafických karet tyto úkoly řeší samostatný čip s názvem NVIO, který integruje: dva 400 MHz RAMDAC, dva Dual Link DVI (nebo LVDS), HDTV-Out. Dokonce i tehdy jsme předpokládali, že samostatný externí čip těžko zůstane ve středním a dolním segmentu, a to se vlastně stalo. U modelů G84 a G86 je podpora všech těchto rozhraní zabudována do samotného čipu.

GeForce 8600 GTS je vybaven dvěma výstupy Dual Link DVI-I s podporou HDCP, jedná se o první grafickou kartu na trhu s takovými schopnostmi (HDCP a Dual Link společně). Pokud jde o HDMI, podpora tohoto konektoru je plně implementována v hardwaru a mohou ji implementovat výrobci na kartách se speciálním designem. GeForce 8600 GT a 8500 GT však podporují HDCP a HDMI jsou volitelné, ale mohou být dobře implementovány jednotlivými výrobci do svých produktů.

Podrobnosti: G92, rodina GeForce 8800

Specifikace G92

  • Kódové označení čipu G92
  • 65 nm technologie
  • 754 milionů tranzistorů (více než G80)
  • Sjednocená architektura s řadou sdílených procesorů pro streamování vrcholů, pixelů a dalších typů dat
  • Takt jádra 600 MHz (GeForce 8800 GT)
  • ALU pracují na více než dvojnásobné frekvenci (1,5 GHz u GeForce 8800 GT)
  • 112 (to je pro GeForce 8800 GT a celkem jich je pravděpodobně 128) skalární ALU s plovoucí desetinnou čárkou (celočíselné a plovoucí desetinné čárky, podpora 32bitové přesnosti FP v rámci standardu IEEE 754, MAD + MUL bez ztráty času)
  • 56 (64) jednotek adresujících textury s podporou komponent FP16 a FP32 v texturách (vysvětlení viz níže)
  • 56 (64) bilineárních filtračních jednotek (stejně jako v G84 a G86 není k dispozici žádná trilineární filtrace a účinnější anizotropní filtrace)
  • Možnost dynamického větvení v shaderech pixelů a vrcholů
  • Zaznamenávejte výsledky až s 8 vyrovnávacími paměťmi snímků současně (MRT)
  • Všechna rozhraní (dvě RAMDAC, dvě Dual DVI, HDMI, HDTV) jsou integrována na čipu (na rozdíl od externího čipu NVIO v GeForce 8800)

Specifikace referenční karty GeForce 8800 GT 512MB

  • Frekvence jádra 600 MHz
  • Efektivní frekvence paměti 1,8 GHz (2 * 900 MHz)
  • Typ paměti GDDR3
  • Kapacita paměti 512 MB
  • Příkon až 110 W.
  • Dva konektory DVI-I Dual Link, podporují výstup v rozlišení až 2560x1600
  • SLI konektor
  • Sběrnice PCI Express 2.0
  • TV-Out, HDTV-Out, podpora HDCP
  • Doporučená cena: 249 $

Specifikace referenční karty GeForce 8800 GT 256 MB

  • Frekvence jádra 600 MHz
  • Frekvence univerzálních procesorů 1 500 MHz
  • Počet univerzálních procesorů 112
  • Počet jednotek textury - 56, míchacích jednotek - 16
  • Efektivní frekvence paměti 1,4 GHz (2 * 700 MHz)
  • Typ paměti GDDR3
  • Kapacita paměti 256 MB
  • Šířka pásma paměti 44,8 gigabajtů za sekundu.
  • Maximální teoretická rychlost plnění 9,6 gigapixelů za sekundu.
  • Teoretická vzorkovací frekvence textury až 33,6 gigatexelů za sekundu.
  • Příkon až 110 W.
  • Dva konektory DVI-I Dual Link, podporují výstup v rozlišení až 2560x1600
  • SLI konektor
  • Sběrnice PCI Express 2.0
  • TV-Out, HDTV-Out, podpora HDCP
  • Doporučená cena 199 USD

Specifikace referenční karty GeForce 8800 GTS 512MB

  • Frekvence jádra 650 MHz
  • Počet univerzálních procesorů 128
  • Efektivní frekvence paměti 2,0 GHz (2 * 1000 MHz)
  • Typ paměti GDDR3
  • Kapacita paměti 512 MB
  • Šířka pásma paměti 64,0 gigabajtů za sekundu.
  • Teoretická vzorkovací frekvence textury až 41,6 gigatexelů za sekundu.
  • Dva konektory DVI-I Dual Link, podporují výstup v rozlišení až 2560x1600
  • SLI konektor
  • Sběrnice PCI Express 2.0
  • TV-Out, HDTV-Out, podpora HDCP
  • Doporučená cena 349 399 $

Čipová architektura G92

Architektonicky se G92 příliš neliší od G80. Z toho, co víme, můžeme říci, že G92 je vlajkovou lodí linky (G80), která byla s malými změnami převedena na nový technický proces. NVIDIA ve svých materiálech naznačuje, že čip má 7 velkých shaderových jednotek a podle toho 56 texturových jednotek, stejně jako čtyři široké ROP, počet tranzistorů v čipu vyvolává podezření, že o něčem nemluví. Ne všechny jednotky, které v čipu fyzicky existují, se podílejí na původně oznámených řešeních; jejich počet v G92 je větší než v GeForce 8800 GT. Přestože je zvýšená složitost čipu vysvětlena přidáním dříve samostatného čipu NVIO, stejně jako video procesoru nové generace. Složitější TMU také ovlivnily počet tranzistorů. Je také pravděpodobné, že mezipaměti byly zvýšeny, aby se zvýšila účinnost 256bitové paměťové sběrnice.

Tentokrát se NVIDIA rozhodla konkurovat odpovídajícím čipům AMD a rozhodla se ponechat poměrně velký počet bloků na čipu střední třídy. Náš předpoklad z přezkumu G84 a G86, že 65 nm technologie bude použita k výrobě mnohem efektivnějších čipů pro střední cenové rozpětí, byl potvrzen. V čipu G92 je několik architektonických změn a nebudeme se jim podrobně věnovat. Všechno, co bylo řečeno výše o řešeních řady GeForce 8, zůstává v platnosti, zopakujeme pouze některé hlavní body architektonických specifikací nového čipu.

Pro nové řešení poskytuje NVIDIA ve svých dokumentech následující diagram:

To znamená ze všech změn - pouze snížený počet bloků a některé změny v TMU, které jsou popsány níže. Jak bylo uvedeno výše, existují pochybnosti, že tomu tak fyzicky je, ale poskytujeme popis na základě toho, co NVIDIA píše. G92 se skládá ze sedmi univerzálních výpočetních jednotek (shaderových procesorů), NVIDIA tradičně hovoří o 112 procesorech (alespoň v prvních řešeních GeForce 8800 GT). Každý z bloků, ve kterém je seskupeno 8 TMU a 16 ALU, může provádět část shaderu vrcholů, pixelů nebo geometrie přes blok 32 pixelů, vrcholů nebo jiných primitiv a může také provádět jiné (negrafické) výpočty. Každý procesor má svou vlastní mezipaměť první úrovně, která ukládá textury a další data. Kromě řídicí jednotky a výpočetních shaderových procesorů existují čtyři jednotky ROP, které provádějí detekci viditelnosti, zapisují do vyrovnávací paměti rámců a MSAA, seskupené s řadiči paměti, frontami pro zápis a mezipamětí druhé úrovně.

Univerzální procesory a TMU

Schéma shaderových jednotek a vyhodnocení jejich špičkového výpočetního výkonu G80 byly uvedeny v příslušném článku, u G92 se nezměnilo, jejich výkon se dá snadno přepočítat na základě změn taktovací frekvence. ALU v čipech pracují na více než dvojnásobné frekvenci, jsou skalární, což umožňuje dosažení vysoké účinnosti. Dosud není známo o funkčních rozdílech, zda je v tomto čipu k dispozici přesnost výpočtu FP64 nebo ne. Přesně existuje podpora výpočtů v celočíselném formátu a při provádění všech výpočtů je dodržován standard IEEE 754, který je důležitý pro vědecké, statistické, ekonomické a další výpočty.

Jednotky textury v G92 nejsou stejné jako v G80, opakují řešení TMU v G84 a G86, kde byly provedeny architektonické změny ke zvýšení výkonu. Připomeňme, že v G80 mohla každá jednotka textury vypočítat čtyři adresy textury a provést osm operací filtrování textury za cyklus, zatímco v G84 / G86 jsou TMU schopné dvojnásobného počtu vzorků textury. To znamená, že každý z bloků má osm modulů adresování textury (určení souřadnicemi přesné adresy pro vzorkování) TA a přesně stejný počet bilineárních filtrujících modulů (TF):

Nemyslete si, že 56 bloků GeForce 8800 GT ve skutečných aplikacích bude silnějších než 32 bloků v GeForce 8800 GTX. Pokud je povoleno trilineární a / nebo anizotropní filtrování, bude filtrování rychlejší, protože může dělat trochu více práce s filtrováním vzorků textury. Tyto informace zkontrolujeme v praktické části analýzou výsledků příslušných syntetických testů. Všechny ostatní funkce jednotek textury se nezměnily, formáty textury FP16, FP32 a další jsou podporovány.

Bloky ROP, zápis do vyrovnávací paměti rámce, vyhlazování

Samotné bloky ROP se také nezměnily, ale změnil se jejich počet. G80 měl šest ROP a nové řešení má čtyři ke snížení nákladů na výrobu čipů a PCB pro grafické karty. Toto snížení může být také způsobeno skutečností, že nevytváří příliš silnou konkurenci pro stávající řešení nejvyšší úrovně.

Každý z bloků zpracovává čtyři pixely neboli 16 subpixelů, tedy celkem 16 pixelů na hodiny pro barevný a Z. V režimu pouze Z je zpracováno dvakrát tolik vzorků na hodiny. S MSAA 16x může čip dodat dva pixely na hodiny, s 4x - 8 atd. Stejně jako v G80 jsou formáty FP32 a FP16 framebuffer plně podporovány společně s vyhlazováním.

Je podporována nová metoda vyhlazování známá z čipů předchozí řady - Coverage Sampled Antialiasing (CSAA). A další novinkou je, že algoritmus vyhlazování průhlednosti byl v GeForce 8800 GT aktualizován. Uživateli byly nabídnuty dvě možnosti: multisampling (TRMS) a supersampling (TRSS), první měl velmi dobrý výkon, ale nefungoval efektivně ve všech hrách a druhý byl vysoce kvalitní, ale pomalý. GeForce 8800 GT deklaruje novou metodu pro multisampling průsvitné povrchy, která zlepšuje její kvalitu a výkon. Tento algoritmus poskytuje téměř stejné zlepšení kvality jako převzorkování, ale má vysoký výkon - pouze o několik procent horší pro režim bez vyhlazování na poloprůhledných površích.

PureVideo HD

Jednou z očekávaných změn v G92 je integrovaný video procesor druhé generace známý z G84 a G86, který získal rozšířenou podporu PureVideo HD. Je již známo, že tato verze video procesoru téměř úplně odlehčí CPU při dekódování všech typů video dat, včetně „těžkých“ formátů H.264 a VC-1.

Stejně jako v modelech G84 / G86 používá G92 nový model programovatelného video procesoru PureVideo HD, který obsahuje takzvaný BSP engine. Nový procesor podporuje dekódování formátů H.264, VC-1 a MPEG-2 s rozlišením až 1 920 a bitovou rychlostí až 30 až 40 Mb / s, přičemž provádí dekódování dat CABAC a CAVLC v hardwaru, což vám umožňuje přehrávat všechny existující HD-DVD a Blu -ray disky i na středně výkonných jednojádrových počítačích. Dekódování VC-1 není tak efektivní jako H.264, ale nový procesor ho stále podporuje.

Více o video procesoru druhé generace se dočtete v části věnované čipům G84 a G86. Práce moderních video řešení byla částečně otestována v nejnovějším materiálu o studiu efektivity hardwarového dekódování video dat.

PCI Express 2.0

Jednou ze skutečných inovací v G92 je podpora sběrnice PCI Express 2.0. Druhá verze PCI Express zdvojnásobuje standardní šířku pásma z 2,5 Gb / s na 5 Gb / s, díky čemuž může konektor x16 přenášet data rychlostí až 8 GB / s v každém směru, na rozdíl od 4 GB / s pro verzi 1.x. Je velmi důležité, aby byl PCI Express 2.0 kompatibilní s PCI Express 1.1 a staré grafické karty budou fungovat na nových základních deskách a nové grafické karty s podporou druhé verze zůstanou funkční na základních deskách bez jeho podpory. Samozřejmě za předpokladu dostatečného externího napájení a bez zvýšení šířky pásma rozhraní.

Aby byla zajištěna zpětná kompatibilita se stávajícími řešeními PCI Express 1.0 a 1.1, podporuje specifikace 2.0 přenosové rychlosti 2,5 Gbps a 5 Gbps. Zpětná kompatibilita PCI Express 2.0 vám umožňuje používat starší 2,5 Gbps řešení v 5,0 Gbps slotech, která budou pracovat s nižší rychlostí, zatímco zařízení navržené podle specifikací verze 2.0 může podporovat rychlost 2,5 Gbps i 5 Gbps. ... Teoreticky je vše v pořádku s kompatibilitou, ale v praxi mohou nastat problémy s některými kombinacemi základních desek a rozšiřujících karet.

Podpora externího rozhraní

Jak se dalo očekávat, další čip NVIO dostupný na deskách GeForce 8800, který podporuje externí rozhraní mimo hlavní (dva 400 MHz RAMDAC, dva Dual Link DVI (nebo LVDS), HDTV-Out), v tomto případě byl zahrnut do samotného čipu , podpora všech těchto rozhraní je zabudována do samotné G92.

Grafické karty GeForce 8800 GT mají obvykle dva výstupy Dual Link DVI-I s podporou HDCP. Pokud jde o HDMI, podpora tohoto konektoru je plně implementována; mohou ji implementovat výrobci na speciálních designových kartách, které mohou být vydány o něco později. Ačkoli je přítomnost konektoru HDMI na grafické kartě zcela volitelná, bude úspěšně nahrazena adaptérem DVI na HDMI, který je dodáván s většinou moderních grafických karet.

Na rozdíl od grafických karet RADEON HD 2000 od AMD neobsahuje GeForce 8800 GT integrovaný zvukový čip, který je vyžadován pro podporu přenosu zvuku přes DVI pomocí adaptéru na HDMI. Taková možnost přenosu obrazových a zvukových signálů prostřednictvím jednoho konektoru je žádaná především na kartách střední a nižší úrovně, které jsou instalovány v malých případech mediálních center, a GeForce 8800 GT je pro tuto roli stěží vhodná.

Podrobnosti: G94, rodina GeForce 9600

Specifikace G94

  • Kódové označení čipu G94
  • 65 nm technologie
  • 505 milionů tranzistorů
  • Sjednocená architektura s řadou sdílených procesorů pro streamování vrcholů, pixelů a dalších typů dat
  • Hardwarová podpora pro DirectX 10, včetně shader modelu - Shader Model 4.0, generování geometrie a záznam mezilehlých dat ze shaderů (stream stream)
  • 256bitová paměťová sběrnice, čtyři nezávislé řadiče, 64bitová šířka
  • Frekvence jádra 650 MHz (GeForce 9600 GT)
  • ALU pracují na více než dvojnásobné frekvenci (1 625 GHz u GeForce 9600 GT)
  • 64 skalárních ALU s plovoucí desetinnou čárkou (celočíselné a plovoucí desetinné čárky, podpora 32bitové přesnosti FP v rámci standardu IEEE 754, MAD + MUL bez ztráty času)
  • 32 jednotek adresujících textury s podporou komponent FP16 a FP32 v texturách
  • 32 bloků bilineárního filtrování (stejně jako u G84 a G92 to dává zvýšený počet bilineárních vzorků, ale bez volné trilineární filtrace a účinné anizotropní filtrace)
  • Možnost dynamického větvení v shaderech pixelů a vrcholů
  • 4 široké bloky ROP (16 pixelů) s podporou režimů vyhlazování až 16 vzorků na pixel, včetně rámcového formátu FP16 nebo FP32. Každý blok se skládá z řady flexibilně konfigurovatelných ALU a je zodpovědný za generování a porovnání Z, MSAA, míchání. Špičkový výkon celého subsystému až 64 vzorků MSAA (+ 64 Z) za cyklus, pouze v režimu Z - 128 vzorků za cyklus
  • Zaznamenávejte výsledky až s 8 vyrovnávacími paměťmi snímků současně (MRT)

Specifikace referenční karty GeForce 9600 GT

  • Frekvence jádra 650 MHz
  • Frekvence univerzálních procesorů 1625 MHz
  • Počet univerzálních procesorů 64
  • Počet jednotek textury - 32, míchacích jednotek - 16
  • Efektivní frekvence paměti 1,8 GHz (2 * 900 MHz)
  • Typ paměti GDDR3
  • Kapacita paměti 512 MB
  • Šířka pásma paměti 57,6 gigabajtů za sekundu.
  • Maximální teoretická rychlost plnění 10,4 gigapixelů za sekundu.
  • Teoretická vzorkovací frekvence textury až 20,8 gigatexelů za sekundu.
  • Dva konektory DVI-I Dual Link, podporují výstup v rozlišení až 2560x1600
  • SLI konektor
  • Sběrnice PCI Express 2.0
  • Příkon až 95 W.
  • Doporučená cena 169-189 $

Architektura G94

Z architektonického hlediska se G94 liší od G92 pouze kvantitativními charakteristikami; má menší počet prováděcích jednotek: ALU a TMU. A také není mnoho rozdílů od G8x. Jak již bylo napsáno v předchozích materiálech, řada čipů G9x je mírně upravená řada G8x, přenesená do nového technického procesu s drobnými architektonickými změnami. Nový čip střední třídy má 4 velké shaderové jednotky (celkem 64 ALU) a 32 texturovacích jednotek, stejně jako čtyři široké ROP.

V čipu je tedy několik architektonických změn, téměř všechny byly napsány výše a vše, co bylo řečeno dříve pro předchozí řešení, zůstává v platnosti. A zde uvádíme pouze hlavní schéma čipu G94:

Jednotky textury v G94 jsou přesně stejné jako v G84 / G86 a G92, jsou schopny vybrat dvakrát tolik bilineárně filtrovaných textur než v G80. Ale 32 texturových jednotek GeForce 9600 GT ve skutečných aplikacích nebude fungovat rychleji než 32 jednotek GeForce 8800 GTX pouze kvůli vyšší provozní frekvenci GPU. To lze pozorovat, pouze když je vypnuto trilineární a anizotropní filtrování, což je extrémně vzácné, pouze v těch algoritmech, kde se používají nefiltrované vzorky, například při mapování paralaxy.

Za další z výhod zejména G9x a GeForce 9600 GT společnost NVIDIA považuje určitou novou kompresní technologii implementovanou v jednotkách ROP, která podle jejich odhadů funguje o 15% efektivnější než ta použitá v předchozích čipech. Zdá se, že se jedná o přesně stejné architektonické úpravy v G9x, jejichž cílem je zajistit efektivnější provoz 256bitové paměťové sběrnice ve srovnání se sběrnicí 320/384 bitů, o které jsme psali dříve. Přirozeně v reálných aplikacích nebude až tak velký rozdíl, i když podle samotné NVIDIA je nárůst z inovací v ROP obvykle jen asi 5%.

Navzdory všem změnám v architektuře G9x, které dodávají čipu složitost, o kterých si povíme později, je počet tranzistorů v čipu poměrně velký. Pravděpodobně je tato složitost GPU vysvětlena zahrnutím dříve samostatného čipu NVIO, video procesoru nové generace, komplikací TMU a ROP, stejně jako dalších skrytých úprav: změna velikosti mezipaměti atd.

PureVideo HD

G94 obsahuje stejný grafický procesor druhé generace známý z G84 / G86 a G92, který má vylepšenou podporu pro PureVideo HD. Při dekódování nejběžnějších typů video dat, včetně H.264, VC-1 a MPEG-2, téměř úplně odlehčí CPU, a to v rozlišeních až 1 920 a bitrate až 30 - 40 Mb / s, přičemž dekódovací práci provádí zcela v hardwaru. Přestože dekódování NVIDIA VC-1 není tak efektivní jako H.264, malá část procesu využívá výkon centrálního procesoru, ale stále vám umožňuje přehrávat všechny stávající disky HD DVD a Blu-Ray, a to i na počítačích se středním výkonem. Více informací o video procesoru druhé generace si můžete přečíst v našich recenzích G84 / G86 a G92, jejichž odkazy jsou uvedeny na začátku článku.

Rádi bychom zmínili softwarová vylepšení PureVideo HD, která byla načasována tak, aby se shodovala s vydáním GeForce 9600 GT. Nejnovější inovace v PureVideo HD zahrnují dekódování dvou streamů, dynamický kontrast a sytost barev. Tyto změny nejsou exkluzivní pro GeForce 9600 GT a v nových verzích ovladačů počínaje ForceWare 174 jsou zavedeny pro všechny čipy, které podporují plnou hardwarovou akceleraci pomocí PureVideo HD. Kromě grafické karty, o které dnes uvažujeme, obsahuje tento seznam: GeForce 8600 GT / GTS, GeForce 8800 GT a GeForce 8800 GTS 512.

Vylepšení dynamického kontrastu se poměrně často používá v domácích spotřebičích, televizorech a videopřehrávačích, může vylepšit snímky s neoptimální expozicí (kombinace rychlosti závěrky a clony). Za tímto účelem se po dekódování každého snímku analyzuje jeho histogram a pokud má snímek špatný kontrast, histogram se přepočítá a použije na snímek. Zde je příklad (vlevo - úvodní obrázek, vpravo - zpracován):

Totéž platí pro vylepšení dynamické sytosti barev zavedené v PureVideo HD. Domácí spotřebiče také velmi dlouho používají některé algoritmy pro vylepšení obrazu, na rozdíl od počítačových monitorů, které reprodukují vše tak, jak to je, což v mnoha případech může způsobit příliš slabý a neživý obraz. Automatické vyvážení barevných složek ve video datech, také vypočítané pro každý nový snímek, zlepšuje lidské vnímání obrazu mírnou úpravou sytosti jeho barev:

Dekódování dvou streamů zrychluje dekódování a následné zpracování dvou různých video streamů současně. To může být užitečné pro výstupní režimy, jako je obraz v obraze, které se používají u některých disků Blu-Ray a HD DVD (například druhý obrázek může ukazovat režiséra filmu komentujícího scény zobrazené v hlavním okně ), WAR a Resident Evil: Vydání Extinction jsou vybavena takovými funkcemi.

Další užitečnou novinkou nejnovější verze PureVideo HD je schopnost současně spouštět prostředí Aero v operačním systému Windows Vista při přehrávání hardwarově akcelerovaného videa v režimu okna, což dříve nebylo možné. Neříkám, že to uživatele opravdu znepokojuje, ale příležitost je pěkná.

Podpora externího rozhraní

Podpora externích rozhraní v GeForce 9600 GT je podobná jako u GeForce 8800 GT, snad s výjimkou přidané integrované podpory pro DisplayPort. Součástí samotného čipu byl také další NVIO čip dostupný na deskách GeForce 8800, který podporuje externí rozhraní mimo hlavní G94.

Referenční grafické karty GeForce 9600 GT mají dva výstupy Dual Link DVI s podporou HDCP. HDMI a DisplayPort jsou hardwarově podporovány na čipu a tyto porty mohou poskytovat partneři NVIDIA na kartách navržených na míru. Jak navíc NVIDIA zajišťuje, na rozdíl od G92 je podpora DisplayPort nyní zabudována do čipu a nejsou vyžadovány žádné externí vysílače. Obecně jsou konektory HDMI a DisplayPort na grafické kartě volitelné; lze je nahradit jednoduchými adaptéry z DVI na HDMI nebo DisplayPort, které se někdy setkávají s moderními grafickými kartami.

Podrobnosti: rodiny G96, GeForce 9400 a 9500

Specifikace G96

  • Kódové označení čipu G96
  • 65 nm technologie
  • 314 milionů tranzistorů
  • Sjednocená architektura s řadou sdílených procesorů pro streamování vrcholů, pixelů a dalších typů dat
  • Hardwarová podpora pro DirectX 10, včetně shader modelu - Shader Model 4.0, generování geometrie a záznam mezilehlých dat ze shaderů (stream stream)
  • 128bitová paměťová sběrnice, dva nezávislé 64bitové řadiče
  • Frekvence jádra 550 MHz
  • ALU pracují na více než dvojnásobné frekvenci (1,4 GHz)
  • 32 skalárních ALU s plovoucí desetinnou čárkou (celočíselné a plovoucí desetinné čárky, podpora 32bitové přesnosti FP v rámci standardu IEEE 754, MAD + MUL bez ztráty času)
  • 16 jednotek adresujících textury s podporou komponent FP16 a FP32 v texturách
  • 16 bloků bilineárního filtrování (jako u G92 to dává zvýšený počet bilineárních vzorků, ale bez volné trilineární filtrace a účinné anizotropní filtrace)
  • Možnost dynamického větvení v shaderech pixelů a vrcholů
  • 2 široké ROP (8 pixelů) s podporou režimů vyhlazování až 16 vzorků na pixel, včetně formátu FP16 nebo FP32 framebuffer. Každý blok se skládá z řady flexibilně konfigurovatelných ALU a je zodpovědný za generování a porovnání Z, MSAA, míchání. Špičkový výkon celého subsystému až 32 vzorků MSAA (+ 32 Z) za cyklus, pouze v režimu Z - 64 vzorků za cyklus
  • Zaznamenávejte výsledky až s 8 vyrovnávacími paměťmi snímků současně (MRT)
  • Všechna rozhraní (dvě RAMDAC, dvě Dual DVI, HDMI, DisplayPort) jsou integrována na čipu

Specifikace referenční karty GeForce 9500 GT

  • Frekvence jádra 550 MHz
  • Počet univerzálních procesorů 32
  • Počet jednotek textury - 16, jednotek míchání - 8
  • Efektivní frekvence paměti 1,6 GHz (2 * 800 MHz)
  • Typ paměti GDDR2 / GDDR3
  • Kapacita paměti 256/512/1024 megabajtů
  • Teoretická vzorkovací frekvence textury až 8,8 gigatexelů za sekundu.
  • Dva konektory DVI-I Dual Link, podporují výstup v rozlišení až 2560x1600
  • SLI konektor
  • Sběrnice PCI Express 2.0
  • TV-Out, HDTV-Out, HDMI a DisplayPort s podporou HDCP

Referenční specifikace GeForce 9400 GT

  • Frekvence jádra 550 MHz
  • Frekvence univerzálních procesorů 1400 MHz
  • Počet univerzálních procesorů 16
  • Počet jednotek textury - 8, míchacích jednotek - 8
  • Efektivní frekvence paměti 1,6 GHz (2 * 800 MHz)
  • Typ paměti GDDR2
  • Kapacita paměti 256/512 MB
  • Šířka pásma paměti 25,6 gigabajtů za sekundu.
  • Maximální teoretická rychlost plnění 4,4 gigapixelu za sekundu.
  • Teoretická vzorkovací frekvence textury až 4,4 gigatexelů za sekundu.
  • Dva konektory DVI-I Dual Link, podporují výstup v rozlišení až 2560x1600
  • SLI konektor
  • Sběrnice PCI Express 2.0
  • TV-Out, HDTV-Out, HDMI a DisplayPort s podporou HDCP

Architektura G96

Architektonicky je G96 přesně polovinou čipu G94, který se zase liší od G92 pouze kvantitativními charakteristikami. G96 má poloviční počet všech prováděcích jednotek: ALU, TMU a ROP. Nový video čip je navržen pro řešení s nejnižší cenou a má dvě velké shaderové jednotky (celkem 32 ALU) a 16 texturovacích jednotek a osm ROP. Má také sníženou paměťovou sběrnici, z 256bitové na 128bitovou ve srovnání s G94 a G92. Všechny hardwarové funkce zůstávají nezměněny, rozdíly jsou pouze ve výkonu.

Podrobnosti: G92b, rodina GeForce GTS 200

Specifikace pro referenční GeForce GTS 250

  • Frekvence jádra 738 MHz
  • Frekvence univerzálních procesorů 1836 MHz
  • Počet univerzálních procesorů 128
  • Počet jednotek textury - 64, míchacích jednotek - 16
  • Efektivní frekvence paměti 2200 (2 * 1100) MHz
  • Typ paměti GDDR3
  • Velikost paměti 512/1024/2048 megabajtů
  • Šířka pásma paměti 70,4 GB / s
  • Maximální teoretická rychlost plnění 11,8 gigapixelů za sekundu.
  • Teoretická vzorkovací frekvence textury až 47,2 gigatexelů za sekundu.
  • Dva konektory DVI-I Dual Link, podporují výstup v rozlišení až 2560x1600
  • Duální konektor SLI
  • Sběrnice PCI Express 2.0
  • TV-Out, HDTV-Out, HDCP, HDMI, DisplayPort
  • Příkon až 150 W (jeden 6pinový konektor)
  • Verze se dvěma sloty
  • MSRP 129 USD / 149 USD / 169 USD

Obecně se tato „nová“ grafická karta založená na 55 nm čipu G92 v ničem neliší od GeForce 9800 GTX +. Vydání nového modelu lze částečně ospravedlnit instalací ne 512 MB grafické paměti, jako u modelu 9800 GTX +, ale gigabajt, což výrazně ovlivňuje výkon v těžkých režimech s nastavením maximální kvality, vysokým rozlišením s povoleným vyhlazováním na celou obrazovku. A existují také možnosti dvou gigabajtů, ale to je spíše marketingová výhoda než skutečná.

Za takových podmínek by starší verze GeForce GTS 250 měly být díky zvýšené kapacitě paměti skutečně znatelně rychlejší než GeForce 9800 GTX +. A některé z modernějších her využijí ještě nižšího rozlišení. Všechno by bylo v pořádku, ale až na konec, někteří výrobci karet vydali GeForce 9800 GTX + s gigabajtem paměti ještě dříve ...

Výroba video čipů G92b podle 55 nm technologických standardů a znatelné zjednodušení designu desek plošných spojů umožnily společnosti NVIDIA vytvořit řešení podobné vlastnostem GeForce 9800 GTX, ale s nižší cenou a nižší spotřebou energie a ztrátou tepla. A nyní, aby mohla napájet GeForce GTS 250, má deska pouze jeden 6kolíkový napájecí konektor PCI-E. To jsou všechny hlavní rozdíly oproti modelu 9800 GTX +.