انویدیا geforce 9800 gt که سری از محصولات. ما سری محصولات کارت گرافیک های انویدیا را تعریف می کنیم. معماری تراشه G92

آداپتور ویدئو Nvidia GeForce 9800 GT با حافظه 512 مگابایت در سال 2008 در بازار ظاهر شد و جایگزین مدل قبلی شد. نسخه های بعدی با 1 گیگابایت GDDR5 و قابلیت های بازی بهبود یافته منتشر شدند. همه انواع کارتها در محدوده قیمت بودجه بودند و برای مونتاژ رایانه های ارزان قیمت بازی در نظر گرفته شده بودند.

پارامترهای آداپتور گرافیکی کاملاً با الزامات برنامه های بازی در 2008-2009 مطابقت دارند. ویژگی های اصلی Nvidia GeForce 9800 GT به شرح زیر است:

GPU G92-270؛
فرکانس GPU - از 550 تا 600 مگاهرتز ؛
فرکانس حافظه - 1400-1800 مگاهرتز ؛
عمق بیت - 256 بیت ؛
حداکثر سرعت انتقال داده - 57.6 گیگابایت در ثانیه
وضوح تصویر پشتیبانی شده - حداکثر 2560x1600.

این کارت گرافیک از فناوری Nvidia SLI برای افزایش کارایی ، HybridPower برای تغییر خودکار به گرافیک یکپارچه و PhysX برای حداکثر واقع بینی گیم پلی پشتیبانی می کند. همچنین با بسته های DirectX 10 و OpenGL 2.0 کار می کند ، گرافیک های سه بعدی با کیفیت بالا ارائه می دهد. مجموعه های مدرن تری از توابع API پشتیبانی نمی شوند.

بررسی GeForce 9800 GT

مصرف برق 9800 GT در 105 وات کاملاً زیاد است ، بنابراین برای کارکرد به منبع تغذیه قدرتمند نیاز دارد. سازنده توصیه می کند حداقل از 450 وات استفاده کنید. برای اجرای بازی های مدرن ، باید یک واحد منبع تغذیه مولد تر - 500 یا 600 وات را انتخاب کنید.

به منظور حفظ دمای طبیعی کارت گرافیک GeForce 9800 GT ، همه تغییرات به سیستم خنک کننده فعال مجهز هستند - به طور معمول ، با یک کولر.

در حالت عادی ، کارت بیش از 77 درجه گرم می شود. حداکثر مقدار آن 105 درجه است.

برای اتصال دستگاه های جانبی ، آداپتور ویدئو دارای اتصالات زیر است:

2 DVI ، که از طریق آداپتورها می توان کابل های معمولی VGA و HDMI را به آن متصل کرد.
تلویزیون خروجی برای خروجی سیگنال آنالوگ ؛
MIO ، که با آن می توانید دو کارت را ترکیب کنید.

حداکثر مقدار فرکانس موثر کارت گرافیک 2000 مگاهرتز است که به شما اجازه می دهد بسته به مدل ، آن را 11 تا 30٪ اورکلاک کنید. شایان توجه است که افزایش محسوس عملکرد می تواند منجر به گرمازدگی شدید شود.

نحوه اورکلاک کارت گرافیک Nvidia GeForce 9800 GT

با اورکلاک کردن Nvidia GeForce 9800 GT می توانید فرکانس آن را افزایش دهید. نتیجه افزایش عملکرد کارت و فریم در ثانیه در طول گیم پلی است. اگرچه شما قادر به اجرای بازی هایی نخواهید بود که حداقل شرایط را برآورده نمی کند.

برنامه های کمکی ویژه مانند MSI Afterburner یا Nvidia Inspector به شما در ارائه اورکلاک کارت کارت گرافیک Nvidia GeForce 9800 GT کمک می کنند.

حداکثر فرکانس آداپتور ویدئویی اورکلاک نشده نباید بیش از 2000 مگاهرتز باشد. کارت اورکلاک شده سریعتر است اما تا 120-125 وات مصرف می کند.

پس از اورکلاک ، استخراج روی 9800 GT امکان پذیر است ، اما توصیه نمی شود. حتی با ظهور ارز رمزنگاری شده جدید Bitcoin Gold که می توان آن را با استفاده از پردازنده های گرافیکی استخراج کرد ، عملکرد حتی برای جبران مجدد برق ، مخصوصاً با چنین TDP بالایی ، همچنان پایین خواهد بود.

Nvidia GeForce 9800 GT چه بازی هایی را به خود جلب می کند

آزمایشی که همزمان در بازی های GeForce 9800 GT انجام شد ، امکان استفاده از کارت ویدیو برای رایانه های شخصی بودجه ای را نشان داد. حداقل مورد نیاز برای رایانه ای که با کارت مطابقت دارد مادربرد با اسلات 16x PCI-Express ، 512-1024 مگابایت RAM و منبع تغذیه 500 وات است. نصب بسته DX10 نیز توصیه می شود.

نتایج تأیید به شرح زیر است:

در بازی Crysys (2009) با وضوح 1280 × 1024 پیکسل. مدل 512 مگابایتی 22 تا 30 فریم در ثانیه را ارائه می دهد - تقریباً در سطح کارت گرافیک HD 4770.
هنگام شروع بازی Stalker (وضوح تصویر 1680x1050 پیکسل) ، اگر از آداپتور با 512 مگابایت GDDR5 استفاده می کنید ، فرکانس تغییر عکس به 13-25 فریم در ثانیه می رسد و اگر نسخه گیگابایتی را بر روی کامپیوتر خود نصب کنید ، به حداکثر 30 می رسد.
یک بازی Skyrim با کارت 512 مگابایت به هیچ وجه شروع نمی شود و یک تغییر گیگابایت در حداقل تنظیمات تا 65 فریم در ثانیه را نشان می دهد.

توصیه نمی شود بازی هایی را که پس از 2011-2012 با GeForce 9800 GT 512 مگابایت منتشر شده اند ، اجرا کنید. بیشتر آنها حداکثر 20 فریم در ثانیه نشان می دهند ، بقیه کار نمی کنند. نسخه ای با حافظه 1 گیگابایتی کار خواهد کرد ، اما بعید است کیفیت قابل قبولی از گیم پلی ارائه دهد.

مقایسه تولید کنندگان

در ابتدای فروش ، قیمت Nvidia GeForce 9800 GT برای نسخه 512 مگابایتی حدود 2700-3000 روبل و حدود 3.5 هزار روبل بود. برای تغییرات گیگابایت. محصولات تولیدکنندگان معروف تری مانند MSI ، Palit و Asus فرکانس حافظه 1800 مگاهرتز و هزینه بیشتری دریافت کردند. اکنون می توان آن را فقط با قیمت 600-700 روبل در بازار ثانویه خریداری کرد.

نام تجاری	حافظه ، MB	فرکانس پردازنده ، مگاهرتز	فرکانس حافظه ، مگاهرتز	هزینه ، مالش
گیگابایت	1024	600	1800	3600
گیگابایت	512	600	1500	2900
گیگابایت	512	550	1800	2800
ECS	512	550	1800	2600
MSI	512	550	1800	2900
ایسوس	512	600	1800	3000
Inno3D	1024	600	1800	3500
Club 3D	1024	550	1400	3300
سودمند	1024	550	1800	3500
زوتاک	1024	550	1600	3400
پالیت	512	600	1800	2700
پالیت	1024	550	1800	3400

مارک های پردرآمد Zotac ، Club 3D و Gigabyte ارزان تر اما کندتر نیز بودند. فرکانس این آداپتورهای گرافیکی در محدوده 1400-1600 مگاهرتز بود. اکنون قیمت آنها تقریباً مشابه مدل هایی است که زمانی هزینه بیشتری دارند - بیش از 1000 روبل.

نحوه نصب مجدد درایور ویدئو برای GeForce 9800 GT

برای عملکرد طبیعی آداپتور ویدئو ، وجود برنامه های کنترل صحیح کار ضروری است. سه روش برای بارگیری و نصب درایورهای جدید در رایانه با کارت 9800 GT وجود دارد:

در حال بارگیری از منبع رسمی سازنده. تنها گزینه ای که عملکرد صحیح و ایمنی کامپیوتر را تضمین می کند.
بارگیری از منابع شخص ثالث. روشی که در آن نه تنها می توانید درایور Nvidia GeForce 9800 GT را بارگیری کنید ، بلکه کامپیوتر خود را با ویروس آلوده کنید.
با استفاده از برنامه های ویژه مانند DriverPack Solution ، DriverHub یا Driver Booster Free. در این حالت ممکن است راننده قدیمی باشد.

در وب سایت رسمی انویدیا ، می توانید نسخه های جدیدی از برنامه های کنترل را برای کارت گرافیک ، طراحی شده برای سیستم عامل های مختلف پیدا کنید. لیست سیستم عامل های پشتیبانی شده توسط کارت شامل ویندوز 7 32 و 64 بیتی ، ویندوز 10 و لینوکس است. در منابع دیگر می توانید درایورهای سیستم عامل های کمیاب مانند Solaris را پیدا کنید.

کارت گرافیک 9800 GT از NVIDIA ادامه منطقی برد 8800GT است. دو محصول فناوری پارامترهای تقریباً یکسانی دارند. تفاوت اصلی بین 9800GT و مدل قبلی پشتیبانی از فناوری HybridPower است. هیچ پیشرفت دیگری وجود ندارد. پردازنده گرافیکی کارت با برچسب G92-270 است. مدل 8800 مدل مشابهی را در اختیار داشت. میکروچیپ مانند گذشته دارای نسخه A2 است. مشخصات سرعت ساعت کارت گرافیک 9800 GT ثابت مانده است: 601/1512 مگاهرتز.

مشخصات 9800 GT

از نظر فنی ، 9800 GT از 8800 هیچ تغییر عمده ای نداشته است.

پارامترهای کارت گرافیک:

GPU: G92.
حافظه فیلم: 512 مگابایت.
باس حافظه: 256 بیت.
فرکانس GPU: 601/1512 مگاهرتز.
بلوک های بافت: 56
بلوک های ROP: 16
فرکانس م atثری که حافظه کارت گرافیک در آن کار می کند: 1800 مگاهرتز.
پردازنده های جهانی (هسته ها): 112.
پشتیبانی از فن آوری های منحصر به فرد: قدرت ترکیبی.
گذرگاه سیستم و سایر رابط های ارتباطی: PCI-E 2.0x16 / 2xDVI / S-Video. HDMI با آداپتور پشتیبانی می شود.

کارت گرافیک 9800 GT چه وظایفی را می تواند حل کند؟

کارت گرافیک ارائه شده به خوبی با بازی های نسل قبلی کنار می آید. اگر کاربر در حال تعقیب موارد جدید نیست ، بدون شک 9800 GT برای او مناسب است. ویژگی های کارت به شما امکان می دهد بازی هایی مانند The Witcher 2 ، S.T.A.L.K.E.R ، Crysis 2 ، Dead Space 3 و سایر موارد را به راحتی اجرا کنید. اتفاقاً Fallout New Vegas نیز با این صفحه بدون مشکل همراه است. اما نسخه چهارم پروژه افسانه ای قابل راه اندازی نیست.

تیراندازها و شبیه سازهای اتومبیل مدرن که پس از سال 2013 منتشر شدند ، کارت ویدیو نیز کار نخواهد کرد. موارد استثنایی وجود دارد ، اما بسیار نادر است. کاربر هنگام کار با اطلاعات گرافیکی و ویدئویی ، تماشای فیلم با وضوح بالا کاملاً راحت است. اگر شخصی عکاس یا طراح سه بعدی حرفه ای نباشد و به حداکثر سرعت کار نیاز داشته باشد ، کارت ویدیوی 9800 GT کاملاً مناسب وی است.

جوانب مثبت و منفی کارت ویدیو

تابلوی مورد نظر دارای مزایای متعددی است که استفاده از آن را همچنان مرتبط می کند. اگرچه این راه حل معایبی نیز دارد.

مزایای 9800 GT چیست؟ ویژگی های مدل نشان می دهد که بسیاری از آنها وجود دارد.

کارت گرافیک از حالت SLI پشتیبانی می کند. می توانید همزمان 4 تخته بخرید و آنها را به صورت گروهی درآورید و بدین ترتیب افزایش چشمگیری در عملکرد داشته باشید.
این هیئت از فناوری PhysX پشتیبانی می کند. این برای تولید جلوه های ویژه اضافی در بازی ها است. لازم به ذکر است که عملکرد کلی کارت گرافیک به طور محسوسی کاهش می یابد. برای کاهش این اثر ، سازنده توصیه می کند از یک شتاب دهنده اختصاصی PhysX برای تکمیل برد اصلی استفاده کنید.
با استفاده از برنامه های کمکی ویژه ، می توانید عملکرد اسمی Nvidia 9800 GT را با افزایش 15-15 درصدی بهبود بخشید. نشانگر خاص به خواسته کاربر و قابلیت های سیستم خنک کننده کارت بستگی دارد. در هنگام اورکلاک ، برای جلوگیری از گرم شدن بیش از حد و در نتیجه خرابی ، باید دمای کارکرد دستگاه را به دقت کنترل کنید.

معایب:

یک راه حل منسوخ شده است.
دارای کارایی محدود در محاسبات هدف عمومی است.
نرمی پخش دیسکها و فیلمهای Blu-Ray با کیفیت HD ارسال شده در اینترنت تا حد زیادی تحت تأثیر پردازنده مرکزی قرار خواهد گرفت (علاوه بر پردازنده کارت گرافیک).
عملکرد ضعیف 9800 GT ، مشخصات هیئت مدیره اجازه اجرا نمی دهد بازی های منتشر شده پس از 2013؛
مصرف انرژی نسبتاً زیاد ؛
عملکرد کافی کارت گرافیک هنگام کار با جلوه های اضافی PhysX.

NVIDIA GeForce 9000 Series

نام کد	G92 ، G92b ، G94 ، G94b ، G96 ، G98
GPU سطح ورود	GeForce 9300GS ، GeForce 9400GT ، GeForce 9500GT
پردازنده گرافیکی میان رده	GeForce 9600
GPU های برتر	GeForce 9800
نسخه Direct3D و سایه بان ها	Direct3D 10 سایه بان مدل 4.0
نسخه OpenGL	OpenGL 3.3
نسخه OpenCL	OpenCL 1.1
سلف، اسبق، جد	GeForce 8
جانشین	GeForce 100

NVIDIA GeForce 9800 GX2

گیگابایت GeForce 9500 GT

مشخصات سری GeForce 9

مدل	9800					9600				9500	9400	9300
مدل	GX2	+ GTX	GTX	GT	GT سبز	GT	GT سبز	GSO 512	GSO	GT	GT	GS
تاریخ انتشار	18.03.08	18.07.08	01.04.08	18.07.08	-	21.02.08	-	-	29.04.08	18.07.08	26.08.08	-
پردازنده گرافیکی	2 عدد G92	G92b	G92		G92b	G94	G94b	G94	G92	G96		G98
تعداد ترانزیستور ، میلیون	2 75 754	754				505			754	314		-
فرآیند فنی ، nm	65	55	65	65 / 55	55	65 / 55	55		65	55		65
فرکانس هسته ، مگاهرتز	600	738	675	600	550	650	600	650	550			567
فرکانس واحد سایه بان ، مگاهرتز	1500	1836	1688	1512	1375	1625	1500	1625	1375	1400
تعداد پردازنده های جریان	2 x 128	128		112		64		48	96	32	16	8
تعداد واحدهای بافت	2 * 64	64		56		32		24	48	16	8
تعداد واحدهای ROP	2 16 16	16							12	8		4
عملکرد ، GFLOPS	2 x 576	705	648	504	462	312	288	234	396	134,4	67,2	33,6
پر کردن صحنه ، میلیارد پیکسل /	2 9. 9.6	11,8	10,8	9,6	8,8	10,4	9,6	7,8	6,6	4,4		2,2
پر کردن صحنه ، میلیارد تکس /	2 38 38.4	47,2	43,2	33,6	30,8	20,8	19,2	15,6	26,4	8,8	4,4	4,5
استاندارد حافظه ویدیویی	GDDR3									DDR2
عرض گذرگاه حافظه ویدئو ، بیت	2 x 256	256							192	128		64
فرکانس حافظه ویدئو ، مگاهرتز	1000	1100		900					800	500
پهنای باند حافظه ، GB /	2 64 64.0	70,4		57,6					38,4	16,0		8,0
اندازه حافظه ویدئو ، مگابایت	2 x 512	512 / 1024						512	384	512		256
مصرف برق ، W	265	140	165	105	75	95	60	90	100	50		30
رابط	PCI Express 2.0 x16
پشتیبانی از نسخه API	Direct3D 10 ، OpenGL 3.3 ، OpenCL 1.1
پشتیبانی از نسخه Shader Model	سایه بان مدل 4.0

سری GeForce 9800

NVIDIA GeForce 9800GX2

اتوبوس PCI Express 2.0؛
دو هسته گرافیکی G92-450 (65nm) که با فرکانس 600 مگاهرتز کار می کنند.
256 پردازنده (2 × 128) جریان با سرعت 1500 مگاهرتز ؛
1024 مگابایت (2 × 512 مگابایت) حافظه ویدیویی GDDR3 با رابط 256 بیتی و فرکانس 1000 مگاهرتز ؛
مصرف برق 265 وات است.
DirectX 10.0 Shader Model 4.0 OpenGL 3.3 سازگار ؛
پشتیبانی از چهار SLI.

در واقع ، این یک کارت دوتایی است که مبتنی بر یک جفت 8800GTS 512 مگابایت است. این کارت گرافیک مفهوم شتاب دهنده های دو GPU GX2 است که در سری NVIDIA GeForce 7900 یافت می شود.

NVIDIA GeForce 9800GTX +

اتوبوس PCI Express 2.0؛
هسته گرافیکی G92b-400 (55 نانومتر) ، با سرعت 738 مگاهرتز ؛
128 پردازنده جریان با سرعت 1836 مگاهرتز ؛
1024 مگابایت یا 512 مگابایت GDDR3
مصرف برق 140 وات است.
پشتیبانی از 3-Way SLI.

این یک نسخه از GeForce 9800GTX با فناوری فرایند 55 نانومتری با افزایش فرکانس ها و مصرف انرژی کمتر است. در عملکرد کمی از AMD / ATI Radeon 4850 پیشی می گیرد و بعداً به GeForce GTS 250 تغییر نام داد.

NVIDIA GeForce 9800GTX

اتوبوس PCI Express 2.0؛
هسته گرافیکی G92-400 (65 نانومتر) ، با سرعت 675 مگاهرتز ؛
128 پردازنده جریان با سرعت 1688 مگاهرتز ؛
1024 مگابایت یا 512 مگابایت حافظه ویدیویی GDDR3 با رابط 256 بیتی و فرکانس 1100 مگاهرتز ؛
مصرف برق 168 وات است.
DirectX 10.0 Shader Model 4.0 OpenGL 3.3 سازگار ؛
پشتیبانی از 3-Way SLI.

آنالوگ NVIDIA GeForce 8800GTS 512 MB با افزایش فرکانس ها. 9800GTX + که در پاسخ به انتشار AMD / ATI Radeon 4850/4870 که عملکرد بالاتری داشت فوراً منتشر شد ، به سرعت جای خود را در بازار از دست داد.

NVIDIA GeForce 9800GT

اتوبوس PCI Express 2.0؛
هسته گرافیکی G92-400 (65nm / 55nm) ، با سرعت 600 مگاهرتز
112 پردازنده جریان
1024 مگابایت یا 512 مگابایت GDDR3
مصرف برق 105 وات است.
DirectX 10.0 Shader Model 4.0 OpenGL 3.3 سازگار ؛
پشتیبانی از SLI دو طرفه.

آنالوگ NVIDIA GeForce 8800GT 512 مگابایت.

NVIDIA GeForce 9800GT Green

اتوبوس PCI Express 2.0؛
هسته گرافیکی G92-400 (55 نانومتر) با عملکرد 550 مگاهرتز ؛
112 پردازنده جریان
1024 مگابایت یا 512 مگابایت حافظه ویدیویی GDDR3 با رابط 256 بیتی ؛
مصرف برق 75 وات است.
DirectX 10.0 Shader Model 4.0 OpenGL 3.3 سازگار ؛
پشتیبانی از SLI دو طرفه.

قبل از عرضه کارت گرافیک 9800 GT ، بسیاری از تحلیلگران و روزنامه نگاران معتقد بودند که اخبار مربوط به ظاهر این آداپتور گرافیکی ساختگی است. پس از انتشار رسمی ، اطلاعات مشخص شد. پیش از این بسیاری از آنها به عنوان یک گل سرسبد برگ های اولویت را به این کارت گرافیک می بخشیدند ، اما مهندسان NVIDIA باز هم تعداد جدیدی را به راه حل های معماری قدیمی اختصاص دادند.

GeForce 9800 GT. مشخصات کارت گرافیک

شتاب دهنده گرافیک تقریباً کپی کاملی از نسخه قبلی خود است - و برخی آزمایشات نشان می دهد که نسل قبلی همچنان پربارتر است. محصول جدید به همان پردازنده مجهز شده است - G92 ، حتی روند فنی نیز تغییر نکرده است. در 65nm باقی ماند ، اگرچه بسیاری معتقد بودند که 9800 GT از 55nm استفاده خواهد کرد. فرکانس های GPU تغییر نکرده اند.

در صفحه رسمی سایت با ارائه GeForce 9800 GT ، مشخصات به شرح زیر است:

GPU: G92. 112 پردازنده جهانی ، 64 واحد بافت.
حافظه ویدیویی: GDDR3 ، حجم آن 512 مگابایت است.
عرض باس حافظه: 256 بیت.
فرکانس GPU: 600 مگاهرتز.
فرکانس واحد سایه بان: 1500 مگاهرتز.
فرکانس حافظه: 1800 (900) مگاهرتز.
بنادر: 2xDVI-I ، خروجی تلویزیون.

تنها چیزی که این کارت گرافیک را از 8800 GT متمایز می کند پشتیبانی از فناوری HybridPower است. این امکان را به شما می دهد تا در حالت اتوماتیک بین گرافیک یکپارچه و گرافیک گسسته جابجا شوید ، که امکان کاهش مصرف برق و

این بروزرسانی را نمی توان برای GeForce 9800 GT مهم دانست ، ویژگی ها را تغییر نمی دهد ، علاوه بر این ، HybridPower بدون رعایت یک شرط نمی تواند کار کند. مادربرد نیز باید از این فناوری پشتیبانی کند و همزمان دارای یک هسته گرافیکی یکپارچه باشد.

تجهیزات

کارت گرافیک در یک جعبه نسبتاً بزرگ قرار دارد که با غلبه بر رنگ های آبی تزئین شده است.

در داخل آن می توانید موارد زیر را پیدا کنید:

خود کارت گرافیک.
ست لاله S-Video.
سیم برق اضافی.
دیسک لیزر با درایورها و برنامه ها.
برخی از ویرایش ها شامل Civilization IV در کیت خود هستند.
راهنمای کاربر.

متون چاپ شده روی بسته بندی عمدتا توسط تبلیغات نشان داده می شوند. با این وجود ، در میان تعریف و تمجید از فن آوری های به کار رفته در محصول GeForce 9800 GT ، مشخصات فنی مستقیماً نشان می دهد که شتاب دهنده گرافیکی براساس 8800 GT ساخته شده است. چنین صداقت غبطه برانگیز است.

وجود تعداد زیادی آداپتور و سیم برق نشانگر این است که NVIDIA به مشتریان خود اهمیت می دهد. اگر شما نیاز به اتصال تجهیزات غیر استاندارد یا چند مانیتور دارید ، لازم نیست اجزای اضافی بخرید ، فقط باید آنها را از جعبه خارج کنید.

طرح

می توان گفت که هنگام مقایسه GeForce 8800 GT و GeForce 9800 GT ویژگی های آنها بسیار بیشتر از طراحی است. البته ، به طور کلی ، یک هیئت مدیره شبیه دیگری است ، اما نمی توانید بگویید که یکسان هستند.

ابعاد هر دو کارت گرافیک ، محل اتصال برق ، تماس های SLI پوشیده شده با یک درپوش لاستیکی و همچنین موقعیت GPU و حافظه IC است. تراشه ها توسط SAMSUNG تولید می شوند و زمان دسترسی 1 ns است.

محل زنجیرهای باقیمانده کاملاً متفاوت است. علاوه بر این ، مهندسان تصمیم گرفتند پس انداز نکنند و از بالاترین کیفیت دستگاه ها استفاده کردند. خازن های جامد روی کارت گرافیک دیده می شوند. عمر مفید اینگونه محصولات بسیار بیشتر از محصولات الکترولیتی سنتی است. کویل های چوک با هسته های فریت نیز از نظر زمان کارکرد نسبت به چوک های استاندارد سود می برند.

اگر متخصصان اقدام به نصب نیمه هادی ها کنند ، مشخصاً تعداد پورت های اتصال دستگاه های خروجی به نمایندگان اصلی نمی رسد. در اینجا دو کانکتور DVI-I و یک تلویزیون خروجی وجود دارد. اما این نقص توسط تمام آداپتورهای لازم جبران می شود.

سیستم خنک کننده

با بررسی دقیق تر ، مشخصات 9800 GT چشمگیر به نظر نمی رسد. با این حال ، یک عنصر در شتاب دهنده گرافیکی وجود دارد که می تواند به کارت های ویدیویی دیگر شانس ایجاد کند - این یک هیت سینک است. اول از همه ، لازم به ذکر است که سیستم خنک کننده نصب شده توسط شرکت معروف آلمانی Zalman تولید شده است ، که یکی از رهبران بازار است.

تا حد ممکن ساده است اما بسیار بی سر و صدا و تا حد ممکن کارآمد کار می کند. هسته سطح GPU را که روی آن خمیر حرارتی اعمال می شود ، لمس می کند. یک جفت لوله 6 میلی متری از آن عبور داده می شود ، شکل آنها شبیه حرف "U" است. آنها از مس ساخته شده اند. بالای لوله ها صفحات نازک آلومینیومی قرار دارد.

به طور منطقی تمام این طرح یک پروانه کم سرعت با قطر 8 سانتی متر است که سرعت چرخش آن بسته به میزان بار هسته گرافیکی به طور خودکار انتخاب می شود. تنها چیزی که می توان به کمبودهای سیستم خنک کننده نسبت داد این است که این اسلات دومین شکاف PCI EXPRESS را پنهان می کند. اگر قرار دادن همزمان دو کارت گرافیک در رایانه ضروری شود ، باید به فکر تعویض رادیاتور باشید.

اورکلاک کردن

GT ، که ویژگی های آن کاملاً متوسط \u200b\u200bاست ، می تواند با استفاده از نرم افزار موجود در بسته ، اورکلاک شود. GamerHUD می تواند فرکانس ها را در حالی که سیستم عامل در حال اجرا است بدون راه اندازی مجدد غیر ضروری تغییر دهد. علاوه بر این ، این برنامه به شما امکان می دهد ولتاژ تغذیه شده به GPU را دستکاری کنید ، اما استفاده از این ویژگی توصیه نمی شود ، به این ترتیب پردازنده ویدیو خراب نمی شود.

پس از اورکلاک ، GeForce 9800 GT به عملکرد پایدار خود ادامه می دهد که مشخصات فرکانس آن برای GPU به 700 مگاهرتز ، برای واحد سایه بان 1700 مگاهرتز و برای حافظه 2000 مگاهرتز افزایش یافته است. دما پس از اورکلاک اندکی افزایش می یابد ، که باید از سیستم خنک کننده تشکر کنیم.

فناوری (nm)90 80 65/55 ترانزیستور (M)681 289 210 754 505 314 پردازنده های جهانی128 32 16 128 64 32 بلوک های بافت32 16 8 64 32 16 بلوک های ترکیبی24 8 16 8 اتوبوس حافظه384 (64x6)128 (64x2)256 (64x4)128 (64x2) انواع حافظهDDR ، GDDR2 ، GDDR3 ، GDDR4 باس سیستم تراشهPCI-Express 16xPCI-Express 2.0 16x RAMDAC2 400 400 مگاهرتز رابط هاخروجی تلویزیون
TV-In (نیاز به تراشه ضبط)
2 عدد پیوند دوگانه DVI
HDTV-Outخروجی تلویزیون
TV-In (نیاز به تراشه ضبط)
2 عدد پیوند دوگانه DVI
HDTV-Out
HDMIخروجی تلویزیون
TV-In (نیاز به تراشه ضبط)
2 عدد پیوند دوگانه DVI
HDTV-Out
HDMI
DisplayPort سایه اندازهای راس4.0 سایه زن پیکسل4.0 دقت پیکسلFP32 دقت راسFP32 قالب های بافتFP32)
FP16
I8
DXTC ، S3TC
3Dc قالب های ارائه FP32
FP16
I8
10
دیگران MRTوجود دارد ضد نام مستعارTAA (چند ضلعی های شفاف AA)
CSAA 2x-16x
نسل Z2 برابر در حالت رنگی نیست بافر استنسیلدو طرفه فناوری سایهنقشه های سایه سخت افزار
بهینه سازی سایه های هندسی

مشخصات کارتهای مرجع بر اساس خانواده G8X

نقشه	تراشه لاستیک	بلوک های ALU / TMU	فرکانس هسته (مگاهرتز)	فرکانس حافظه (مگاهرتز)	اندازه حافظه (مگابایت)	پهنای باند حافظه (GB)	نرخ texel (mtex)	فیل نرخ (Mpix)
GeForce 8500 GT	G86 PEG16x	16/8	450	400(800)	256 DDR2	12.8 (128)	3600
GeForce 8600 GT	G84 PEG16x	32/16	540	700(1400)	256 GDDR3	22.4 (128)	8600	4300
GeForce 8600 GTS	G84 PEG16x	32/16	675	1000(2000)	256 GDDR3	32.0 (128)	10800	5400
GeForce 8800 GTS 320 مگابایت	G80 PEG16x	96/24	500	800(1600)	320 GDDR3	64.0 (320)	12000	10000
GeForce 8800 GTS 640MB	G80 PEG16x	96/24	500	800(1600)	640 GDDR3	64.0 (320)	12000	10000
GeForce 8800 GTX	G80 PEG16x	128/32>	575	900(1800)	768 GDDR3	86.4 (384)	18400	13800
GeForce 8800 Ultra	G80 PEG16x	128/32	612	1080(2160)	768 GDDR3	104.0 (384)	19600	14700
GeForce 8800 GT 256MB	G92 PEG16x	112/56	600	700(1400)	256 GDDR3	44.8 (256)	33600	9600
GeForce 8800 GT 512MB	G92 PEG16x	112/56	600	900(1800)	512 GDDR3	57.6 (256)	33600	9600
GeForce 8800 GTS 512MB	G92 PEG16x	128/64	650	1000(2000)	512 GDDR3	64.0 (256)	41600	10400
GeForce 8800 GS	G92 PEG16x	96/48	550	800(1600)	384 GDDR3	38.4 (192)	26400	6600
GeForce 9400 GT	G96 PEG16x	16/8	550	800(1600)	256/512 GDDR2	25.6 (128)	4400	4400
GeForce 9500 GT	G96 PEG16x	32/16	550	800(1600)	256/512 GDDR2 / GDDR3	25.6 (128)	8800	4400
GeForce 9600 GSO	G92 PEG16x	96/48	550	800(1600)	384 GDDR3	38.4 (192)	26400	6600
GeForce 9600 GT	G94 PEG16x	64/32	650	900(1800)	512 GDDR3	57.6 (256)	20800	10400
GeForce 9800 GT	G92 PEG16x	112/56	600	900(1800)	512 GDDR3	57.6 (256)	33600	9600
GeForce 9800 GTX	G92 PEG16x	128/64	675	1100(2200)	512 GDDR3	70.4 (256)	43200	10800
GeForce 9800 GTX +	G92 PEG16x	128/64	738	1100(2200)	512/1024 GDDR3	70.4 (256)	47200	11800
GeForce 9800 GX2	2xG92 PEG16x	2 برابر (64/128)	600	1000(2000)	2x512 GDDR3	2x64.0 (2x256)	76800	19200
GeForce GTS 250	G92 PEG16x	128/64	738	1100(2200)	512/1024 GDDR3	70.4 (256)	47200	11800
نقشه	تراشه لاستیک	بلوک های ALU / TMU	فرکانس هسته (مگاهرتز)	فرکانس حافظه (مگاهرتز)	اندازه حافظه (مگابایت)	پهنای باند حافظه (GB)	نرخ texel (mtex)	فیل نرخ (Mpix)

جزئیات: G80 ، خانواده GeForce 8800

مشخصات G80

نام رسمی تراشه GeForce 8800 است
نام رمز G80
فناوری 90 نانومتری
681 میلیون ترانزیستور
معماری یکپارچه با آرایه ای از پردازنده های مشترک برای جریان پردازش راس و پیکسل و سایر انواع ممکن داده ها
پشتیبانی سخت افزاری از جدیدترین نوآوری های DirectX 10 ، از جمله مدل جدید shader - Shader Model 4.0 ، تولید هندسه و ضبط داده های میانی از Shader (خروجی جریان)
باس حافظه 384 بیتی ، 6 کنترل کننده مستقل ، 64 بیت عرض ، پشتیبانی از GDDR4
هسته اصلی 575 گیگاهرتز (GeForce 8800 GTX)
128 ALU نقطه شناور مقیاس دار (قالب های صحیح و نقطه شناور ، پشتیبانی از دقت 32 بیتی FP در استاندارد IEEE 754 ، MAD + MUL بدون افت ساعت)
ALU ها بیش از دو برابر فرکانس کار می کنند (1.35 گیگاهرتز برای 8800 GTX)
32 واحد بافت ، پشتیبانی از اجزای FP16 و FP32 در بافت
64 بلوک فیلتر دو خطی (به عنوان مثال فیلتر سه بعدی رایگان صادق امکان پذیر است ، و همچنین فیلتر ناهمسانگرد دو برابر کارآمدتر در سرعت)
- اندازه بلوک برنامه ریزی - 8x4 (32) پیکسل.
6 بلوک ROP عریض (24 پیکسل) با پشتیبانی از حالت های ضد تعریض تا 16 نمونه در هر پیکسل ، از جمله با فرمت بافر قاب FP16 یا FP32 (یعنی HDR + AA امکان پذیر است). هر بلوک از مجموعه ای از ALU با قابلیت تنظیم انعطاف پذیر تشکیل شده و وظیفه تولید و مقایسه ترکیب Z ، MSAA را دارد. حداکثر عملکرد کل زیر سیستم تا 96 نمونه MSAA (+ 96 Z) در هر چرخه ، در حالت فقط Z - 192 نمونه در هر چرخه است.
همه رابط ها به یک تراشه اضافی NVIO خارجی (2 RAMDAC ، 2 Dual DVI ، HDMI ، HDTV) منتقل می شوند
مقیاس پذیری بسیار خوب معماری ، شما می توانید کنترل کننده های حافظه و ROP ها (در کل 6) ، واحدهای سایه بان (در کل 8 TMU + ALU) را یکی یکی مسدود یا حذف کنید

مشخصات کارت مرجع GeForce 8800 GTX

فرکانس هسته 575 مگاهرتز
فرکانس پردازنده های عمومی 1350 مگاهرتز
تعداد واحدهای بافت - 32 واحد واحد - 24 واحد
ظرفیت حافظه 768 مگابایت
پهنای باند حافظه 86.4 گیگابایت در ثانیه.
حداکثر سرعت پرش نظری 13.8 گیگاپیکسل در ثانیه.
نرخ نمونه گیری از تئوری بافت 18.4 گیگاتکسل در ثانیه است.
کانکتور SLI
اتوبوس PCI-Express 16x
MSRP 599 دلار

مشخصات کارت مرجع GeForce 8800 GTS

فرکانس هسته 500 مگاهرتز
فرکانس پردازنده های هدف عمومی 1200 مگاهرتز
تعداد پردازنده های جهانی 96
تعداد واحدهای بافت - 24 واحد واحد - 20 واحد
نوع حافظه GDDR3 ، 1.1 ns (فرکانس اسمی 2 * 900 مگاهرتز)
ظرفیت حافظه 640 مگابایت
حداکثر سرعت پرش نظری 10.0 گیگاپیکسل در ثانیه.
نرخ نمونه گیری نظری بافت 12.0 گیگاتکسل در ثانیه است.
دو رابط DVI-I (Dual Link ، خروجی را در رزولوشن تا 2560x1600 پشتیبانی می کند)
کانکتور SLI
اتوبوس PCI-Express 16x
پشتیبانی از TV-Out ، HDTV-Out ، HDCP
قیمت پیشنهادی 449 دلار

معماری

ما مدتها منتظر انتقال به معماریهای گرافیکی یکپارچه بوده ایم. اکنون می توانیم این واقعیت را بیان کنیم - با ظهور GeForce 8800 ، این انتقال اتفاق افتاده است و قله حساس نیز قبلاً عبور کرده است. این امر با نزول تدریجی چنین معماری هایی به بخش های متوسط \u200b\u200bو بودجه ای و توسعه بیشتر آنها ، تا ادغام با معماری های پردازنده چند هسته ای در طولانی مدت ، به دنبال خواهد داشت. بنابراین ، بیایید با اولین معماری متحد NVIDIA آشنا شویم:

این نمودار کامل تراشه است. این تراشه از 8 واحد محاسباتی جهانی (پردازنده های سایه بان) تشکیل شده است ، و اگرچه NVIDIA از 128 پردازنده صحبت می کند ، با بیان اینکه هر ALU چنین است ، تا حدودی نادرست است - واحد اجرای دستورالعمل یک واحد پردازنده است که در آن 4 TMU و 16 ALU گروه بندی می شوند. در کل ، بنابراین ، 128 ALU و 32 TMU داریم ، اما میزان اجرای آن 8 بلوک است ، هر کدام از آنها در یک لحظه می توانند کار خود را انجام دهند ، برای مثال ، بخشی از یک راس یا پیکسل یا سایه زن هندسه را روی یک بلوک 32 پیکسلی (یا یک بلوک از تعداد راس ها و سایر موارد اولیه مربوطه). همه شاخه ها ، انتقال ها ، شرایط و غیره کاملاً روی یک بلوک اعمال می شوند و بنابراین منطقی است که آن را پردازنده سایه بان بنامیم ، البته بسیار گسترده.

هر پردازنده از این دست به حافظه نهان سطح اول مخصوص خود مجهز است که اکنون نه تنها بافت ها ، بلکه سایر داده های قابل درخواست پردازنده سایه بان را نیز در خود ذخیره می کند. مهم است که درک کنیم جریان اصلی داده ، به عنوان مثال پیکسل یا رئوس ، که پردازش می شوند و در یک دایره تحت کنترل کاردینال خاکستری حرکت می کنند (بلوک مشخص شده در نمودار پردازنده موضوع) ، ذخیره نمی شوند ، بلکه جریان هستند ، که جذابیت اصلی گرافیک امروز است معماری - عدم دسترسی کاملاً تصادفی در سطح اولیه های پردازش شده.

علاوه بر واحد کنترل و 8 پردازنده سایه زن محاسباتی ، 6 ROP وجود دارد که تشخیص قابلیت مشاهده ، نوشتن در بافر قاب و MSAA (آبی ، کنار بلوک های حافظه نهان L2) را با کنترل کننده های حافظه گروه بندی می کند ، صف های نوشتن و حافظه نهان L2 را انجام می دهد.

بنابراین ، ما یک معماری بسیار گسترده (8 بلوک ، پردازش هر قسمت 32 پیکسل) داریم که می تواند در هر دو جهت هموار شود. افزودن یا از بین بردن کنترل کننده های حافظه و پردازنده های سایه بان ، پهنای باند کل سیستم را بر اساس آن مقیاس می زند ، بدون بر هم زدن تعادل یا ایجاد گلوگاه ها. این یک راه حل منطقی و زیبا است که مزیت اصلی معماری واحد - تعادل خودکار و بهره وری بالا از استفاده از منابع موجود را اجرا می کند.

علاوه بر واحدهای سایه بان و ROP ها ، مجموعه ای از واحدهای کنترل و مدیریت وجود دارد:

بلوکی که داده ها را با فرمت های مختلف (Vertex ، Geometry و Pixel Thread Issue) برای اجرا راه اندازی می کند ، نوعی دروازه بان است که داده ها را برای خرد کردن تعداد پردازنده های سایه بان مطابق با قالب داده ، سایه بان کنونی و وضعیت آن ، شرایط انشعاب و غیره آماده می کند.
Setup / Raster / ZCull - بلوکی که رئوس را به پیکسل تبدیل می کند - در اینجاست که نصب انجام می شود ، مثلث را به بلوک های 32 پیکسل تبدیل می کنیم ، بلوک مقدماتی HSR.
Input Assembler بلوکی است که داده های اولیه هندسی و دیگر حافظه سیستم یا حافظه محلی را انتخاب می کند و ساختارهای داده منبع را از جریان هایی که از خارج به ورودی "چرخ فلک" ما می رود ، جمع می کند. و در خروجی ، پس از دایره های زیاد تحت کنترل تنظیمات راس ، هندسی ، پیکسل سایه زن و ترکیب ، ما پیکسل های بلوک ROP را آماده (و در صورت لزوم صاف) می کنیم.

به هر حال ، یک انحراف کوچک: به وضوح دیده می شود که در آینده این بلوک ها شخصیت عمومی تری پیدا می کنند و به انواع خاصی از سایه بان ها گره نخواهند خورد. آنهایی که به سادگی به بلوک های جهانی تبدیل می شوند که داده ها را برای محاسبه و تبدیل قالب راه اندازی می کنند - به عنوان مثال ، از یک سایه به سایه دیگر ، از راس به پیکسل و غیره این هیچ تغییری اساسی در معماری ایجاد نمی کند ، نمودار تقریباً یکسان خواهد بود ، به استثنای تعداد کمتری از بلوک های ویژه "خاکستری". در حال حاضر ، هر سه بلوک Thread Issue به احتمال زیاد (واقعاً) یک بلوک با عملکردهای مشترک و اضافات متنی هستند:

پردازنده Shader و TMU / ALU آن

بنابراین ، در هر یک از 8 واحد سایه بان 16 ALU مقیاس وجود دارد. که باز هم به ما امکان می دهد فارغ از کد سایه بان ، کارایی بار آنها را تا 100٪ افزایش دهیم. ALU ها با دو برابر فرکانس کار می کنند و بنابراین از 8 ALU بردار چهار م componentلفه (G70) به سبک قدیمی با همان فرکانس هسته اصلی مطابقت دارند یا فراتر از آن هستند NVIDIA محاسبه زیر را برای عملکرد اوج انجام می دهد:

با این حال ، این برای مضرترین گزینه برای دیگران معتبر است ، هنگامی که دو ضرب اتفاق می افتد. در زندگی واقعی ، ارزش این است که این مزیت را به نصف یا تقریبا تقسیم کنید. اما ، در هر صورت ، این ALU های مقیاس دار به دلیل فرکانس ساعت بالاتر و تعداد آنها از همه تراشه های موجود گذشته سبقت می گیرد. شاید به جز پیکربندی SLI G71 ، در مورد سایه زنی هایی که از نظر معماری جدید از مزیت های بالایی برخوردار نیستند.

جالب اینجاست که دقت تمام ALU ها FP32 است و با توجه به معماری جدید ، هیچ برتری برای سایه بان های FP16 با دقت کم پیش بینی نمی کنیم. نکته جالب دیگر پشتیبانی از محاسبات در قالب عدد صحیح است. این مورد برای پیاده سازی SM4 لازم است. هنگام اجرای حساب ، استاندارد IEEE 754 رعایت می شود ، که آن را برای محاسبات جدی غیر بازی - علمی ، آماری ، اقتصادی و غیره مناسب می کند.

اکنون در مورد تعامل واحدهای بافت و ALU ها در یک واحد سایه بان:

عملیات نمونه برداری و فیلتر کردن بافت ها به منابع ALU نیازی ندارد و اکنون می توان کاملاً موازی با محاسبات ریاضی انجام داد. تولید مختصات بافت (در نمودار - آ) هنوز مقداری از وقت ALU را اشغال می کند. این منطقی است اگر بخواهیم از ترانزیستورهای تراشه در 100٪ استفاده کنیم ، زیرا تولید مختصات بافت به عملیات شناور استاندارد نیاز دارد و شروع کار ALU های جداگانه برای آن عاقلانه نیست.

واحدهای بافت خود پیکربندی زیر را دارند:

4 ماژول برای آدرس دهی به بافت های TA (تعیین مختصات آدرس دقیق برای نمونه برداری) و دو برابر بیشتر ماژول ها برای فیلتراسیون دو خطی TF وجود دارد. چرا؟ این اجازه می دهد تا ، با مصرف متوسط \u200b\u200bترانزیستورها ، فیلتر سه خطی صادقانه رایگان فراهم کنیم یا با فیلتر ناهمسانگرد ، سرعت را به نصف کاهش دهیم. سرعت در رزولوشن های معمولی ، در فیلترهای معمولی و بدون AA مدت زیادی بی معنی بوده است - و نسل قبلی شتاب دهنده ها در چنین شرایطی به خوبی کنار می آیند. تراشه جدید همچنین از فرمت های بافت FP16 / FP32 و همچنین اصلاح گامای SRGB در ورودی (TMU) و خروجی (ROP) پشتیبانی می کند.

در اینجا مشخصات مدل سایه بان پردازنده های جدید که مطابق با نیازهای SM4 هستند آورده شده است:

تغییرات کمی و کیفی قابل توجهی وجود دارد - محدودیت های کمتر و کمتری برای سایه بان ها ، بیشتر و بیشتر مشترک با CPU. تا کنون ، بدون دسترسی تصادفی زیاد (چنین عملیاتی در SM4 ظاهر شده است - مورد Load Op در نمودار ، اما اثربخشی آن برای اهداف عمومی هنوز مورد سوال است ، به خصوص در اولین اجرای) ، اما شکی نیست که این جنبه به زودی به عنوان در طول این 5 سال ، پشتیبانی از فرمت های FP - از اولین نمونه ها در NV30 گرفته تا خط لوله FP32 ، پایان به پایان FP32 در همه حالت ها - در G80.

همانطور که به یاد داریم ، علاوه بر 8 واحد سایه بان ، 6 واحد ROP وجود دارد:

نمودار دو مسیر جداگانه برای Z و C نشان می دهد ، اما در واقع این فقط یک مجموعه از ALU ها است که هنگام پردازش پیکسل ها با رنگ به دو گروه تقسیم می شوند یا هنگام پردازش در حالت Z-Only به عنوان یک گروه عمل می کنند ، در نتیجه توان دو برابر می شود. امروزه ، شمردن پیکسل های جداگانه منطقی نیست - تعداد کافی از آنها در حال حاضر وجود دارد ، محاسبه اینکه چند نمونه MSAA می توانند در هر چرخه پردازش شوند ، مهمتر است. بر این اساس ، تراشه با MSAA 16x می تواند 6 پیکسل کامل در ساعت ، با 8x - 12 و غیره تولید کند. جالب است که مقیاس پذیری کار با بافر قاب در بهترین حالت است - همانطور که به یاد می آوریم ، هر واحد ROP با کنترل کننده حافظه خود کار می کند و با دستگاه های همسایه تداخل نمی کند.

و سرانجام ، پشتیبانی کامل از فرمت های فریم بافر FP32 و FP16 همراه با ضد الگوریتم ، اکنون محدودیتی برای تخیل توسعه دهندگان وجود ندارد و HDR در کل خط لوله حتی در حالت AA نیازی به تغییر توالی فریم کلی ندارد.

CSAA

همچنین یک روش جدید ضد Aliasing وجود دارد - CSAA... به زودی یک مطالعه دقیق از آن در سایت قرار خواهد گرفت ، اما در حال حاضر توجه داریم که این روش از بسیاری جهات شبیه رویکرد ATI است و همچنین با الگوهای شبه تصادفی و انتشار تعداد به مناطق هندسی همسایه سروکار دارد (لکه برداری پیکسل رخ می دهد ، پیکسل ها مرز تیز ندارند ، اما مثل اینکه یکی به دیگری با اصطلاح AA ، منطقه خاصی را پوشش می دهد). علاوه بر این ، رنگ نمونه ها و عمق جدا از اطلاعات مربوط به مکان آنها ذخیره می شود ، بنابراین 16 نمونه می توانند روی یک پیکسل قرار بگیرند ، اما به عنوان مثال ، فقط 8 مقدار عمق محاسبه شده - که علاوه بر این باعث صرفه جویی در پهنای باند و چرخه های ساعت می شود.

شناخته شده است که MSAA کلاسیک در حالت های بزرگتر از 4 برابر از نظر حافظه بسیار طاقت فرسا می شود ، در حالی که کیفیت هرچه کمتر رشد می کند. روش جدید با اصلاح هزینه های محاسباتی قابل مقایسه با MSAA 4 برابر ، این حالت را اصلاح می کند و اجازه می دهد یک حالت 16 برابر ضد الگوریتم به وضوح بهتر از 16 برابر MSAA به دست آید.

NVIO

نوآوری دیگر در G80 رابط های خارج از تراشه شتاب دهنده اصلی است. یک تراشه جداگانه به نام NVIO اکنون مسئول آنها است:

این تراشه ادغام می شود:

2 * 400 مگاهرتز RAMDAC
2 * DVI دوگانه (یا LVDS)
HDTV-Out

زیر سیستم خروجی به این شکل است:

دقت همیشه 10 بیت در هر جز component است. البته ، در بخش متوسط \u200b\u200bو حتی بیشتر از آن در راه حل های بودجه ، ممکن است یک تراشه خارجی جداگانه حفظ نشود ، اما برای کارت های گران قیمت این راه حل مزایای بیشتری نسبت به معایب دارد. رابط ها سطح قابل توجهی از تراشه را اشغال می کنند ، وابستگی زیادی به تداخل دارند و به منبع تغذیه ویژه نیاز دارند. با حذف همه این مشکلات با یک تراشه خارجی ، می توانید کیفیت خروجی و انعطاف پذیری پیکربندی را بدست آورید ، در حالی که با در نظر گرفتن حالت های بهینه RAMDAC های داخلی ، طراحی یک تراشه پیچیده را نیز ساده تر می کنید.

جزئیات: G84 / G86 ، GeForce 8600 و 8500 خانواده

مشخصات G84

نام رسمی تراشه GeForce 8600 است
نام رمز G84
فناوری 80 نانومتر
289 میلیون ترانزیستور
فرکانس هسته تا 675 مگاهرتز (GeForce 8600 GTS)
ALU ها بیش از دو برابر فرکانس کار می کنند (1.45 گیگاهرتز برای GeForce 8600 GTS)
16 واحد بافت ، پشتیبانی از اجزای FP16 و FP32 در بافت
16 بلوک فیلتر دو خطی (در مقایسه با G80 ، امکان فیلتر سه خطی رایگان و فیلتر ناهمسانگرد کارآمدتر از نظر سرعت وجود ندارد)
امکان انشعاب پویا در سایه اندازهای پیکسل و راس
ثبت نتایج تا حداکثر 8 بافر فریم به طور همزمان (MRT)

مشخصات کارت مرجع GeForce 8600 GTS

فرکانس هسته 675 مگاهرتز
فرکانس پردازنده های جهانی 1450 مگاهرتز
نوع حافظه GDDR3
ظرفیت حافظه 256 مگابایت
پهنای باند حافظه 32.0 گیگابایت در ثانیه.
حداکثر سرعت پرش نظری 5.4 گیگاپیکسل در ثانیه.
نرخ نمونه برداری نظری 10.8 گیگاتکسل در ثانیه.
مصرف برق تا 71 وات
کانکتور SLI
اتوبوس PCI-Express 16x
پشتیبانی از TV-Out ، HDTV-Out ، HDCP
قیمت پیشنهادی 199-229 دلار

مشخصات مرجع GeForce 8600 GT

فرکانس هسته 540 مگاهرتز
فرکانس پردازنده های عمومی 1180 مگاهرتز
تعداد پردازنده های جهانی 32
تعداد واحدهای بافت - 16 (به مصنوعی مراجعه کنید) ، واحدهای ترکیب - 8
نوع حافظه GDDR3
ظرفیت حافظه 256 مگابایت
پهنای باند حافظه 22.4 گیگابایت در ثانیه.
حداکثر سرعت پرش نظری 4.3 گیگاپیکسل در ثانیه.
سرعت نمونه برداری از تئوری بافتی 8.6 گیگاتکسل در ثانیه.
مصرف برق تا 43 وات
کانکتور SLI
اتوبوس PCI-Express 16x
قیمت پیشنهادی 149-159 دلار

مشخصات G86

نام رسمی تراشه GeForce 8500 است
نام رمز G86
فناوری 80 نانومتر
210 میلیون ترانزیستور
معماری یکپارچه با آرایه ای از پردازنده های مشترک برای پخش راس ، پیکسل و انواع دیگر داده ها
پشتیبانی سخت افزاری از DirectX 10 ، از جمله مدل جدید shader - Shader Model 4.0 ، تولید هندسه و ضبط داده های میانی از سایه بان ها (خروجی جریان)
حافظه حافظه 128 بیتی ، دو کنترل کننده 64 بیتی مستقل
فرکانس اصلی تا 450 مگاهرتز (GeForce 8500 GT)
ALU ها با دو فرکانس کار می کنند (900 مگاهرتز برای GeForce 8500 GT)
16 ALU نقطه شناور مقیاس دار (قالب های صحیح و نقطه شناور ، پشتیبانی از دقت 32 بیتی FP در استاندارد IEEE 754 ، MAD + MUL بدون افت ساعت)
8 واحد بافت ، پشتیبانی از اجزای FP16 و FP32 در بافت
8 بلوک فیلتر دو خطی (در مقایسه با G80 ، امکان فیلتر سه بعدی رایگان و فیلتر ناهمسانگرد کارآمدتر از نظر سرعت وجود ندارد)
امکان انشعاب پویا در سایه اندازهای پیکسل و راس
2 ROP عریض (8 پیکسل) با پشتیبانی از حالتهای ضد بیگانه تا 16 نمونه در هر پیکسل ، از جمله فریم بافر FP16 یا FP32. هر بلوک از مجموعه ای از ALU با قابلیت تنظیم انعطاف پذیر تشکیل شده و وظیفه تولید و مقایسه ترکیب Z ، MSAA را دارد. حداکثر عملکرد کل زیر سیستم تا 32 نمونه MSAA (+ 32 Z) در هر چرخه ، در حالت فقط Z - 64 نمونه در هر چرخه
ثبت نتایج تا حداکثر 8 بافر فریم به طور همزمان (MRT)
همه رابط ها (دو RAMDAC ، دو Dual DVI ، HDMI ، HDTV) روی تراشه ادغام شده اند (برخلاف تراشه NVIO خارجی در GeForce 8800)

مشخصات مرجع GeForce 8500 GT

فرکانس هسته 450 مگاهرتز
فرکانس پردازنده های جهانی 900 مگاهرتز
فرکانس حافظه موثر 800 مگاهرتز (2 * 400 مگاهرتز)
نوع حافظه DDR2
ظرفیت حافظه 256/512 مگابایت
پهنای باند حافظه 12.8 گیگابایت در ثانیه.
حداکثر سرعت نظری 3.6 گیگاپیکسل در ثانیه.
نرخ نمونه نظری بافت ها 3.6 گیگاتکسل در ثانیه است.
مصرف برق تا 40 وات
دو اتصال DVI-I Dual Link ، از خروجی با رزولوشن حداکثر 2560x1600 پشتیبانی می کند)
کانکتور SLI
اتوبوس PCI-Express 16x
TV-Out ، HDTV-Out ، پشتیبانی اختیاری از HDCP
قیمت پیشنهادی 89-129 دلار

معماری G84 و G86

مشخصات نشان می دهد که G84 در حدود یک چهارم تا یک سوم پرچمداران خط G80 است. از نظر تعداد پردازنده های جهانی ، این یک چهارم است و از نظر تعداد ROP ها و کنترل کننده حافظه - یک سوم. با استفاده از واحدهای بافت دشوارتر است ، به نظر می رسد نه یک چهارم ، بلکه نصف نیست ، ما در مورد این در زیر صحبت خواهیم کرد. G86 ، به نوبه خود ، به طور کلی چیز جالبی است - از نظر قدرت محاسبه ، فقط 1/8 G80 است و از نظر ROP هنوز همان 1/3 است. بدیهی است که NVIDIA هیچ عجله ای برای انتشار تراشه هایی که از نظر محاسباتی سریع در سطح پایین قیمت هستند ، ندارد.

سوال اصلی در اینجا - آیا همین یک چهارم و 8/1 برای رقابت با راه حل های فعلی و تراشه های AMD آینده کافی خواهد بود؟ آیا NVIDIA تعداد بلوک ها را بیش از حد کاهش داده است؟ علاوه بر این ، نمی توان گفت که هر دو تراشه از نظر تعداد ترانزیستور بسیار کم هستند ... در G84 تقریبا نیمی از ترانزیستورهای G80 ، در G86 - تقریبا یک سوم وجود دارد. به نظر می رسد که راه حل سازش است ، اگر آنها نیمی از واحدهای G80 را حفظ کنند ، تراشه برای تولید بسیار گران است و حتی با موفقیت با GeForce 8800 GTS خود رقابت می کند.

در آینده نزدیک ، به احتمال زیاد ، بر اساس فناوری 65 نانومتر ، می توان تراشه های کارآمدتری را برای بازه های قیمتی متوسط \u200b\u200bو پایین تولید کرد ، اما اکنون به این شکل درآمده است. ما عملکرد تراشه های جدید را در تست های مصنوعی و بازی در نظر خواهیم گرفت ، اما قبلاً می توان گفت که G84 و G86 به دلیل تعداد کم ALU ممکن است خیلی سریع نباشند ، به احتمال زیاد با راه حل های فعلی با قیمت مشابه مطابقت دارند.

ما در مورد جزئیات بیش از حد معماری G84 و G86 صحبت نخواهیم کرد ، تغییرات زیادی در مقایسه با G80 وجود ندارد ، همه آنچه در بررسی GeForce 8800 گفته شد معتبر باقی مانده و برای مشخصات کمی تنظیم شده است. اما هنوز ، ما نکات اصلی را که قابل توجه ما هستند شرح خواهیم داد و چندین اسلاید را به مشخصات معماری تراشه های جدید اختصاص می دهیم.

G80 از هشت واحد محاسباتی جهانی (پردازنده های سایه بان) تشکیل شده است ، NVIDIA ترجیح می دهد در مورد 128 پردازنده صحبت کند. ظاهراً واحد اجرای دستورالعمل یک واحد پردازنده کامل است که در آن 4 TMU و 16 ALU گروه بندی شده اند. هر یک از بلوک ها در یک لحظه می توانند بخشی از یک راس ، پیکسل یا سایه زن هندسی را روی یک بلوک 32 پیکسلی ، رئوس یا سایر بدوی ها اجرا کنند و همچنین می توانند محاسبات فیزیکی را انجام دهند. هر پردازنده حافظه پنهان سطح اول مخصوص به خود را دارد که بافت ها و سایر داده ها را ذخیره می کند. علاوه بر واحد کنترل و پردازنده های سایه زن محاسباتی ، شش ROP وجود دارد که قابلیت تشخیص دید ، نوشتن در بافر فریم و MSAA را دارند ، با کنترل کننده های حافظه ، صف های نوشتن و کش سطح دوم گروه بندی می شوند.

این معماری قادر به مقیاس گذاری در هر دو جهت است که در راه حل های جدید انجام شده است. ما قبلاً به این راه حل زیبا اشاره کرده ایم که مزیت اصلی معماری واحد - تعادل خودکار و بهره وری بالای استفاده از منابع موجود را در مقاله GeForce 8800 پیاده سازی می کند. همچنین فرض بر این بود که یک راه حل سطح متوسط \u200b\u200bشامل نیمی از واحدهای محاسباتی و یک راه حل مبتنی بر دو پردازنده سایه بان است. و یک ROP بودجه خواهد بود. متأسفانه ، اگر GeForce 8800 دارای هشت پردازنده متشکل از 32 TMU و 128 ALU بود ، تعداد آنها در تراشه های جدید بیش از آنچه در ابتدا انتظار داشتیم کاهش یافت. ظاهراً مدار G84 به این شکل است:

یعنی همه چیز بدون تغییر باقی مانده است ، به جز تعداد بلوک ها و کنترل کننده های حافظه. تغییرات کوچکی در رابطه با واحدهای بافت وجود دارد که در این شکل قابل توجه است ، اما بعداً در مورد آن صحبت خواهیم کرد. کنجکاو ، اگر فقط 32 پردازنده در G84 باقی مانده است ، این همه ترانزیستور کجا رفت؟ G84 تقریباً نیمی از ترانزیستورها را در مقایسه با G80 با تعداد قابل توجهی کاهش یافته کانال حافظه ، ROP ها و پردازنده های سایه بان دارد. و G86 ترانزیستورهای زیادی دارد و فقط 16 پردازنده دارد ...

همچنین جالب است که چقدر در برنامه های واقعی بار بین اجرای راس ، پیکسل و سایه های هندسه متعادل می شود ، زیرا تعداد واحدهای اجرای جهانی اکنون بسیار کمتر شده است. علاوه بر این ، معماری یکپارچه چالش های جدیدی را برای توسعه دهندگان ایجاد می کند ؛ هنگام استفاده از آن ، باید در مورد چگونگی استفاده موثر از کل قدرت بین سایه اندازهای راس ، پیکسل و هندسه فکر کنید. بیایید یک مثال ساده بزنیم - بر محاسبات پیکسل تمرکز کنید. در این حالت ، افزایش بار بلوک های راس در یک معماری سنتی منجر به افت عملکرد نمی شود ، در حالی که در یک معماری واحد باعث تغییر تعادل و کاهش منابع برای محاسبات پیکسل می شود. ما قطعاً موضوع عملکرد را مورد بررسی قرار خواهیم داد ، و اکنون به مطالعه تغییرات معماری G84 و G86 ادامه خواهیم داد.

پردازنده Shader و TMU / ALU

طرح واحدهای سایه بان و ارزیابی اوج عملکرد محاسباتی G80 در مقاله مربوطه آورده شده است ، برای G84 و G86 این طرح تغییری نکرده است و عملکرد آنها به راحتی قابل محاسبه است. ALU ها در تراشه ها نیز با دو برابر فرکانس کار می کنند و مقیاس پذیر هستند ، که امکان بهره وری بالا را فراهم می کند. در عملکرد نیز هیچ تفاوتی وجود ندارد ، دقت همه ALU ها FP32 است ، از محاسبات در قالب عدد صحیح پشتیبانی می شود و اجرای آن مطابق با استاندارد IEEE 754 است که برای محاسبات علمی ، آماری ، اقتصادی و سایر موارد مهم است.

اما واحدهای بافت در مقایسه با موارد استفاده شده در G80 تغییر کرده اند. NVIDIA اطمینان می دهد که برای افزایش عملکرد پردازنده های یکپارچه ، تغییرات معماری در تراشه های جدید ایجاد شده است. در G80 ، هر واحد بافت می تواند چهار آدرس بافت را محاسبه کرده و هشت عملیات فیلتراسیون بافت را در هر چرخه انجام دهد. ادعا می شود که در تراشه های جدید عدد اول دو برابر شده است ، و این توانایی دو برابر تعداد نمونه های بافت را دارد. یعنی واحدهای بافت G84 و G86 از پیکربندی زیر برخوردار هستند (برای مقایسه ، نمودار بلوک G80 در سمت چپ نشان داده شده است):

طبق NVIDIA ، اکنون هر یک از بلوک ها دارای هشت ماژول آدرس دهی بافت (تعریف با مختصات آدرس دقیق برای نمونه برداری) TA و دقیقاً به همان تعداد ماژول فیلتر دو خطی (TF) است. G80 دارای چهار ماژول TA و هشت TF بود که امکان تهیه فیلتر سه خطی "رایگان" با کاهش مصرف ترانزیستور یا کاهش سرعت با فیلتراسیون ناهمسانگرد را نصف می کند ، که به طور خاص برای شتاب دهنده های سطح بالا مفید است ، جایی که فیلترهای ناهمسانگرد تقریباً همیشه توسط کاربران استفاده می شود. ما صحت این اطلاعات را در بخش عملی بررسی خواهیم کرد ، حتماً به تجزیه و تحلیل آزمایش های مصنوعی مربوطه نگاه کنید ، زیرا آنها با این داده ها مغایرت دارند.

تمام عملکردهای دیگر واحدهای بافت یکسان است ، فرمت های بافت FP16 / FP32 و سایر موارد پشتیبانی می شوند. فقط اگر در G80 FP16 به دلیل دو برابر شدن تعداد فیلترها ، فیلتر فیلتر نیز با سرعت کامل بود ، این دیگر در محلول های سطح متوسط \u200b\u200bو پایین نیست (دوباره با مشروط بر اینکه تغییرات فوق واقعاً وجود داشته باشد).

بلوک های ROP ، نوشتن در فریم بافر ، ضد الگوریتم

ROP ها ، که شش مورد در G80 و دو مورد در تراشه های جدید بودند ، تغییری نکرده اند:

هر یک از بلوک ها چهار پیکسل (16 زیر پیکسل) را پردازش می کند ، در مجموع 8 پیکسل در هر ساعت برای رنگ و Z است. در حالت فقط Z ، دو برابر نمونه در هر ساعت پردازش می شود. با MSAA 16x ، تراشه می تواند دو پیکسل در هر ساعت ، با 4x - 8 و غیره ارائه دهد. همانند G80 ، پشتیبانی کامل از فرمت های بافر با فریم FP32 و FP16 همراه با ضداسازی وجود دارد.

روش ضداسه زنی جدید شناخته شده از GeForce 8800 پشتیبانی می شود - Antialiasing Coverage Sampled Antialiasing (CSAA) ، که به تفصیل در مواد مربوطه شرح داده شده است:

به طور خلاصه ، ماهیت روش این است که رنگ نمونه ها و عمق جدا از اطلاعات مربوط به مکان آنها ذخیره می شود ، می تواند 16 نمونه در هر پیکسل وجود داشته باشد و فقط 8 مقدار عمق محاسبه شده ، که باعث صرفه جویی در پهنای باند و چرخه های ساعت می شود. CSAA با ارائه اطلاعات بیشتر در مورد چگونگی همپوشانی این پیکسل در لبه های مثلث ، نیاز به انتقال و ذخیره یک رنگ یا مقدار Z را برای هر زیر پیکسل از بین می برد و مقدار متوسط \u200b\u200bیک پیکسل صفحه را اصلاح می کند. در نتیجه ، روش جدید امکان به دست آوردن حالت 16 برابر ضد الگوریتم را می دهد که بسیار بهتر از MSAA 4x است و هزینه های محاسباتی قابل مقایسه با آن است. و در موارد نادر ، که روش CSAA کارساز نباشد ، MSAA معمول با درجه کمتر و عدم وجود کامل ضداسه زنی بدست می آید.

PureVideo HD

بیایید به جالب ترین تغییرات برویم. به نظر می رسد که G84 و G86 دارای نوآوری هایی هستند که حتی از G80 را نیز به طرز مطلوبی متمایز می کند! این مربوط به پردازنده ویدئویی یکپارچه است که در تراشه های جدید پشتیبانی گسترده ای از PureVideo HD دریافت کرده است. گفته شده است که این تراشه ها هنگام رمزگشایی انواع داده های رایج ویدیویی ، از جمله "سنگین ترین" فرمت H.264 ، پردازنده مرکزی سیستم را کاملاً تخلیه می کنند.

G84 و G86 از مدل جدیدی از پردازنده ویدئویی قابل برنامه ریزی PureVideo HD استفاده می کنند که نسبت به نمونه مورد استفاده در G80 از قدرت بیشتری برخوردار است و موتور به اصطلاح BSP را شامل می شود. پردازنده جدید از رمزگشایی فرمت های H.264 ، VC-1 و MPEG-2 با رزولوشن 1920x1080 و بیت ریت تا 30-40 مگابیت بر ثانیه پشتیبانی می کند ، این کار تمام رمزگشایی داده های CABAC و CAVLC را به صورت سخت افزاری انجام می دهد که به شما امکان می دهد تمام HD-DVD های موجود را بازی کنید و دیسک های Blu-ray حتی در رایانه های شخصی یک هسته ای میان رده.

پردازنده ویدئویی در G84 / G86 از چندین قسمت تشکیل شده است: خود پردازنده ویدئو نسل دوم (VP2) که وظایف IDCT ، جبران حرکت و رفع انسداد را برای فرمت های MPEG2 ، VC-1 و H.264 انجام می دهد که از رمزگشایی سخت افزاری جریان دوم پشتیبانی می کند. یک پردازشگر جریان (BSP) که وظایف رمزگشایی آماری CABAC و CAVLC را برای قالب H.264 انجام می دهد و این یکی از وقت گیرترین محاسبات است. AES128 موتور رمزگشایی داده محافظت شده ، که هدف آن از نام آن مشخص است - این رمزگشایی داده های ویدیویی مورد استفاده در محافظت از کپی در دیسک های Blu-ray و HD-DVD است. تفاوت در میزان پشتیبانی سخت افزاری برای رمزگشایی ویدیو در تراشه های ویدیویی مختلف به این ترتیب است:

وظایفی که توسط تراشه ویدیویی انجام می شود با رنگ آبی و پردازنده مرکزی با سبز برجسته می شوند. همانطور که می بینید ، اگر نسل قبلی فقط در بعضی کارها به پردازنده کمک می کرد ، پردازنده ویدیویی جدیدی که در جدیدترین تراشه ها استفاده می شود ، همه کارها را به تنهایی انجام می دهد. ما اثرات راه حل های موجود در مواد آینده را در مورد بررسی اثربخشی رمزگشایی ویدئویی سخت افزاری بررسی خواهیم کرد ، در حالی که NVIDIA ارقام زیر را در مواد ارائه می دهد: هنگام استفاده از پردازنده مدرن دو هسته ای و رمزگشایی نرم افزار از داده ها ، پخش دیسک های Blu-ray و HD-DVD تا 90 تا 100٪ زمان پردازنده را می خورد ، با رمزگشایی سخت افزاری روی تراشه ویدیویی نسل قبلی روی همان سیستم - حداکثر 60-70٪ و با موتور جدیدی که آنها برای G84 و G86 تولید کرده اند - فقط 20٪. این ، البته ، به نظر می رسد رمزگشایی کاملاً سخت افزاری اعلام شده نیست ، اما هنوز هم بسیار بسیار کارآمد است.

در زمان اعلام این خبر ، ویژگی های جدید معرفی شده در PureVideo HD فقط در نسخه 32 بیتی ویندوز ویستا کار می کنند و پشتیبانی PureVideo HD در ویندوز XP فقط در تابستان ظاهر می شود. در مورد کیفیت پخش ویدئو ، پردازش پس از آن ، deinterlacing و غیره ، NVIDIA حتی در GeForce 8800 با این کار موارد را بهبود بخشید و تراشه های جدید از این نظر تفاوت چندانی ندارند.

محاسبات CUDA ، غیر بازی و فیزیک

در مقاله GeForce 8800 ذکر شده است که افزایش عملکرد اوج حساب شناور در شتاب دهنده های جدید و انعطاف پذیری ساختار سایه بان متحد برای محاسبه فیزیک در برنامه های بازی و حتی مشکلات جدی تر کافی است: مدل سازی ریاضی و فیزیکی ، مدل ها و محاسبات اقتصادی و آماری ، تشخیص الگو ، تصویربرداری ، گرافیک علمی و موارد دیگر. برای این منظور ، یک API ویژه محاسباتی گرا منتشر شد که برای سازگاری و توسعه برنامه هایی که محاسبات را به GPU منتقل می کنند - CUDA (Compute Unified Device Architecture) مناسب است.

برای کسب اطلاعات بیشتر در مورد CUDA ، به مقاله G80 مراجعه کنید ، ما اخیراً به یک روند مرسوم دیگر خواهیم پرداخت - پشتیبانی از محاسبات فیزیک در GPU. NVIDIA این فناوری را کوانتوم افکت می نامد. اعلام شده است که تمام تراشه های ویدئویی نسل جدید ، از جمله G84 و G86 که امروزه در نظر گرفته شده اند ، برای محاسبات از این نوع مناسب هستند و امکان انتقال بخشی از بار را از CPU به GPU دارند. شبیه سازی دود ، آتش ، انفجار ، پویایی مو و لباس ، پشم و مایعات و موارد دیگر به عنوان مثالهای عینی ذکر شده است. اما فعلاً می خواهم درباره چیز دیگری بیشتر بنویسم. واقعیت این است که تاکنون فقط تصاویری از برنامه های آزمایشی با تعداد زیادی اشیا calculated فیزیکی محاسبه شده توسط تراشه های ویدیویی به ما نشان داده شده است و تاکنون حتی بوی بازی هایی با چنین پشتیبانی نیز نمی دهد.

پشتیبانی از رابط خارجی

همانطور که به یاد داریم ، در GeForce 8800 تا حدودی از یک نوآوری غیرمنتظره دیگر غافلگیر شدیم - یک تراشه اضافی که از رابط های خارجی خارج از اصلی پشتیبانی می کند. در مورد کارت های ویدیویی برتر ، این وظایف توسط تراشه جداگانه ای به نام NVIO انجام می شود که یکپارچه می شود: دو RAMDAC 400 مگاهرتزی ، دو Dual Link DVI (یا LVDS) ، HDTV-Out. حتی در آن زمان ، ما فرض کردیم که یک تراشه خارجی جداگانه به سختی در بخشهای میانی و پایین باقی خواهد ماند و این همان چیزی است که در واقع اتفاق افتاده است. در G84 و G86 ، پشتیبانی از همه این رابط ها در خود تراشه تعبیه شده است.

GeForce 8600 GTS به دو خروجی Dual Link DVI-I با پشتیبانی HDCP مجهز شده است ، این اولین کارت گرافیک در بازار با چنین قابلیت هایی (HDCP و Dual Link با هم) است. همانطور که برای HDMI ، پشتیبانی از این اتصال به طور کامل در سخت افزار پیاده سازی شده است و توسط تولید کنندگان بر روی کارت های مخصوص طراحی قابل اجرا است. اما GeForce 8600 GT و 8500 GT از HDCP و HDMI پشتیبانی می کنند اختیاری است ، اما ممکن است توسط تولید کنندگان جداگانه در محصولات خود اجرا شود.

جزئیات: خانواده G92 ، GeForce 8800

مشخصات G92

نام رمز تراشه G92
فناوری 65 نانومتر
754 میلیون ترانزیستور (بیشتر از G80)
معماری یکپارچه با آرایه ای از پردازنده های مشترک برای پخش راس ، پیکسل و انواع دیگر داده ها
هسته اصلی 600 مگاهرتز (GeForce 8800 GT)
ALU با فرکانس بیش از دو برابر کار می کنند (1.5 گیگاهرتز برای GeForce 8800 GT)
112 (این مربوط به GeForce 8800 GT است و در مجموع احتمالاً 128 دستگاه وجود دارد) ALU های نقطه شناور مقیاسی (قالب های صحیح و نقطه شناور ، پشتیبانی از دقت 32 بیتی FP در استاندارد IEEE 754 ، MAD + MUL بدون افت ساعت)
56 (64) واحد آدرس دهی بافت با پشتیبانی از م componentsلفه های FP16 و FP32 در بافت (برای توضیحات زیر را ببینید)
56 (64) واحد فیلتر دو خطی (مانند G84 و G86 ، هیچ فیلتر سه بعدی رایگان و فیلتر ناهمسانگرد کارآمدتری وجود ندارد)
امکان انشعاب پویا در سایه اندازهای پیکسل و راس
ثبت نتایج تا حداکثر 8 بافر فریم به طور همزمان (MRT)
همه رابط ها (دو RAMDAC ، دو Dual DVI ، HDMI ، HDTV) روی تراشه ادغام شده اند (برخلاف تراشه NVIO خارجی در GeForce 8800)

مشخصات کارت مرجع GeForce 8800 GT 512MB

فرکانس هسته 600 مگاهرتز
فرکانس حافظه موثر 1.8 گیگاهرتز (2 * 900 مگاهرتز)
نوع حافظه GDDR3
ظرفیت حافظه 512 مگابایت
مصرف برق تا 110 وات
دو کانکتور DVI-I Dual Link ، از خروجی با رزولوشن 2560x1600 پشتیبانی می کند
کانکتور SLI
اتوبوس PCI Express 2.0
پشتیبانی از TV-Out ، HDTV-Out ، HDCP
قیمت پیشنهادی 249 دلار

مشخصات کارت مرجع GeForce 8800 GT 256MB

فرکانس هسته 600 مگاهرتز
فرکانس پردازنده های جهانی 1500 مگاهرتز
تعداد پردازنده های جهانی 112
تعداد واحدهای بافت - 56 واحد واحد - 16 واحد
فرکانس حافظه موثر 1.4 گیگاهرتز (2 * 700 مگاهرتز)
نوع حافظه GDDR3
ظرفیت حافظه 256 مگابایت
پهنای باند حافظه 44.8 گیگابایت در ثانیه.
حداکثر سرعت پرش نظری 9.6 گیگاپیکسل در ثانیه.
نرخ نمونه برداری از تئوری تا 33.6 گیگاتکسل در ثانیه.
مصرف برق تا 110 وات
دو کانکتور DVI-I Dual Link ، از خروجی با رزولوشن 2560x1600 پشتیبانی می کند
کانکتور SLI
اتوبوس PCI Express 2.0
پشتیبانی از TV-Out ، HDTV-Out ، HDCP
قیمت پیشنهادی 199 دلار

مشخصات کارت مرجع GeForce 8800 GTS 512MB

فرکانس هسته 650 مگاهرتز
تعداد پردازنده های جهانی 128
فرکانس حافظه موثر 2.0 گیگاهرتز (2 * 1000 مگاهرتز)
نوع حافظه GDDR3
ظرفیت حافظه 512 مگابایت
پهنای باند حافظه 64.0 گیگابایت در ثانیه.
نرخ نمونه برداری از تئوری حداکثر تا 41.6 گیگاتکسل در ثانیه.
دو کانکتور DVI-I Dual Link ، از خروجی با رزولوشن 2560x1600 پشتیبانی می کند
کانکتور SLI
اتوبوس PCI Express 2.0
پشتیبانی از TV-Out ، HDTV-Out ، HDCP
قیمت پیشنهادی 349-399 دلار

معماری تراشه G92

از نظر معماری ، G92 تفاوت زیادی با G80 ندارد. با توجه به آنچه می دانیم ، می توان گفت که G92 پرچمدار خط (G80) است که با تغییرات جزئی به یک روند فنی جدید منتقل شده است. NVIDIA در مواد خود نشان می دهد که تراشه دارای 7 واحد سایه زن بزرگ است و بر این اساس ، 56 واحد بافت و همچنین هر چهار واحد ROP گسترده ، تعداد ترانزیستورهای تراشه این شبهات را ایجاد می کند که آنها در مورد چیزی صحبت نمی کنند. در راه حل های اعلام شده اولیه ، همه بلوک های موجود در تراشه درگیر نیستند ؛ تعداد آنها در G92 بیشتر از GeForce 8800 GT است. اگرچه افزایش پیچیدگی تراشه با افزودن تراشه NVIO جداگانه و همچنین پردازنده ویدیویی نسل جدید توضیح داده شده است. علاوه بر این ، پیچیده تر بودن TMU ها بر تعداد ترانزیستورها تأثیر گذاشته است. همچنین ، به احتمال زیاد حافظه پنهان برای افزایش کارایی گذرگاه حافظه 256 بیتی افزایش یافته است.

این بار NVIDIA به منظور رقابت با تراشه های AMD مربوطه ، تصمیم گرفت تعداد زیادی بلوک را در تراشه میان رده جا بگذارد. فرض ما از بررسی G84 و G86 مبنی بر اینکه از فناوری 65 نانومتر برای تولید تراشه های بسیار کارآمدتر در محدوده قیمت متوسط \u200b\u200bاستفاده خواهد شد ، تأیید شده است. تغییرات معماری در تراشه G92 کم است و ما به طور جزئی در مورد آنها صحبت نمی کنیم. هر آنچه در بالا در مورد راه حلهای سری GeForce 8 گفته شد همچنان پابرجاست ، ما فقط برخی از نکات اصلی مشخصات معماری تراشه جدید را تکرار می کنیم.

برای راه حل جدید ، NVIDIA نمودار زیر را در اسناد خود ارائه می دهد:

یعنی از بین همه تغییرات - فقط تعداد بلوک کاهش یافته و برخی تغییرات در TMU که در زیر توضیح داده شده است. همانطور که در بالا گفته شد ، تردیدهایی وجود دارد که از نظر جسمی چنین است ، اما ما بر اساس آنچه NVIDIA می نویسد ، توصیف می کنیم. G92 از هفت واحد محاسباتی جهانی (پردازنده های سایه بان) تشکیل شده است ، NVIDIA به طور سنتی از 112 پردازنده صحبت می کند (حداقل در اولین راه حل های GeForce 8800 GT). هر یک از بلوک ها ، که 8 TMU و 16 ALU در آنها گروه بندی شده اند ، می توانند بخشی از یک راس ، پیکسل یا سایه انداز هندسه را روی یک بلوک 32 پیکسلی ، رئوس یا سایر موارد اولیه اجرا کنند و همچنین می توانند محاسبات دیگر (غیر گرافیکی) را انجام دهند. هر پردازنده حافظه پنهان سطح اول مخصوص به خود را دارد که بافت ها و سایر داده ها را ذخیره می کند. علاوه بر واحد کنترل و پردازنده های سایه زن محاسباتی ، چهار واحد ROP وجود دارد که قابلیت تشخیص دید ، نوشتن در بافر فریم و MSAA را دارند ، با کنترل کننده های حافظه ، صف های نوشتن و کش سطح دوم گروه بندی می شوند.

پردازنده های عمومی و TMU ها

طرح واحدهای سایه بان و ارزیابی اوج عملکرد محاسباتی G80 در مقاله مربوطه آورده شده است ، برای G92 تغییری نکرده است ، محاسبه مجدد عملکرد آنها براساس تغییرات در فرکانس ساعت آسان است. ALU ها در تراشه ها بیش از دو برابر فرکانس کار می کنند ، آنها مقیاس پذیر هستند ، که دستیابی به بازده بالا را امکان پذیر می کند. هنوز در مورد تفاوت های عملکردی مشخص نیست که آیا دقت محاسبه FP64 در این تراشه موجود است یا خیر. دقیقاً پشتیبانی از محاسبات در قالب عدد صحیح وجود دارد و هنگام اجرای کلیه محاسبات ، استاندارد IEEE 754 ، که برای محاسبات علمی ، آماری ، اقتصادی و سایر موارد مهم است ، مشاهده می شود.

واحدهای بافت در G92 مانند G80 نیستند ، آنها محلول TMU را در G84 و G86 تکرار می کنند ، که در آن برای افزایش کارایی تغییرات معماری ایجاد شده است. به یاد بیاورید که در G80 ، هر واحد بافت می تواند چهار آدرس بافت را محاسبه کرده و هشت عملیات فیلتراسیون بافت در هر چرخه انجام دهد ، در حالی که در G84 / G86 TMU ها قادر به دو برابر تعداد نمونه های بافت هستند. یعنی ، هر یک از بلوک ها دارای هشت ماژول آدرس دهی بافت (تعیین توسط مختصات آدرس دقیق برای نمونه برداری) TA و دقیقاً به همان تعداد ماژول فیلتر دو خطی (TF) است:

فکر نکنید 56 بلوک GeForce 8800 GT در برنامه های واقعی از 32 بلوک GeForce 8800 GTX قوی تر خواهد بود. با فعال کردن فیلتر سه بعدی و / یا ناهمسانگرد ، دومی سریعتر خواهد بود ، زیرا آنها می توانند کمی بیشتر در مورد فیلتر کردن نمونه های بافت کار کنند. ما این اطلاعات را در قسمت عملی با تجزیه و تحلیل نتایج آزمون های مصنوعی مربوطه بررسی خواهیم کرد. تمام عملکردهای دیگر واحدهای بافت تغییر نکرده است ، قالب های بافت FP16 ، FP32 و سایر موارد پشتیبانی می شوند.

بلوک های ROP ، نوشتن در فریم بافر ، ضد الگوریتم

بلوک های ROP نیز تغییر نکرده اند ، اما تعداد آنها تغییر کرده است. G80 دارای شش ROP بود و راه حل جدید دارای چهار ROP برای کاهش هزینه تولید تراشه و PCB برای کارت های ویدیو است. همچنین ، این کاهش ممکن است به این دلیل باشد که رقابت خیلی قوی برای راه حل های سطح بالا موجود ایجاد نمی کند.

هر یک از بلوک ها چهار پیکسل یا 16 زیر پیکسل را پردازش می کند که در کل 16 پیکسل در هر ساعت برای رنگ و Z است. در حالت فقط Z ، دو برابر تعداد نمونه در هر ساعت پردازش می شود. با MSAA 16x ، تراشه می تواند دو پیکسل در هر ساعت ، با 4x - 8 و غیره ارائه دهد. همانند G80 ، از فرمت های بافر با فریم FP32 و FP16 همراه با ضداسازی کاملاً پشتیبانی می شود.

روش جدید ضد Aliasing شناخته شده از تراشه های سری قبلی پشتیبانی می شود - Coverage Sampled Antialiasing (CSAA). نوآوری دیگر این است که الگوریتم ضد شفافیت شفافیت در GeForce 8800 GT به روز شده است. دو گزینه به کاربر پیشنهاد شده است: چند نمونه برداری (TRMS) و ابر نمونه برداری (TRSS) ، اولی عملکرد بسیار خوبی داشت ، اما در همه بازی ها به طور مثر کار نمی کرد ، و دوم با کیفیت بالا ، اما کند بود. GeForce 8800 GT روش جدیدی را برای سطوح شفاف چند نمونه برداری اعلام می کند که کیفیت و عملکرد آن را بهبود می بخشد. این الگوریتم تقریباً همان بهبود کیفیت نمونه برداری فوق نمونه را می دهد ، اما عملکرد بالایی دارد - فقط چند درصد بدتر از حالت بدون ضد زنگ زدن در سطوح نیمه شفاف.

PureVideo HD

یکی از تغییرات مورد انتظار در G92 پردازنده ویدئویی یکپارچه نسل دوم شناخته شده از G84 و G86 است که پشتیبانی گسترده ای از PureVideo HD دریافت کرده است. قبلاً مشخص شده است که این نسخه از پردازنده ویدئویی هنگام رمزگشایی انواع داده های ویدئویی ، از جمله فرمت های "سنگین" H.264 و VC-1 ، پردازنده را تقریباً به طور کامل بارگیری می کند.

همانند G84 / G86 ، G92 از مدل جدیدی از پردازنده ویدیویی PureVideo HD قابل برنامه ریزی استفاده می کند که شامل موتور اصطلاحاً BSP است. پردازنده جدید از رمزگشایی با فرمت های H.264 ، VC-1 و MPEG-2 با رزولوشن 1920x1080 و سرعت بیت تا 30-40 مگابیت بر ثانیه پشتیبانی می کند و کار رمزگشایی داده های CABAC و CAVLC را به صورت سخت افزاری انجام می دهد که به شما امکان می دهد تمام HD-DVD و Blu های موجود را بازی کنید درایوهای مادون قرمز حتی در رایانه های شخصی تک هسته ای با قدرت متوسط. رمزگشایی VC-1 به اندازه H.264 کارآمد نیست ، اما همچنان توسط پردازنده جدید پشتیبانی می شود.

در بخش پردازنده های ویدیویی G84 و G86 می توانید اطلاعات بیشتری در مورد پردازنده ویدئویی نسل دوم بخوانید. کار راه حل های ویدئویی مدرن تا حدی در آخرین مطالب مربوط به مطالعه اثربخشی رمزگشایی سخت افزاری داده های ویدیویی مورد آزمایش قرار گرفت.

PCI Express 2.0

یکی از نوآوری های واقعی در G92 پشتیبانی از گذرگاه PCI Express 2.0 است. نسخه دوم PCI Express پهنای باند استاندارد را دو برابر می کند ، از 2.5 Gb / s به 5 Gb / s ، در نتیجه ، اتصال x16 می تواند داده ها را با سرعت حداکثر 8 GB / s در هر جهت ، در مقابل 4 GB / s انتقال دهد. برای نسخه 1.x. این بسیار مهم است که PCI Express 2.0 با PCI Express 1.1 سازگار است و کارت گرافیک های قدیمی در مادربردهای جدید کار می کنند و کارت گرافیک های جدید با پشتیبانی از نسخه دوم بدون پشتیبانی از آن در مادربردها عملکردی باقی می مانند. البته به شرطی که منبع تغذیه خارجی کافی و بدون افزایش پهنای باند رابط وجود داشته باشد.

برای اطمینان از سازگاری معکوس با راه حلهای موجود PCI Express 1.0 و 1.1 ، مشخصات 2.0 از سرعت انتقال 2.5Gbps و 5Gbps پشتیبانی می کند. سازگاری معکوس PCI Express 2.0 به شما امکان می دهد از راه حلهای 2.5 گیگابیت بر ثانیه در اسلات های 5.0 گیگابیت بر ثانیه استفاده کنید که با سرعت کمتری کار خواهند کرد ، در حالی که دستگاهی که مطابق مشخصات نسخه 2.0 طراحی شده است می تواند سرعت 2.5 گیگابیت بر ثانیه و 5 گیگابیت بر ثانیه را پشتیبانی کند. ... از لحاظ تئوری ، همه چیز با سازگاری خوب است ، اما در عمل ، ممکن است مشکلاتی در برخی از ترکیبات مادربردها و کارتهای توسعه ایجاد شود.

پشتیبانی از رابط خارجی

همانطور که انتظار می رفت ، تراشه NVIO اضافی موجود در تابلوهای GeForce 8800 ، که از رابط های خارجی خارج از اصلی (دو RAM 400 مگاهرتز RAM ، دو Dual Link DVI (یا LVDS) ، HDTV-Out) پشتیبانی می کند ، در این مورد در تراشه موجود است ، پشتیبانی از همه این رابط ها در خود G92 تعبیه شده است.

کارت گرافیک های GeForce 8800 GT معمولاً دارای دو خروجی Dual Link DVI-I با پشتیبانی HDCP هستند. تا آنجا که به HDMI مربوط می شود ، پشتیبانی از این اتصال به طور کامل پیاده سازی شده است ؛ این می تواند توسط تولیدکنندگان روی کارت های طراحی ویژه پیاده سازی شود ، که ممکن است کمی بعد منتشر شود. اگرچه وجود رابط HDMI روی کارت گرافیک کاملاً اختیاری است ، اما با موفقیت با آداپتور DVI به HDMI جایگزین می شود که بیشتر کارتهای گرافیک مدرن را در اختیار شما قرار می دهد.

بر خلاف کارت گرافیک های AMD RADEON HD 2000 ، GeForce 8800 GT فاقد تراشه صوتی یکپارچه است که برای پشتیبانی از انتقال صدا از طریق DVI با استفاده از آداپتور به HDMI لازم است. چنین امکانی برای انتقال سیگنال های صوتی و تصویری از طریق یک اتصال ، اول از همه در کارت های سطح میانی و پایین ، که در موارد کوچک مراکز رسانه نصب شده اند ، تقاضا دارد و GeForce 8800 GT به سختی برای این نقش مناسب است.

جزئیات: G94 ، خانواده GeForce 9600

مشخصات G94

نام رمز تراشه G94
فناوری 65 نانومتر
505 میلیون ترانزیستور
معماری یکپارچه با آرایه ای از پردازنده های مشترک برای پخش راس ، پیکسل و انواع دیگر داده ها
پشتیبانی سخت افزاری از DirectX 10 ، شامل مدل سایه بان - Shader Model 4.0 ، تولید هندسه و ضبط داده های میانی از سایه بان ها (خروجی جریان)
گذرگاه حافظه 256 بیتی ، چهار کنترل کننده مستقل ، عرض 64 بیتی
فرکانس هسته 650 مگاهرتز (GeForce 9600 GT)
ALU ها بیش از دو برابر فرکانس کار می کنند (1.625 گیگاهرتز برای GeForce 9600 GT)
64 ALU نقطه شناور مقیاس دار (قالب های صحیح و نقطه شناور ، پشتیبانی از دقت 32 بیتی FP در استاندارد IEEE 754 ، MAD + MUL بدون افت ساعت)
32 واحد آدرس دهی بافت با پشتیبانی از م componentsلفه های FP16 و FP32 در بافت
32 بلوک فیلتر دو خطی (مانند G84 و G92 ، این باعث افزایش تعداد نمونه های دو خطی می شود ، اما بدون فیلتر سه بعدی رایگان و فیلتر ضد انحصاری موثر)
امکان انشعاب پویا در سایه اندازهای پیکسل و راس
4 بلوک ROP عریض (16 پیکسل) با پشتیبانی از حالت های ضد انحراف تا 16 نمونه در هر پیکسل ، از جمله فریم بافر FP16 یا FP32. هر بلوک از مجموعه ای از ALU با قابلیت تنظیم انعطاف پذیر تشکیل شده و وظیفه تولید و مقایسه ترکیب Z ، MSAA را دارد. حداکثر عملکرد کل زیر سیستم تا 64 نمونه MSAA (+ 64 Z) در هر چرخه ، در حالت فقط Z - 128 نمونه در هر چرخه
ثبت نتایج تا حداکثر 8 بافر فریم به طور همزمان (MRT)

مشخصات کارت مرجع GeForce 9600 GT

فرکانس هسته 650 مگاهرتز
فرکانس پردازنده های جهانی 1625 مگاهرتز
تعداد پردازنده های جهانی 64
تعداد واحدهای بافت - 32 واحد واحد - 16 واحد
فرکانس حافظه موثر 1.8 گیگاهرتز (2 * 900 مگاهرتز)
نوع حافظه GDDR3
ظرفیت حافظه 512 مگابایت
پهنای باند حافظه 57.6 گیگابایت در ثانیه.
حداکثر سرعت پرش نظری 10.4 گیگاپیکسل در ثانیه.
نرخ نمونه برداری از تئوری تا 20.8 گیگاتکسل در ثانیه.
دو کانکتور DVI-I Dual Link ، از خروجی با رزولوشن 2560x1600 پشتیبانی می کند
کانکتور SLI
اتوبوس PCI Express 2.0
مصرف برق تا 95 وات
قیمت پیشنهادی 169-189 دلار

معماری G94

از نظر معماری ، G94 فقط از نظر مشخصات کمی با G92 متفاوت است ؛ تعداد واحدهای اجرای آن کمتر است: ALU و TMU. و همچنین تفاوت های زیادی با G8x وجود ندارد. همانطور که در مطالب قبلی نوشته شده بود ، تراشه های G9x یک خط G8x کمی اصلاح شده است که با تغییرات جزئی معماری به یک فرآیند فنی جدید منتقل شده است. تراشه میان رده جدید دارای 4 واحد سایه زن بزرگ (در مجموع 64 ALU) و 32 واحد بافت و همچنین چهار ROP گسترده است.

بنابراین ، تغییرات معماری کمی در تراشه وجود دارد ، تقریباً همه آنها در بالا نوشته شده اند ، و همه آنچه قبلاً برای راه حل های قبلی گفته شد ، همچنان پابرجا هستند. و در اینجا ما فقط نمودار اصلی تراشه G94 را ارائه می دهیم:

واحدهای بافت در G94 دقیقاً مانند G84 / G86 و G92 هستند ، آنها قادرند دو برابر نمونه های فیلتر شده دو خطی از بافت را در مقایسه با G80 انتخاب کنند. اما 32 واحد بافتی GeForce 9600 GT در برنامه های واقعی فقط به دلیل فرکانس کاری بالاتر GPU سریعتر از 32 واحد GeForce 8800 GTX کار نمی کنند. این امر فقط در صورت خاموش بودن فیلتر سه خطی و ناهمسانگرد مشاهده می شود ، که بسیار نادر است ، فقط در آن الگوریتم هایی که از نمونه های فیلتر نشده استفاده می شود ، به عنوان مثال ، در نقشه برداری اختلاف منظر.

یکی دیگر از مزایای G9x و GeForce 9600 GT ، به ویژه شرکت NVIDIA فناوری فشرده سازی خاصی را در واحدهای ROP پیاده سازی می کند که طبق تخمین آنها ، 15٪ کارآمدتر از تراشه های قبلی است. ظاهراً ، اینها دقیقاً همان اصلاحات معماری در G9x هستند که برای عملکرد کارآمدتر گذرگاه حافظه 256 بیتی طراحی شده اند ، در مقایسه با گذرگاه 320/384 بیتی ، که قبلاً در مورد آن نوشتیم. به طور طبیعی ، در برنامه های واقعی تفاوت زیادی وجود نخواهد داشت ، حتی طبق گفته خود NVIDIA ، افزایش نوآوری در ROP معمولاً فقط حدود 5٪ است.

علی رغم تمام تغییراتی که در معماری G9x وجود دارد و باعث پیچیدگی تراشه می شود که بعداً در مورد آن صحبت خواهیم کرد ، تعداد ترانزیستورهای تراشه کاملاً زیاد است. احتمالاً ، این پیچیدگی GPU با افزودن تراشه NVIO جداگانه ، پردازنده ویدیویی نسل جدید ، عارضه TMU ها و ROP ها و همچنین سایر تغییرات پنهان: تغییر اندازه حافظه پنهان و غیره توضیح داده شده است.

PureVideo HD

G94 همان پردازنده ویدئویی نسل دوم را دارد که از G84 / G86 و G92 شناخته می شود و دارای پشتیبانی بهبود یافته از PureVideo HD است. تقریباً به طور کامل پردازنده را هنگام رمزگشایی انواع متداول داده های ویدئویی ، از جمله H.264 ، VC-1 و MPEG-2 ، در رزولوشن 1920x1080 و سرعت بیت تا 30-40 مگابیت بر ثانیه تخلیه می کند و کار رمزگشایی را کاملاً در سخت افزار انجام می دهد. اگرچه رمزگشایی VC-1 NVIDIA به اندازه H.264 کارآمد نیست ، اما بخش کوچکی از پردازش از پردازنده مرکزی استفاده می کند ، اما با این وجود به شما امکان می دهد تمام دیسک های HD DVD و Blu-Ray موجود را حتی در رایانه های با قدرت متوسط \u200b\u200bنیز پخش کنید. اطلاعات بیشتر در مورد پردازنده ویدئویی نسل دوم را می توانید در بررسی های G84 / G86 و G92 که پیوندهای آن در ابتدای مقاله آمده است ، بخوانید.

خوب ، ما می خواهیم به پیشرفت های نرم افزاری PureVideo HD اشاره کنیم که زمان آن هم زمان با عرضه GeForce 9600 GT بود. آخرین نوآوری ها در PureVideo HD شامل رمزگشایی با جریان دوگانه ، کنتراست پویا و اشباع رنگ است. این تغییرات منحصر به GeForce 9600 GT نیست و در درایورهای جدید ، با شروع ForceWare 174 ، این تغییرات برای همه تراشه هایی ارائه می شود که از شتاب کامل سخت افزاری با استفاده از PureVideo HD پشتیبانی می کنند. جدا از کارت گرافیک که امروز در نظر داریم ، این لیست شامل: GeForce 8600 GT / GTS ، GeForce 8800 GT و GeForce 8800 GTS 512 است.

از افزایش کنتراست پویا که اغلب در وسایل خانگی ، تلویزیون ها و پخش کننده های ویدیو استفاده می شود ، می تواند تصاویر را با نوردهی بهینه (ترکیبی از سرعت شاتر و دیافراگم) بهبود بخشد. برای این کار پس از رمزگشایی هر فریم ، هیستوگرام آن مورد تجزیه و تحلیل قرار می گیرد و اگر کادر کنتراست ضعیفی نداشته باشد ، هیستوگرام مجدداً محاسبه و بر روی تصویر اعمال می شود. در اینجا مثالی آورده شده است (چپ - تصویر شروع ، راست - پردازش شده):

تقریباً همین مورد در مورد افزایش اشباع رنگ پویا در PureVideo HD اعمال می شود. بر خلاف مانیتورهای رایانه ای ، که همه چیز را همانطور که هست بازتولید می کنند ، لوازم خانگی نیز مدتهاست که از برخی الگوریتمهای افزایش دهنده تصویر استفاده می کنند ، که در بسیاری از موارد می تواند تصویری بیش از حد کم نور و بی روح ایجاد کند. تعادل خودکار اجزای رنگ در داده های ویدیویی ، همچنین هر فریم جدید را محاسبه می کند ، با تنظیم کمی اشباع رنگ آن ، درک انسان از تصویر را بهبود می بخشد:

رمزگشایی با جریان دوگانه رمزگشایی و پردازش پس از دو جریان مختلف ویدیویی را به طور همزمان تسریع می کند. این می تواند برای حالت های خروجی مانند تصویر در تصویر که در برخی دیسک های Blu-Ray و HD DVD استفاده می شود مفید باشد (به عنوان مثال ، تصویر دوم ممکن است کارگردان فیلم را در مورد صحنه های نشان داده شده در پنجره اصلی نشان دهد) ) ، WAR و Resident Evil: نسخه های Extinction به چنین ویژگی هایی مجهز شده اند.

نوآوری مفید دیگر در آخرین نسخه PureVideo HD ، امکان اجرای پوسته Aero در سیستم عامل ویندوز ویستا به طور همزمان هنگام پخش ویدیوی شتاب سخت افزاری در حالت پنجره ای است که قبلاً امکان پذیر نبود. نه اینکه بگوییم واقعاً کاربران را نگران می کند اما فرصت خوبی است.

پشتیبانی از رابط خارجی

شاید پشتیبانی از رابط های خارجی در GeForce 9600 GT مانند GeForce 8800 GT باشد ، به استثنای پشتیبانی یکپارچه برای DisplayPort. تراشه NVIO اضافی موجود در تابلوهای GeForce 8800 ، که از رابط های خارجی خارج از G94 اصلی پشتیبانی می کند ، نیز در خود تراشه موجود بود.

کارت های ویدیوی مرجع GeForce 9600 GT دارای دو خروجی Dual Link DVI با پشتیبانی HDCP هستند. HDMI و DisplayPort از لحاظ سخت افزاری روی تراشه پشتیبانی می شوند و این درگاه ها را می توان توسط شرکای NVIDIA روی کارتهای طراحی شده سفارشی تهیه کرد. علاوه بر این ، همانطور که NVIDIA اطمینان می دهد ، برخلاف G92 ، پشتیبانی از DisplayPort اکنون در تراشه تعبیه شده است و نیازی به فرستنده خارجی نیست. به طور کلی ، رابط های HDMI و DisplayPort در کارت گرافیک اختیاری هستند ؛ می توان آنها را با آداپتورهای ساده از DVI به HDMI یا DisplayPort جایگزین کرد که گاهی اوقات با کارت گرافیک های مدرن روبرو می شوند.

جزئیات: خانواده G96 ، GeForce 9400 و 9500

مشخصات G96

نام رمز تراشه G96
فناوری 65 نانومتر
314 میلیون ترانزیستور
معماری یکپارچه با آرایه ای از پردازنده های مشترک برای پخش راس ، پیکسل و انواع دیگر داده ها
پشتیبانی سخت افزاری از DirectX 10 ، شامل مدل سایه بان - Shader Model 4.0 ، تولید هندسه و ضبط داده های میانی از سایه بان ها (خروجی جریان)
گذرگاه حافظه 128 بیتی ، دو کنترل کننده مستقل ، عرض 64 بیتی
فرکانس هسته 550 مگاهرتز
ALU ها بیش از دو برابر فرکانس (1.4 گیگاهرتز) کار می کنند
32 ALU نقطه شناور مقیاس دار (قالبهای صحیح و نقطه شناور ، پشتیبانی از دقت 32 بیتی FP در استاندارد IEEE 754 ، MAD + MUL بدون افت ساعت)
16 واحد آدرس دهی بافت با پشتیبانی از م componentsلفه های FP16 و FP32 در بافت
16 بلوک فیلتر دو خطی (همانطور که برای G92 وجود دارد ، این باعث افزایش تعداد نمونه های دو خطی می شود ، اما بدون فیلتر سه خطی رایگان و فیلتر ناهمسانگرد موثر)
امکان انشعاب پویا در سایه اندازهای پیکسل و راس
2 ROP عریض (8 پیکسل) با پشتیبانی از حالتهای ضد بیگانه تا 16 نمونه در هر پیکسل ، از جمله فریم بافر FP16 یا FP32. هر بلوک از مجموعه ای از ALU با قابلیت تنظیم انعطاف پذیر تشکیل شده و وظیفه تولید و مقایسه ترکیب Z ، MSAA را دارد. حداکثر عملکرد کل زیر سیستم تا 32 نمونه MSAA (+ 32 Z) در هر چرخه ، در حالت فقط Z - 64 نمونه در هر چرخه
ثبت نتایج تا حداکثر 8 بافر فریم به طور همزمان (MRT)
همه رابط ها (دو RAMDAC ، دو Dual DVI ، HDMI ، DisplayPort) روی تراشه ادغام شده اند

مشخصات مرجع GeForce 9500 GT

فرکانس هسته 550 مگاهرتز
تعداد پردازنده های جهانی 32
تعداد واحدهای بافت - 16 واحد واحد - 8 واحد
فرکانس حافظه موثر 1.6 گیگاهرتز (2 * 800 مگاهرتز)
نوع حافظه GDDR2 / GDDR3
ظرفیت حافظه 256/512/1024 مگابایت
نرخ نمونه برداری از تئوری تا 8.8 گیگاتکسل در ثانیه.
دو کانکتور DVI-I Dual Link ، از خروجی با رزولوشن 2560x1600 پشتیبانی می کند
کانکتور SLI
اتوبوس PCI Express 2.0
TV-Out ، HDTV-Out ، HDMI و DisplayPort با پشتیبانی از HDCP

مشخصات مرجع GeForce 9400 GT

فرکانس هسته 550 مگاهرتز
فرکانس پردازنده های جهانی 1400 مگاهرتز
تعداد پردازنده های جهانی 16
تعداد واحدهای بافت - 8 واحد واحد - 8 واحد
فرکانس حافظه موثر 1.6 گیگاهرتز (2 * 800 مگاهرتز)
نوع حافظه GDDR2
ظرفیت حافظه 256/512 مگابایت
پهنای باند حافظه 25.6 گیگابایت در ثانیه.
حداکثر سرعت نظری 4.4 گیگاپیکسل در ثانیه.
نرخ نمونه برداری از تئوری تا 4.4 گیگاتکسل در ثانیه.
دو کانکتور DVI-I Dual Link ، از خروجی با رزولوشن 2560x1600 پشتیبانی می کند
کانکتور SLI
اتوبوس PCI Express 2.0
TV-Out ، HDTV-Out ، HDMI و DisplayPort با پشتیبانی از HDCP

معماری G96

از نظر معماری ، G96 دقیقاً نیمی از تراشه G94 است ، که به نوبه خود ، فقط از نظر مشخصات کمی با G92 متفاوت است. G96 دارای نیمی از تعداد واحدهای اجرای: ALU ، TMU و ROP است. تراشه ویدئویی جدید برای راه حلهایی با کمترین دامنه قیمت طراحی شده است و دارای دو واحد سایه زن بزرگ (در مجموع 32 ALU) و 16 واحد بافت و همچنین هشت ROP است. همچنین دارای یک باس حافظه برش خورده ، از 256 بیت تا 128 بیتی در مقایسه با G94 و G92. تمام ویژگی های سخت افزاری بدون تغییر باقی مانده اند ، تنها تفاوت در عملکرد است.

جزئیات: خانواده G92b ، GeForce GTS 200

مشخصات مرجع GeForce GTS 250

فرکانس هسته 738 مگاهرتز
فرکانس پردازنده های جهانی 1836 مگاهرتز
تعداد پردازنده های جهانی 128
تعداد واحدهای بافت - 64 واحد مخلوط - 16 واحد
فرکانس حافظه موثر 2200 (2 * 1100) مگاهرتز
نوع حافظه GDDR3
اندازه حافظه 512/1024/2048 مگابایت
پهنای باند حافظه 70.4 GB / s
حداکثر سرعت پرش نظری 11.8 گیگاپیکسل در ثانیه.
نرخ نمونه برداری از تئوری تا 47.2 گیگاتکسل در ثانیه.
دو کانکتور DVI-I Dual Link ، از خروجی با رزولوشن 2560x1600 پشتیبانی می کند
اتصال دوگانه SLI
اتوبوس PCI Express 2.0
TV-Out ، HDTV-Out ، پشتیبانی از HDCP ، HDMI ، DisplayPort
مصرف برق تا 150 وات (یک اتصال 6 پین)
نسخه دو شکاف
MSRP 129 دلار / 149 دلار / 169 دلار

به طور کلی ، این کارت گرافیک "جدید" مبتنی بر تراشه 55 نانومتری G92 هیچ تفاوتی با GeForce 9800 GTX + ندارد. انتشار مدل جدید را می توان با نصب نه 512 مگابایت حافظه ویدئویی روی آن مانند 9800 GTX + ، بلکه یک گیگابایت توجیه کرد ، که عملکرد در حالت های سنگین با تنظیمات حداکثر کیفیت ، وضوح بالا با قابلیت ضد تعارض تمام صفحه را تحت تأثیر قرار می دهد. و گزینه های دو گیگابایتی نیز وجود دارد ، اما این بیشتر یک مزیت بازاریابی است تا یک گزینه واقعی.

در چنین شرایطی ، نسخه های قدیمی GeForce GTS 250 به دلیل افزایش ظرفیت حافظه باید به طور قابل ملاحظه ای سریعتر از GeForce 9800 GTX + باشند. و برخی از بازی های مدرن تر ، از وضوح حتی پایین تر نیز بهره مند می شوند. همه چیز خوب است ، اما بعد از همه ، برخی از تولید کنندگان کارت GeForce 9800 GTX + را با یک گیگابایت حافظه حتی زودتر منتشر کردند ...

تولید تراشه های ویدئویی G92b مطابق با استانداردهای فن آوری 55 نانومتر و ساده تر شدن قابل توجه طراحی PCB ، به NVIDIA اجازه داد تا از نظر مشخصات ، محلولی مشابه GeForce 9800 GTX ، اما با قیمت پایین تر و مصرف انرژی کمتر و اتلاف گرما ایجاد کند. و اکنون ، برای تأمین برق GeForce GTS 250 ، این برد تنها یک اتصال برق 6 پین PCI-E دارد. این همه تفاوت اصلی با 9800 GTX + است.

بررسی GeForce 9800 GT

نحوه اورکلاک کارت گرافیک Nvidia GeForce 9800 GT

Nvidia GeForce 9800 GT چه بازی هایی را به خود جلب می کند

مقایسه تولید کنندگان

نحوه نصب مجدد درایور ویدئو برای GeForce 9800 GT

مشخصات 9800 GT

کارت گرافیک 9800 GT چه وظایفی را می تواند حل کند؟

جوانب مثبت و منفی کارت ویدیو

مشخصات سری GeForce 9

سری GeForce 9800

NVIDIA GeForce 9800GX2

NVIDIA GeForce 9800GTX +

NVIDIA GeForce 9800GTX

NVIDIA GeForce 9800GT

NVIDIA GeForce 9800GT Green

GeForce 9800 GT. مشخصات کارت گرافیک

تجهیزات

طرح

سیستم خنک کننده

اورکلاک کردن

مشخصات کارتهای مرجع بر اساس خانواده G8X

جزئیات: G80 ، خانواده GeForce 8800

مشخصات G80

مشخصات کارت مرجع GeForce 8800 GTX

مشخصات کارت مرجع GeForce 8800 GTS

معماری

پردازنده Shader و TMU / ALU آن

CSAA

NVIO

جزئیات: G84 / G86 ، GeForce 8600 و 8500 خانواده

مشخصات G84

مشخصات کارت مرجع GeForce 8600 GTS

مشخصات مرجع GeForce 8600 GT

مشخصات G86

مشخصات مرجع GeForce 8500 GT

معماری G84 و G86

پردازنده Shader و TMU / ALU

بلوک های ROP ، نوشتن در فریم بافر ، ضد الگوریتم

PureVideo HD

محاسبات CUDA ، غیر بازی و فیزیک

پشتیبانی از رابط خارجی

جزئیات: خانواده G92 ، GeForce 8800

مشخصات G92

مشخصات کارت مرجع GeForce 8800 GT 512MB

مشخصات کارت مرجع GeForce 8800 GT 256MB

مشخصات کارت مرجع GeForce 8800 GTS 512MB

معماری تراشه G92

پردازنده های عمومی و TMU ها

بلوک های ROP ، نوشتن در فریم بافر ، ضد الگوریتم

PureVideo HD

PCI Express 2.0

پشتیبانی از رابط خارجی

جزئیات: G94 ، خانواده GeForce 9600

مشخصات G94

مشخصات کارت مرجع GeForce 9600 GT

معماری G94

PureVideo HD

پشتیبانی از رابط خارجی

جزئیات: خانواده G96 ، GeForce 9400 و 9500

مشخصات G96

مشخصات مرجع GeForce 9500 GT

مشخصات مرجع GeForce 9400 GT

معماری G96

جزئیات: خانواده G92b ، GeForce GTS 200

مشخصات مرجع GeForce GTS 250

دوست داشت؟