05-20-2013
|
|
مدیر بخش مکانیک - ویندوز و رفع اشکال
|
|
تاریخ عضویت: Sep 2009
نوشته ها: 2,586
سپاسها: : 5,427
6,159 سپاس در 1,794 نوشته ایشان در یکماه اخیر
|
|
معرفی ششمین نسل تراشههای انویدیا NVIDIA GTX 680
NVIDIA GTX 680
گاهی اوقات کارتهای گرافیکی جدید نسبت به نسل پیش از خود تفاوتهای ساختاری زیادی ندارند و سازندگان تراشهها ترجیح میدهند با چند بهروزرسانی کلی نسل جدیدی از پردازندههای گرافیکی را معرفی کنند اما زمانی هم این کارتها با تراشههایی وارد بازار میشوند که ساختار آنها تغییر پیدا کرده و پیشرفتهای اساسی در آنها انجام شده است. کارتهای جیفورس نسل ششم و همچنین نسل جدید تراشههای گرافیکی AMD شامل همین تغییرات شدهاند و پیشرفتهای قابل توجهی در معماری آنها دیده میشود.
انویدیا در نسل چهارم تراشههای گرافیکی که با مدلهایی مانند GTX 480 کار خود را آغاز کرد ساختار جدیدی به نام فرمی (Fermi) را توسعه داد. فرمی نام خود را از یک فیزیکدان ایتالیایی گرفته بود که در زمینه انرژی اتمی صاحبنام بود اما تراشههای انویدیا تنها حرارت و مصرف بسیار بالا را از این نام به ارث بردند و عملا نسل چهارم با موفقیت قابل قبولی روبهرو نشد، هر چند بعد از معرفی مدلهای اولیه، با ورود کارتهای متوسط، انویدیا توانست این مشکلات را تا حدود زیادی کاهش دهد. در نسل پنجم، تراشههای انویدیا قدرت زیادی پیدا کردند و علاوه بر بهبود مصرف انرژی و افزایش کارایی در زمینههایی مانند پردازشهای عمومی توسط تراشه یا GPGPU نیز عملکرد قابل توجهی نشان دادند، به طوری که تا مدتها تراشه GTX 580 عنوان قویترین تراشه گرافیکی را با خود همراه داشت. در تراشههای گرافیکی نسل ششم، انویدیا با تحولی دیگر در ساختار تراشهها وارد میدان شده و با تغییر پلتفرم از ساختار فرمی، معماری جدیدی به نام کپلر (Kepler) را مورد استفاده قرار داده است. این تراشهها با فناوری ۲۸ نانومتری تولید میشوند و انویدیا مدعی شده است تراشههای GeForce GTX 680 سریعترین تراشههای موجود با بهترین راندمان مصرف انرژی هستند. این تراشهها با کد GK104 تولید شدهاند و البته انویدیا باز هم اعلام کرده است این تراشهها تنها یک راهحل متوسط ولی قدرتمند هستند و امسال راهحل دیگری معرفی خواهد کرد که توانایی بالاتری نسبت به این مدل دارد ولی در حال حاضر جیفورس GTX 680 قویترین تراشه برای اجرای بازیها و محتوای سهبعدی است.
مهمترین نقطه عطف این تراشهها را میتوان در راندمان مصرف انرژی آنها عنوان کرد که بیشترین کارایی را در مقابل هر یک وات مصرفشده دارند که این موضوع علاوه بر کاهش فناوریساخت به ۲۸ نانومتر، به ساختار معماری کپلر هم مربوط است.
در این بین میتوان اشارهای هم به AMD داشت که اوایل سال میلادی تراشههای قدرتمند HD 7970 را معرفی کرد که در آنها نیز راندمان مصرف انرژی بهبود پیدا کرده و البته تغییرات ساختاری زیادی در آنها انجام شده است. به عنوان مثال معماری VLIW با معماری GCN عوض شده است و کارایی بهتری در زمینه
GPGPU دارد. AMD با این معماری تلاش زیادی برای استفاده از توان کارتهای گرافیکی برای پردازشهای عمومی و محاسباتی سیستم انجام داده است تا کارت گرافیکی بتواند علاوه بر پردازش محتوای سهبعدی در سایر کاربردها نیز با cpu همراهی کند. این موضوع نکتهای است که انویدیا دو نسل پیش از این و با ساختار فرمی به طور جدی آن را دنبال کرد و حالا نیز در این زمینه مدعی است.
ساختار کپلر شباهتهای زیادی با ساختار فرمی دارد بنابراین با نگاهی به گذشته، ابتدا ساختار فرمی را توضیح میدهیم و سپس به سراغ کپلر میرویم.
ساختارفرمی
تراشههای GTX 580 دارای ۵۱۲ پردازنده جریانی (Stream Processors) هستند که انویدیا نام این پردازندهها را هستههای کودا (CUDA) گذاشته است. هستههای کودا در بلوکهایی ۳۲ عددی جای میگیرند و به آنها SM گفته میشود. چهار گروه از این SMها در یک خوشه پردازشی (کلاستر) ردیف میشوند که به این خوشه GPC گفته میشود. در نهایت چهار GPC یک تراشه با معماری GF100 را تشکیل میدهند. از این چهار واحد، دو واحد در بالا و دو واحد نیز در پایین تراشه قرار گرفتهاند و بین آنها را حافظه درونی L2 پر کرده است. این حافظه به صورت ۴۸ واحد در میان تراشه قرار گرفته و ردهبندی آنها به صورت شش بخش است که در هر کدام از آنها هشت حافظه استفاده شده است. در اطراف تراشه نیز شش واحد کنترل حافظه دیده میشود.
۱۶ واحد SM (بلوکهای ۳۲ عددی هستههای کودا) در میان چهار واحد GPC مشخص است. این SMها میتوانند در هر چرخه فرکانس ۵۱۲ دستورالعمل را اجرا کنند. در انتهای ساختار SM چهار واحد پردازش بافتی نیز قرار داده شده و علاوه بر آن در هر SM یک واحد پردازش هندسی هم وجود دارد که مجموع آنها به ۱۶ واحد میرسد. انویدیا نام این قسمت را موتور پلیمورف یا موتور چندشکلی گذاشته است. موتور PolyMorph و موتور پیکسلی Raster دو بخش مهم اجرایی در ساختار فرمی هستند که در واقع یکی از تفاوتهای مهم این کارتها با نسلهای پیشین ناشی از این دو قسمت است. موتور Raster ترکیبی از تمام روشهای پیشین برای پردازش تصویر است که شامل تنظیم لبهها و سهضلعیها، تبدیل تصاویر به بیتمپ یا نقشههای بیتی و تبدیل نقشههای دوبعدی به تصاویر سهبعدی است. این واحد در تراشههایی که دارای معماری GF100 هستند میتواند در هر چرخه فرکانس تا ۳۲ پیکسل را پردازش کند. موتور پلیمورف که انویدیا آن را برای پردازشهای هندسی اختصاص داده است، چندین فعالیت اصلی را در کارتهای گرافیکی انجام میدهد که موارد زیر از نمونههای این وظایف است:
Vertex Fetch: در تصاویری مثل سطح آب یا شعلههای آتش با وجود اینکه با یک بافت سطحی روبهرو هستیم اما این بافت ثابت نیست و حرکت دارد. به عنوان مثال امواج بسیار کوچک سطح آب یا زبانههای شعله آتش اگر به صورت بافت پردازش شوند نتیجه یک تصویر صاف و بدون جزییات خواهد بود. موتور پلیمورف پردازش این سطوح را انجام میدهد.
Tessellation: تصاویر سهبعدی از چندضلعیها تشکیل شدهاند و با کمک Tessellation یا موزاییککاری، این چندضلعیها در یک ساختار مناسب کنار هم قرار میگیرند و آماده پردازش میشوند. دلیل این امر هم پیچیدگیهایی است که برای پردازش مستقیم تصویر وجود دارد و کارتهای گرافیکی با تقسیم یک سطح به چندضلعیها کار پردازش را آسانتر میکنند. با این حال پردازش جزییات ظریفی که در برخی اجسام مانند صورت انسان دیده میشود نیاز به توان قابل توجهی از سوی کارت گرافیکی دارد. علت اینکه نام این بخش Tessellation یا موزاییککاری گذاشته شده به دلیل شیوه مشابهی است که در پرداخت گرافیکی انجام میشود و این چندضلعیها به طور مرتب در کنار یکدیگر قرار میگیرند تا تصویر نهایی تشکیل شود.
Viewport Transform:تصاویر در بازیها و نمایشهای سهبعدی همیشه تولید نمیشوند و اغلب از تصاویر از پیش طراحیشده برای نمای سهبعدی استفاده میشود که این شبهعکسها با قرار گرفتن در کنار یکدیگر تصویر نهایی را خلق میکنند. در پردازشهای گرافیکی موضوع جایگیری و چیدمان این تصاویر مهم است و این بخش توسط Viewport مدیریت میشود.
موتورهای Raster در یک تراشه با مهندسی GF110 چهار عدد هستند یعنی برای هر GPC یک موتور Raster در نظر گرفته شده در حالی که موتورهای پلیمورف در هر GPC چهار عدد هستند و مجموع آنها در یک تراشه به ۱۶ عدد میرسد. ضمنا باید توجه داشت بسیاری از این امکانات برای این تراشه یا این کارتهای گرافیکی انحصاری نیست بلکه مجموعهای از تواناییهای فراهمشده توسط نسخه یازدهم دایرکتایکس است که کارتهای مختلف توان متفاوتی در اجرای آنها دارند. قبلا در تراشههای نسل GT200 از یک موتور Raster بزرگ استفاده میشد. بهکارگیری ۱۶ موتور پلیمورف به این معنی است که امکان پردازش موازی در این حالت بیشتر است و البته باید توجه داشت مدیریت این دادهها به صورت موازی که در کانال اطلاعات قرار دارند کار آسانی نیست. GF110 علاوه بر این موارد، تکههای مختلف و اجزای کوچک تصویر را نیز بررسی میکند و در صورت لزوم آنها را به تکههای کوچکتر تبدیل خواهد کرد تا توسط چند SM به صورت همزمان پردازش شوند. در این حالت اطلاعات مرتبط با داده در حال پردازش درون هسته باقی میماند و از طریق حافظه سطح L1 در میان SMها جابهجا میشود.
معماری کپلر
در ساختار کپلر مانند قبل یک موتور GigaThreadEngine، کـنــتـرلرهای حافظه، حافظه L2 cache برای دادهها و دستورالعملها، موتور پیکسلی Raster و کلاسترهای پردازشی وجود دارد و از این نظر تفاوتی با قبل ندارند. در تراشه GTX 680 چهار واحد GPC دیده میشود که هر کدام از آنها دارای یک موتور
Raster و چندین پردازنده جریانی هستند. تا پیش از این در ساختار فرمی و قبل از آن در ساختار تسلا، خوشههای حاوی واحدهای کوچک پردازشی کودا درون تراشه، SM نامیده میشدند اما انویدیا در ساختار کپلر نام آنها را SMX گذاشته است. در فرمی چهار GPC در تراشه وجود داشت که هر کدام دارای چهار SM بودند، اکنون در ساختار کپلر در هر کدام از چهار واحد GPC دو SMX دیده میشود.
در کپلر، موتورهای پلیمورف ارتقا پیدا کردهاند و نسخه دوم آنها به نام PolyMorph Engine 2.0 معرفی شده است که سرعت آنها دو برابر شده است. این تراشهها دارای ۱۹۲ پردازنده کودا، ۳۲ واحد SFU و ۳۲ واحد load & store هستند که فرکانس آنها نسبت به فرمی دو برابر شده است. واحدهایی به نام TMU که مخفف Texture mapping unit هستند میتوانند بیتمپها را تغییر سایز دهند یا آنها را بچرخانند تا در یک قسمت مشخص استفاده شوند. این عملیات به توان پردازشی قابل توجهی نیاز دارد و میتواند توانایی کارت را محدود کند. در کپلر این واحدها دو برابر شدهاند و به ۱۶ عدد رسیدهاند.
استفاده از فناوری ۲۸ نانومتری تاثیر زیادی روی تراشه داشته است که این موضوع را در ترکیب با معماری کپلر باید بررسی کرد. به عنوان یک اصل کلی هر چقدر تعداد ترانزیسورهای استفادهشده در یک ساختار پردازشی بیشتر باشد به معنی توانایی آن ساختار محسوب میشود. در تراشه GTX 680 تعداد ترانزیستورها تنها ۱۸ درصد افزایش داشته است و از سه میلیارد ترانزیستور در تراشه GTX 580 به ۳.۵۴ میلیارد در ساختار GTX 680 رسیده است. بعد از تجربه تلخی که انویدیا در مدلهایی مثل GTX 480 داشت تاکید زیادی روی راندمان مصرف انرژی دارد که این موضوع در ساختار کپلر به اوج خود رسیده است و توانایی واحدهای پردازشی به ازای هر وات مصرفی دو برابر شده است. در این تراشه توان مصرفی واحدهای کنترل منطقی و پردازندههای استریم کاهش پیدا کرده است و یکی دیگر از پیشرفتها نیز کاهش فرکانس هستههای کوداست. در نسلهای قبلی فرکانس پردازندههای استریم به دلیل کارایی بافر و ترتیب پردازش، حدود دو برابر فرکانس هسته گرافیکی تعیین میشد اما در تراشههای فعلی تمام تراشه با یک فرکانس اجرا میشود.
یکی دیگر از تغییرات کپلر نسبت به قبل، تغییر در منطق کنترل و پردازش است. در ساختار فرمی یک مکانیسم سختافزاری برای رمزگشایی و مرتبسازی مجدد استفاده میشد که در کپلر این روش، نرمافزاری شده است و انرژی کمتری مصرف میکند ضمن اینکه در مکانیسم جدید فرآیندهای کنترل و نظارت هم کاهش پیدا کردهاند یا به عبارتی بهینه شدهاند در نتیجه فرآیندهای کمتری در مسیر پردازش دادهها اجرا میشود که این موضوع نیز روی کاهش مصرف توان و افزایش توانایی تراشه موثر است.
مدیریت فرکانس یکی از مهمترین پیشرفتهای انویدیا در ساختار کپلر است. برای امنیت بیشتر تراشه و کارت گرافیکی، معمولا یک دامنه امن از حداقل و حداکثر توان مصرفی و فرکانس قابل اجرا برای تراشه تعیین میشود که کارت حتی در شرایط لود کامل و بهرغم توانایی برای افزایش فرکانس نمیتواند از آن محدوده تجاوز کند. در برخی شرایط نیز برای اجرای یک فرآیند که عملکرد بخش ویژهای از تراشه را نیاز دارد یک ظرفیت خالی به صورت رزرو در سایر بخشها باقی میماند که با وجود مصرف انرژی و تولید حرارت از آن استفاده نمیشود. انویدیا در کپلر از این ظرفیت برای افزایش فرکانس استفاده میکند و نام این فناوری را GPU Boost گذاشته است. توان این فناوری در برخی برنامهها ممکن است بیشتر از سایر کاربردها باشد و از طریق آن برخی پارامترهای اصلی تراشه مانند فرکانس، مصرف انرژی، حرارت و بار پردازشی کنترل میشود و بر اساس آن فرکانس تراشه گرافیکی و میزان ولتاژ کارت تنظیم خواهد شد. این فناوری در واقع نوعی اورکلاک خودکار فرکانس است که در پردازندهها نیز مورد استفاده قرار میگیرد و حالا در کارتهای گرافیکی رواج پیدا کرده است. به عنوان مثال فرکانس پایه در تراشه GTX 680 معادل ۱۰۰۶ مگاهرتز است و تراشه میتواند در این فرکانس به طور ایمن اجرا شود. اگر بار پردازشی GPU افزایش پیدا کند و نیاز به توان بیشتری باشد کارت به صورت خودکار این فرکانس را تا ۱۰۵۸ و سپس تا ۱۱۰۰ مگاهرتز افزایش میدهد. حتی ممکن است مقادیر فرکانس بیشتر از این هم افزایش داشته باشد ولی پس از پردازش مورد نظر دوباره فرکانس کارت کاهش پیدا میکند و به مقدار نرمال بازمیگردد.
یکی از فناوریهای دیگر در تراشههای جدید به ورتیکال سینک (V-Sync) اختصاص دارد که برای همگامسازی سرعت بهروزرسانی تصویر در کارت گرافیکی و مانیتور است. تکنولوژی V-Sync زمانی استفاده میشود که سرعت رفرش یا بهروزرسانی تصویر در مانیتور پایینتر از سرعت معادل آن در کارت گرافیکی باشد. به عنوان مثال سرعت اجرای بازی ۹۰ فریم در ثانیه است ولی مانیتور با توانایی ۶۰ هرتز نمیتواند این سرعت را نمایش دهد. در این حالت سرعت کارت را کاهش میدهند تا منطبق با سرعت مانیتور باشد. این روش با اینکه خود برای حل مشکل ایجاد شده است اما مشکلات دیگری را هم به وجود میآورد، به عنوان مثال زمانی که سرعت کارت پایینتر از سرعت مانیتور باشد آنگاه برای تطبیق سرعت ممکن است تعداد فریمها در یک ثانیه به ۳۰، ۲۰ یا حتی ۱۵ فریم در ثانیه کاهش پیدا کند. در تراشههای GTX 680 فناوری V-Sync فقط زمانی اجرا میشود که واقعا لازم باشد؛ مثل زمانی که در یک قسمت از بازی تعداد فریمها در یک ثانیه از فرکانس مانیتور بیشتر باشد.
Asus GTX680-2GD5
کارتهای گرافیکی ایسوس از اولین مدلهای مجهز به تراشههای نسل ششم انویدیا بودند که وارد بازار شدند. البته هنوز این مدلها تنوع و توزیع گستردهای ندارند ولی به زودی جایگزین کارتهای نسل پنج خواهند شد. ایسوس از نماد ROG که نشاندهنده محصولات مخصوص بازی است روی این کارتها نیز استفاده کرده است و حداقل میتوان روی بستهبندی محصول این نشان را مشاهده کرد. نشان ROG خصوصیات ویژه کارت برای گیمرهای حرفهای را نشان میدهد و در اغلب این مدلها برخی از خصوصیات سختافزاری برای اجرای بازیها بهینه شده است.
در مشخصات اصلی این کارت برخی از ویژگیهای اصلی تراشه مانند افزایش خودکار توان برای اجرای بازیها، ورتیکال سینک و نمایش سهبعدی بازیها عنوان شده است و علاوه بر آن میتوان به نرمافزار طراحیشده توسط ایسوس اشاره کرد که GPU Tweak نام دارد و برای اورکلاک کارت به کار میرود. از طریق این نرمافزار میتوان مواردی همچون فرکانس و ولتاژ را تغییر داد و بر حرارت نظارت داشت.
کارتهای مجهز به تراشه GTX 680 مانند سایر مدلهای حرفهای نسل ششم بر پایه رابط نسل سوم PCIe هستند و در این مدل از دو گیگابایت حافظه GDDR5 استفاده شده است. حدود ۳.۵ میلیارد ترانزیستور در این تراشه به کار رفته است و ۱۵۳۶ هسته کودا وظیفه اصلی پردازش اطلاعات را بر عهده دارند. نکته قابل توجه این است که فرکانس پردازنده گرافیکی با اینکه توانایی اورکلاک خودکار دارد اما فرکانس پایه نیز در این کارت نسبت به مدلهای پیشین در رده بالایی تنظیم شده و به ۱۰۵۸ مگاهرتز رسیده است. در کارتهای نسل ششم با اینکه از نظر توان پردازشی با افزایش کارایی مواجه هستیم اما به دلیل استفاده از فناوریساخت ۲۸ نانومتری و معماری کپلر، میزان مصرف انرژی کاهش پیدا کرده است که در این مدل از ایسوس نیز همین مشخصات دیده میشود. در بخش حافظه میتوان دو گیگابایت حافظه از نوع GDDR5 را مشاهده کرد که در فرکانس ۶۰۰۸ مگاهرتز اجرا میشوند. این مقدار، حافظه موثر است که به صورت ضریبی از عدد چهار عنوان میشود و حافظه اصلی کارت ۱۵۰۲ مگاهرتز است. یک رابط ۲۵۶ بیتی نیز برای انتقال دادهها در نظر گرفته شده است. در مورد فرکانس تراشه این توضیح ضروری است که فرکانس پایه ۱۰۰۶ مگاهرتز است و در حالت اورکلاک این مقدار به ۱۰۵۸ مگاهرتز میرسد.
در قسمت پشت کارت میتوان یک رابط HDMI نسخه ۱.۴a و یک رابط Display Port نسخه ۱.۲ را مشاهده کرد که در کنار دو رابط DVI قرار گرفتهاند. این رابطها میتوانند از چهار مانیتور با دقت تصویر ۵۷۶۰×۱۰۸۰ به طور همزمان پشتیبانی کنند البته برای نمایش بازیها میتوان از سه مانیتور در کنار یکدیگر استفاده کرد و مانیتور چهارم را به موارد دیگر اختصاص داد که این مورد در اجرای بازیها در محیط شبکه میتواند سودمند باشد.
کارت GTX 680 ایسوس بر اساس طراحی مرجع تولید شده است به همین دلیل میتوان گفت به سایر کارتهای تولیدشده توسط سایر سازندگان شباهت بسیار بالایی دارد. در این مدلها از یک سینک آلومینیومی استفاده میشود که در حالت عادی روی دو شکاف PCIe در مادربورد را میپوشاند. این سینکها با دریافت حرارت تولیدشده توسط تراشه از طریق سه لوله مسی، سطح تماس با هوا را افزایش میدهند و باعث خنک شدن تراشه میشوند. جریان هوای تولیدشده توسط فن از میان این پرهها عبور میکند و پس از عبور از محفظه درون کارت از طریق براکتهای پشت خارج میشود. جنس بدنه از پلاستیک فشرده است که علاوه بر محافظت از اجزای درونی کارت و عدم انتقال حرارت به سطح بیرونی، میتواند نویز تولیدشده توسط فن را کاهش دهد. انویدیا برای این مدلها یک بورد به طول ۱۰ اینچ در نظر گرفته است که در بالای آن میتوان دو محل برای اتصال پل SLI را مشاهده کرد. در نتیجه این مدل از پیکربندی سه کارت گرافیکی به شیوه ۳WAY SLI پشتیبانی میکند.
کارتهای GTX 680 دارای دو کانکتور شش پین توان هستند و میزان مصرف آن ۱۹۵ وات عنوان شده است که از طریق چهار فاز توان تغذیه میشوند.
ویرایش توسط bigbang : 05-20-2013 در ساعت 12:08 AM
|
جای تبلیغات شما اینجا خالیست با ما تماس بگیرید
|
|