• اخبار
  • مقالات
  • تست و بررسی
  • رسانه
  • دانلود
  • انجمن
  • مقاله
  • آکادمیک
  • آموزشی، کاربردی
  • اورکلاکینگ
  • اینترنت و شبکه
  • بازی های رایانه ای
  • سخت افزار
  • نرم افزار

نگاهی به معماری جدید NVIDIA Ada Lovelace، قاصد نسل سوم فناوری NVIDIA RTX

سید مهدی یحیایی 07 آوریل 2023 , 20:54 مقاله / سخت افزار
یک ستارهدو ستارهسه ستارهچهار ستارهپنج ستاره (هنوز امتیازی ثبت نشده است)

اشتراک گذاری این مطلب

پیش از پرداختن به معماری Ada Lovelace پیشنهاد می‌کنیم برای آشنایی با فناوری Ray Tracing انویدیا و حافظه‌های GDDR6X به مقاله‌ی نگاهی به معماری جدید NVIDIA Turing انقلابی در فناوری Ray Tracing مراجعه کنید.

نکته: برای مشاهده‌ی تصاویر موجود در مقاله در سایز بزرگتر روی آنها کلیک کنید.

معماری GPU

Ada Lovelace و اولین برنامه‌ی کامپیوتری در جهان

کمپانی انویدیا همواره از نام دانشمندان موثر در حوزه‌ی الکترونیک و کامپیوتر برای نام‌گذاری معماری‌های جدید خود استفاده می‌کند. معماری جدید این کمپانی نیز به افتخار بانو آدا لاولیس نام‌گذاری شده است. Ada Lovelace با اسم کامل Augusta Ada King, Countess of Lovelace ریاضی‌دان و نویسنده‌ی بریتانیایی که در اوایل تا اواسط قرن نوزدهم میلادی زندگی می‌کرد، عمدتاً به دلیل تحقیق و پژوهش بر روی رایانه‌ی مکانیکی همه‌منظوره‌ی پیشنهادی چارلز بابیج (Charles Babbage's proposed mechanical general-purpose computer, the Analytical Engine) که یک موتور تحلیلی بود شهرت داشت. همچنین آدا لاولیس را اولین برنامه‌نویس کامپیوتر می دانند. Analytical Engine یا موتورتحلیلی، کامپیوتری بود که آدا لاولیس درباره‌ی آن مطالبی به چاپ رسانده بود. این کامپیوتر هرگز ساخته نشد اما آدا متوجه شد که این ماشین می‌تواند از یک سری دستور العمل‌های ساده (یک برنامه) برای انجام محاسبات پیچیده پیروی کند.

بررسی کارت گرافیک GIGABYTE GeForce RTX 4070 Ti GAMING OC (بخش اول)

معماری گرافیکی Ada Lovelace قاصد نسل سوم فناوری NVIDIA RTX است، تلاشی برای افزایش واقع‌گرایی بازی‌های رایانه‌ای با استفاده از فناوری Rel-time Ray tracing بدون مقدار عظیمی از توان محاسباتی مورد نیاز برای ترسیم تصاویر سه بعدی بهینه شده با ردیابی پرتو یا Ray tracing. این پیشرفت با تلفیق گرافیک شطرنجی مرسوم با عناصر Ray tracaing مانند بازتاب‌ها (Reflections)، نورپردازی و روشنایی سراسری (Global illumination یا GI) انجام می‌شود. نسل سوم RTX خبر از کودا کورهای جدید با IPC قوی‌تر آدا لاولیس، نسل سوم‌های هسته‌های RT، نسل چهارم هسته‌های Tensor و پردازشگر جدید Optical Flow (مولفه‌ای که نقش کلیدی در تولید فریم‌های جدید بدون دخالت رندر گرافیکی اصلی GPU) می‌دهد.

بررسی کارت گرافیک GIGABYTE GeForce RTX 4070 Ti GAMING OC (بخش اول)

معماری گرافیکی Ada که RTX 4090 را هدایت می‌کند، از فرآیند ریخته‌گری TSMC 4 نانومتری EUV برای افزایش تعداد ترانزیستورها به 76.3 میلیارد ترانزیستور استفاده می‌کند و این میزان در مقایسه با 28.3 میلیارد ترانزیستور RTX 3090 تقریبا 3 برابر (170 درصد یا 2.7 برابر) بیشتر است در حالیکه مقداری کوچکتر است (608 میلی‌متر مربع AD102 در مقایسه با 628 میلی‌متر مربع GA102). این پردازنده گرافیکی دارای رابط میزبان PCI-Express 4.0 x16 و گذرگاه 384 بیتی حافظه‌ GDDR6X است که به 24 گیگابایت حافظه متصل می‌شود. شتاب‌ دهنده Optical Flow یا OFA یک جزء مستقل سطح بالا است. این تراشه دارای دو واحد NVENC و یک واحد NVDEC در سری GeForce RTX 40 است درحالیکه این واحد ارزشمند در آینده برای کارت‌های گرافیک حرفه‌ای دارای هر 6 واحد فعال NVENC و NVDEC خواهد بود. NVENC کوتاه شده‌ی Nvidia Encoder و NVDEC کوتاه شده‌ی Nvidia Decoder می‌باشد.

نگاهی به معماری جدید NVIDIA Ada Lovelace، قاصد نسل سوم فناوری NVIDIA RTX

سلسله مراتب اجزای GPU شبیه به نسل‌های گذشته‌ی پردازنده‌های گرافیکی NVIDIA به نظر می‌رسد. تراشه‌ی سیلیکونی AD102 دارای 12 خوشه‌ی پردازش گرافیکی (Graphics Processing Cluster یا GPC) است که هر کدام از آنها دارای کودا کورهای SIMD و ماشین رندر گرافیکی است. هر GPC یک موتور Raster Engine یا پردازش شطرنجی (اجزای پردازش هندسی) و دو پارتیشن ROP (هر کدام دارای 8 واحد ROP) را برای کودا کورها به اشتراک می‌گذارد. در بعد پایین‌تر، واحدهای GPC آدا لاولیس شامل 6 خوشه پردازش بافت یا Texture Processor Cluster یا TPC هستند. هر واحد TPC دارای دو واحد پردازنده‌‌های جریانی (Streaming Multiprocessors یا SM) و یک واحد چندشکلی (Polymorph unit) است. هر واحد SM متشکل از 128 هسته‌ی کودا در 4 پارتیشن است. نیمی از این هسته‌ها به طور خالص FP32 و نیمی دیگر توانایی کارکرد در هر دو حالت FP32 اعشاری یا INT32 صحیح هستند. به همین دلیل توانایی پردازش FP32 جی‌پی‌یو بالاتر است.

نگاهی به معماری جدید NVIDIA Ada Lovelace، قاصد نسل سوم فناوری NVIDIA RTX

واحد SM قابلیت پردازش ریاضی همزمان FP32+INT32 را حفظ می‌کند. هر SM همچنین شامل یک هسته‌ی RT نسل سوم، چهار هسته Tensor نسل چهارم، مقداری حافظه کش و در نهایت 4 واحد بافت گذاری یا TMU است. در هر واحد GPC تعداد 12 واحد SM وجود دارد، بنابراین در یک GPC تعداد 1536 هسته کودا، 48 هسته‌ی Tensor، تعداد 12 هسته‌ی RT و مقداری حافظه کش تعبیه شده است. در نهایت تراشه‌ی کامل AD102 شامل 12 واحد GPC می‌باشد و دارای 18432 هسته‌ی کودا، 576 هسته Tensor و 144 هسته‌ی RT است. هر GPC دارای 16 واحد ROP است بنابراین تراشه AD102 دارای 192 واحد ROP می‌باشد. یک حافظه کش 96 مگابایتی به عنوان میدان شهری برای تمام GPCها، کنترلرهای حافظه و رابط PCIe به تبادل اطلاعات می‌پردازد.

نگاهی به معماری جدید NVIDIA Ada Lovelace، قاصد نسل سوم فناوری NVIDIA RTX

در تصویر بلاک دیاگرام که متعلق به RTX 4090 است، واحدهایی که با رنگ قرمز مشخص شده‌اند به معنای واحدهای غیر فعال می‌باشند. بنابراین GPU متعلق به RTX 4090 با غیر فعال کردن یک GPC کامل و دو TPC از دو GPC (در مجموع 16 TPC) در اختیار کاربران قرار می‌گیرد. همچنین حافظه‌ی کش سطح 2 برای RTX 4090 از 96 مگابایت به 72 مگابایت کاهش یافته است. این موضوع برای سایر کارت‌های گرافیکی نیز تکرار می‌شود و به تدریج واحد‌های بیشتری غیر فعال می‌شوند. در جدول نیز مشخصات کارت‌های گرافیک RTX 40 را در مقایسه با RTX 30 مشاهده می‌کنید:

نگاهی به معماری جدید NVIDIA Ada Lovelace، قاصد نسل سوم فناوری NVIDIA RTX

هسته RT نسل سوم، محاسباتی‌ترین جنبه‌های ردیابی پرتوهای بلادرنگ (Real-time Ray tracing) از جمله پیمایش BVH را تسریع می‌کند. موتور Displaced micro-mesh یک ویژگی انقلابی است که با هسته‌های RT نسل سوم معرفی شد و می‌تواند قابلیت Displaced micro-mesh را تسریع ببخشد. همانطور که سایه زن‌های مش و تسلیشن تاثیر عمیقی بر بهبود عملکرد با پردازش هندسی شطرنجی پیچیده داشته‌اند، به توسعه دهندگان بازی‌های رایانه‌ای اجازه می‌دهند پیچیدگی هندسی را به میزان قابل توجهی افزایش دهند. DMMها روشی برای کاهش پیچیدگی ساختار داده سلسله مراتب محدود (BVH) است که برای تعیین محل برخورد پرتو به هندسه استفاده می‌شود. در گذشته BVH مجبور بود حتی کوچکترین جزئیات را برای تعیین درست نقطه‌ی متقاطع ثبت کند. ری تریسینگ معماری Ada ارتقای قابل توجه‌ای از عملکرد را از Shader Execution Reordering (SER) دریافت می‌کند، یک ویژگی تعریف شده‌ی نرم‌افزاری که نیاز به آگاهی از موتورهای بازی‌های رایانه‌ای دارد تا به GPU کمک کند تا رشته‌های کاری مرتبط با ری ترسینگ را سازماندهگی و بهینه کند.

نگاهی به معماری جدید NVIDIA Ada Lovelace، قاصد نسل سوم فناوری NVIDIA RTX نگاهی به معماری جدید NVIDIA Ada Lovelace، قاصد نسل سوم فناوری NVIDIA RTX

در حال حاضر BVH نیازی به داده برای هر مثلث روی یک جسم ندارد، اما می‌تواند اجسام با هندسه‌ی پیچیده را به عنوان شبکه‌ای از مثلث‌های پایه نشان دهد که ساختار داده BVH را بسیار ساده می‌کند. یک BVH ساده‌تر به معنای صرف کمتر حافظه است و به کاهش بار CPU در ری تریسینگ کمک می‌کند، زیرا سی‌پی‌یو تنها باید ساختار کوچکتری را تولید کند. با هسته‌های قدیمی‌تر RT معماری Amper و Turing، هر مثلث روی یک جسم باید در سربار بالا نمونه‌برداری می‌شد، بنابراین هسته RT می‌توانست پرتوها را برای هر مثلث دقیقا محاسبه کند. با معماری آدا لاولیس، BVH ساده‌تر به علاوه نقشه‌ی جابه‌جای به هسته‌های RT ارسال می‌شود که اکنون می‌تواند نقطه‌ی برخورد دقیقی را به تنهایی شناسایی کند. انویدیا فشرده‌سازی 11:1 تا 28:1 را برای مجموع تعداد مثلث‌ها در نظر گرفته است. این امر زمان کامپایل BVH را از 7.6 برابر به بیش از 15 برابر در مقایسه با هسته‌های قدیمی‌تر RT کاهش می‌دهد و به فضای ذخیره‌سازی را نیز بین 6.5 تا 20 برابر کمتر می‌کند. DMMها می‌توانند استفاده از دیسک و پهنای باند حافظه و همچنین استفاده از گذرگاه PCIe و درنهایت بار CPU را کاهش دهند. NVIDIA با Simplygon و Adobe همکاری نزدیکی داشت تا پشتیبانی DMM را به زنجیره ابزار خود اضافه کند.

نگاهی به معماری جدید NVIDIA Ada Lovelace، قاصد نسل سوم فناوری NVIDIA RTX نگاهی به معماری جدید NVIDIA Ada Lovelace، قاصد نسل سوم فناوری NVIDIA RTX
Opacity Micro Meshes یا OMM یک ویژگی جدید است که با معماری Ada Lovelace معرفی شد تا به بهبود عملکرد شطرنجی به ویژه اشیایی که دارای آلفا (داده‌های شفاف) هستند کمک کند. اکثر اشیاء با اولویت پایین در یک صحنه‌ی سه بعدی، مانند برگ‌های روی درخت، اساسا مستطیل‌هایی با بافت روی برگ‌ها هستند که در آن شفافیت (آلفا) شکل برگ را ایجاد می‌کند. هسته‌های RT برای تلاقی پرتوها با چنین اجسامی مشکل دارند، زیرا آنها واقعا به شکلی نیستند که نشان می‌دهند (در واقع فقط مستطیل‌هایی با بافت‌هایی هستند که به مخاطب توهم شکل را می‌دهند). هسته‌های RT نسل گذشته باید چندین بار تعامل با مرحله‌ی رندر ایجاد می‌کردند تا شکل یک شیء شفاف را کشف کنند زیرا این هسته‌ها به تنهایی قادر به تست و آزمایش آلفا نبودند.

نگاهی به معماری جدید NVIDIA Ada Lovelace، قاصد نسل سوم فناوری NVIDIA RTX نگاهی به معماری جدید NVIDIA Ada Lovelace، قاصد نسل سوم فناوری NVIDIA RTX

این موضوع با OMM حل شده است. همانطور که DMMها هندسه را با ایجاد شبکه‌هایی از ریز مثلث‌ها ساده می‌کنند، OMM ها شبکه‌هایی از بافت‌های مستطیلی ایجاد می‌کنند که با بخش‌هایی از بافت که آلفا نیستند همسو می‌شوند. بنابراین هسته‌ RT درک بهتری از هندسه جسم دارد و می‌تواند نقاط تقاطع پرتوها را به درستی محاسبه کند. این موضوع عملکرد قابل توجهی بر عملکرد سایه در برنامه‌های غیر RT نیز دارد. کاربردهای عملی OMMها فقط اشیاء با اولویت پایین مانند پوشش گیاهی نیستند، بلکه دود و مه موضعی نیز می‌باشند. به طور سنتی برای چنین افکت‌هایی overdraw زیادی وجود داشت، زیرا آنها چندین بافت را روی هم قرار می‌دادند که همگی باید به طور کامل توسط سایه‌زن‌ها پردازش می‌شدند. اکنون تنها پیکسل‌های غیر شفاف اجرا می‌شوند. OMMها 30 درصد نرخ پر شدن بافر گرافیکی را افزایش می‌دهند و افزایش فریم ریت 10 درصد نیز ایجاد می‌کنند.

نگاهی به معماری جدید NVIDIA Ada Lovelace، قاصد نسل سوم فناوری NVIDIA RTX

DLSS 3 یک ویژگی انقلابی است که همراه با کارت‌های گرافیکی RTX 40 معرفی شد. این ویژگی نوید دو برابر نرخ فریم را با کیفیتی قابل مقایسه می‌دهد. این قابلیت با نام AI Frame Generation شناخته می‌شود. در حالیکه DLSS 3 تمام ویژگی‌های DLSS 2 و AI super-resolution (افزایش یک فریم با وضوح پایین‌تر به وضوح اصلی با حداقل کاهش کیفیت یا به عبارت دیگر اسکیل آپ یک رزولیشن پایین‌تر) آن را دارد، می‌تواند با استفاده از هوش مصنوعی تمام فریم‌ها را به سادگی و بدون درگیر کردن خطوط رندر گرافیکی تولید کند.

نگاهی به معماری جدید NVIDIA Ada Lovelace، قاصد نسل سوم فناوری NVIDIA RTX

بنابراین هر فریم متناوب با DLSS 3 بدون اینکه کپی فریم رندر شده قبلی باشد، با هوش مصنوعی تولید می‌شود. این موضوع در حال حاضر تنها در معماری Ada Lovelace امکان‌پذیر است، زیرا یک جزء سخت‌افزاری به نام شتاب دهنده‌ی نوری (Optical Flow Accelerator یا OFA) که با ایجاد آنچه انویدیا آن را میدان جریان نوری (Optical flow-field) می‌نامد، به پیش‌ بینی شکل ظاهری فریم بعدی کمک می‌کند. OFA تضمین می‌کند که الگوریتم DLSS 3 توسط اشیاء ثابت در صحنه‌‌های سه بعدی که به سرعت در حال تغییر هستند (مانند مسیر مسابقه) اشتباه گرفته نمی‌شود. این فرآیند به شدت به ارتقاء عملکرد معرفی شده فرمت ریاضی FP8 هسته‌های Tensor نسل چهارم وابسته است. سومین عنصر کلیدی DLSS 3، رفلکس (Reflex) است. با کاهش صف رندر به صفر، Reflex نقشی حیاتی در حصول اطمینان از اینکه فریم ریت‌های DLSS 3 در سطح قابل قبولی قرار دارد و یک صف رندر اسکیل آپ را گیج نمی‌کند، ایفا می‌کند. ترکیبی از OFA و نسل چهارم هسته‌های Tensor دلیل آن است که معماری Ada Lovelace برای استفاده از DLSS 3 مورد نیاز است و اینکه چرا این قابلیت در معماری‌های قدیمی‌تر کار نمی‌کند.

نگاهی به معماری جدید NVIDIA Ada Lovelace، قاصد نسل سوم فناوری NVIDIA RTX نگاهی به معماری جدید NVIDIA Ada Lovelace، قاصد نسل سوم فناوری NVIDIA RTX





سید مهدی یحیایی

31 سال سن، ساکن تهران، کارشناس ارشد مهندسی معماری سیستم‌های کامپیوتری (سخت افزار)

درج نظر

0 نظر
نظرات شما

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *





تازه های مقاله

نگاهی به معماری جدید NVIDIA Ada Lovelace، قاصد نسل سوم فناوری NVIDIA RTX 0

2 ماه پیش

آشنایی با مانیتورهای مطرح گیمینگ گیگابایت در بازارهای داخلی 0

11 ماه پیش

آشنایی با مادربوردهای پرفروش گیگابایت B660 در بازار ایران 0

12 ماه پیش

دستگاه‌های حافظه نانو الکترومکانیکی (NEM) 0

1 سال پیش

پر بازدیدترین های مقاله

چگونه مشکل The disk is Write Protected را در فلش مموری‌ها حل کنیم؟ 224

7 سال پیش

بروزرسانی فریمور (Firmware) مودم های TP LINK 443

8 سال پیش

آموزش نصب ویندوز 10 از طریق UEFI و BIOS 30

5 سال پیش

چگونه Windows Defender را در ویندوز 10 غیر فعال کنیم 20

7 سال پیش

برچسب ها

آدا لاولیسمعماری ada lovelaceمعماری GPU

آخرین نظرات

ناهید محمدی می 23, 2023

عالی بود تشکر در

[آشنایی با فایل‌های AAE در زمان انتقال تصاویر از آیفون به کامپیوتر ]

محمد می 23, 2023

باسلام خدمت شما استاد عزیز این باردوم گه پست میزارم جهت راهن در

[بروزرسانی فریمور (Firmware) مودم های TP LINK ]

نسترن می 21, 2023

من با استفاده از روش سوم تونستم این مشکل رو برای فلش مموریم در

[آموزش رفع خطای The disk structure is corrupted and unreadable ]

محمد می 21, 2023

بادرود اگر ممکن راهنمایی کنید جهت این مدل مودم {firmware} در

[بروزرسانی فریمور (Firmware) مودم های TP LINK ]

علیزاده می 13, 2023

سلام و درود واقعا ازتون ممنونم که متن و آموزش با ارزشمند در

[آموزش انتقال اطلاعات مهم و حیاتی در هنگام پیشبرد روند عملیات تعویض ویندوز ]

پربازدیدترین ها

اس‌اس‌دی SSD Crucial T700 Gen 5 در سطح هارددیسک! 3 هفته پیش

سخت افزار

جدیدترین لپ‌تاپ‌های MSI در راه بازار ایران؛ ترکیب هنرمندانه نسل 13 اینتل با گرافیک RTX40 4 هفته پیش

سخت افزار

گیگابایت لپ‌تاپ‌های گیمینگ را با AORUS 16 گسترش می‌دهد 3 هفته پیش

لپ تاپ

عرضه نسخه‌ای احتمالی از کارت گرافیک RTX 4070 با تجهیز به سیلیکون AD103 در آینده؟ 3 هفته پیش

سخت افزار

کمپانی اینتل بخشی از سهم خود از بازار پردازنده‌های مرکزی را به ای‌ام‌دی واگذار کرد 3 هفته پیش

سخت افزار

آپدیت 24 و 48 گیگابایتی حافظه رم را برای مادربردهای AM5 گیگابایت 3 هفته پیش

سخت افزار

آخرین ارسال های انجمن

  • عکس های جالب و دیدنی
    منتشر شده در: 17-09-2020
  • مشاوره جهت خرید منابع تغذیه (Power Supply)
    منتشر شده در: 05-09-2020
  • کنترل گارانتی محصولات در سایت آواژنگ
    منتشر شده در: 05-09-2020
  • نگاهی به مودم های ارزان قیمت برند TP-Link در بازار
    منتشر شده در: 29-06-2020

ما را دنبال کنید

درباره ما

مجموعه سخت افزار ایران نخستین مرجع معتبر و رسمی فعال در زمینه سخت افزار کامپیوتر و محصولات بخش IT با سابقه ای نسبتا زیاد در راهنمایی کاربران عزیز ایرانی در سال 1382 هجری شمسی پایه گذاری شد ...

نگاهی به معماری جدید NVIDIA Ada Lovelace، قاصد نسل سوم فناوری NVIDIA RTX

تمامی حقوق برای سخت افزار محفوظ است.

    • درباره ما
    • تیم تحریریه
    • جوایز سخت افزار
    • تبلیغات
    • ارتباط با ما
    • سلب مسئولیت