Asynchronous compute, AMD, Nvidia, و DX12: ما نعرفه حتى الآن

4
 
من طرف Mobileshop.ae
Asynchronous compute, AMD, Nvidia, و DX12: ما نعرفه حتى الآن

منذ أن DirectX 12 أعلن عن AMD و Nvidia قد jockeyed عن موقف من منهم سوف نقدم أفضل دعم API جديد ومختلف الميزات. إمكانية أن AMD قد تحدث على نطاق واسع هو GCN دعم asynchronous compute . Asynchronous compute يتيح لجميع وحدات معالجة الرسومات على أساس AMD معمارية GCN أداء الرسومات وحساب أعباء العمل في آن واحد. في الأسبوع الماضي, أكسيد ألعاب الموظف وأفادت وعلى عكس الاعتقاد السائد ، نفيديا الأجهزة لم أستطع إجراء غير متزامن حساب و أن تأثير الأداء من محاولة القيام بذلك كانت كارثية على الشركة من الأجهزة.

هذا الإعلان انطلقت موجة من البحث في ما Nvidia الأجهزة أو عدم الدعم ، وكذلك القصصية يدعي أن الناس (أو فعلت) العودة GTX 980 Ti مبنية على رماد التفرد في الأداء. لقد قضيت الأيام القليلة الماضية في حديث مع مصادر مختلفة تعمل على المشكلة ، بما في ذلك Mahigan و CrazyElf في Overclock.netوكذلك من خلال تحليل مختلف مجموعات البيانات وتقارير الأداء. Nvidia لم تستجب لطلب توضيحات بعد, لكن هنا الوضع كما نحن حاليا فهمه.

Nvidia, AMD, و asynchronous compute

عندما AMD و Nvidia الحديث عن دعم متزامن حساب أنهم لا يتحدثون عن نفس الأجهزة القدرة. غير متزامن قيادة المحركات في AMD Gpu (بين 2 إلى 8 اعتمادا على البطاقة التي تملكها) قادرة على تنفيذ أعباء عمل جديدة في latencies منخفضة مثل دورة واحدة. الراقية AMD بطاقة ثمانية ACEs و كل الآس ثمانية قوائم الانتظار. ماكسويل, وعلى النقيض من ذلك ، فقد اثنين من خطوط أنابيب, واحد منها هو ذات الأولوية العالية أنابيب رسومات. الأخرى لديها قائمة انتظار عمق 31 — ولكن Nvidia لا يمكن التبديل السياقات في أي مكان بالقرب بأسرع AMD يمكن.

وفقا حديث معينة في GDC 2015, هناك قيود على نفيديا preeemption القدرات. نص إضافي أدناه الشريحة يفسر أن "GPU يمكن التبديل فقط السياقات في أوجه نداء حدود" و "المستقبل Gpu, نحن نعمل على تمكين الدقيقة الحبيبات الاستباق ، لكن ما زال الطريق طويلا." استكشاف مختلف قدرات ماكسويل و GCN المستخدمين في Beyond3D ، Overclock.net استخدمت غير متزامن حساب اختبارات تقييم القدرة على كل من AMD و Nvidia الأجهزة. المعيار تم تنقيحه عدة مرات في الأسبوع في وقت مبكر جدا النتائج لا تقارن البيانات رأينا في تشغيل لاحق.

علما بأن هذا اختبار من asynchronous compute الكمونوليس الأداء. هذا ليس اختبار الإنتاجية الكلي — وبعبارة أخرى ، فقط كم من الوقت يستغرق تنفيذ الاختبار هو إثبات ما إذا asynchronous compute تحدث أو لا. لأن هذا هو زمن اختبار انخفاض عدد (أقرب إلى الأصفر "1" line) يعني نتائج أقرب إلى المثالية.

Radeon R9 290

هنا هو R9 290 الأداء. الخط الأصفر هو الكمال — هذا ما كنا عليه إذا GPU تحولت وتنفيذها على الفور. Y-محور الرسم البياني تطبيع الأداء 1x, حيث كنا نتوقع الكمال غير متزامن استتار أن يكون. الخط الأحمر هو ما يهمنا في هذا. يظهر GCN أداء مثالي تقريبا في معظم الحالات عقد الأداء ثابت حتى في الخيط التهم الارتفاع. الآن قارن هذا نفيديا GTX 980 Ti.

vevF50L

محاولة تنفيذ الرسومات و حساب في وقت واحد على GTX 980 Ti أسباب الانخفاضات و المسامير في الأداء قليلا في الطريق من المكاسب. الآن لا يوجد سوى عدد قليل من الخيط يهم أين Nvidia مباريات مثالية الأداء (كمون, في هذه الحالة) و كثير من الحالات حيث لا. مزيد من التحقيق إلى أن نفيديا asynch أنابيب يظهر تتكئ على وحدة المعالجة المركزية على بعض الخطوات الأولية ، بينما AMD GCN مقابض العمل في الأجهزة.

الآن أفضل الأدلة المتاحة تشير إلى أنه عندما AMD و Nvidia الحديث عن asynchronous compute أنهم يتحدثون عن اثنين مختلفة جدا من قدرات. "Asynchronous compute" في الحقيقة ، ليست بالضرورة أفضل اسم ما يحدث هنا. السؤال هو ما إذا كان أو لم Nvidia Gpu يمكن تشغيل الرسومات وحساب أعباء العمل بشكل متزامن. AMD يمكن مجاملة من الآس الوحدات.

 

من المقترح أن AMD نهج أكثر مثل Hyper-Threading التي يسمح GPU العمل على تباين في حساب والرسومات أعباء العمل في وقت واحد من دون خسارة في الأداء ، في حين أن Nvidia قد يميل على وحدة المعالجة المركزية من الإعداد الأولي الخطوات محاولة جدولة المتزامن حساب + الرسومات عبء العمل المثالي التنفيذ. من الواضح أن العملية لا يعمل بعد. منذ الأولي من المادة أكسيد منذ ما يلي:

"نحن في الواقع مجرد تجاذب اطراف الحديث مع Nvidia عن Async حساب الواقع السائق لم تنفذ بالكامل بعد ، ولكن يبدو كما كان. ونحن نعمل بشكل وثيق مع لهم لأنها تنفذ بالكامل Async حساب."

هنا هو ما قد يعني بالنظر Nvidia نفسها العروض في GDC و اختبار مختلف المعايير التي تم تجميعها على مدى الأسبوع الماضي. ماكسويل لا GCN-نمط التكوين asynchronous compute محركات و لا يمكن التبديل بين الرسومات وحساب أعباء العمل بأسرع GCN. وفقا Beyond3D المستخدم EXt3h :

"كانت هناك مطالبات في الأصل أن Nvidia Gpu لن تكون قادرة على تنفيذ async حساب shaders في async الأزياء في جميع هذه الأسطورة سرعان ما فضحت. ما أصبح واضحا هو أن Nvidia Gpu يفضل الكثير من حمل أخف من بطاقات AMD. في الأحمال الصغيرة, Nvidia Gpu تشغيل الدوائر حول بطاقات AMD. في تحميل عالية, حسنا, على العكس تماما, تصل إلى نقطة حيث Nvidia Gpu استغرق كل هذا الوقت الطويل أن عملية عبء العمل تفجر الضمانات في نظام التشغيل Windows. مما تسبب في ويندوز الزناد وقتل سائق, على افتراض أنه علق.

"النتيجة النهائية (حتى الآن): AMD Gpu قادر على التعامل مع أعلى بكثير من الحمل. حوالي 10 أضعاف أضعاف ما Nvidia Gpu يمكن التعامل معها. لكنهم أيضا بحاجة أيضا عن 4x الضغط قبل أن يصلوا إلى اللعب هناك من القدرات."

Ext3h يذهب إلى القول بأن الاستباق في Nvidia قضية تستخدم فقط عند التبديل بين الرسومات السياقات (1x الرسومات + 31 لحساب mode) و "نقية حساب السياق" ولكن يدعي أن هذه الوظيفة "تماما مكسورة" على بطاقات Nvidia في الوقت الحالي. ويذكر أيضا أنه في حين أن ماكسويل 2 (GTX 900 عائلة) قادر على تنفيذ متوازي "الأجهزة لا يستفيدون منها كثيرا على الرغم من أن لديها فقط قليلا 'الثغرات' في تظليل استخدام كلتا الحالتين. حتى في نهاية المطاف, هي متسلسلة تنفيذ معظم عبء العمل ، على الرغم من إذا كنت تمكنت من تعطيل خط أنابيب في بعض الطريق عن طريق بناء مؤسفة عبء العمل ، يمكنك أن تربح من ذلك".

Nvidia في الوقت ذاته تمثل أكسيد أنه يمكن تنفيذ asynchronous compute غير أن هذه القدرة لم يكن كاملا في تمكين السائقين. مثل أكسيد سننتظر و نرى كيف تتطور الحالة. تحليل مؤشر ترابط في Beyond3D يجعل من الواضح جدا أن هذه مسألة معقدة بشكل لا يصدق ، والكثير من Nvidia و ماكسويل قد أو قد لا تعمل غير واضح.

في وقت سابق ذكرنا أن AMD نهج غير متزامن الحوسبة بشكل سطحي يشبه Hyper-Threading. هناك طريقة أخرى يكون فيها هذا التشبيه قد يثبت دقة: عندما Hyper-Threading لاول مرة العديد من AMD المشجعين سألت لماذا الفريق الأحمر لم نسخ ميزة تعزيز الأداء على K7 و K8. AMD رد في وقت K7 و معالجات K8 كان أقصر بكثير أنابيب جدا أبنية مختلفة ، في جوهرها أقل من المرجح أن تستفيد من Hyper-Threading نتيجة لذلك. على P4, في المقابل, كان طويل أنابيب عالية نسبيا كشك معدل. إذا كان مؤشر ترابط واحد المتوقفة, HT يسمح مؤشر ترابط آخر على مواصلة التنفيذ مما عزز الشريحة الأداء العام.

GCN-نمط غير متزامن الحوسبة من غير المرجح أن تعزز ماكسويل الأداء, وبعبارة أخرى, لأن ماكسويل ليست مصممة لهذا النوع من العمل. سواء Nvidia للتغلب على هذا التحديد (أو تنفيذ شيء حتى أسرع) يتضح

التعليقات 0

لنترك التعليق دخول أو تسجيل