• Menarate
  • Hi-tech Новости
  • Асинхронные вычисления, АМД, Нвидиа, и DX12: что мы знаем до сих пор

Асинхронные вычисления, АМД, Нвидиа, и DX12: что мы знаем до сих пор

4
от Mobileshop.ae
Комментарии: 0
Асинхронные вычисления, АМД, Нвидиа, и DX12: что мы знаем до сих пор

С тех пор, совместимая с DirectX 12 было объявлено, AMD и NVIDIA уже боролись за высокие места на относительно того, какие из них предлагают улучшенную поддержку нового API и его различные функции. Одна возможность, что AMD уже говорили до обширно ГКН является поддержка асинхронных вычислений . Для асинхронных вычислений позволяет все видеокарты, основанные на технологии AMD архитектуры gcn для выполнения графических и вычислительных рабочих нагрузок одновременно. На прошлой неделе, оксид игры сотрудник сообщил, что вопреки всеобщему убеждению, оборудования NVIDIA не мог выполнять асинхронные вычисления и влияние на производительность попытке сделать это был плачевным в компании оборудования.

Этот анонс начался шквал исследований оборудования от NVIDIA не поддерживают, а также анекдотических утверждений, что люди будут (или уже сделал) возвращают свои карты GTX 980 ти основано на пепелище необычность исполнения. Мы провели последние несколько дней в разговоре с различных источников, работая над проблемой, в том числе Mahigan и CrazyElf на Overclock.net, а также синтаксического анализа с помощью различных наборов данных и отчетов об их исполнении. Компания NVIDIA не откликнулся на нашу просьбу разъяснить как еще, но вот в ситуации как мы в настоящее время понимаем это.

Компании NVIDIA, AMD и асинхронных вычислений

Когда AMD и NVIDIA разговоры о поддержке асинхронного вычисления, они не говорят о том же аппаратные возможности. Асинхронные двигатели команду в компании AMD графические процессоры (между 2-8 зависимости от того, какой картой вы владеете) способны выполнении новых рабочих нагрузок на задержки как минимум в качестве единого цикла. Высокого класса от AMD карта имеет восемь Эйсов и каждый туз имеет восемь очередей. Максвелл, напротив, имеет два трубопровода, один из которых является одним из приоритетных графического конвейера. В другой-глубиной очереди-31 — но NVIDIA не сможете переключать контексты нигде рядом столь же быстро, как AMD может.

По материалам выступления на gdc 2015, существуют ограничения на технологию NVIDIA preeemption возможности. Дополнительный текст под слайдом объясняет, что “ГПУ может только переключение контекстов на звонок нарисовать границы” и “о будущих графических процессоров, мы работаем над тем, чтобы включить более тонкую прерываниями, но это еще далеко.” Исследовать различные возможности Максвелл и gcn, пользователи на Beyond3D и Overclock.net использовали асинхронные вычислительные тесты, которые оценивали потенциал по обе AMD и NVIDIA оборудования. Ориентир был пересмотрен несколько раз за неделю, так что первые результаты не сопоставимы с данными, которые мы видели в более поздних пробегах.

Отметим, что это испытание асинхронного вычисления задержки, не существенно. Это не тест общая пропускная способность — другими словами, просто как долго это берет, чтобы выполнить — и тест предназначен для демонстрации при асинхронных вычислений происходит или нет. Потому что это латентный тест, нижние цифры (ближе к желтому “1” линия) означает результат ближе к идеальному.

Radeon R9 290

Вот Р9 290 производительности системы. Желтая линия-совершенство — вот что мы получим если GPU переключается и выполняется мгновенно. Ось ординат на графике показаны нормированные производительности на 1х, который является, где мы ожидали бы идеальной асинхронной задержки быть. Красная линия-это то, что нас больше всего интересует. Он показывает ГКН выполнение почти идеально в большинстве случаев, проведение устойчивая производительность даже как нить поднимутся показатели. Теперь сравните это от NVIDIA видеокарты GTX 980 ти.

vevF50L

Попытка запустить графику и вычисления одновременно на карте GTX 980 ти причин провалов и скачков в производительности и мало прибыли. Прямо сейчас, есть только несколько ниток насчитывает где от NVIDIA соответствует идеальной производительности (задержка, в данном случае) и много случаев, когда это не так. Дальнейшее расследование показало, что асинхронное трубопровода от NVIDIA появляется, чтобы опереться на CPU для некоторых своих первоначальных шагов, тогда как AMD в ГКН ручек работа в аппаратной.

Прямо сейчас, лучшие имеющиеся данные свидетельствуют о том, что когда AMD и NVIDIA поговорим об асинхронных вычислений, они говорят о двух очень разных возможностей. “Асинхронных вычислений”, на самом деле, не обязательно лучшее название тому, что тут происходит. На вопрос, является ли или не графических процессоров NVIDIA может запустить графику и вычислительных рабочих нагрузок одновременно. AMD может, любезность своего туза единиц.

 

Было высказано предположение, что АМД подход больше напоминает технологию Hyper-Threading, которая позволяет графическому процессору работать на разнородных вычислительных и графических задач одновременно без потери производительности, в то время как NVIDIA может быть опираясь на CPU для некоторых своих первоначальных шагов настройки и попытке запланировать одновременные вычисления + графика нагрузки для идеального исполнения. Очевидно, что процесс не работает, что ж еще. Поскольку наши первоначальные статьи, оксид заявил следующее:

“На самом деле мы просто болтали с NVIDIA об асинхронных вычислений, действительно водитель не полностью реализован его пока нет, но мне показалось, что это было. Мы работаем в тесном сотрудничестве с ними, поскольку они полностью реализуют асинхронные вычисления.”

Вот что что, скорее всего, означает, дается от NVIDIA собственные презентации на gdc и различными контрольными показателями, которые были собраны на прошлой неделе. Максвелл не имеет ГКН стиле конфигурация ядра для асинхронных вычислений и он не может переключаться между графическим и вычислительными нагрузками как быстро как ГКН. По данным Beyond3D пользователя EXt3h :

“Были претензии изначально, что GPU от NVIDIA даже не быть в состоянии выполнять асинхронные вычислительные шейдеры в асинхронной моде вообще, этот миф был быстро развенчан. Что стало ясно, однако, заключается в том, что GPU от NVIDIA предпочли гораздо более тяжелые нагрузки, чем карточки от AMD. При малых нагрузках графических процессоров NVIDIA будет ходить кругами вокруг карточки от AMD. При большой нагрузке, а, наоборот, до точки, где графических процессоров NVIDIA принял такое долгое время для обработки рабочей нагрузки, которую они срабатывают гарантий в Windows. Что вызвало окон, чтобы спустить курок и убить водителя, предполагая, что он застрял.

“Конечный результат (на данный момент): технология AMD графические процессоры способны обрабатывать гораздо более высокие нагрузки. Примерно в 10х раз больше, чем графических процессоров NVIDIA может обрабатывать. Но они также нуждаются также около 4х давление, прежде чем они доберутся, чтобы играть там возможности.”

Ext3h говорится, что в случае вытеснения от NVIDIA используется только при переключении между графических контекстов (1х графика + 31 вычислить режим) и “чисто вычислительном контексте,” но утверждает, что эта функциональность находится “сокрушается ” на карт NVIDIA в настоящее время. Он также заявляет, что пока Максвелл 2 (у GTX 900 семейные) способен параллельного выполнения, “аппаратура не прибыль от нее много, хотя, поскольку есть только маленький ‘пробелы’ в шейдер утилизации либо способом. Так в итоге, это все-таки просто последовательное исполнение для наиболее нагрузкой, хотя если вам все же удалось задержать трубопровода в некотором роде, создав досадной нагрузкой, вы бы все равно прибыли от него.”

Компания NVIDIA, между тем, представлял в оксид, что он может реализовать асинхронные вычисления, однако, что и эта возможность не была полностью включена в драйверы. Как окись, мы собираемся подождать и посмотреть, как развивается ситуация. Анализ резьба на Beyond3D делает его очень ясно, что это невероятно сложный вопрос, и многое из того, что NVIDIA и Максвелл могут или не могут делать непонятно.

Ранее, мы упоминали, что AMD подход к асинхронным вычислениям внешне напоминала гипер-продевать нитку. Есть еще один способ, который может доказать, что аналогия точная: если Многопоточность дебютировал, многие драмов болельщики спрашивали, почему команда красных не скопировал функцию, чтобы повысить производительность на К7 и К8. AMD в ответ на раз было, что К7 и К8 процессоры имели намного меньшие трубопроводы и очень разных архитектур, и неразрывно меньше шансов воспользоваться преимуществами технологии Hyper-Threading, как результат. В Р4, в отличие от него, был длинный конвейер и сравнительно высокой кабиной ставка. Если один поток останавливается, ХТ позволило другой поток продолжит выполнение, которое увеличило общую производительность чипа.

ГКН-стиль асинхронных вычислений, вряд ли это улучшит производительность Максвелл, иными словами, потому, что Максвелл на самом деле не предназначен для такого рода нагрузок. То ли от NVIDIA может обойти это ограничение (или реализовать что-то даже быстрее), еще неизвестно

Коментарии 0

Чтобы оставить свой комментарий Войдите или Зарегистрируйтесь