Асимметричный ответ ATI: новая технология CrossFire

24 мая, в Москве, в самый разгар жаркой весны, сотрудники фирмы ATI провели конференцию, посвященную описанной в этой статье технологии, подробностям новой игровой приставки Xbox 360 и другим не менее полезным вещам. Было здорово, спасибо Николаю Радовскому и другим представителям компании за полезную информацию и очень компетентные ответы на вопросы!

Они также могут использовать технику под названием «альтернативная рендеринг кадров», где каждая карта генерирует другой кадр движущегося изображения, переворачивая между двумя картами несколько раз в секунду. Наличие двух графических процессоров позволяет отображать больше деталей или достигать более высокой частоты кадров для более плавного движения.

Эта технология также позволяет вам получить практически такую ​​же производительность из двух видеокарт среднего уровня, которые вы выбрали бы из одной карты высокого класса. Во-первых, это использование одной карты, которая так же быстро или быстрее, чем две карты.

А теперь, не мешкая, перейдем к сути статьи:

ATI CrossFire — так официально называется канадский ответ на NVIDIA SLI, о котором шептались и «подозревали» технологические форумы сети еще полгода назад. Есть ли отличия? Да, несомненно. Есть ли преимущества? Судя по всему, да, и весьма значительные. Через некоторое время мы опубликуем тесты и практические исследования аспектов качества, а пока исследуем теоретические и архитектурные стороны и попробуем спрогнозировать тенденции и результаты.

Технология ATI CrossFire обеспечивает четыре режима работы

Она также поддерживалась меньшим количеством пакетов программного обеспечения. Ваш случай также должен быть достаточно большим, чтобы содержать две видеокарты, имея в виду, что многие из них довольно большие, и ваш источник питания также должен будет иметь возможность использовать две ваттные головоломки. Наконец, вам может потребоваться обновить систему охлаждения, поскольку две видеокарты генерируют тепло, которое необходимо будет удалить из корпуса, чтобы не повредить ваш компьютер или его жесткий диск.

Общая архитектура CrossFire

Основная цель технологии — организация совместной работы двух графических ускорителей над построением изображения. Причем, архитектура должна быть не только эффективной (высокий КПД, низкая стоимость дополнительных схем, доступность для простых частных покупателей и энтузиастов), но и удобной в использовании (совместимость с уже существующими программами и даже с уже существующими аппаратными решениями, прозрачность, простота и надежность). Требований очень много, и, забегая вперед, похвалим ATI за качественный и очень продуманный подход при решении этих задач. Итак, нам предложена вот такая архитектура:

Его работа появилась в торговых изданиях, таких как «Журнал недвижимости в Миннесоте» и «Адвокат Ассоциации по многоквартирным домам в Миннесоте». Ландер имеет степень бакалавра искусств в области политологии из Колумбийского университета. Единственная проблема заключалась в том, что будущее просто не дошло до нас. Это, очевидно, оставило мне много вопросов относительно производительности, совместимости и т.д.

Частота часов не уменьшается с помощью драйвера, как в прошлом, но чистый эффект все тот же - вы всегда ограничены самой медленной картой. Сказав, что нет проблем при смешивании и сопоставлении различных размеров буфера кадра. Драйвер всегда будет использовать самый низкий общий знаменатель, будет ли он память или буфер кадров.

Несколько ускорителей (в варианте для пользователей их два) формируют собственную часть изображения, и выводят её через TMDS трансмиттеры в общепринятом цифровом стандарте DVI. Затем информация попадает в «черный» (на схеме — красный) ящик под названием Composing Engine, устройство, которое собственно и осуществляет совмещение результатов работы ускорителей для получения финального изображения. На выходе из этого красного ящика — вновь стандартный цифровой DVI сигнал, но на этот раз — уже финального кадра, собранного из двух порций данных, рассчитанных обоими VPU. Для устранения проблем с синхронизацией, Composing Engine содержит собственную буферную память, что позволяет этому устройству накапливать данные асинхронно, и, затем, по мере готовности обоих ускорителей, формировать и выдавать результирующий кадр. Таким образом, четкая синхронизация работы VPU не требуется, достаточно двух фактов — каждый VPU должен знать, какую часть данных ему надо рассчитать, и каждый VPU должен закончить передачу рассчитанных данных в этот «красный ящик», Composing Engine. После этого будет осуществлена передача кадра на устройство вывода, в формате DVI или (если нам нужен аналоговый сигнал) на внешний графический DAC, преобразующий цифровой DVI поток в стандартный аналоговый VGA сигнал.

Совместимые видеокарты для Crossfire

Эта дополнительная гибкость усложняет максимальную производительность, не влияя на качество. Некоторые приложения обновляют динамические постоянные буферы каждый кадр, в то время как другие приложения обновляют их реже. Поэтому мы снова должны найти правильный баланс, который обычно работает на качество, не влияя на производительность.

Обеспечение экстремальной производительности

В тех случаях, когда драйвер должен «отбрасывать» кадры, потому что один из кадров занимает больше времени, чем ожидалось, что-то там корректируется? Пусть другие люди беспокоятся о оптимальных настройках и разрешениях. Не все функции могут поддерживаться на всех компонентах или системах - обратитесь к производителю вашего компонента или системы за конкретными возможностями модели и поддерживаемыми технологиями.

Теперь самый актуальный вопрос — как VPU будут делить между собой рассчитываемые данные? Небольшая теоретическая часть на эту тему:

Основные алгоритмы взаимодействия ускорителей

Можно легко выделить три основных алгоритма, применяемых в наше время для этой цели в различных потребительских и профессиональных решениях:

Однако для каналов дистанционного управления задано гораздо больше, чем диапазон. Латентность, телеметрия, устойчивость к помехам, возможность подключения к интеллектуальным устройствам, простота использования и полная отделка слишком часто приносятся в жертву за последний бит диапазона.

Во время наших многочисленных миссий по всему миру мы собрали список требований и обнаружили, что ни одна существующая система не может покрыть их всех. Встроенная батарея на приемнике автоматически превращает ее в маяк - и она будет продолжать передавать свое последнее известное местоположение, пока батарея не разрядится.

  • Разделение экрана на несколько непересекающихся зон (Scissor, также известно как Slicing). Это решение используется в современной технологии NVIDIA SLI, и во многих специальных решениях, таких как симуляторы для обучения пилотов (несколько окон тренировочной установки, модели самолета), большие информационные мультиэкраны и т.д.

    Для двух VPU будет происходить вертикальное разделение финального кадра на две зоны. Интересно, что граница зон не обязательно должна проходить по середине кадра и может выбираться динамически, исходя из сложности той или иной части изображения — грубо говоря, в верхней половине может оказаться меньше объектов, чем внизу (небо) и тогда один из ускорителей будет простаивать, что может быть скомпенсировано увеличением его зоны ответственности. Задача подобной динамической балансировки нетривиальна, и требует анализа сцены, что не всегда удобно. Этот метод хорош для сбалансированных по критерию геометрических вычислений / закраска приложений, так как в идеале (при правильном адаптивном делении кадра на зоны ответственности), позволит им поровну распределить и геометрическую и пиксельную нагрузку по двум ускорителям.

    Общая архитектура CrossFire

    Но не верьте нам на слово. Это длинная связь, которую все ждали! Открываются новые возможности двусторонней связи. Адаптивная полоса пропускания управляет скоростью передачи или оптимизируется для максимального диапазона. Он обеспечивает сверхнизкую задержку с невероятной пропускной способностью.

    Для более высоких разрешений пропускная способность просто недостаточно. Это правда, что это всего лишь 10%, но, по крайней мере, это так. Какие ограничения вы думаете? Да, уже знал, что речь идет о фреймворзе, это, вероятно, было неблагоприятно сформулировано.

  • Построчное или шахматное или иное чередование рассчитываемых пикселей (Tiling) — самый удобный и прозрачный, с точки зрения организации, метод, когда ускорители рассчитывают соседние строчки (SLI от 3dfx, где чередовались четные и нечетные строки) или пиксели в шахматном порядке (фактически почти тоже самое) или соседние отсчеты для AA в рамках одного результирующего пикселя. Таким образом, нагрузка по закраске делится строго поровну, вне зависимости от конкретной сцены, а вот геометрическую нагрузку VPU приходится дублировать — оба ускорителя рассчитывают одни и те же геометрические данные. Получается, что в случае приложений, не упирающихся в геометрическую производительность ускорителя (а в наше время это практически все игровые приложения), этот метод может обеспечить серьезный прирост скорости закраски, вплоть до двукратного (если запас простаивающей геометрической производительности двукратный). Таким образом, мы распараллеливаем пиксельную работу поровну, имея близкий к 100% КПД, без каких-либо видимых проблем совместимости или сложностей в организации балансировки и разделения потока данных. Метод требует минимальных вмешательств в драйверы, прозрачен для приложений и выглядит наиболее оптимальным, сейчас, для игрового пользовательского рынка. Особенно, учитывая все большее число приложений с тяжелой пиксельной нагрузкой и шейдерными спецэффектами. Более того, по ходу дела, этот метод может быть использован для эффективного FSAA, основанного на усреднении отсчетов, рассчитанных разными ускорителями. Что в дополнение к MSAA, реализованному в каждом VPU, даст нам еще и суперсэмплинг (SSAA), способный решить некоторые проблемы не достаточно эффективно устраняемые MSAA.
  • Чередование рассчитываемых кадров (Alternate Frame Rendering) — методика знакомая нам еще по самому первому многочиповому решению ATI в пользовательской нише — RAGE Fury MAXX. Хороша для приложений, упирающихся в геометрическую производительность ускорителя и не критичных к плавности смены кадров, что, надо отметить, редкость в наше время в игровых приложениях, но может иметь место в DCC/CAD/CAM/CAE применениях (например, при интерактивном редактировании моделей в приложениях для создания реалистичной графики).

Итак, суммируем плюсы и минусы вышеописанных подходов:

Scissor
(Slicing)


  • Делит и геометрическую и пиксельную нагрузку
  • Высокая степень асинхронности работы VPU
  • Ускоритель полностью владеет своей подотчетной зоной изображения результата
  • Требует балансировки на лету зон для равномерного распределения нагрузки
  • Могут быть проблемы с AA на стыке зон
  • Требует заметного вмешательства в драйвер и потому высока вероятность неожиданной и неверной работы некоторых приложений

Tiling
+SuperAA

Чтобы иметь возможность написать комментарий, вы должны быть авторизованы! Однако будьте осторожны, так как две видеокарты не означают, что производительность в игре будет удвоена! Фактически, выигрыш от 15% до 40% наблюдается в зависимости от игр, что далеко не незначительно.

Помог ли вам Краб? Помогите ему, выключив блокировщик рекламы! Нет сырого ответа, необходимо учитывать несколько переменных. Так что же это дает уровень производительности? На уровне установки это детская игра. Вы всегда сможете играть в эти игры, но они не будут учитывать ваши две видеокарты, они будут использовать только один. Отметим большое изменение в миллисекундах, необходимое для рендеринга каждого изображения. Эта задержка в несколько миллисекунд будет восприниматься как рывок.

  • Делит пиксельную нагрузку ровно поровну
  • Очень точная балансировка нагрузки между VPU
  • Можно использовать для новых методик AA (SSAA)
  • Прозрачен для приложений и почти не требует модификации драйверов, мала вероятность неверной работы приложений
  • Не делит геометрическую нагрузку и потому требует существенного запаса в геометрической производительности
  • Требует достаточно синхронной работы ускорителей и соответственно отсутствия различия их скоростных и прочих характеристик

Alternate Frame Rendering

В целом, лучше инвестировать в высокопроизводительную и более дорогую графическую карту, чем добавлять две высокопроизводительные графические карты. Наконец, как указано в преамбуле, вторая видеокарта не доставляет все свои силы, поэтому вы платите графическую карту по высокой цене, чтобы использовать половину ее мощности.

Учитывая проблему несовместимости с некоторыми играми, рассмотрите игры, в которые вы будете играть. В этом случае перейдите к одной видеокарте высокого класса, она будет дешевле. Тем не менее, всегда лучше брать две видеокарты у одного производителя по соображениям стабильности.


  • Делит и пиксельную и геометрическую нагрузку, причем геометрия не дублируется по шине — разные ускорители получают разные наборы данных
  • Ускоритель полностью отвечает за свой кадр, никаких следов стыковки, даже в случае сложного постпроцессинга, никаких ограничений на метод построения кадра.
  • Неровное чередование кадров и распределение нагрузки
  • КПД сильно зависит от CPU и системы, а также от характера сцены и падает с ростом FPS
  • Проблема со значительной задержкой между кадром, который нам демонстрируется и кадром, который в данный момент строится.

Какой из них избрали специалисты ATI? Оставайтесь с нами, об этом чуть позже. А пока перейдем к конкретике реализации CrossFire в «железе». Как же вышеописанный метод «красного ящика», объединяющего изображения, был исполнен ATI на практике? Вот так:

Основные алгоритмы взаимодействия ускорителей

Мы можем комбинировать немного всего, пока графические карты основаны на одной и той же архитектуре. В целом, эти два решения очень похожи. В мире видеокарт есть несколько разногласий, чем включение нескольких карт на один компьютер. Действительно, как мы видели, мы обнаружили всестороннее сравнение, основанное на измерениях задержки.

Разумеется, у нас уже есть две видеокарты стоимостью более двадцати тысяч крон с налогами, которые сражаются за интересы клиентов в высшей категории. В дополнение к более высокой потребляемой мощности, шуму и высоким требованиям к пространству в корпусе, это в основном микроштукация или частота кадров неравномерности. Хотя пара карт генерирует большое количество кадров в секунду, латентность между ними неравномерна, а увеличение беглости, воспринимаемой человеческим глазом, не так, как ожидалось.

Конкретика CrossFire

Итак, у нас есть две карты, установленные в одной системе (требуется материнская плата CrossFire Edition), с двумя графическими PCI-Express слотами форм-фактора x16. Обычная карта ATI и специальная карта ATI с технологией CrossFire:


Вот почему статья называется «Асимметричный ответ» ;-) Оказывается, инженеры ATI решили поместить описанный выше «красный ящик» (С Engine на схеме) на одну карту, «главную», и передавать на него данные со второй карты через обычный внешний DVI разъем. Тем самым, создав решение, совместимое с уже существующими картами, выпущенными до появления CrossFire! Разве это не здорово — если у вас уже есть PCI-Express карта ATI с DVI выходом, то вам достаточно докупить специальную CrossFire карту, соединить DVI выход старой карты с новой при помощи специального провода, который идет в комплекте. И ваша суперсистема готова. На выходе новой карты вы получите уже собранное Composing Engine, по результатам работы обоих ускорителей изображение, в DVI или аналоговом VGA формате.

Цены, даты, прогнозы

Чтобы сравнить степень микроштуков и реальный поток игр с отдельными картами, необходимо было использовать измерение латентности вместо классического измерения частоты кадров. Это не очень практично, но это лучше, чем ничего.


Примечание редактора: эта статья была самой успешной на прошлой неделе. По этой причине мы сейчас публикуем его снова сегодня по случаю закрытия выходных дней со ссылкой на его успех.

Наши тесты показывают, что увеличение производительности сильно зависит от игры. Здесь производительность почти удвоилась: 22, 5 - 44, 3 кадра в секунду. Фактически, лишь немногие из протестированных нами игр достаточно масштабированы четырьмя графическими процессорами. Если это так, то потребляемая мощность также: Это увеличивается от примерно 600 Вт до 200 Вт - 1, 2 киловатт только для графических устройств. В дополнение к высокой цене входа для такой видеокарты и 200-ваттного источника питания, поэтому также сохраняются высокие затраты на последующее наблюдение.

На карте с технологией CrossFire установлен специальный разъем, напоминающий DVI, но имеющий большее число контактов, на схеме он обозначен как DMS. Через этот разъем в карту попадает DVI сигнал с первой карты, через него же из карты выходят сигналы DVI и аналогового VGА результирующего изображения, собранного красным ящиком. Кроме того, на исходной карте остается незадействованным второй выход (DVI+VGA или только VGA), а также TV-Out, а на карте CrossFire — тоже есть второй DVI+VGA. Все эти выходы, не участвующие в совместном построении изображения, разумеется, могут быть использованы для дополнительных мониторов и других стандартных применений в «мирное», не игровое время, но на них естественно нельзя выводить совместное изображение, рассчитанное обоими ускорителями в режиме CrossFire — оно поступает только на выходы разъема DMS.

Принципы работы Crossfire

В случае профиля перекрестного огня три из четырех графических чипов вообще не активируются. Драйверы последовательно развиваются дальше, и постепенно начинаются различные детские болезни, такие как микро-бег. Явление в видео, которое прилагается к этой статье, хорошо видно. В конце концов, сравнение спортивного автомобиля может быть здесь снова: невероятно необоснованно, но и невероятно весело! В гостях - старые монохромные компьютерные игры. Теперь почти любая игра, даже для тех, кто ранее использовал доски, такие как стратегия, усложнил трехмерные миры.

А теперь самый интересный вопрос. Внимание, знатоки. Какой алгоритм разбиения изображения был выбран ATI для реализации в своем «красном ящике»?

Правильный ответ — любой из трех описанных выше!

Физически, на CrossFire карте «красный ящик» представляет собою не специальный чип с жестко запрограммированным в него алгоритмом работы, а небольшой универсальный чип с программируемым массивом логических вентилей. Этот небольшой чип содержит в себе гибко настраиваемую схему логических элементов и буферную память для хранения промежуточных результатов, а алгоритм его работы задается драйверами, загружающими в него соответствующую схему связей. На данный момент ATI реализовали все три выше описанные методики, но это не значит, что в будущем не появятся новые, улучшенные или гибридные решения по разделению нагрузки на два ускорителя. Все, что будет необходимо — просто обновить драйверы. Не удержусь и второй раз похвалю инженеров ATI за элегантное решение — мало того, что такой подход существенно снизил стоимость разработки и внедрения CrossFire, он позволил выбирать для каждого конкретного применения режим, оптимальный с точки зрения КПД (из доступных) и, тем самым, во многом застраховал наши инвестиции в мультичиповое решение от капризов конкретных игр и приложений.

Поскольку это не может быть иначе для большего количества графических элементов, тем больше требуемая вычислительная мощность. Если есть устройство, которое выиграло от этого, безусловно, оно. Они превратились из элемента, способного отображать несколько символов на экране, чтобы ускорить все типы графических приложений. Они уже могут помочь в воспроизведении, кодировании и декодировании видео и фильмов, и вы даже можете использовать его для расчетов техники или финансов.

Проблема, с которой сталкиваются дизайнеры, всегда одинакова. Игры должны показывать более сложные миры. Чтобы усложнить все, в некоторых случаях вы можете даже взаимодействовать с объектами и имитировать даже физические аспекты. Если это сочетается с более крупными экранами на рынке, вы увидите, что для четкого представления объектов требуется более высокое разрешение. Если нам нужно вычислить больше очков, нам нужны более мощные карты. Это привело к тому, что эти элементы могут стать более дорогими и создавать больше температуры, чем даже сам микропроцессор.

Итак, задействуя CrossFire:

  • Мы можем использовать старую карту, уже установленную в нашей системе * , надо купить вторую CrossFire карту и системную плату с двумя графическими слотами PCI-Express (если такой еще нет).
  • Мы можем выбирать для каждого конкретного приложения оптимальный метод взаимодействия ускорителей при построении изображения. Причем, мы можем предоставить этот выбор драйверу, и тогда он будет сверяться со списком заранее проверенных ATI приложений, для которых уже подобрана оптимальная установка, или установит самый надежный с точки зрения прозрачности для приложения Tiling метод, если приложение ему не известно. А можем выбрать метод самостоятельно, поэкспериментировав с результатами в конкретном приложении, заботясь о КПД или о максимальном качестве изображения.
  • Мы можем получить, в будущем, новые режимы и методы взаимодействия.
  • Мы можем на лету, не перезагружая систему, включать и выключать CrossFire, а также менять режимы его работы.
  • У нас появляются новые методы AA — когда к 2, 4 или 6 семпловому MSAA в каждом чипе, добавляется еще и 2хSSAA — усреднение результатов в Composing Engine. В итоге получается уже знакомая нам по продуктам NVIDIA гибридная формула. В случае ATI, доступны два новых режима (пока) — SS2х(MS4x) SS2х(MS6х), которые почему-то названы ATI «10хAA» и «14хАА», что не совсем точно;-) скорее, надо было назвать их «2*4хAA» и «2*6xAA». Разумеется, в таких режимах устанавливается различное расположение отсчетов MSAA для первого и второго ускорителя, только тогда это сглаживание будет иметь смысл. Но, как мы знаем, у чипов ATI паттерн отсчетов гибко задается на сетке 4х4, и таким образом мы можем разместить там два набора по 6 отсчетов так, чтобы они не пересекались.
  • Мы можем использовать совместно карты разных производителей (например, ASUS и Sapphire в одной упряжке)!

* При условии, что у вас есть системная плата CrossFire Edition

Но, к счастью, генерация изображений может быть выполнена параллельно. То есть, если на графической карте есть процессор со многими, мы можем сделать каждый из них независимо друг от друга отображать часть экрана. Нет необходимости ждать, пока одна строка закончится, чтобы начать со следующего.

Что вы можете сделать, если вам нужно больше энергии?

Это делает современную карту с 400 или более ядрами внутри. Существует также число, которое заставляет их выделяться друг от друга. Хотя существуют разные режимы работы, концепция проста. Подключенные карты будут генерировать изображения и тем самым ускорить процесс.

Какие конкретные ограничения есть у этой технологии на данный момент:

  • Технология будет доступна (вначале) только для карт серии X800 и X850. Причем для обычных карт серии X800 необходима X800 карта с технологией CrossFire, а для карты X850 соответствующая CrossFire карта серии X850.
  • Любые карты семейства можно сочетать (любая X800 с X800 CrossFire и любая X850 с X850 CrossFire), но число конвейеров будет ограничено до минимального общего — то есть, если одна из карт 12 конвейерная, то и вторая, даже будучи 16 конвейерной, будет работать в режиме CrossFire как 12 конвейерная. Это сделано для балансировки производительности.
  • Технология совместного рендеринга работает только на один монитор.
  • Пока что объявлена гарантированная (!) совместимость только материнскими платами на чипсетах ATI серии Xpress 200 с приставкой CrossFire Edition для процессоров Intel и AMD, однако по мере тестирования и обкатки будут анонсироваться и совместимые платы на чипсетах других производителей — никаких принципиальных проблем в такой совместной работе нет, но могут возникать конкретные несовместимости.


Что вам нужно для использования этой технологии?

Прежде всего, нужно иметь две или более карты, способные подключаться. Не все совместимы друг с другом, поэтому, пожалуйста, проверьте его перед покупкой. Как только обнаруживается, появляется препятствие материнской платы. У вас должен быть чипсет, способный его поддерживать. Кроме того, вам нужно будет обновить драйверы. Снова вы можете проверить его на веб-сайте производителя.

Кроме того, если этот параметр используется, один видеовыход включен. Тогда вы не сможете использовать конфигурации с несколькими мониторами. Это и благодаря непрерывному продвижению этих технологий не воспринимает его как нечто неизменное и всегда проверяет спецификации карт перед их приобретением.

Какие перспективы есть у этой технологии на будущее:

  • Ее очень легко адаптировать к другим существующим (X700 и иже) и будущим решениям ATI. Фактически, любая новая флагманская карта ATI может выходить сразу и в исполнении с этой технологией
  • Будут проверены и признаны совместимыми новые системные платы с двумя графическими слотами, в том числе на чипсетах Intel и, возможно, даже на чипсетах NVIDIA.
  • Позже эта технология может быть масштабирована дальше, не секрет, что по аналогии с процессорами через пару лет могут появиться многоядерные или многочиповые ускорители в одном корпусе, и тогда станут возможными схемы 2*2 (две карты с двумя ускорителями на каждой).

Цены, даты, прогнозы

Теперь немного совсем приземленной конкретики. Для начала цены и доступность:

Причем, на прилавках магазинов CrossFire карты будут уже в конце июня, начале июля.

Вот такие данные по производительности решений с двумя картами, CrossFire X850 XT в сравнении с NVIDIA SLI 6800 Ultra приводит ATI (внимание: в обоих случаях задействованы две карты):

Для разрешения 1600х1200 (4xAA 8xAF)

Воздержимся от комментариев до получения собственных результатов скорости и качества работы этой технологии, а пока же отметим, что SLI работает лишь с ограниченным (причем сильно ограниченным) числом игр, в чем очень заметно проигрывает CrossFire, и, требует покупки двух новых карт, что также не может считаться большим плюсом по сравнению с CrossFire. Которая (потенциально) применима к практически миллиону уже существующих владельцев продуктов на базе всех карт семейства X800 и X850, без необходимости продавать свою старую карту.

Два самых актуальных вопроса: удастся ли ATI удержать это технологическое первенство? Ведь следующее поколение продуктов NVIDIA может взять на вооружение лучшие находки канадских специалистов в том или ином виде. И почему технология называется CrossFire — не имелась ли в виду одноименная машина фирмы Chrysler ? ;-)

Разумеется, реально очень многое будет зависеть от соотношения цена / производительность в конкретных играх. А также от наличия проблем с качеством изображения и совместимостью. Все эти аспекты мы исследуем в ближайшее время, а пока же подведем промежуточный итог:

Инженеры ATI создали очень выгодную, гибкую и удобную архитектуру многочипового рендеринга, нацеленную на конечных пользователей и игровые приложения. На бумаге перспективы CrossFire выглядят более заманчиво, чем NVIDIA SLI, а архитектурное решение можно (и нужно) признать более изящным и продуманным. В активе и совместимость с уже существующими картами и работа со всеми приложениями, и гибкий выбор метода совместной работы ускорителей. Разумеется, подобная технология нацелена на достаточно узкую нишу энтузиастов, и не принесет компании особенной сверхприбыли, но не следует забывать, что лидерство в абсолютном зачете, которое может обеспечить CrossFire, несомненно, скажется на продажах mainstream продукции ATI в лучшую сторону, а технологическое лидерство в такой области — не менее осязаемый и ценный вклад в имидж компании.

Альтернативная технология, позволяющая объединять две видеокарты для увели­чения производительности, получила название . По сравнению с тех­нологией NVIDIA SLI, у имеется ряд принципиальных отличий и преимуществ.

Напомним, что технология NVIDIA SLI имеет несколько ограни­чений: обе карты должны быть абсолютно идентичны или, другими словами, обла­дать одним и тем же BIOS (правда, требование идентичных BIOS было только в первых реализациях технологии NVIDIA SLI). Кроме того, режим SLI работает далеко не со всеми играми, а если и работает, то в ряде случаев не дает желаемого прироста производительности. К тому же эффективность технологии NVIDIA SLI и список поддерживаемых ею игр в значительной мере зависят от используемого видеодрайвера.

Технологии объединения видеокарт (Технология ATI CrossFire)

Технология ATI CrossFire работает со всеми играми под DirectX и OpenGL. Объединяемые видеокарты не обязательно должны быть одинаковыми и могут быть произведены разными компаниями. Технология ATI CrossFire подразумева­ет больше режимов рендеринга, чем NVIDIA SLI, и поддерживает режим улучше­ния качества изображения.

На первый взгляд CrossFire имеет немало общего с NVIDIA SLI: для работы CrossFire требуется материнская плата с двумя слотами PCI Express х16 под гра­фику. Хотя CrossFire теоретически не зависит от чипсета, ATI утверждает, что система будет работать только на материнских платах с чипсетом Radeon Xpress 200 CrossFire.

CrossFire-версия несколько отличается от обычных карг ATI. Для сборки системы CrossFire, кроме стандартной графической карты Radeon Х800 или Х850 (ведомая/ slave), потребуется специальная версия видеокарты Radeon Х800 или Х850 CrossFire (ведущая/master). При этом видеокарты не соединяются между собой мости­ком - только специальным внешним кабелем.

Специальный чип на ведущей CrossFire-карте смешивает картинки, сгенерирован­ные обычной и CrossFire-картой, после чего выводит изображение на дисплей. Смешивание происходит попиксельно.

Разделение на простую и CrossFire-версию карт на первый взгляд можно расценить как недостаток по сравнению со SLI, так как в случае с решением NVIDIA вам не нужно думать, какую карту брать, - обе одинаковые. Но если вдуматься, концепция ATI дает определенные преимущества.

Владельцы Radeon Х800 или Х850 могут без проблем докупить к своей системе любую модель CrossFire. Здесь не играют роли различия ни в тактовых частотах, ни в версиях BIOS, ни в конфигурации конвейера, ни в производителях. Един­ственное ограничение: модель CrossFire должна соответствовать другой графиче­ской карте. Другими словами, быть картой Х800 или Х850.

CrossFire-версия карты координирует тактовые частоты и адаптируется к обычной карте на основе пиксельных конвейеров. Скажем, если обычная карта использует 12 активных пиксельных конвейеров, то CrossFire-карта тоже перейдет на 12 кон­вейеров. Но за гибкость приходится платить. Владельцы «младшей» Х800 или Х850 заплатят достаточно приличную сумму за CrossFire-версию карты по сравнению со своей, и не факт, что они получат большой выигрыш, ведь темп гонки будет задавать обычная карта.

Технология ATI CrossFire обеспечивает четыре режима работы:

1. SuperTiling;

2. Scissor;

3. Alternate Frame Rendering (AFR);

4. Super AA.

Режим SuperTiling - это стандартный режим для технологии . Он рабо­тает для всех игр и приложений Direct3D. Следует отметить, что современные графические процессоры не обрабатывают одновременно все изображение - они разделяют его на небольшие квадраты (quads), которые раскладываются процес­сором по разным конвейерам. В режиме SuperTiling экран разбивается на отдельные квадраты размером 32 х 32 пиксела так, что каждая видеокарта получа­ет изображение с выделенными в шахматном порядке фрагментами для обработки. Таким образом, нагрузка делится строго поровну между кадрами, независимо от конкретной сцены, а вот геометрическую нагрузку приходится дублировать - обе карты рассчитывают одни и те же геометрические данные.

К преимуществам этого режима относится возможность работы со всеми играми и приложениями, а также оптимальное распределение нагрузки (с точки зрения пикселов). В то же время в некоторых приложениях в режиме SuperTiling произ­водительность возрастает незначительно. Обе карты должны просчитывать всю геометрию сцены, даже если затем они будут вычислять половину пикселов. В иг­рах, которые усиленно используют пиксельные программы, можно ожидать более высокого прироста производительности. Кроме того, режим SuperTiling не рабо­тает с играми OpenGL.


Реализация режима SuperTiling

Режим рендеринга Scissor разделяет экран на две части по горизонтали. Одна карга вычисляет верхнюю часть экрана, а вторая - нижнюю. Динамическая балансировка нагрузки позволяет разделить экран на части таким образом, чтобы на карты ложилась равная вычислительная нагрузка. Такой режим является стан­дартным для приложений OpenGL. Кроме того, данный режим позволяет получить прирост производи тельности в большинстве игр. В го же время, как и в случае SuperTiling, в режиме Scissor обе видеокарты должны полностью просчитывать геометрию сцены.

ATI CrossFire: режим (AFR)

Режим Alternate Frame Rendering (AFR) подразумевает поочередный рендеринг кадров каждым графическим процессором. Одна карта просчитывает все нечетные кадры, а вторая - все четные. 11ринцин легко понять, если учесть, что меняющаяся сцена всегда состоит из последовательности отдельных кадров, кото­рые быстро сменяют друг друга, создавая впечатление непрерывного движения.

Преимущество такого решения состоит в том, что обе карты оптимально распре­деляют вычислительную нагрузку. Однако в ряде случаев использование режима AFR невозможно: например, когда обработка следующего кадра напрямую зависит от результатов обработки предыдущего.

Четвертый режим CrossFire называется Super АА (Anti-Aliasing). Точнее, речь идет даже не об одном, а о четырех режимах Super АА: 8х АА, 10х АА, 12х А А и 14х АА. В данных режимах карта не обеспечивает более высокой частоты кадров (произ­водительности), но существенно улучшает качество картинки. Эти режимы по­зволят повысить качество изображения в играх, которые не получают выигрыша в производительности от использования двух видеокарт. Наличие данных аль­тернативных режимов рендеринга является ключевым отличием технологии от NVIDIA SLI.

Режимы Super АА можно использовать во всех приложениях без каких бы то ни было ограничений, поскольку они не предполагают распределения рабочей нагруз­ки между двумя видеокартами - каждая карга выполняет рендеринг кадра на основе уникального набора точек-семплов, после чего результаты рендеринга объ­единяются и формируется единое изображение.

В режиме 8х АА обе карты генерируют одно и то же изображение, причем каждая из них работает в режиме сглаживания изображения 4х, но использует разные точки-семплы (шаблоны сглаживания). Затем чип смешивает обе картинки в одну. В результате пользователь получает сглаживание 8х по цене 4х FSAA.

Аналогично в режиме 12х АА каждая карта работает в режиме сглаживания изо­бражения 6х, но использует разные шаблоны. В результате смешивания картинок получается режим сглаживания 12х АА при производительности, соответствующей режиму 6х FSAA.

В режимах 10х АА и 14х АА используется принципиально новая концепция режи­ма SSAA (SuperSampling АА). Фактически данные режимы сглаживания представ­ляют собой комбинацию режимов 8х АА и 12х АА с новой технологией сглажива­ния 2х SuperSampling А А, при которой каждая карта осуществляет обработку всей сцены с необходимым разрешением и сдвигом на иолпиксела по диагонали. В ито­ге рендеринг сцены фактически выполняется в режиме 10х АА (8х АА + 2х SSAA) или 14х АА (12х АА + 2х SSAA).



Эта статья также доступна на следующих языках: Тайский

  • Next

    Огромное Вам СПАСИБО за очень полезную информацию в статье. Очень понятно все изложено. Чувствуется, что проделана большая работа по анализу работы магазина eBay

    • Спасибо вам и другим постоянным читателям моего блога. Без вас у меня не было бы достаточной мотивации, чтобы посвящать много времени ведению этого сайта. У меня мозги так устроены: люблю копнуть вглубь, систематизировать разрозненные данные, пробовать то, что раньше до меня никто не делал, либо не смотрел под таким углом зрения. Жаль, что только нашим соотечественникам из-за кризиса в России отнюдь не до шоппинга на eBay. Покупают на Алиэкспрессе из Китая, так как там в разы дешевле товары (часто в ущерб качеству). Но онлайн-аукционы eBay, Amazon, ETSY легко дадут китайцам фору по ассортименту брендовых вещей, винтажных вещей, ручной работы и разных этнических товаров.

      • Next

        В ваших статьях ценно именно ваше личное отношение и анализ темы. Вы этот блог не бросайте, я сюда часто заглядываю. Нас таких много должно быть. Мне на эл. почту пришло недавно предложение о том, что научат торговать на Амазоне и eBay. И я вспомнила про ваши подробные статьи об этих торг. площ. Перечитала все заново и сделала вывод, что курсы- это лохотрон. Сама на eBay еще ничего не покупала. Я не из России , а из Казахстана (г. Алматы). Но нам тоже лишних трат пока не надо. Желаю вам удачи и берегите себя в азиатских краях.

  • Еще приятно, что попытки eBay по руссификации интерфейса для пользователей из России и стран СНГ, начали приносить плоды. Ведь подавляющая часть граждан стран бывшего СССР не сильна познаниями иностранных языков. Английский язык знают не более 5% населения. Среди молодежи — побольше. Поэтому хотя бы интерфейс на русском языке — это большая помощь для онлайн-шоппинга на этой торговой площадке. Ебей не пошел по пути китайского собрата Алиэкспресс, где совершается машинный (очень корявый и непонятный, местами вызывающий смех) перевод описания товаров. Надеюсь, что на более продвинутом этапе развития искусственного интеллекта станет реальностью качественный машинный перевод с любого языка на любой за считанные доли секунды. Пока имеем вот что (профиль одного из продавцов на ебей с русским интерфейсом, но англоязычным описанием):
    https://uploads.disquscdn.com/images/7a52c9a89108b922159a4fad35de0ab0bee0c8804b9731f56d8a1dc659655d60.png