на главную страницуна главную страницуна главную страницу

Коротко | Процессоры | Системные платы | Видеосистема | Носители информации | Мультимедиа | Периферия | Домашние кинотеатры | Портативные ПК | Мобильная связь | Изображение в числах | Коммуникации | Колонка редактора | Конференция | Поиск по сайту | Komok.com | Computorg | Журнал iXBT.com | Драйверы Rambler's Top100


ATI RADEON 9800 PRO 128MB


"9800 - это не только 9700 плюс 100,
но и оптимизация драйверов с F-buffer-ом..."


СОДЕРЖАНИЕ

  1. Общие сведения
  2. Особенности видеокарты ATI RADEON 9800 PRO 128MB
  3. Конфигурации тестовых стендов и особенности настроек драйверов
  4. Результаты тестов: коротко о 2D
  5. Синтетические тесты RightMark3D: идеология и описание тестов
  6. Результаты тестов: RightMark3D: Pixel Filling
  7. Результаты тестов: RightMark3D: Geometry Processing Speed
  8. Результаты тестов: RightMark3D: Hidden Surface Removal
  9. Результаты тестов: RightMark3D: Pixel Shading
  10. Результаты тестов: RightMark3D: Point Sprites
  11. Результаты тестов: Синтетические тесты 3DMark2001 SE
  12. Выводы из результатов синтетических тестов
  13. Результаты тестов: Игровые тесты 3DMark2001 SE: Game1
  14. Результаты тестов: Игровые тесты 3DMark2001 SE: Game2
  15. Результаты тестов: Игровые тесты 3DMark2001 SE: Game3
  16. Результаты тестов: Игровые тесты 3DMark2001 SE: Game4
  17. Результаты тестов: Игровые тесты 3DMark03: Game1
  18. Результаты тестов: Игровые тесты 3DMark03: Game2
  19. Результаты тестов: Игровые тесты 3DMark03: Game3
  20. Результаты тестов: Игровые тесты 3DMark03: Game4
  21. Результаты тестов: Quake3 ARENA
  22. Результаты тестов: Serious Sam: The Second Encounter
  23. Результаты тестов: Return to Castle Wolfenstein
  24. Результаты тестов: Code Creatures DEMO
  25. Результаты тестов: Unreal Tournament 2003 DEMO
  26. Результаты тестов: AquaMark
  27. Результаты тестов: RightMark 3D
  28. Результаты тестов: DOOM III Alpha version
  29. Качество 3D
  30. Выводы

Общие сведения

Не успели отзвучать фанфары по поводу выхода "в свет" последних продуктов от NVIDIA — GeForce FX 5600 (NV31) и GeForce FX 5200 (NV34), а также результатов тестирования High-End-долгостроя GeForce FX 5800 (NV30), как канадская компания ATI Technologies снова пошла в атаку и анонсировала также целую линейку нового поколения видеоакселераторов.

Впрочем, как покажут наши исследования ниже, да и судя по тем сведениям, что нам доступны, линейка представляет собой лишь несколько видоизмененные и улучшенные продукты. Давайте посмотрим на новое семейство:

  • RADEON 9800 PRO — 380 МГц чип, 128 Мбайт 340 МГц (DDR 680) 256 бит локальной памяти;
  • RADEON 9800 — 325? МГц чип, 128 Мбайт 310? МГц (DDR 620?) 256 бит локальной памяти;
  • RADEON 9600 PRO — 400? МГц чип, 128 Мбайт 300? МГц (DDR 600) 128 бит локальной памяти;
  • RADEON 9600 — 350? МГц чип, 64/128 Мбайт 275? МГц (DDR 550) 128 бит локальной памяти;
  • RADEON 9200 PRO — 275 МГц чип, 64/128 Мбайт 275 МГц (DDR 550) 128 бит локальной памяти;
  • RADEON 9200 — 250 МГц чип, 64/128 Мбайт 200 МГц (DDR 400) 128 бит локальной памяти.


По сути два последних продукта — это тот же RADEON 9000/PRO, но с AGP 8x, поэтому ничего нового. Однако, маркетологи снова выдали перл: присвоили более высокий номер 9200 чипу (карте), который слабее нынешнего RADEON 9100 (бывшего RADEON 8500LE). Что будут представлять собой в реальности 9600 и 9600 PRO, пока никто не знает, но уже некоторые данные имеются, прежде всего о том, что эти процессоры будут фактически половиной от 9800/Pro (4 пиксельных и 2 вершинных конвейера). В Сети имеются утечки информации о том, что производительность новых 9600/PRO ниже, чем у нынешних 9500/PRO. Разумеется, верить слухам — неблагодарное дело, по мере появления карт и драйверов мы обязательно их будем исследовать, но все же симптомы пока тревожные, ведь не так давно мы провели тестирование последних продуктов от NVIDIA для mainstream и low-секторов рынка (NV31/34), где эти ускорители в тяжелых режимах работы (АА и анизотропия) весьма успешно соперничали с линейкой RADEON 9500/PRO. Чтож схватка предстоит жаркая!

Впрочем, не будем забегать вперед, время покажет. Сегодня все же мы рассматриваем High-End продукт. Кстати, если вернуться в русло вышеприведенных рассуждений, то зададим вопрос: RADEON 9800 PRO — это нечто новое с точки зрения технологий и 3D-функций или же просто разогнанный вариант RADEON 9700 PRO?



Полагаем, что читатели получат исчерпывающий ответ из нашего настоящего материала. Кстати, напомним список обзоров, посвященных RADEON 9700/9700 PRO, откуда можно почерпнуть все подробности, связанные с предыдущим High-End продуктом от ATI:

Приведем характеристики, с которыми RADEON 9800 PRO был анонсирован:

  1. Технология производства: 0.15 микрон;
  2. Число транзисторов: 115 миллионов;
  3. Тактовая частота ядра: 380 МГц;
  4. Шина памяти: 256 бит DDR (позже, возможно DDR II);
  5. Максимальный объем локальной памяти: 256 Мб;
  6. Тактовая частота памяти: 340 DDR (680) МГц, пропускная способность около 24 Гб/сек;
  7. Интерфейсная шина: AGP 8x, пропускная способность 2 Гб/сек;
  8. Полная поддержка основных возможностей DX9:
    1. Плавающие 64 и 128 бит форматы данных для текстур (включая объемные и кубические текстуры) и кадрового буфера (векторы из 4 компонент F16 или F32);
    2. Пиксельные конвейеры с плавающей арифметикой (формат вычислений F24[4] или F24[3+1]);
    3. Пиксельные шейдеры версии 2.0;
    4. Четыре независимых вершинных конвейера;
    5. Вершинные шейдеры версии 2.0;
    6. Аппаратная тесселяция N-Patches с картами смещения (Displacement Mapping) и, по желанию, адаптивным уровнем детализации;
    7. Новая технология F-буфера позволяет исполнять пиксельные шейдеры практически неограниченной длины.
  9. Восемь независимых пиксельных конвейеров
  10. Восемь текстурных блоков (по одному на пиксельный конвейер), способных производить трилинейную фильтрацию без потери скорости, а также комбинировать анизотропную фильтрацию с трилинейной.
  11. Четырехканальный (4 канала по 64 бита) контроллер памяти, связанный с ядром ускорителя и AGP коммутатором "каждый-с-каждым";
  12. Технология экономии пропускной полосы памяти HyperZ III+ (Быстрая очистка и сжатие буфера глубины на основе блоков 8х8, иерархический Z-буфер для быстрого определения видимости);
  13. Дополнительные оптимизации для скоростной работы двустороннего буфера шаблонов.
  14. Ранний Z-тест (пиксельный шейдер выполняется только для видимых пикселей);
  15. Аппаратное ускорение распаковки и сжатия MPEG 1/2, возможность произвольно обрабатывать видеопоток с помощью пиксельных шейдеров (технология VIDEOSHADER);
  16. Два независимых CRTC;
  17. Два встроенных 10 бит 400 МГц RAMDAC с аппаратной гаммакоррекцией;
  18. Встроенный TV-Out;
  19. Встроенный DVI (TDMS трансмиттер) интерфейс, разрешение до 2043*1536.
  20. Встроенный цифровой интерфейс общего назначения для подключения внешнего RAMDAC или DVI трансмиттера, а также для сопряжения с TV тюнером.
  21. FC корпусовка (FlipChip — с перевернутым открытым кристаллом).

Итак, характеристики, очень близки к предыдущему флагману — R300. Основным аппаратные отличия кроются в двух областях — оптимизации производительности работы с двусторонним буфером шаблонов — которая может дать прирост в играх на движке DOOM III и им подобных, интенсивно использующих динамические тени на основе буфера шаблонов, и наличие специальной логики в пиксельных процессорах.

Эта дополнительная возможность позволяет сохранять в локальной памяти ускорителя не только финальные значения цвета, рассчитанные пиксельным шейдером, но и промежуточные значения параметров, возникающих, по ходу расчета. Такой подход называется F-буфером и требует наличия относительно несложной аппаратной поддержки в чипе (запись и восстановление потока параметров) а также специального компилятора. Все вместе это позволяет аппаратно исполнять практически неограниченные по длине шейдеры, разбивая их на куски, каждый из которых отрабатывает отдельно, над целой зоной экрана, для каждого пиксела из этой зоны записывая промежуточные параметры, передаваемые следующему куску шейдера в буфер параметров (F-буфер). Следующий кусок шейдера считывает параметры в той же последовательности, в которой они были записаны, продолжает вычисления, и снова записывает уже новые параметры. Этот подход в большинстве случаев будет более выгодным с точки зрения производительности, чем многопроходное построение изображения. Однако пока, поддержка этой технологии планируется только в OpenGL драйвере.

Разумеется, эта технология нацелена в первую очередь на реалистическую графику и DCC — в играх пока еще далеко до полного освоения возможностей даже стандартных ограниченных 64 вычислительными командами пиксельных шейдеров 2.0.

Вот здесь можно подробнее прочитать про технологию F-buffer (FIFO-stream buffer).

Плата

Карта снабжена интерфейсом AGP х2/x4/x8, 128 МБ локальной памяти DDR SDRAM (восемь микросхем, размещенных на лицевой и оборотной сторонах PCB).



На карте установлены микросхемы памяти Samsung марки K4D26323RA-GC2A, форм-фактора BGA. Максимальная частота работы — 350 (700) МГц, поэтому можно сделать вывод, что время выборки — 2.8 нс. По умолчанию память работает на частоте 340 (680) МГц, чип — 380 МГц.

Как мы видим, используется та же самая память, которую мы могли видеть на RADEON 9700 PRO.

ATI RADEON 9800 PRO 128MB
ATI RADEON 9700 PRO 128MB

Как мы видим, повышение частот работы карты привело к существенной переработке PCB, отличия от RADEON 9700 PRO видны невооруженным глазом.

Да и для охлаждения чипа используется кулер несколько иной формы:

Интересно, кто дал идею радиатора такой параллелограммной формы? Как мне кажется, идея серебристого радиатора весьма хороша, но вот несколько нелепая форма... Кстати, обратите внимание на то, что в данном случае радиатор посажен на чип на термопасте, а не через "термолипучку", как в случае RADEON 9700 PRO.

И еще одно новшество. Обратите внимание на возвышение на нижней стороне радиатора.

Еще когда мы рассматривали RADEON 9700 PRO, то заметили, что у многих карт высота кристалла ниже защитной рамки, которая расположена по периметру подошвы чипа. И в одном из материалов проделали эксперимент по снятию этой рамки, чтобы радиатор лучше прижимался к кристаллу:



Так вот, у RADEON 9800 PRO такой проблемы нет:

Благодаря тому самому выступу на радиаторе он прижимается к кристаллу без всяких помех, что прекрасно видно на просвет. Правда, надо отметить очень грубую обработку подошвы радиатора, что недопустимо для чипов с открытым кристаллом.

Раз мы сняли кулер, то можно оценить и размер кристалла. Он примерно такого же размера, как и R300, но зато имеет несколько иную подложку, придающую ему зеркальность. Упаковка кристалла такая же — FCPGA.





Обратим внимание на то, что у карты изменен разъем для внешнего питания. Вероятно достаточно много было критики насчет установки относительно хрупкого разъема типа того, что у Floppy-drive (несколько раз вставить-снять кабель питания, и разъем может просто отвалиться). Поэтому на RADEON 9800 PRO мы видим уже более массивное гнездо для питающего кабеля типа того, что применяется на накопителях (HDD, CDD-ROM).

Что касается TV-out, то отличий в этом плане от RADEON 9700 PRO нет. Более подробно о работе этой функции можно прочитать в материале Андрея Карпенко.

Разгон

Мы хотим сразу выразить благодарность автору RivaTuner-а Алексею Николайчуку за оперативный выпуск новой версии этой утилиты, которая уже поддерживает и RADEON 9800 PRO:



Поэтому разгон очень даже возможен, и RADEON 9800 PRO продемонстрировал прекрасный потенциал — 430/385 (770) МГц!

Установка и драйверы

Рассмотрим конфигурацию тестового стенда, на котором проводились испытания карт:

  • Компьютер на базе Pentium 4:
    • процессор Intel Pentium 4 3066 (HT=ON);
    • системная плата ASUS P4G8X (iE7205);
    • оперативная память 1024 MB DDR SDRAM;
    • жесткий диск Seagate Barracuda IV 40GB;
    • операционная система Windows XP SP1.
  • Компьютер на базе Athlon XP:
    • процессор AMD Athlon XP 2600+ (2133 MHz);
    • системная плата EPoX (NVIDIA nForce2);
    • оперативная память 1024 MB DDR SDRAM PC3200;
    • жесткий диск Seagate Barracuda IV 40GB;
    • операционная система Windows XP SP1.

На стендах использовались мониторы ViewSonic P810 (21") и ViewSonic P817 (21").

При тестировании применялись драйверы от ATI CATALYST 3.2 (версия 6.307), VSync отключен, компрессия текстур отключена в приложениях. Установлен DirectX 9.0.

Для сравнительного анализа приведены результаты уже знакомых читателям видеокарт:

  • Reference card NVIDIA GeForce FX 5800 Ultra (500/500 (1000) МГц, 128 МБ, driver 42.82 для игровых тестов и 42.68 для 3DMark03);
  • Hercules 3D Prophet 9700 PRO (RADEON 9700 PRO, 325/310 (620) МГц, 128 МБ).

Настройки драйверов

Новая версия драйверов 6.307 в плане настроек ничем не отличается от ранее выпускаемых для RADEON 9700. Разве лишь версия SmoothVision и анизотропии проставлена 2.1, а не 2, как ранее. Поэтому мы не будем приводить скриншоты и подробно описывать настройки, читатель сможет это узнать из материала по RADEON 9700 PRO.

Мы акцентируем ваше внимание на возможности форсирования RADEON 9800 в драйверах для RADEON 9700 с помощью Soft9800. Это патч к RivaTuner, он доступен на сайте "Мир NVIDIA", который позволяет драйверам "видеть" не RADEON 9700 PRO, а RADEON 9800 PRO, и, если есть какие-то скрытые возможности или оптимизации, присущие только последнему, они могут стать доступными и RADEON 9700 PRO.

В нашем дальнейшем материале мы провели тщательное расследование того, что же дает "настоящий" RADEON 9800 PRO, а что можно получить от таким образом переделанного в 9800 RADEON 9700 PRO. Результаты весьма интересны. Забегая вперед, можем сказать, что версия, гуляющая в Сети, о том, что

RADEON 9800 PRO = RADEON 9700 PRO + повышенные частоты + оптимизация в драйверах

полностью НЕ подтвердилась, в игровых тестах ситуация неоднозначная. Но это все впереди.

Также хотим сказать, что проведено сравнение работы RADEON 9800 PRO на пониженных до уровня RADEON 9700 PRO частотах.

Отметим, что в дальнейшем термином Soft 9800 PRO мы будем называть RADEON 9700 PRO, запущенный на пропатченных драйверах, которые его определили как RADEON 9800 PRO. Разумеется, если частоты работы не оговорены отдельно, они стандартные для RADEON 9700 PRO — 325/620 MHz

Результаты тестов

2D-графика

2D-графику знал еще император Нерон, который любил не только петь, но и рисовать. Еще в те, очень далекие времена, все окружение императора, а также его мать, знали, что качество 2D очень субъективно, что зависит от качества красок (теперь от качества монитора), от кистей (теперь от видеокарты), да и от взгляда самого художника. Нерон приходил в бешенство от подобной философии, считая, что 2D — это некий абсолютный идеал, которому надо поклоняться (что сейчас делают матроксоведы), и даже убил свою мать из-за этого... И по сей день дух Нерона не может успокоиться, являясь обладателям мыльных картинок очередным ужасом, после чего те несутся в форумы с криками о помощи (но не могут рассказать, что же ужасного они видели, Нерон неуловим, его лишь ощущают)... Только там, где есть надежные и экранированные кабели, где есть высококачественные мониторы, там дух Нерона не найдет себе пристанища, и муки чудовищных картинок не доставляют пользователям потерь нервных ресурсов...

Поэтому тестирование 2D у нас происходит на мониторе ViewSonic P817-E совместно с BNC-кабелем Bargo, дух Нерона нам незнаком, да и даже он мог быть довольным: качество-то 2D у RADEON 9800 PRO превосходное! В 1600х1200 при 85Гц, а также 1280х1024 при 120Гц просто все отлично.

Разумеется, невзирая не гнев Нерона, напомню, что качество зависит от конкретного экземпляра.

Синтетические тесты RightMark 3D (DirectX 9)

В этой статье мы представим вам подробные описания и первые результаты тестирования, полученные с помощью разрабатываемого нами набора конфигурируемых синтетических тестов для API DX9.

Набор синтетических тестов из разрабатываемого нами тестового пакета RightMark 3D включает в себя (на данный момент) следующие тесты:

  1. Тест на закраску и фильтрацию текстур (Pixel Filling Test);
  2. Тест на производительность обработки геометрии (Geometry Processing Speed Test);
  3. Тест на производительность работы с отсечением невидимых точек и примитивов (Hidden Surface Removal Test);
  4. Тест на производительность сложных пиксельных шейдеров (Pixel Shader Test);
  5. Тест на производительность отрисовки, освещения и анимации спрайтов (Point Sprites Test).

Полагаем, что нет смысл повторять здесь освещение идеологических вопросов тестирования, поэтому еще раз просим желающих узнать по-подробнее об идеологии синтетических тестов прочитать внимательно материал по NV30. Там же можно найти и их описание.

Для тех, кто уже сейчас горит желанием экспериментировать с синтетическими тестами RightMark 3D, мы предлагаем скачать и опробовать "командностроковые" варианты тестов, формирующие результирующий файл XLS в формате XML, принятом в Microsoft Office XP:

Внутри каждого архива вы найдете описание параметров каждого теста и пример .bat файла, используемого нами для тестирования ускорителей. Мы будем благодарны любым откликам, как в плане пожеланий и идей, так и информации об ошибках или странном поведении тестов.

Пишите по адресу: unclesam@ixbt.com.

Результаты практического тестирования

Приведем и прокомментируем данные, полученные нами на бюджетных и мэйнстрим ускорителях двух "основных" в данный момент семейств (ATI и NVIDIA).

  • ATI:
    • RADEON 9700 PRO 128 Mb
    • RADEON 9800 PRO 128 Mb
  • NVIDIA:
    • GeForce FX 5800 Ultra 128MB

Pixel Filling

  1. В виду того, что все последние драйверы Catalyst (3.1 и старше) вкупе с нашим синтетическим тестом выдают на некоторых продуктах ATI странные, очевидно заниженные, результаты, видимо из за неуспешной попытки оптимизировать работу этого теста на режимах с выборкой значений текстур, мы не приводим результатов Pixel Filling с текстурами для RADEON и ограничимся только вариантом теста без наложения текстур:

    ...совершенно очевидно, что в этом тесте разница результатов заключается сугубо в различии тактовых частот RADEON 9700 и RADEON 9800. Еще раз отметим преимущество чипов ATI в режимах с закраской цвета, возникшее, несмотря на более низкие тактовые частоты, благодаря наличию 8 пиксельных конвейеров (NV30 имеет 4 конвейера) и достаточной для этого ПСП 256-битной локальной шины памяти.

    Продукт Теоретический максимум, млн.текселей в сек. Полученный максимум, млн.текселей в сек.
    RADEON 9700 PRO 2600 2335
    RADEON 9800 PRO 3000 2546
    GeForce FX 5800 Ultra 2000 1995

    Как видно из этой таблицы, NVIDIA ближе всего подобралась к теоретическому пределу, но и продукты ATI не особенно отстают от своего потенциального потолка, разве что RADEON 9700 PRO мог бы продемонстрировать более высокие результаты, но сдерживающим фактором видимо стала пропускная полоса памяти.

Geometry Processing Speed

Займемся исследованием геометрической производительности ускорителей.

  1. Производительность фиксированного TCL (производительность эмулирующего его шейдера):

    В случае фиксированного TCL картина вполне ожидаемая, разница производительности соответствует разнице частот.

  2. Теперь обратимся к вершинным шейдерам 1.1:

    в случае шейдеров версии 1.1 — тоже самое

  3. Шейдеры 2.0 с циклами:

    А вот в области шейдеров 2.0 нас ожидает приятный сюрприз! ATI выполнила обещания по оптимизации производительности вторых шейдеров вообще и циклов в них в частности — получен заметный, похвальный прирост, на некоторых сложных шейдерах достигающий почти двукратного значения! Скорее всего, прирост кроется не столько в железе, сколько в драйверах и позже, по мере выхода следующих версий наверняка распространится на семейство RADEON 9700. Так что его владельцам не стоит переживать по этому поводу. А пока эти оптимизации включены только на R350, и таким образом, видимо, призваны "наглядно символизировать" преимущества R350 над R300 для не слишком вникающих в детали энтузиастов.

    Однако, есть вероятность (хотя и небольшая) что низкая производительность вторых вершинных шейдеров была следствием и соответственно могла быть исправлена на уровне железа, в скором времени мы выясним этот вопрос.

    Итак, с новыми драйверами R350 получил в этом тесте заметное преимущество над NV30. Вторые шейдеры догнали по производительности первые — теперь циклы стали действительно практически бесплатными. Роль оптимизации драйверов (а именно компилятора и оптимизатора микрокода шейдеров) видна здесь как никогда хорошо — почти двукратный прирост это очень и очень много. Интересно, готовит ли NVIDIA подобные сюрпризы, как это уже не раз бывало?

  4. Проверим перекрестную зависимость от степени детализации геометрии и сложности шейдера:


    Баланс производительности в зависимости от сложности сцены практически не изменился — видимо размеры и алгоритмы вершинных очередей и КЭШей остались прежними.

Hidden Surface Removal

  1. Посмотрим на эффективность HSR в различных разрешениях на сложной сцене (без текстур и с текстурами):


    и в том и в другом случае отличий практически не наблюдается, небольшое различие вызвано (видимо) побочными эффектами — следствием разницы частот. Любое изменение алгоритма HSR или его эффективности, несомненно, дало бы куда как более наглядную разницу.

  2. Теперь посмотрим на зависимость эффективности HSR от сложности сцены (без текстур и с текстурой):


    Как и ранее, в обзоре RADEON 9700 PRO, мы констатируем, что одноуровневый HSR NVIDIA предпочитает простые сцены, в то время как иерархический алгоритм ATI получает максимальное преимущество на сценах средней сложности, но наличие текстур уравнивает эти подходы, как в смысле характера закономерности, так и чуть более сближает их по эффективности. В идеальном пределе HSR алгоритм NVIDIA менее эффективен, но в реальной работе наличие текстур и раннего Z отсечения делает эту разницу не столь вопиющей.

Pixel Shading

  1. Посмотрим, не изменилась ли производительность пиксельных процессоров R350 по сравнению с R300:

    ...ничего неожиданного — рост производительности R350 в вопросе вторых пиксельных шейдеров опять хорошо соответствует росту тактовой частоты его ядра. В результате, проигрыш флагмана NVIDIA — NV30 только усиливается.

Point Sprites

  1. Теперь спрайты (без освещения и с освещением):


    Разница слегка превышает разницу в частотах — это следствие оптимизации вторых вершинных шейдеров. Теперь, в отличие от R300, NV30 проигрывает во всех режимах.

3D-графика, 3DMark2001 SE — синтетические тесты

Подчеркну, что все замеры по всем 3D-тестам проводились в 32-битной глубине цвета.

Скорость закраски



В случае мультитекстурирования:

...никаких сюрпризов — R350 и R300 расположились согласно разнице тактовых частот. В режиме мультитекстурирования NV30 лидирует — 8 текстурных блоков на более высокой частоте 500 МГц опережают продукты ATI, а в режиме с одной текстурой проигрывает из-за вдвое меньшего числа пиксельных конвейеров.

Пиксельный шейдер

Простой вариант:

На высоком разрешении заметен существенный прирост результатов. Но, мы проверили ранее (с помощью синтетики RightMark 3D) производительность пиксельных шейдеров — она не изменилась, точнее, изменилась точно на разницу частот. Значит, дело в чем-то другом.

Возможно, что это еще одна оптимизация новых драйверов ATI работающая только с R350 — на сей раз — в области пиксельных шейдеров и только под этот конкретный тест.

Посмотрим, изменится ли картина при условии более вычислительно интенсивных пиксельных шейдеров:

Здесь все в хорошем соответствии с разницей частот, т.е. этот результаты этого теста можно признать более-менее адекватными.

Вершинные шейдеры



И вновь вполне ожидаемые результаты.

Итак, за исключением отдельных моментов результаты 3D Mark 2001 хорошо согласуются с полученными ранее результатами RightMark 3D, хотя и несут изначально меньше информации ввиду отсутствия каких либо настроек параметров синтетических тестов.

Выводы из результатов синтетических тестов

Итак, подведем краткий итог по детальному исследованию различных блоков R350 с помощью синтетических тестов.

  1. Каких либо существенных архитектурных отличий не обнаружено. Можно относиться к R350 как к R300 с увеличенной тактовой частотой ядра, усиленной оптимизацией работы с двусторонним буфером шаблонов, которая возможно даст о себе знать в DOOM III и играх на его основе и потенциальным наличием аппаратной поддержки для F-буфера и длинных пиксельных шейдеров.
  2. Налицо не очень корректное поведение драйверов ATI в плане включения некоторых новых оптимизаций только на R350 — результаты полученные на таких драйверах могут создать ошибочное впечатление о значительном архитектурном преимуществе R350 надо R300 и стимулировать неоправданную покупку первого. Каково же будет удивление новоиспеченного владельца R350, когда через некоторое время выйдут драйверы на сей раз обеспечивающие те же самые приросты и для R300 — т.е. сводящие разницу между этими чипами до разницы их тактовых частот, которая собственно не столь велика. И даже если подобные драйверы не выйдут по той или иной причине никогда, все равно остается возможным появление сторонних модификаций и патчей (например в составе RivaTuner) включающих эти оптимизации и на R300. Впрочем, для принятия осторожного решения мы рекомендуем подождать развития событий.

3D-графика, 3DMark2001 — игровые тесты

Сразу отмечу, почему мы использовали в наших тестах настройки анизотропии 16х у карт от ATI и 8х у карт от NVIDIA. Никакой дискриминации в отношении карт от ATI нет! Алгоритмы работы этой функции у ATI и NVIDIA очень различаются (об этом мы говорили подробно в нашем материале по NV30), поэтому сопоставлять только цифры "8" неразумно. Критерий один: максимально возможное качество. У NVIDIA по ее "счетчику" — это 8х, а у ATI — 16х. Скриншоты мы уже приводили, и не один раз. К тому же, интересно будет узнать, как сопоставляются разные режимы работы анизотропии (Application, Balanced, Aggressive) от NVIDIA с максимально качественным режимом от ATI, тем более, что опять же, скриншоты мы уже приводили, и читатель может оценить соотношение скорости и качества (милости просим в обзор NV30 за скриншотами оценки качества анизотропной фильтрации).

Думаю, что в таблицах соотношений все данные имеются, поэтому отдельно комментировать нет смысла за исключением анализа Soft9800.



3DMark2001, 3DMARKS

















Если кто хочет проценты перевести в "разы", то надо к процентам прибавить 100 и все разделить на 100.

Обратим внимание на то, что форсирование RADEON 9800 при АА и анизотропии на RADEON 9700 PRO привело к существенному росту производительности относительно результатов самого RADEON 9700 PRO при АА и анизотропии. Заточка драйверов? Однозначно! Хотя без нагрузки АА и анизо прироста почти нет.

3DMark2001, Game1 Low details



















3DMark2001, Game2 Low details



















3DMark2001, Game3 Low details



















3DMark2001, Game4

















Подводя итоги тестирования в 3DMark2001SE, мы можем сказать следующее:

  1. Перевес RADEON 9800 PRO над GeForce FX 5800 Ultra не столь существенный в режимах без дополнительной нагрузки (иногда даже были проигрыши). Тяжелые режимы дают неоднозначную картину: от явных и сильных проигрышей (Game4) до таких успешных перевесов (до 40-50% в Game3, Game2). Ясно одно: благодаря 256-битной шине и более высокой ПСП у RADEON 9800 PRO очень хорошо смотрится АА.
  2. Имеется оптимизация драйверов под RADEON 9800 PRO, об этом явно говорят сравнения производительностей так называемого Soft9800 PRO и RADEON 9700 PRO в тяжелых режимах при АА и анизотропии. Впрочем, и без этой нагрузки хоть небольшое, но превосходство первого над вторым имеется. Прошу обратить еще внимание на то, что на повышенной частоте работы Soft9800 PRO при АА и анизотропии мы можем наблюдать почти равенство с "родным" RADEON 9800 PRO.

3D-графика, 3DMark03 — игровые тесты



3DMark03, 3DMARKS





Наблюдаем такую же картину оптимизации драйверов от ATI под RADEON 9800 PRO, когда "обведение драйверов вокруг пальца" с подставлением для 9700 PRO Device ID от 9800 PRO приводит к росту производительности.

3DMark03, Game1

Характеристики теста Wings of Fury:

  • DirectX 7.0 тест; примерно 32000 полигонов в сцене, под текстуры используется 16 мегабайт видеопамяти, 6 мегабайт для буферов под вершины и 1 мегабайт для индексов.
  • Все геометрические операции базируются на использовании вершинных шейдеров 1.1, которые могут эмулироваться через CPU (если "железо" не поддерживает аппаратно).
  • Все самолеты выполнены с помощью 4-х текстурных слоев, поэтому акселераторы, умеющие обрабатывать 4 текстуры за проход, будут в выигрыше.
  • Эффекты дыма и шлейфов выполнены с помощью техник точечных спрайтов и др.






3DMark03, Game2

Характеристики теста Battle of Proxycon:

  • DirectX 8.1 тест; примерно 250 000 полигонов в сцене при использовании пиксельных шейдеров 1.1 (и 150 000 полигонов — если используются шейдеры 1.4), под текстуры используется 80 мегабайт видеопамяти, 6 мегабайт для буферов под вершины и 1 мегабайт для индексов.
  • Все геометрические операции базируются на использовании вершинных шейдеров 1.1, которые могут эмулироваться через CPU (если "железо" не поддерживает аппаратно).
  • Все персонажи "одеты" также с помощью вершинных шейдеров.
  • Некоторые источники света производят динамические тени, получаемые при помощи стенсил-буфера.
  • Все пиксельные операции производятся с помощью шейдеров 1.1, или, если это возможно, 1.4.
  • Вычисление попиксельного освещения для эффектов дымок, и других компонентов.
  • Акселераторы, поддерживающие пиксельные шейдеры 1.1, используют один проход для определения Z-буфера, затем по три прохода на каждый источник света. Если акселератор поддерживает шейдеры 1.4, то ему требуется всего по одному проходу на каждый источник света.






3DMark03, Game3

Характеристики теста Trolls' Lair:

  • DirectX 8.1 тест; примерно 560 000 полигонов в сцене при использовании пиксельных шейдеров 1.1 (и 280 000 полигонов — если используются шейдеры 1.4), под текстуры используется 64 мегабайт видеопамяти, 19 мегабайт для буферов под вершины и 2 мегабайта для индексов.
  • Все геометрические операции базируются на использовании вершинных шейдеров 1.1, которые могут эмулироваться через CPU (если "железо" не поддерживает аппаратно).
  • Все персонажи "одеты" также с помощью вершинных шейдеров.
  • Некоторые источники света производят динамические тени, получаемые при помощи стенсил-буфера.
  • Все пиксельные операции производятся с помощью шейдеров 1.1, или, если это возможно, 1.4.
  • Вычисление попиксельного освещения для эффектов дымок, и других компонентов.
  • Для реалистичного отображения волос героини используются физические модели, а также анизотропное освещение.






3DMark03, Game4

Характеристики теста Mother Nature:

  • DirectX 9.0 тест; примерно 780 000 полигонов в сцене, под текстуры используется 50 мегабайт видеопамяти, 54 мегабайт для буферов под вершины и 9 мегабайт для индексов.
  • Каждый лист на деревьях отдельно анимирован при помощи вершинных шейдеров 2.0. Трава анимирована с помощью вершинных шейдеров 1.1.
  • Поверхность озера образована при помощи пиксельных шейдеров 2.0.
  • Небо также получено при помощи пиксельных шейдеров 2.0, для солнечных бликов используется реализованная в DX9 повышенная точность расчетов.
  • Поверхность земли получена с помощью шейдеров 1.4.






Что можно сказать по итогам 3DMark03?

  1. NVIDIA доказала своей версией драйверов 42.68, что оптимизацию под этот пакет можно сделать без особого труда. Мы видим, что только в Game3 RADEON 9800 PRO сумел прилично обойти NV30, а в остальных тестах даже проиграл.
  2. Оптимизация драйверов от ATI под RADEON 9800 PRO мы наблюдаем и в этом случае.

3D-графика, игровые тесты

Приступаем к оценке производительности видеокарты в 3D-играх. В качестве инструментария мы использовали:

  • Return to Castle Wolfenstein (MultiPlayer) (id Software/Activision) — OpenGL, мультитекстурирование, Checkpoint-demo, настройки тестирования — все на максимально возможном уровне, S3TC OFF, конфигурации можно скачать тут

  • Serious Sam: The Second Encounter v.1.05 (Croteam/GodGames) — OpenGL, мультитекстурирование, Grand Cathedral demo, настройки тестирования: quality, S3TC OFF

  • Quake3 Arena v.1.17 (id Software/Activision) — OpenGL, мультитекстурирование, Quaver, настройки тестирования все на максимальном уровне: уровень детализации — High, уровень детализации текстур — №4, S3TC OFF, плавность кривых поверхностей резко увеличена при помощи переменных r_subdivisions «1» и r_lodCurveError «30000» (подчеркну, что по умолчанию r_lodCurveError «250» !), конфигурации можно скачать тут

  • Unreal Tournament 2003 Demo (Digital Extreme/Epic Games) — Direct3D, Vertex Shaders, Hardware T&L, Dot3, cube texturing, качество по умолчанию

  • Code Creatures Benchmark Pro (CodeCult) — игровой тест, демонстрирующий работу платы в DirectX 8.1, Shaders, HW T&L.

  • AquaMark (Massive Development) — игровой тест, демонстрирующий работу платы в DirectX 8.1, Shaders, HW T&L.

  • RightMark 3D v.0.4 (одна из игровых сцен) — DirectX 8.1, Dot3, cube texturing, shadow buffers, vertex and pixel shaders (1.1, 1.4).

Quake3 Arena, Quaver



















Оптимизация драйверов NVIDIA под эту игру и... полный проигрыш RADEON 9800 PRO сопернику в лице GeForce FX 5800 Ultra.

Но при этом мы наблюдаем, что драйверы от ATI просто отлично заточены под RADEON 9800 PRO, что дало Soft9800 PRO получить превосходство почти в 25% над RADEON 9700 PRO на его же частотах.

Однако что странно: Soft9800 PRO на частотах "родного" 9800 PRO продемонстрировал более высокую скорость, нежели сам RADEON 9800 PRO (с АА и анизотропией). Как говорится, перестарались :-). А если серьезно, то данный факт говорит о том, что все же RADEON 9800 PRO не является 9700-м, работающим на более высоких частотах, это все же другой процессор.

Serious Sam: The Second Encounter, Grand Cathedral



















А вот этот тест нам говорит, что его любит больше ATI, чем NVIDIA :-). Несмотря на то, что при анизотропии RADEON 9800 PRO проиграл сопернику, засчет более быстрого АА новый продукт ATI в тяжелом режиме АА+анизотропия все же выиграл.

Есть ли заточка драйверов под RADEON 9800 PRO и в этой игре? Разумеется, есть! И это видно на диаграммах. Однако, мы можем это видеть только в режимах с АА и анизотропией. Плюс мы снова видим, что скорость Soft 9800 PRO на частотах 380/680 МГц выше, чем у RADEON 9800 PRO, что дает еще раз повод для размышлений, поскольку теория, выдвинутая рядом СМИ в Сети о том, что RADEON 9800 PRO = RADEON 9700 PRO + повышенные частоты, терпит крах.

Return to Castle Wolfenstein (Multiplayer), Checkpoint



















Снова оптимизация драйверов от NVIDIA под данную игру? Невероятно, но факт: RADEON 9800 PRO проиграл сражение. Причем, даже в тяжелых режимах с АА и анизотропией.

Заточка драйверов под 9800 также имеется, но снова только выявляется в тяжелых режимах с АА и анизотропией.

Однако снова мы получаем подтверждение, что RADEON 9800 PRO — это другой продукт, нежели просто улучшенный RADEON 9700 PRO.

Code Creatures









И вот перед нами тест, где огромную роль играет скорость работы шейдеров. Как известно, в этом плане у детищ ATI все в порядке в отличие от NVIDIA GeForce FX 5800. Потому мы и наблюдаем победу RADEON 9800 PRO.

И... Как только попадается тест, который не является массово используемым, мы не обнаруживаем в нем заточки драйверов под RADEON 9800 PRO. Именно в этом тесте последний берет только своими более высокими частотами и теми оптимизациями (кеши, более высокие скорости работы шейдеров и др.), которые, безусловно, имеются в самом процессоре.

Unreal Tournament 2003 DEMO



















Данная игра сильно зависит от скорости вершинных шейдеров, поэтому у RADEON 9800 PRO получился очень хороший выигрыш. Да и в тяжелых режимах с АА и анизотропией новый продукт выглядит просто блестяще!

Насчет оптимизации драйверов под 9800, мы видим, что на частотах 9700 PRO она есть, да и очень даже приличная. Разогнанный до частот 9800 PRO ускоритель на базе 9700 PRO, переделанный в Soft9800 PRO показал точно такую же производительность в режимах с АА и анизотропией, что и "родной" RADEON 9800 PRO, поэтому можно вести смело речь о чистой оптимизации.

AquaMark



















Картина разнородная. В режимах без дополнительной нагрузки RADEON 9800 PRO победил (кроме 1600х1200), а вот при нагрузке АА и анизотропией проиграл сопернику, несмотря на то, что в АА выглядел по скорости лучше.

Оптимизация драйверов под RADEON 9800 PRO есть, однако, видимо, программисты в данном случае не считали этот тест уж очень важным и не очень старались :-)

RightMark 3D



















Вот где все и раскрывается :-). С одной стороны, видна убедительная и даже великолепная победа RADEON 9800 PRO над соперником от NVIDIA, поскольку снова и снова мы говорим о скорости работы шейдеров, которая выше у продуктов от ATI; с другом стороны, данный тест является внутренним, он недоступен программистам от ATI или NVIDIA, поэтому мы видим потрясающую картину: Soft 9800 PRO 380/680 MHz в тяжелых режимах катастрофически отстал от "родного" RADEON 9800 PRO! Более того, на частотах 325/620 МГц он отстал и от RADEON 9700 PRO!

То есть, когда дело доходит до игр или тестов, под которые программисты не смогли сделать какую-либо оптимизацию в драйверах, когда процессор работает чисто своими возможностями, и когда тест активно использует современные технологии, RADEON 9800 PRO показывает явно, что он самостоятельный продукт, а не просто "улучшенная ревизия" 9700 PRO.

DOOM III Alpha



Что можно сказать? Драйверы от NVIDIA одерживают победу. Ну и более гибкая программируемость NV30.

Качество 3D-графики

Мы тщательно рассмотрели работу RADEON 9800 PRO в играх, особенно с АА и анизотропией и не нашли никакой разницы в плане качества от RADEON 9700 PRO. В одном из предыдущих наших материалов мы очень подробно рассмотрели различия между АА и анизотропией от NVIDIA и ATI, поэтому советуем прочитать об этом в обзоре GeForce FX 5800 Ultra (теория, практика), а также в материале по GeForce FX 5600/5200 (практическое сравнение анизотропии).

Поэтому нет смысла в данном материале повторять сказанное ранее в тех обзорах.

Выводы

Сегодня мы рассмотрели самый быстрый на сегодня игровой видеоакселератор — ATI RADEON 9800 PRO. Что можно сказать, подводя итоги?

  1. Выпуск данного продукта является ответом ATI на пусть хоть и несколько эфемерный, но все же выход в свет NVIDIA GeForce FX 5800 Ultra. Канадская компания приложила максимум усилий, чтобы из 0.15 мкм выжать все, что еще было ранее "невыжатым", прежде всего, более высокие частоты работы. И это ей удалось. Правда, в ряде тестов все же RADEON 9800 PRO проиграл, даже обладая релизом драйверов. А как известно, полноценного релиза драйверов для GeForce FX пока нет, и еще неизвестно, на сколько он поднимет производительность (а у NVIDIA такое встречалось и не один раз). Все же мы ожидали более весомых приростов, и уж точно отсутствие проигрышей у нового детища ATI. Возможно в будущем ATI выпустит еще более производительные модификации R350 например под именем RADEON 9900 PRO, в том числе не будем исключать и возможность использования той или иной разновидности DDR2 памяти.
  2. RADEON 9800 PRO является не просто чипом, над производством которого поработали инженеры, сумевшие поднять частоту работы кристалла. Очевидно, что R350 был переработан, как с точки зрения более высокого выхода годных чипов и частот так и с точки зрения взаимодействия блоков и кеширования (т.е. производительности в приложениях). Сложно отделить прирост принесеный оптимизациями архитектуры и оптимизацией драйверов — мы сможем сделать это познее если появятся драйверы в которых оптимизации активируются и на R300.
  3. Итак мы наблюдаем и хитрости со стороны разработчиков. Очевидно, что под ряд известных и популярных тестов проведена оптимизация драйверов, чтобы они выдавали больше скорости именно на RADEON 9800 PRO, а не на предыдущем RADEON 9700 PRO, что было доказано нашими тестами. Поэтому усилия российского программиста Алексея Николайчука, которого наверно вскоре будут ненавидеть в NVIDIA и ATI (или кто-то его переманит к себе на работу :-) ), помогут обладателям RADEON 9700/PRO получить некоторую прибавку в скорости в ряде тестов и игр, использовав патч Soft9800.
  4. Сама видеокарта, судя по ее разводке, по себестоимости почти не отличается от RADEON 9700 PRO, поэтому на конечную цену будет оказывать влияние себестоимость самого R350, а также маркетинговые интересы. Полагаем, что реально ее цена не должна быть выше $400-420 в начале продаж.
  5. Разумеется, владельцам RADEON 9700 PRO нет смысла продавать свои карты и покупать 9800 PRO, выигрыш не колоссальный. А вот тем, кто хочет приобрести топовый ускоритель High-End класса и кто метит в 9700 PRO мы можем посоветовать подождать выхода RADEON 9800 PRO. К сожалению, по последним данным, эти карты появятся в свободной продаже вряд ли раньше середины-конца апреля. По тем же сведениям, через месяц-полтора в продажу должны пойти ускоренные варианты GeForce FX 5800 под кодовым названием NV35. Поэтому пока неясно, с кем реально будет конкурировать RADEON 9800 PRO: NV30 или NV35. Что будет с RADEON 9700 PRO? Будет ли он снят вообще или просто "понижен в должности"? Пока непонятно. Разумеется, хотелось бы, чтобы 9700 и 9700 PRO остались, но ушли на более низшую ценовую ступень ($200-250), однако, как известно, выпуск новых RADEON 9600(PRO) позиционируется на $170-200, и RADEON 9700 будет портить продажи, обладая заведомо более высокой скоростью. К тому же себестоимость R300 ненамного меньше, чем R350, поэтому снижать цены на R300 вряд ли выгодно для ATI. Мы можем предполагать, что RADEON 9700/PRO изчезнет, его место займет RADEON 9800/PRO.







Андрей Воробьев (anvakams@ixbt.com)
Александр Медведев (unclesam@ixbt.com)
Опубликовано — 19 марта 2003 года
 
Комментарии?  Поправки?  Дополнения? anvakams@ixbt.com


на главную страницуна главную страницуна главную страницу

Коротко | Процессоры | Системные платы | Видеосистема | Носители информации | Мультимедиа | Периферия | Домашние кинотеатры | Портативные ПК | Мобильная связь | Изображение в числах | Коммуникации | Колонка редактора | Конференция | Поиск по сайту | Komok.com | Computorg | Журнал iXBT.com | Драйверы


Copyright © by iXBT.com, 1997—2003. Produced by iXBT.com

Rambler's Top100