РОССИЙСКИЙ УНИВЕРСИТЕТ ДРУЖБЫ НАРОДОВ Филиал РУДН в г. Перми Факультет: ПРИКЛАДНАЯ ИНФОРМАТИКА Дисциплина: ИНФОРМАЦИОННЫЕ СИСТЕМЫ РЕФЕРАТ ПО ТЕМЕ «Архитектура видеокарт» Фарыма Глеб Алексеевич 1 курс, ПИ-10-1 № 3732100153 ПЕРМЬ 2011 год СодержаниеВведение……………………………………………………………………………………….3 Основные характеристики видеокарт……………………………………………….………5 Основные компоненты видеокарты………………………………………………………….6 Технологии…………………………………………………………………………………….6 Технологии NVIDIA………………………………………………………………………….7 Технологии AMD………………………………………………………………………….…8 Интерфейсы видеокарт……………………………………………………………………….9 Функциональные блоки видеокарт…………………………………………………………12 Решения на нескольких видеокартах……………………………………………………….13 Устройство видеоускорителя………………………………………………………………..15 Классический пример конвейера……………………………………………………………20 Унифицированная архитектура………………………………………………………………21 Ядро и память.Разгон.……………………………………………………………..…………..22 Заключение………………………………………………….…………………………….……22 Источники………………………………………………………………………………………23 Введение. Работа с графикой – одна из сложных задач, выполняемым персональным компьютером. Видеокарта – это сложное многофункциональное звено из всех компонентов компьютера. По другому ее также еще называют видеоплата, видеоадаптер. На нее ложатся такие задачи, как обработка и вывод на экран монитора изображения. Видеоплата обладает собственной оперативной памятью и не зависит от основной. В последнее время многие системные платы идут с встроенным видеоядром и исходя из этого покупать отдельно видеокарту нет необходимости. Все пользователи ПК делятся на две группы: Пользователи, работающие с офисными приложениями, Интернетом, простой графикой, прослушиванием музыки – для них качество видеокарты стоит не на первом месте; Пользователи-любители компьютерных игр и профессиональные дизайнеры – для них вопрос качества видеокарты просто жизненно необходим. Видеокарты обычно являются так называемыми платами расширения, которые вставляются в специальные слоты на основной (системной или материнской) плате компьютера. Это сделано для упрощения модернизации, прежде всего. Самые дешевые графические решения могут быть встроены в чипсет системной платы, они обычно хоть и могут выполнять функции игровой 3D видеокарты, но делают это крайне медленно и подходят разве что для обычной офисной работы или двухмерных игр. У пользователя есть возможность как покупки нового компьютера целиком, так и модернизации (или upgrade — апгрейда) старой конфигурации, с приобретением части новых и вероятной продажи (выбрасывания в мусор, откладывания на черный день или для сборки очередного ПК — на выбор) старых комплектующих. Заменив наиболее важные комплектующие, зачастую можно сравнительно небольшими средствами поднять производительность ПК для того, чтобы играть в современные игры с приемлемой производительностью. Несмотря на то, что определение слабого звена для игрового компьютера не всегда является простой задачей, чаще всего в низкой производительности будет виновата именно видеокарта, а не процессор или малый объем памяти. Да, существуют игры, которые при определенных условиях будут ограничены процессором (они называются «процессорозависимыми»), игры, которые сильно страдают от недостатка оперативной памяти, но в первую очередь, производительность игры зависит от видеокарты. И чем более высокие графические настройки в играх вы хотите использовать, тем большая нагрузка ляжет на неё, и тем большая зависимость будет от её производительности. Особенно к этому относятся такие настройки, как разрешение экрана, уровень антиалиасинга и анизотропной фильтрации, которые нагружают исключительно видеокарту. Сейчас компоненты ПК имеют тенденцию к интеграции: в материнские платы «засовывают» звуковые и видеокарты, а в ЦП интегрируют ядро для обработки графики. Вероятно, данная тенденция вызвана желанием создать унифицированный процессор, который обрабатывал бы все сразу, так как подобный подход к обработке информации был «обкатан» на консолях (Xbox, Xbox 360 совмещали 3 вида обработчиков в 1) и показал себя очень неплохо. Возможно, эта архитектура и была уместна на консолях, но, похоже, принцип взаимозаменяемости компонентов будет сопровождать ПК ещё долго. Зато на «персоналках» прослеживается тоже кое-что занятное: разработчики, уперевшись в предел частоты одного ядра, делают ставку на распараллеливание вычислений, и не зря – коэффициент прироста производительности от последующих ядер все возрастает (в основном благодаря усовершенствованию технологий). Уже сейчас в магазинах можно приобрести процессоры на 6 ядер, видеокарты на двух чипах, а также подключить множество видеокарт (до 3-4) или мониторов (до 6-ти). В данный момент создан даже 1000 ядерный процессор, но основная сложность в том, что их довольно сложно программировать, а уж о массовом рынке пока и речи не идёт. В сложившейся в мире высоких технологий ситуации для достижения наилучшего результата продуманная архитектура вычислительных компонентов наиболее важна, тем более самых загруженных – видеокарт. Основные характеристики видеокарт. Объем оперативной памяти. На сегодняшний день все графические видеокарты имеют объем оперативной памяти минимум 256 Мб (для просмотра видео хватает даже 8 Мб). Остальное виртуальное пространство используется для создания качественной графики в трехмерных играх и чем его больше, тем реалистичней кажется игра. В трехмерных играх для быстрой и полноценной работы на 19-дюймовых мониторах хватает и 256 Мб памяти. Для работы с высоким разрешением 1600×1200 требуется уже чуть больше оперативной памяти – до 512 Мб. Ну а 1 Гб может значительно улучшить качество картинки и сделать ее намного реалистичнее. Тип используемой памяти. Совсем недавно этот параметр не имел особого значения, но сейчас многие пользователи придираются к типу памяти. Тип памяти на видеокарте практически ни чем не отличается от обычной оперативной памяти и используется, как правило, DDR3, а более дорогие модели оснащены более быстрой памятью – GDDR5.Многие модели видеокарт собранные разными производителями на основе одного чипсета могут оснащаться разными типами памяти, за счет чего их быстродействие может отличаться на десятки процентов. Частота работы графического чипа и памяти. Память и графический тип на видеокартах могут работать как разных, так и на одной частоте и чем быстрее, тем лучше.Впрочем, частота работы чипа и памяти не единственный показатель быстродействия. Нередки случаи, когда более быстрая по этим значениям видеокарта значительно уступает своему более медленному конкуренту в основном, из-за количественных характеристик- там больше элементов для обработки графики. Разрядность шины. От разрядности или от «ширины» шины зависит быстродействие видеокарты. Стандартная «ширина» шины 256 бит, но на дешевых моделях ее могут искусственно сократить до 128 бит. При этом вся мощь даже самых «крутых» процессоров сводится на нет. Так что при выборе видеокарты стоит обратить внимание на этот параметр. Поддержка HD-видео. HD-видео – это видео с высоким разрешением. HD-фильмы на компьютере появились совсем недавно и все сводится к тому, что будущее именно за ними. К сожалению декодирование HD-сигнала дает дополнительную нагрузку на центральный процессор и даже процессоры с тактовой частотой 2 Ггц с этим не справляются. Именно поэтому на видеокартах в новых чипсетах от AMD и NVIDIA предусмотрен аппаратный HD-декодер, который берет всю нагрузку по обработке HD-сигнала на себя. Если вы планируете смотреть HD-фильмы не на экране монитора, а на плазменной ЖК-панели, то вам следует обратить внимание на выход HDMI. Поддержка технологий. Для того чтобы сделать стыковки и переходы между картинками плавными в видеокарте применяется методы аппаратного сглаживания и фильтрации. Например, билинейная и трилинейная фильтрация (поддерживается платами, выпущенными с 2001 года), анизотропная (отвечает за качество отображения «удаленных» от пользователя участков игрового ландшафта), сейчас карточки поддерживают всё больше технологий, описанных далее. Основные компоненты видеокарты: Процессор видеокарты (ядро), мощность которого тоже исчисляется, как и у центрального процессора в мегагерцах. Память (DDR2-DDR5), чем больше объем, частота работы, тем лучше. Подсистема питания (её стоит выделить, т.к. потребление питания возрастает в разы, может присутствовать дополнительное питание). Интерфейс PCI-E (1.0 – 2.1), AGP(устарел). Разъёмы (выходы DVI, D-SUB, S-VIDEO, HDMI + выход для технологии SLI/Crossfire/ CrossfireX). Система охлаждения обычно устанавливается поставщиком (т.е. Sapfire, MSI, Palit и пр.), бывает как активная (радиатор+кулер, водяное), так и пассивная (радиатор). Технологии. Основное назначение – придать картинке максимальную реалистичность при минимальных ресурсозатратах. В связи с тем, что поставщика видеокарт два, то технологии разнятся. Но специфика развития отрасли и продвижение ОC Windows заставляет производителей придерживаться общих технологий: DirectX — библиотека драйверов, встроенных в Windows, позволяющая игровым программам использовать такие возможности «железа», как встроенные технологии сглаживания (сейчас есть DirectX 10,11.). Пиксельные шейдеры – создают максимально реалистичные поверхности, от дрожащего на ветру листа до волнистой глади озера, регулируют освещенность пикселей. DX 8.1 поддерживает шейдеры версии 1.1, DX 9.0 — шейдеры 2.0, DX 9.0c — шейдеры 3.0 и DX10 — шейдеры версии 4.0. Поддержка цифрового интерфейса вывода (DV). Жидкокристаллические мониторы скоро совсем вытеснят привычные для нас модели на основе электронно-лучевой трубки (ЭЛТ). Большинство ЖК-мониторов поддерживает не аналоговый, а цифровой метод передачи информации с системного блока, и производители видеоплат все чаще оснащают их соответствующим разъемом. Технологии NVIDIA 3D Vision для профессионаловобеспечивают высококачественную среду для работы со стереоскопическим 3D. Технология 3D VISION Surround позволяет задействовать три монитора в режиме Full HD 3D. Архитектура CUDA – это революционная архитектура параллельных вычислений. NVIDIA GPUDirect™ – обеспечивает прирост производительности до 30% при передаче данных. Непосредственный доступ к памяти к видеопамяти, минуя ОЗУ. Hybrid SLI – объединяет дискретные графические процессоры с встроенным в материнскую плату. Технология Optimus автоматически оптимизирует расход заряда батареи, обеспечивая более долгую работу и поддерживая графическую производительность. PhysX– это мощный физический движок, обеспечивающий реалистичную физику в режиме реального времени в самых последних ведущих играх для ПК и консоли. PowerMizer- передовая программно-аппаратная технология специально предназначена для увеличения времени работы ноутбуков от батарей. PowerMizer позволяет пользователям настраивать производительность системы и потребление энергии под свои нужды с помощью удобных инструментов настройки. PureVideo обеспечивает плавное воспроизведение HD видео во всех форматах при высокой четкости картинки. Субпиксельная обработка высокой точности позволяет масштабировать видео так, что даже в маленьких окнах видео будет иметь HD качество. SLI – многопроцессорная графическая технология использует увеличенную полосу пропускания шины PCI Express и включает интеллектуальные аппаратные и программные средства, позволяющие нескольким графическим процессорам работать эффективно для достижения высокой производительности. Раньше компания NVIDIA предлагала поддержку технологии SLI только в своих чипсетах. С закатом бизнеса разработчикам пришлось ослабить поводья ― поддержка SLI появилась во многих чипсетах Intel. Наконец, в лагере «зеленых» решили сдаться окончательно. Если верить опубликованным данным, компания собирается активировать свою технологию в чипсетах для будущих процессоров AMD на основе микроархитектуры Bulldozer. Информация была получена из внутренней презентации компании NVIDIA. Разработчик предложит поддержку SLI в чипсетах AMD 990FX (SLI, 3-way SLI) и AMD 990X (SLI). Эти чипсеты предназначены для работы с процессорами под кодовым именем Zambezi ― это настольные “монстры” для энтузиастов. Компания NVIDIA предполагает, что будущая платформа AMD предложит весьма высокую производительность в играх, так что SLI отлично дополнит общую функциональность. Что важно, компания не собирается активировать поддержку технологии через переходный мост NF200 ― чипсеты обойдутся без дополнительной дорогостоящей логики – это значительно упростит слияние технологий этих компаний и снизит цену. Технологии AMD (раннее название ATI, сейчас – AMD) VISIONEngine является кроссплатформенным программным обеспечением и поддерживает, помимо персонального компьютера также игровые консоли PlayStation 3, Wii и Xbox 360. Ускоряет обработку графики. ATI Eyefinity (AMD Eyefinity или просто Eyefinity) — технология, разработанная американской компанией AMD, которая обеспечивает совместное подключение нескольких дисплеев к персональному компьютеру, предполагает подключение от одного до шести дисплеев включительно к одной видеокарте. AMD EyeSpeed Technology – технология ускорения видео: новый уровень качества онлайн-видео, превосходное качество любимых фильмов в HD форматах, высокая скорость приложений, реалистичные эффекты в играх. AMD HD3D Technology – технология позволяющая формировать панорамное стереоскопическое изображение. AMD CrossFireX Technology – технология, позволяющая одновременно использовать мощности двух и более видеокарт Radeon для построения трёхмерного изображения. AMD PowerPlay Technology – технология динамического управления питанием, используемая в некоторых графических процессорах (GPU) производства фирмы AMD (ранее — ATI). Принцип работы основан на отслеживание загрузки GPU, определении оптимальных параметров и соответственном изменении тактовой частоты чипа, памяти и напряжения питания, тем самым оптимизируя энергопотребление и тепловыделение видеокарты. Технология в режимах простоя может отключать неиспользуемые блоки графического процессора. ATI HyperMemory Technology – технология, разработанная американской компанией AMD, позволяющая использовать ОЗУ как часть или весь кадровый буфер видеокарт линейки Radeon и чипсетами материнских плат. Она опирается на скоростной обмен данными по двунаправленной шине PCI Express (x16 считается уже приемлемым). Интерфейсы видеокарт. AGP (Accelerated Graphics Port или Advanced Graphics Port) — это высокоскоростной интерфейс, основанный на спецификации PCI, но созданный специально для соединения видеокарт и системных плат. Шина AGP лучше подходит для видеоадаптеров по сравнению с PCI (не Express!) потому, что она предоставляет прямую связь между центральным процессором и видеочипом, а также некоторые другие возможности, увеличивающие производительность в некоторых случаях, например, GART — возможность чтения текстур напрямую из оперативной памяти, без их копирования в видеопамять; более высокую тактовую частоту, упрощенные протоколы передачи данных и др.В отличие от универсальной шины PCI, AGP используется только для видеокарт. Интерфейс имеет несколько версий, последняя из них — AGP 8x с пропускной способностью 2.1 Гб/с, что в 8 раз больше начального стандарта AGP с параметрами 32-бит и 66 МГц. Новых системных плат с AGP уже не выпускают, они окончательно уступили рынок решениям с интерфейсом PCI Express, но AGP до сих пор имеет широкое распространение и дает достаточную пропускную способность даже для новых видеочипов.Спецификации AGP появились в 1997 году, тогда Intel выпустил первую версию описания, включающую две скорости: 1x и 2x. Во второй версии (2.0) появился AGP 4x, а в 3.0 — 8x. Рассмотрим все варианты подробнее:AGP 1x — это 32-битный канал, работающий на частоте 66 МГц, с пропускной способностью 266 Мбайт/с, что в два раза выше полосы PCI (133 Мбайт/с, 33 МГц и 32-бит).AGP 2x — 32-битный канал, работающий с удвоенной пропускной способностью 533 Мбайт/с на той же частоте 66 МГц за счет передачи данных по двум фронтам, аналогично DDR памяти (только для направления «к видеокарте»).AGP 4x — такой же 32-битный канал, работающий на 66 МГц, но в результате дальнейших ухищрений была достигнута учетверенная «эффективная» частота 266 МГц, с максимальной пропускной способностью более 1 ГБ/с.AGP 8x — дополнительные изменения в этой модификации позволили получить пропускную способность уже до 2.1 ГБ/с.Видеокарты с интерфейсом AGP и соответствующие слоты на системных платах совместимы в определенных пределах. Видеокарты, рассчитанные на 1.5 В, не работают в 3.3 В слотах, и наоборот. Но существуют универсальные разъемы, которые поддерживают оба типа плат. В настоящее время этот интерфейс устарел, но используется на многих старых ПК и энтузиастами, ведь основная проблема этого интерфейса – отсутствие технологической поддержки (например, DirectX 10 или PhysX.) PCI Express (PCIe или PCI-E, не путать с PCI-X), ранее известная как Arapaho или 3GIO, отличается от PCI и AGP тем, что это последовательный, а не параллельный интерфейс, что позволило уменьшить число контактов и увеличить пропускную способность. PCIe — это лишь один из примеров перехода от параллельных шин к последовательным, вот другие примеры этого движения: HyperTransport, Serial ATA, USB и FireWire. Важное преимущество PCI Express в том, что он позволяет складывать несколько одиночных линий в один канал для увеличения пропускной способности. Многоканальность последовательного дизайна увеличивает гибкость, медленным устройствам можно выделять меньшее количество линий с малым числом контактов, а быстрым — большее.Интерфейс PCIe пропускает данные на скорости 250 Мбайт/с на одну линию, что почти вдвое превышает возможности обычных слотов PCI. Максимально поддерживаемое слотами PCI Express количество линий — 32, что дает пропускную способность 8 ГБ/с. А PCIe слот с восемью рабочими линиями примерно сопоставим по этому параметру с быстрейшей из версий AGP. Что еще больше впечатляет при учете возможности одновременной передачи в обоих направлениях на высокой скорости. Наиболее распространенные слоты PCI Express x1 дают пропускную способность одной линии (250 Мбайт/с) в каждом направлении, а PCI Express x16, который применяется для видеокарт, и в котором сочетается 16 линий, обеспечивает пропускную способность до 4 ГБ/с в каждом направлении.Несмотря на то, что соединение между двумя PCIe устройствами иногда собирается из нескольких линий, все устройства поддерживают одиночную линию, как минимум, но опционально могут работать с большим их количеством. Физически, карты расширения PCIe входят и работают нормально в любых слотах с равным или большим количеством линий, так, PCI Express x1 карта будет спокойно работать в x4 и x16 разъемах. Также, слот физически большего размера может работать с логически меньшим количеством линий (например, на вид обычный x16 разъем, но разведены лишь 8 линий). В любом из приведенных вариантов, PCIe сам выберет максимально возможный режим, и будет нормально работать.Чаще всего для видеоадаптеров используются разъемы x16, но есть платы и с x1 разъемами. А большая часть системных плат с двумя слотами PCI Express x16, работает в режиме x8 для создания SLI и CrossFire систем. Физически другие варианты слотов, такие как x4, для видеокарт не используются. Напоминаю, что всё это относится только к физическому уровню, попадаются и системные платы с физическими PCI-E x16 разъемами, но в реальности с разведенными 8, 4 или даже 1 каналами. И любые видеокарты, рассчитанные на 16 каналов, работать в таких слотах будут, но с меньшей производительностью.PCI Express отличается не только пропускной способностью, но и новыми возможностями по энергопотреблению. Эта необходимость возникла потому, что по слоту AGP 8x (версия По разъему PCI Express можно передавать до 75 Вт, а дополнительные 75 Вт получают по стандартному шестиконтактному разъему питания. В последнее время появились видеокарты с двумя такими разъемами, что в сумме дает до 225 Вт. PCI Express 2.0. В дальнейшем, группа PCI-SIG, которая занимается разработкой соответствующих стандартов, представила основные спецификации PCI Express 2.0. Вторая версия PCIe вдвое увеличила стандартную пропускную способность, с 2.5 Гб/с до 5 Гб/с, так что разъем x16 позволяет передавать данные на скорости до 8 ГБ/с в каждом направлении. При этом PCIe 2.0 совместим с PCIe 1.1.Спецификация PCIe 2.0 поддерживает как 2.5 Гб/с, так и 5 Гб/с скорости передачи, это сделано для обеспечения обратной совместимости с существующими PCIe 1.0 и 1.1 решениями. Обратная совместимость PCI Express 2.0 позволяет использовать прошлые решения с 2.5 Гб/с в 5.0 Гб/с слотах, которые просто будут работать на меньшей скорости. А устройство, разработанное по спецификациям версии 2.0, может поддерживать 2.5 Гб/с и/или 5 Гб/с скорости. Основное нововведение в PCI Express 2.0 — это удвоенная до 5 Гб/с скорость, но это не единственное изменение, есть и другие нововведения для увеличения гибкости, новые механизмы для программного управления скоростью соединений и т.п. В PCI-SIG разработали новую спецификацию для обеспечения увеличивающегося энергопотребления графических карт, она расширяет текущие возможности энергоснабжения до 225/300 Вт на видеокарту. Для поддержки этой спецификации используется новый 8-ми-штырьковый разъем питания. PCI Express 2.1.Основное нововведение в PCI Express 2.1 — это удвоенная до 10 Гб/с скорость. PCI Express External. В 2007 году группа PCI-SIG, занимающаяся официальной стандартизацией решений PCI Express, объявила о принятии спецификации PCI Express External Cabling 1.0, описывающих стандарт передачи данных по внешнему интерфейсу PCI Express 1.1. Эта версия позволяет передавать данные со скоростью 2.5 Гб/с, а следующая должна увеличить пропускную способность до 5 Гб/с. В рамках стандарта представлены четыре внешних разъема: PCI Express x1, x4, x8 и x16. Старшие разъемы оснащены специальным язычком, облегчающим подключение. Внешний вариант интерфейса PCI Express может использоваться не только для подключения внешних видеокарт, но и для внешних накопителей и других плат расширения. Максимальная рекомендованная длина кабеля при этом равна 10 метров, но её можно увеличить при помощи соединения кабелей через повторитель.Чем это может быть полезно для видеокарт? Например, это точно может облегчить жизнь любителей ноутбуков, при работе от батарей будет использоваться маломощное встроенное видеоядро, а при подключении к настольному монитору — мощная внешняя видеокарта. Значительно облегчится апгрейд подобных видеокарт, не нужно будет вскрывать корпус ПК. Производители смогут делать совершенно новые системы охлаждения, не ограниченные особенностями карт расширения, с питанием должно быть меньше проблем — скорее всего, будут использоваться внешние блоки питания, рассчитанные специально на определенную видеокарту, их можно в один внешний корпус с видеокартой встроить, используя одну систему охлаждения. Должна облегчиться сборка систем на нескольких видеокартах (SLI/CrossFire). Функциональные блоки видеокарт. Графический процессор содержит много различных функциональных блоков. По количеству некоторых компонентов можно оценить, насколько графический процессор мощный.. Рассмотрим самые важные функциональные блоки: Вершинные процессоры (блоки вершинных шейдеров). Как и блоки пиксельных шейдеров, вершинные процессоры выполняют код программ-шейдеров, которые касаются вершин. Поскольку больший бюджет вершин позволяет создавать более сложные 3D-объекты, производительность вершинных процессоров очень важна в 3D-сценах со сложными объектами или с большим их количеством. Впрочем, блоки вершинных шейдеров всё же не так очевидно влияют на производительность, как пиксельные процессоры. Пиксельные процессоры (блоки пиксельных шейдеров). Пиксельный процессор – это компонент графического чипа, выделенный на обработку пиксельных программ-шейдеров. Эти процессоры выполняют вычисления, касающиеся только пикселей. Поскольку пиксели содержат информацию о цвете, пиксельные шейдеры позволяют достичь впечатляющих графических эффектов. Например, большинство эффектов воды, которые вы видели в играх, создаётся с помощью пиксельных шейдеров. Обычно число пиксельных процессоров используется для сравнения пиксельной производительности видеокарт. Если одна карта оснащена восемью блоками пиксельных шейдеров, а другая – 16 блоками, то вполне логично предположить, что видеокарта с 16 блоками будет быстрее обрабатывать сложные пиксельные программы. Также следует учитывать и тактовую частоту, но сегодня удвоение числа пиксельных процессоров эффективнее по энергопотреблению, чем удвоение частоты графического чипа. Унифицированные шейдеры. Унифицированные (единые) шейдеры используются стандартом DirectX 10. То есть структура кода вершинных, геометрических и пиксельных программ будет единая, хотя шейдеры будут выполнять разную работу. Новую спецификацию можно посмотреть в Xbox 360, где графический процессор был специально разработан ATi для Microsoft. Блоки наложения текстур (Texture Mapping Unit, TMU). Текстуры следует выбрать и отфильтровать. Эта работа выполняется блоками наложения текстур, которые работают совместно с блоками пиксельных и вершинных шейдеров. Работа TMU заключается в применении текстурных операций над пикселями. Число текстурных блоков в графическом процессоре часто используется для сравнения текстурной производительности видеокарт. Вполне разумно предположить, что видеокарта с большим числом TMU даст более высокую текстурную производительность. Блоки растровых операций (Raster Operator Unit, ROP). Процессоры растровых операций отвечают за запись пиксельных данных в память. Скорость, с которой выполняется эта операция, является скоростью заполнения (fill rate). В ранние дни 3D-ускорителей число ROP и скорость заполнения являлись очень важными характеристиками видеокарт. Сегодня работа ROP по-прежнему важна, но производительность видеокарты уже не упирается в эти блоки, как было раньше. Поэтому производительность (и число) ROP уже редко используется для оценки скорости видеокарты. Конвейеры используются для описания архитектуры видеокарт и дают вполне наглядное представление о производительности графического процессора.Конвейер нельзя считать строгим техническим термином. В графическом процессоре используются разные конвейеры, которые выполняют отличающиеся друг от друга функции. Исторически под конвейером понимали пиксельный процессор, который был подключён к своему блоку наложения текстур (TMU). Например, у видеокарты Radeon 9700 используется восемь пиксельных процессоров, каждый из которых подключён к своему TMU, поэтому считают, что у карты восемь конвейеров.Но современные процессоры описать числом конвейеров весьма сложно. По сравнению с предыдущими дизайнами, новые процессоры используют модульную, фрагментированную структуру. Новатором в этой сфере можно считать ATi, которая с линейкой видеокарт X1000 перешла на модульную структуру, что позволило достичь прироста производительности через внутреннюю оптимизацию. Некоторые блоки процессора используются больше, чем другие, и для повышения производительности графического процессора ATi постаралась найти компромисс между числом нужных блоков и площадью кристалла (её нельзя очень сильно увеличивать). В данной архитектуре термин "пиксельный конвейер" уже потерял своё значение, поскольку пиксельные процессоры уже не подключены к собственным блокам TMU. Например, у графического процессора ATi Radeon X1600 есть 12 блоков пиксельных шейдеров и всего четыре блока наложения текстур TMU. Поэтому нельзя говорить, что в архитектуре этого процессора есть 12 пиксельных конвейеров, как и говорить, что их всего четыре. Впрочем, по традиции пиксельные конвейеры всё ещё упоминают. Решения на нескольких видеокартах. Использовать несколько видеокарт для увеличения графической производительности – идея не новая. В ранние дни 3D-графики копания 3dfx вышла на рынок с двумя видеокартами, работающими параллельно. Но с исчезновением 3dfx технология совместной работы нескольких потребительских видеокарт была предана забвению, хотя ATi выпускала подобные системы для профессиональных симуляторов ещё с выхода Radeon 9700. Пару лет назад технология вернулась на рынок: с появлением решений nVidia SLI и, чуть позднее, ATi Crossfire. Совместное использование нескольких видеокарт даёт достаточную производительность, чтобы вывести игру с высокими настройками качества в высоком разрешении. Но выбирать то или иное решение не так просто. Начнём с того, что решения на основе нескольких видеокарт требуют большое количество энергии, поэтому блок питания должен быть достаточно мощным. Всё это тепло придётся отводить от видеокарты, поэтому нужно обратить внимание на корпус ПК и охлаждение, чтобы система не перегрелась. Кроме того, помните, что SLI/CrossFire требует соответствующей материнской платы (либо под одну технологию, либо под другую), которая обычно стоит дороже по сравнению со стандартными моделями. Конфигурация nVidia SLI будет работать только на определённых платах nForce, а карты ATi CrossFire – только на материнских платах с чипсетом CrossFire или на некоторых моделях Intel. Ситуацию осложняет и то, что некоторые конфигурации CrossFire требуют, чтобы одна из карт была специальной: CrossFire Edition. После выхода CrossFire для некоторых моделей видеокарт ATi разрешила включать технологию совместной работы по шине PCI Express, причём с выходами новых версий драйверов число возможных комбинаций увеличивается. Но всё же аппаратный CrossFire с соответствующей картой CrossFire Edition даёт более высокую производительность. Но и карты CrossFire Edition стоят дороже обычных моделей. Следует учитывать и другие факторы. Хотя две графические карты, работающие совместно, и дают прирост производительности, ему далеко до двукратного. Чаще всего прирост производительности составляет 20-60%. А в некоторых случаях из-за дополнительных вычислительных расходов на согласование прироста нет вообще. По этой причине конфигурации на нескольких картах вряд ли оправдывают себя с дешёвыми моделями, поскольку более дорогая видеокарта, как правило, всегда обгоняет пару дешёвых карт. В общем, для большинства потребителей брать решение SLI/CrossFire смысла не имеет. Но если вы хотите включить все опции улучшения качества или играть в экстремальных разрешениях, например, 2560×1600, когда надо просчитывать больше 4 миллионов пикселей на кадр, то без двух или четырёх спаренных видеокарт не обойтись. Устройство видеоускорителя. Считается, что прадедушкой современной видеокарты (также известной как графическая плата, видеоадаптер, графический адаптер, видеоакселератор) является адаптер MDA (Monochrome Display Adapter), представленный в 1981 году для IBM PC. Видеокарта того времени имела 4Кбайт видеопамяти, работала только с текстовой информацией и с разрешением 720х350 точек (80х25 символов), а цвет букв зависел от типа монитора: белые, изумрудные или янтарные. Дальнейшее развитие MDA было выпущено в 1982 году известной компанией Hercules и называлось Hercules Graphics Controller (HGC), но и эта видеокарта не позволяла работать с графикой. Стоит заметить, что длина карты HGC была более 30 см. И только с выходом видеоадаптера CGA (Color Graphics Adapter), который стал основой для последующих стандартов, появилась возможность работать с цветной графической информацией в разрешении 320х200 (16 цветов) и 640х200 (монохромный режим – то есть чёрно-белый), при этом объём памяти видеокарты уже равнялся 16 Кбайт. Следующий стандарт для видеокарт – Enhanced Graphics Adapter (EGA), разработанный в 1984 году, позволял при разрешении 640×350 работать с 16 цветами из 64-цветной палитры одновременно. Ёмкость видеопамяти составляла всё те же 16 Кбайт, а также была заявлена совместимость с CGA и MDA. Все описанные выше видеокарты подключались к монитору через 9-контактный разъём и передавали информацию в цифровом виде. Только с выходом адаптера стандарта MCGA (Multicolor Graphics Adapter – многоцветный графический адаптер) произошёл переход на аналоговый сигнал, так как палитра была увеличена до 262144 цветов (по 64 оттенка на каждый из базовых цветов Red/Green/Blue). Разрешение экрана, выдаваемое MCGA при работе с текстом, было 640х400 с 256 одновременно отображаемыми цветами, для графических приложений – 320х200 точек. Разъём для подключения к монитору приобретает привычный для нас вид – 15-контактный D-Sub. Следующим витком эволюции компьютерной видеоподсистемы является VGA (Video Graphics Array – графический видеомассив), который появился в 1987 году. Адаптеры VGA уже поддерживали разрешение 640х480 и 256 цветов (из палитры в 262144 цвета), объём памяти составлял 256 Кбайт, а соотношение сторон экрана равнялось привычным сейчас 4:3. Именно с этого стандарта пошло множество знакомых сейчас простонародных названий: VGA’шный монитор, VGA’шный разъём и так далее. Более того, именно из этой аббревиатуры развились сокращённые названия разрешений (например, теперь считается, что VGA – это 640х480 точек, SVGA – 800х600, XGA – 1024х768 и так далее). И наконец, в 1991 году появляются первые адаптеры SVGA (Super VGA), позволяющие работать при разрешении 800х600 и 1024х768 точек, количество отображаемых цветов увеличилось до 65536 (High Color) и 16,7 млн (True Color). Также появляется возможность пользователю задать частоту обновления экрана монитора – до этого момента она была жёстко привязана к определённому значению. Память видеоадаптеров SVGA была уже более 1 Мбайт. Для связи с видеокартой и передачи необходимых данных в самом начале эры IBM PC использовался интерфейс XT-Bus, потом на смену ему пришла шина ISA (Industry Standard Architecture – архитектура промышленного стандарта). Но и ISA уже не хватало для относительно большого потока данных. Тогда она была дополнена интерфейсом VLB (или VESA), который в итоге был заменён шиной PCI (Periferal Component Interconnect – объединение внешних компонентов). PCI является более универсальной шиной, через которую можно было подключать множество других контроллеров, не только видеоадаптеры, к тому же она способна работать и на других платформах. С развитием графических оболочек операционных систем (например, Windows) видеокарты взяли на себя часть вычислений по окончательному выводу изображения на экран, которые обычно производил центральный процессор: перемещение окон, рисование линий, шрифтов и другие. С появлением трёхмерных игр видеокарты обзавелись 3D-акселератором, который сперва имел вид отдельной платы, вставляемой в свободный разъём на материнской плате, а позже уже был интегрирован дополнительным чипом на видеокарту – до этого момента видеоадаптер позволял работать только с двухмерной графикой (2D). Далее, с развитием технологий производства полупроводников, графический чип стал содержать в себе все необходимые блоки, отвечающие как за 2D-, так и 3D-графику. Для максимальной универсальности и совместимости видеокарт с программным обеспечением компания Microsoft создаёт API DirectX (API – интерфейс программирования приложений), работающий в среде Windows. Так как мир не однополярный и кроме Windows существуют и другие операционные системы, был разработан альтернативный API – мультиплатформенный OpenGL, а также его дополнение для звука – OpenAL. Именно в те времена доминирующая на тот момент компания 3dfx (все активы 3dfx после банкротства перешли к NVIDIA) представляет технологию SLI (Scan Line Interleave – чередование строчек), благодаря которой появилась возможность объединить две подобные видеокарты с шиной PCI для формирования изображения методом чередования строк, что увеличивало быстродействие графической подсистемы и разрешение экрана. Действительно, всё новое – это хорошо (в данном случае – очень хорошо) забытое старое: спустя почти 15 лет NVIDIA возродила SLI. Ближе к концу 90-х прошлого века видеоадаптеры получают собственную шину – AGP (Accelerated Graphics Port – ускоренный графический порт) и приобретают черты современных видеокарт: объём локальной видеопамяти достиг десятков мегабайт, появилась возможность выводить видеоизображение на ещё один приёмник, например, телевизор. Из-за ограничений шины PCI, а именно её разновидностью является AGP, производителям графических процессоров пришлось в итоге отказаться от технологий, подобных SLI (о современных компьютерных шинах вы можете узнать в этом материале). И только в начале 2000 годов происходит революционный скачок, благодаря которому мы теперь можем наслаждаться реалистичной графикой в играх последних лет. Появился более скоростной интерфейс – PCI Express (PCI-E), появилась возможность подключать два монитора, причём информация опять выводится в цифровом виде (в более расширенном виде, чем в первых поколениях видеокарт), объём памяти в некоторых случаях достигает 1 Гбайт (1024 Мбайт). Рассказывать об эволюции видеокарт, экзотических решениях и «выдумках» инженеров можно бесконечно. Однако, учитывая темпы развития IT-индустрии и бесперспективность графических технологий и архитектур прошлого поколения, мы не станем подробно останавливаться на «старых» видеокартах, а рассмотрим современные, поддерживающие интерфейс PCI Express. Видеокарта, как и любой другой продукт, рассчитанный на розничный рынок, поставляется в коробке (Retail-версия) как обычной, так и оригинальной формы. Изредка, в последнее время всё реже, покупателю предлагают приобрести продукт в OEM- или так называемой bulk-комплектации, то есть без коробки: антистатический пакет с видеокартой, необходимые кабели и переходники, диск с драйвером. Такая комплектация предназначена для продажи только компаниям – сборщикам компьютеров и не должна попадать в розничную продажу. Естественно, никакой разницы в видеокартах нет, не хватает лишь красивой коробки, которая обеспечивает заметную долю удовольствия от приобретения. В комплект поставки современного видеоадаптера обычно входят всевозможные переходники, инструкция, диск с драйверами, иногда и с дополнительным программным обеспечением, а также различные бонусы (но не обязательно): игры, чехлы, джойстики. В качестве основного примера мы рассмотрим видеокарту производства Chaintech, построенную на базе GeForce 7600GT и оснащённую 256 Мбайт видеопамяти. Видеокарта, как и материнская плата, представляет собой очень сложное устройство, но меньших размеров и с небольшим количеством разъёмов. Размеры видеокарт примерно зависят от того класса, к которому они относятся, так как имеют схематические решения различной сложности: карты начального – Low-End – класса имеют длину около 15-18 см, Middle-End – в среднем 20 см, а длина High-End достигает 25-27 см. Конечно, это не регламентированное требование, а результат того обстоятельства, что мощные контроллеры требуют более сложного набора сопутствующих компонентов. Печатная плата видеоадаптера состоит из нескольких слоев, каждый из которых содержит тонкие токопроводящие дорожки, компоненты видеокарты устанавливаются только на верхних слоях: лицевой и обратной. И ни в коем случае нельзя делать дополнительные отверстия на плате – прецеденты были, и не один раз, – видеокарта сразу же выйдет из строя. С каждой стороны плата покрыта диэлектрическим лаком и усеяна множеством мелких элементов (резисторы, конденсаторы), так что обращаться с видеоадаптером необходимо аккуратно, чтобы не повредить эти элементы. Все дорожки на плате объединяют между собой графическое ядро (GPU – графический процессор, видеоядро), видеопамять, раздельные подсистемы питания ядра и памяти (иногда и разъём для дополнительного питания – в случае мощной видеокарты), интерфейсный разъём для подключения к материнской плате, а также разъёмы для подключения мониторов и телевизора. Ключевым компонентом любой современной видеокарты является графический процессор, который занимается расчётами выводимой на экран информации и трёхмерных сцен. На данный момент разработкой графических процессоров занимаются в основном компании NVIDIA, продвигающая серию GeForce, и AMD, купившая канадскую компанию ATI с её линейкой Radeon. Остальные игроки графического рынка, увы, не выдержали конкуренции и той скорости, с которой разрабатываются очередные поколения видеокарт, и если и выпускают свою продукцию, то отличной производительностью и массовостью похвастаться не могут. В зависимости от того, какой GPU положен в основу видеокарты, определяются её характеристики: поддержка тех или иных технологий визуализации и рендеринга, тип памяти и ширина её шины. Графическое ядро представляет собой припаянный к плате чип, в большинстве случаев без защитной крышки, кристалл которого содержит сотни миллионов транзисторов (даже в несколько раз больше, чем у центральных процессоров). Каждый такой чип состоит из вычислительных блоков, контроллеров шины и памяти, блоков для вывода видеоинформации (RAMDAC). Вся эта структура определяется архитектурой ядра, которая сперва разрабатывается для самого мощного видеоадаптера в семействе-поколении, например: G70, G80 – NVIDIA, R580, R600 – AMD. Затем «топовое» ядро упрощается для менее производительных решений методом исключения определённых блоков. Случаи разработки принципиально новых ядер для среднего и нижнего уровня рынка довольно редки. Для того чтобы удалось разместить всё больше и больше транзисторов в кристалле ядра, используются новые, более тонкие техпроцессы, благодаря которым уменьшаются размеры элементов и повышается рабочая частота чипа. На данный момент графические процессоры производятся по 90, 80 и 65 нм технологическим нормам. В сравнении с концом 90-х годов и началом 2000-х, когда доминировал техпроцесс 250-220 нм, современное производство без каких-либо оговорок можно считать настоящим прорывом, тем более что на носу уже техпроцесс 45 нм. Общее правило «тоньше техпроцесс – выше частота – меньше тепла» объясняется следующим образом: транзистор, мельчайшая единица, из которого состоят все блоки GPU, представляет собой своеобразные ворота для электронов. Стенки и «створка ворот» – затвор транзистора – изготавливаются из диэлектрика, не пропускающего ток, а передаются электроны по стоку. Но так как идеального диэлектрика нет, существуют токи утечки – некоторое количество электронов всё же пробивается через закрытый затвор, вызывая тот самый нагрев. Для того чтобы заставить транзисторы переключаться быстрее (повысить частоту), нужно подать на них больший ток, а это приведёт к большему нагреву. Более мелкие транзисторы, произведённые по более тонкому техпроцессу, требуют для своей работы меньшие токи, а следовательно, и токи утечки у них меньше. Вот потому-то более «тонкие» чипы, как правило, работают на более высокой частоте и греются меньше. Кроме того, производители полупроводников и занимающиеся собственно производством чипов неустанно изыскивают новые способы уменьшить токи утечек: новые диэлектрические сплавы и вещества с низкой проницаемостью. Вот уже мы дожили до того, что, например, ядро G86 (GeForce 8600) при хорошем охлаждении достигает и перешагивает через порог 1 ГГц. В данный момент времени происходит переход от архитектуры традиционной конвейерной обработки данных графическим процессором к унифицированной и более гибкой благодаря новому API DirectX 10. В предыдущем поколении видеокарт данные, полученные от центрального процессора, сперва обрабатываются вершинным блоком (также называется процессором, конвейером): создаются вершины, над которыми производятся преобразования, дополненные вершинными шейдерами (программы, добавляющие некоторые эффекты объектам, например – мех, волосы, водная гладь, блеск и так далее). Далее вершины собираются в примитивы – треугольники, линии, точки, после чего переходят в пиксельный блок. Здесь определяются конечные пиксели, которые будут выведены на экран, и над ними проводятся операции освещения или затенения, текстурирования (этим занимается блок TMU – Texture Mapping Unit, который связан с пиксельным конвейером), присвоения цвета, добавляются эффекты от пиксельных шейдеров. Классический пример конвейера. Далее вычисляются координаты конкретного пикселя, чтобы отбросить те, которые будут скрыты другими объектами и не видны пользователю. В следующем блоке фрагменты собираются в полигоны, состоящие из отдельных пикселей, и уже готовая картинка передаётся в память для последующей выборки и вывода на экран. В характеристиках видеокарт, поддерживающих DirectX 9, всегда упоминается количество пиксельных, вершинных процессоров и текстурных блоков. Например, в видеоадаптере GeForce 7600 GT есть 12 пиксельных и 5 вершинных процессора (ввиду меньшей нагрузки на вершинные конвейеры их количество – в пределах 2-8 шт. в зависимости от уровня графического процессора) и 12 TMU – по одному на пиксельный конвейер. Естественно, чем больше текстурных блоков, тем больше будет производительность видеокарты. Но компания ATI, начиная с серии Radeon X1000, отошла от привычной формулы «один TMU на один пиксельный конвейер», уменьшив общее количество «текстурников», которые теперь не связаны напрямую с пиксельными процессорами благодаря оптимизации архитектуры видеоядра. При этом количество пиксельных конвейеров в самой старшей модели видеокарты было увеличено до 48, а количество TMU осталось на уровне 16 шт. Такое решение – своего рода задел на будущее, так как в последние годы всё более заметно, что разработчики игр ориентируются не на грубую силу в виде огромного числа полигонов, а на тонкий расчёт, то есть использование сложных шейдеров, требующих математической вычислительной мощи. Недостаток процесса формирования 3D-сцены при классическом рендеринге состоит в том, что, если уже обработанные данные нужно снова запросить и изменить, приходится дожидаться завершения всего конвейера и заново вычитывать их из памяти или вообще снова получать данные от центрального процессора. Также разделение ядра на отдельные вершинные и пиксельные процессоры сильно ограничивает разработчиков графических приложений, ведь необходимо предусмотреть все варианты геометрии и эффектов в будущих играх, учитывая особенности решений обоих ведущих производителей видеокарт. Унифицированная архитектура. Теперь поговорим о будущем графических процессоров. В основу унифицированной архитектуры легла концепция потоковой обработки данных, благодаря которой появилась возможность отправки данных на повторную обработку без ожидания завершения всех стадий конвейера. Также был добавлен новый вид шейдеров – геометрический, работающий с геометрией на уровне примитивов, а не вершин, что способствует разгрузке центрального процессора от лишней работы. И, конечно же, отказ от разделения на пиксельные и вершинные процессоры – теперь они общие, получили новое название – потоковые процессоры (стрим-процессоры) и в любой момент могут быть перепрограммированы под конкретные нужды приложения. Если необходим просчёт «скелета» сцены, то для текстурирования и пиксельной работы выделяется необходимое число блоков, а остальное идёт на вершинные операции. Если же, например, необходимо воссоздать бушующее море, всё наоборот: все силы бросаются на пиксельную обработку, а для геометрии, естественно, только необходимое. Количество стрим-процессоров в новых ядрах достигает 128 шт. (NVIDIA) или 320 шт. (AMD), но напрямую их сравнивать нельзя из-за их особенностей. Кстати, если говорить по всей строгости, процессоров у AMD R600 не 320, а 64, но каждый из них за один такт выполняет до 5 инструкций, что равняется 320 виртуальным процессорам. Блоки TMU теперь не связаны напрямую с шейдерными, и их количество не сильно изменилось при переходе к унифицированной архитектуре. Ядро и память.Разгон. Частота графического процессора задаётся, исходя из возможностей чипа или маркетинговых соображений разработчиков, иногда даже поддаётся заводскому разгону (оверклокинг – повышение рабочих частот компонентов компьютера) производителями видеокарт, чтобы выделить продукт и привлечь потенциального покупателя. Плохого в этом ничего нет, так что если есть возможность приобрести изначально разогнанный видеоадаптер, да ещё и по той цене, что и обычный, то это будет отличным выбором. Ядро рассматриваемой нами видеокарты Chaintech GeForce 7600GT функционирует на частоте 600 МГц, в отличие от номинальной в 560 МГц, – налицо заводской разгон. Обычно высокоуровневые видеокарты работают на более низких частотах, чем младшие собратья, – виной тому более высокая сложность чипа класса High-End, и с ростом частоты таких ядер будет повышаться уровень энергопотребления, а следовательно, и тепловыделение. В видеокартах классом ниже справиться с повышенным тепловыделением куда проще, чем в высокоуровневом сегменте. В некоторых графических процессорах компании NVIDIA используются различные частоты для большей части ядра и некоторых функциональных блоков, например, в GeForce 8800GTX ядро работает на частоте 575 МГц, а стрим-процессоры на частоте 1350 МГц. Или же в GeForce 7900GS ядро работает на частоте 450 МГц, а блок геометрии на 470 МГц. Более того, частота стрим-процессоров растёт не линейно по отношению к основной частоте ядра, а в процентном соотношении: если ядро разогнать с 575 до 625 МГц, то есть на 8,6%, то частота шейдерного домена составит 1466 МГц. Заключение. Видеокарты – наиболее используемый ресурс персональных компьютеров, и их значение очень велико в том смысле, что имея столько возможностей, они постоянно развиваются, что влечет за собой постоянные замены всех остальных комплектующих. В связи с тем, что нагрузки на них возрастают, уже сейчас мы наблюдаем огромные скачки в развитии этого направления. Возможно, уже совсем скоро забудут названия сегодняшних новинок, ведь все индустрии сейчас требуют как можно большего количества обработанных с ПК данных, а кино – и игровая индустрии являются одними из самых прибыльных по всей планете. Производительность видеокарт растет в геометрической прогрессии, равно как и их стоимость. Прогресс в этой области не остановить и уже совсем скоро, благодаря возможностям видеоадаптеров, виртуальная жизнь станет ещё более яркой.ИСТОЧНИКИ: http://www. radeon.ru http://www.spravkapc.ru http://www.ixbt.com http://www.ferra.ru http://www.igromania.ru http://ru.wikipedia.org http://www.nvidia.ru http://www.kompstat.ru http://www.sd-company.su http://www.mobimag.ru 23
Похожие работы
Методы формирования нейросетей Сущность электронного документооборота
Основные понятия экономической информатики Под экономической информатикой понимается наука, предназначенная для формирования теоретических основ моделирования деятельности хозяйствующих субъектов, также государственных, региональных и муниципальных образований. Ее…
Игра в Морской бой с компьютером
СОДЕРЖАНИЕ Введение 1 Постановка задачи 2 Математические и алгоритмические основы решения задачи 3 Функциональные модели и блок-схемы решения задачи 4 Программная реализация решения задачи 5…
Обработка данных в автоматизированных системах
Министерство образования и науки Украины Севастопольский национальный технический университет Кафедра технической кибернетики КУРСОВОЙ ПРОЕКТ на тему: «Обработка данных в автоматизированных системах» (альбом документов) Севастополь 2006…
Винчестеры
Содержание 1. Винчестеры Практическое задание 1 Программа на языке программирования BASIC Практическое задание 2 Практическое задание 3 Список литературы Винчестеры Накопи́тель на жёстких магни́тных ди́сках,…
Математична модель вимірювальної системи в середовищі Delphi
Курсова робота Математична модель вимірювальної системи в середовищі Delphi АНОТАЦІЯ Опис програми містить загальний опис алгоритмів головної програми та допоміжних на рівні блок-схем, а також…