Московский Государственный Институт Радиотехники, Электроники и Автоматики Технический Университет курсовой проект по теме Шина PCI. Порт AGP. Студент Головченко Владимир Группа ВВ-2-95 Преподаватель Дешко И.П. МОСКВА 1997 План Стр. Введение 1 Сигналы шины 4 Разъемы шины 7 Порт AGP 10
Литература 15 I SIG, являющейся некорпоративной ассоциацией представителей микрокомпьютерной промышленности. Группа PCI SIG поставила задачу разработать стандарт, который допускал бы аппаратное расширение и был применим на разнообразных платформах.
PCI Interconnect bus – шина соединения периферийных компонентов. Занимает особое место в PC – архитектуре, являясь мостом между локальной шиной процессора и шиной ввода-вывода ISAEISA или MCA. Разработана для Pentium-систем, хорошо сочетается и с 486 процессорами. Частота шины 20-33 Мгц, теоритическая максимальная скорость 132264 Мбайтс для 3264 бит. Имеет версии с питанием 5В, 3.3В и универсальную с переключением линий
V IO с 5В на 3.3В. Ключами являются пропущенные ряды контактов 12, 13 и 50, 51. Для 5В-слота ключ расположен на месте контактов 50, 51 для 3.3В – 12, 13 для универсального – два ключа 12, 13 и 50, 51. 32-битный слот заканчивается контактами А62В62, 64-битный – А94В94. I дает возможность воспроизводить цветные видеофильмы с высоким разрешением во многих окнах экрана. Она позволяет использовать дополнительные порты, автоматически устанавливающие
свою конфигурацию, а также гарантирует высочайшую скорость обмена с жесткими дисками. Строго говоря, PCI вовсе не является истинной локальной шиной, а представляет собой дополнительную, или промежуточную шину. Она занимает промежуточный уровень между процессорной шиной системы и такими стандартными шинами расширения, как ISA, EISA или MCA, причем соединяется с ними при помощи электронных мостов.рис. 1 Благодаря изоляции от локальной шины центрального процессора шина PCI подключает больше устройств, чем VL-BUS, так как эти устройства не будут представлять электрической нагрузки для шины ЦП. Спецификация PCI предусматривает до десяти единичных нагрузок. Рис.1 Шина PCI в архитектуре типичного настольного компьютера PC ЦЕНТРАЛЬНЫЙ МОНИТОР ПРОЦЕССОР КЭШ МОСТ КОНТРОЛЛЕР ДЗУПВ ГРАФИЧЕСКАЯ ПАМЯТИ ПОДСИСТЕМА ЛОКАЛЬНАЯ ШИНА
PCI ФАКС ВСТРОЕННАЯ ИНТЕРФЕЙС ЭЛЕКТРОНИКА ШИНЫ МОДЕМ IDE РАСШИРЕНИЯ ПЛАТА РАСШИРЕНИЯ ПЛАТЫ PCI ШИНА ISA, EISA или MCA ВИНЧЕСТЕР Если развязка процессора от шины PCI реализована недостаточно удачно, это может вызвать задержки при выполнении любых операций обмена между ЦП и устройствами, подключенными к шине PCI.
Компания Intel, которая разработала шину PCI, создала и наборы микросхем PCI, позволяющие решить эту проблему благодаря рационально организованной буферизации в мостовом интерфейсе при выполнении операций чтения и записи. Набор ИС компании Intel позволяет центральному процессору компьютера произвести запись выдачу данных на периферийное устройство, с тем чтобы контроллер PCI немедленно запомнил эти данные в своем буфере, а
ЦП мог быстро перейти к следующей операции, не дожидаясь завершения вывода. Затем буфер сам передаст данные устройству PCI в эффективном режиме группового обмена. Изоляция шины PCI – это своего рода шаг в будущее архитектуры PC, поскольку тем самым обеспечивается возможность работы с более быстродействующими микропроцессорами. Теоритически можно подключить шину PCI к 100-Мгц МП
Pentium или 200-Мгц RISK-процессору Alpha, в то время как о прямом соединении истинной локальной шины с ЦП фактически не может быть и речи. Такая независимость от процессора служит весьма важным преимуществом с точки зрения изготовителя системы, поскольку позволяет снизить расходы на разработку благодаря тому, что одни и теже периферийные устройства шины можно при минимальных доработках использовать с центральными процессорами нескольких различных поколений. Поскольку шина PCI независима от процессора, периферийная плата или ИС этой шины будет в равной мере хорошо работать в машине с процессором 486, Pentium, Alpha, а со временем и в компьютере Macintosh с процессором PowerPС. Автоконфигурирование устройств выбор адресов, запросов прерывания, каналов DMA поддерживается средствами BIOS и ориентировано на технологию
Plug and Play. Стандарт PCI определяет для каждого слота конфигурационное пространство размером до 256 восьмибитных регистров, не приписанных ни к пространству памяти, ни к пространству ввода-вывода. Доступ к ним осуществляется по специальным циклам шины Configuration Read и Configuration Write, вырабатываемым контроллером при обращении процессора к регистрам контроллера шины PCI, расположенным в его пространстве ввода-вывода.
СИГНАЛЫ ШИНЫ PCI AD310 – мультиплексированная шина адресаданных. Адрес передается по сигналу -FRAME, в последующих тактах передаются данные. -CBE30 – командаразрешение обращения к байтам. Команда, определяющая тип очередного цикла шины чтение-запись памяти, ввода-вывода или конфигурационное чтение-запись, подтверждение прерывания и другие задается четырехбитным кодом в фазе адреса по сигналу -FRAME. –
FRAME – индикатор фазы адреса иначе – передача данных. -DEVSEL – попытка инициатора обратиться к основной памяти. -IRDY – готовность инициатора к обмену данными. -LOCK – используется для установки, обслуживания и освобождения захвата ресурса на PCI. -REQ30 – запрос от PCI-мастера на захват шины для слотов 30. -GNT30 – разрешение мастеру на использование шины. PAR – общий бит паритета для линий
AD310 и CBE30. -ParityER – сигнал об ошибке паритета от устройства, ее обнаружившего. -RST – сброс всех регистров в начальное состояние. IDSEL – выбор устройства в циклах конфигурационного считывания и записи. -SERR – системная ошибка, активизируется любым устройством PCI и вызывает NMI. -REQ64 – запрос на 64-битный обмен. -ACK64 – подтверждение 64-битного обмена. -INTR A,B,C,D – линии запросов прерывания, циклически сдвигаются в слотах и направляются на доступные линии IRQ с помощью конфигурационных регистров. Запрос по низкому уровню позволяет использовать одну линию несколькими источниками. Clock – тактовая частота шины. Test Clock, -TSTRES, TestDO, TestDI – сигналы для тестирования адаптеров по интерфейсу JTAG на системной плате обычно не задействованы. TSTMSLCT – перевод в режим тестирования. –
TRDY – готовность целевого устройства к обмену данными. -STOP – запрос целевого устройства к инициатору на останов текущей транзакции. РАЗЪЕМЫ ШИНЫ PCI Ряд ВРяд АРяд ВРяд А- 12 В1-TSTRESGNDКлюч51GNDКлючTest Clock2 12BAD 852-CBE 0GND3TSTMSLCTAD 753 3.3BTest DO4Test DI 3.3B54AD 6 5В5 5BAD 555AD 4 5B6-INTR AAD 356GND-
INTR B7-INTR CGND57AD 2-INTR D8 5BAD 158AD 0-PRSNT 19ReservedV IO59V IOReserved10 V IO-ACK6460-REQ64-PRSNT 211Reserved 5B61 5BGNDКлюч12GNDКлюч 5B62 5BGNDКлюч13GNDКлючКонец 32-битного разъемаReserved14ReservedGND15-RSTReserv ed63GNDClock16V IOGND64-CBE 7GND17-GNT-CBE 665-CBE 5-REQ18GND-CBE 466V IOV IO19ReservedGND67PAR64AD 3120AD 30AD 6368AD 62AD 2921 3.3BAD 6169GNDGND22AD 28V
IO70AD 60AD 2723AD 26AD 5971AD 58AD 2524GNDAD 5772GND 3.3B25AD 24GND73AD 56-CBE 326IDSELAD 5574AD 54AD 23273.3BAD 5375V IOGND28AD 22GND76AD 52AD 2129AD 20AD 5177AD 50AD 1930GNDAD 4978GND3.3B31AD 18V IO79AD 48AD 1732AD 16AD 4780AD 46-CBE 2333.3BAD 4581GNDGND34-FRAMEGND82AD 44-IRDY35GNDAD 4383AD 423.3B36-TRDYAD 4184 V IO-DEVSEL37GNDGND85AD 40GND38-STOPAD 3986AD 38-Lock393.3BAD 3787GND-ParityER40SDONEV IO88AD 363.3B41-SBOFFAD 3589AD 34-SysERR42GNDAD 3390GND3.3B43PARGND91AD 32-CBE 144AD 15Reserved92ReservedAD 14453.3BReserved93GNDGND46AD 13GND94ReservedAD 1247AD 11Конец 64-битного разъемаAD 1048GNDGND49AD 9GNDКлюч50GNDКлюч12, 13 – ключ для 3.3В 50, 51 – ключ для 5В Определены два типа устройств стандарта PCI – целевое и ведущее. Целевое устройство воспринимает команды и реагирует на запросы ведущего. Ведущее устройство представляет собой более интеллектуальное устройство, которое может производить обработку независимо от шины или других устройств.
Ведущее устройство разделяет шину с основным процессором и целевыми устройствами. Кроме того, оно может выступать целевым устройством для других ведущих устройств. Определение стандарта PCI требует 47 контактов только для целевого и 49 контактов для ведущего. Это число представляется невероятно малым, если учесть потенциальные возможности шины и тот факт, что сюда включены функции передачи данных и адресации, управления интерфейсом, арбитража, а также системные
функции. Однако спецификация предусматривает до 120 соединений для стандартной 32-битовой платы и 184 для 64-битовых плат. В основе стандарта лежит мультиплексирование, при котором через одни и те же контакты передаются разнотипные сигналы. Адреса и данные мультиплексируются на одни и те же контакты, поэтому одиночная передача по шине PCI состоит из двух фаз фаза адресации сопровождается одной или несколькими фазами данных. Ведущее устройство выдает адрес и обращается к конкретному устройству на шине.
Выбранное устройство переходит в соответствующий режим для приема данных или инструкций, а затем ведущее устройство посылает пакет данных по тем же контактам, которые использовались для вызова. После определения адреса ведущее устройство может посылать данные без повторения адресации, так как целевое устройство уже выбрано. Отметим, что передача данных может включать в себя и чтение и запись информации. Для PCI определяются три физических адресных пространства памяти, ввода-вывода и конфигурации. Адресация памяти и ввода-вывода аналогична применяемой во всех шинах. Адресное пространство конфигурации PCI предназначено для входящего в определение стандарта средства автоматического аппаратного конфигурирования. Еще одной интересной особенностью шины, способствующей е упрощению, является распределенное дешифрирование адреса, когда каждое подключенное к локальной шине PCI устройство производит дешифрирование адреса самостоятельно.
Благодаря этому становятся ненужными схемы централизованного дешифрирования адреса и сигналы выбора устройств, за исключением одного сигнала, предназначенного для конфигурирования. ПОРТ AGP AGP Acselerated Graphics Port Прежде чем приступить к дальнейшему изложению, определим некоторые термины. Фрейм – буфер – память, расположенная на видеокарте и являющаяся хранилищем видеоизображения. Текстурными данными называются материалы, отображаемые на 3D-объектах цвет, фактура .
Для хранения текстур используется специальная текстурная память, расположенная на видеокарте. Информацию о видимости трехмерных поверхностей хранит z-буфер, так-же расположенный на видеокарте. Итак, например, для того чтобы в трехмерной игре виртуальный воин не размахивал попусту бластером, ожидая смены интерьера, необходимо как можно быстрее прокачать информацию об этих изменениях между графическим акселератором и соответствующими областями памяти.
Во многих графических подсистемах для этого используются дорогие быстродействующие чипы памяти, увеличивающие и стоимость компьютера. Вот тут-то и выявляется узкое место сегодняшних PC. Во-первых, для повышения качества отображения 3D-графики необходимо все больше и больше текстур, соответственно и текстурной памяти, поэтому размещение их в видеопамяти продолжало бы увеличивать стоимость графической подсистемы. И, что самое главное, эта память заведомо потеряна для системы в целом, поскольку имеет только целевое назначение хранение текстур . Во-вторых, текстурные данные довольно статичны по своей природе, и их все равно надо куда-то поместить на период работы конкретного 3D-приложения. Альтернативным решением этой проблемы стало бы перемещение текстур из памяти видеокарты в основную память. Такое перемещение позволило бы освободить ресурсы, которые могли бы использоваться другими элементами системы.
Однако быстрое наложение текстур на объекты в масштабе реального времени требует значительно большой пропускной способности, что может предоставить шина PCI с портом AGP. AGP – специализированная надстройка над шиной PCI, позволяющая создать скоростной канал обмена данными между графическим акселератором и системной логикой PC. При этом прожорливые текстурные данные вместо драгоценной видеопамяти отъедят кусочек основной.
рис. 3 Итак, AGP – расширение основной PCI-архитектуры основывается на трех китах многоканальной шине адреса, конвейерной обработке данных и рабочей частоте шины 133 Мгц. Для того чтобы достигнуть высокой скорости передачи, AGP определен как непосредственное или прямое соединение point-to-point, а не через общую шину. рис. 4 Как видно, новая подсистема связана с памятью и процессором через системное логическое устройство
и предназначена исключительно для графики, причем эта система поддерживает графический контроллер как на материнской плате, так и на внешней графической карте. Непосредственное соединение двух оконечных устройств, несомненно упростит задачу синхронизации, улучшит целостность данных, упростит AGP-протоколы и устранит арбитражные потери, присущие шине PCI. Как видно из рисунка 4, системная архитектура предлагаемого порта, добавляя высокоскоростной маршрут между графической подсистемой и системной памятью, не оказывает влияния на любой другой периферийный порт. При этом Intel пытается в трансляционном отношении сохранить в значительной мере часть PCI-спецификации, особо избегая использования любой из зарезервированных областей и штырьков в PCI-спецификации. Большинство PCI – сигналов используется в AGP – командах, но, по сравнению с PCI, добавлено еще 16 сигналов, ответственных за расширенные функции
AGP. Специфические AGP-протоколы, подобно конвейеру, перекрываются на PCI таким образом, что для стандартного устройства в шине PCI надстройка AGP прозрачна. Тем не менее всем AGP устройствам потребуется отвечать на PCI-запросы, поэтому они должны оперировать едиными сигналами, как определено спецификацией PCI . Несмотря на совместимость AGP и PCI, они предназначены для различных устройств.
Главная причина в том, что AGP – это не шина в широком смысле и поддерживает единственное графическое устройство. Если бы Intel пыталась сформировать AGP как расширенный набор PCI, устанавливая AGP-устройства в этой шине, то это решение должно было или ограничить AGP частотой 33 Мгц, или обязать все PCI устройства поддерживать 66 Мгц, удорожая большинство периферийных устройств. Кроме того,
AGP определяет собственный слот, отличный от PCI, и многоканальная адресация сигналов не должна приспосабливаться к существующему PCI-слоту. Значительная совместимость с PCI-шиной позволила Intel разработать спецификацию на AGP очень быстро. Сходство с PCI также упростит задачу разработчиков аппаратных средств. В течении следующих нескольких лет многие графические чипы, будут носителями двойного
AGPPCI-интерфейса, давая системному разработчику больше гибкости. Конвейер данных – основное расширение протокола, предусматриваемое AGP. Но только операции чтения и записи, инициируемые видеоускорителем и направленные в основную память, поставлены на конвейер. Системная логика может иметь доступ к графическому чипу только по стандартам PCI-протокола. Все операции шины, включая чтение и запись, обращенные в графический контроллер, выполнены как стандартные PCI-запросы. Конвейерная обработка данных, определяемая AGP, работает по методу разделения транзакций групповые операции чтениязаписи. Рассмотрим это на примере чтения из системной памяти. Графический чип выдает запрос на конвейерную обработку запрос доступа в чип системной логики. Системная логика отвечает на запрос и обеспечивает затем передачу данных из основной памяти.
Графический чип, не дожидаясь получения предшествующей порции данных, выдает следующий запрос. Это перекрытие результатов и обеспечивает конвейер различных запросов чтения или записи, причем очередь запросов всегда активна. Что особенно важно, AGP-спецификация не навязывает предела длины очереди запросов, этот предел определяется возможностями системной реализации. Для конвейерной AGP-обработки характерна несвязанность фаз адреса и данных. см. рис.
5 Другое важное различие между AGP и PCI – техника двойной синхронизации, используемая для достижения скорости передачи данных с тактовой частотой 133 Мгц. Непосредственное соединение графического акселератора и чипа системной логики упростит не только электрическую среду их взаимодействия, но и обеспечит хорошее нагрузочное согласование, таким образом, открывается возможность осуществлять синхронизацию от импульсов одного и того же задающего тактового генератора
частотой 66Мгц как по переднему фронту импульса, так и по заднему. За счет этого и появляется возможность синхронизации по стробам 66 Мгц и 133 Мгц. При этом передача данных на частоте 66 Мгц соответствует некоторой расчетной спецификации 66 Мгц шины PCI, а режим AGP-133 требует дополнительного интерфейса –
Intel добавляет 8-разрядную адресную шину SBA Bus, причем адреса и данные демультиплексированы, а адресация по шине SBA служит исключительно для передачи AGP-запросов доступа в системную память. На частоте 133 МГц AGP достигает максимальной пропускной способности 533 Мбайтс. Очевидно, что принцип двойной синхронизации предъявляет особые требования к качеству импульсов задающего генератора. Текстурные данные, которые планируется загружать в основную память, должны быть непрерывными с точки зрения трехмерного приложения и графического акселератора. Типичная текстура размерностью 256х256 пикселов и 16 бит на цвет занимает 128 Кбайт, и сколько таких текстур Как разместить их непрерывно в физической памяти Windows такой возможности не предоставляет. Решение Intel надо расположить текстурные данные в системной памяти постранично по 4
Кб, а информацию об их местоположении поместить в некую область памяти – карту текстуры, и затем распределить эти участки в физической памяти здесь прослеживается явная аналогия с формированием FAT – file allocation table на винчестере.Таблицу такого перевода виртуального адреса в физический Intel назвал GART Graphics Address Remapping Table. Intel в AGP установит чип, в котором и будет реализована
GART. Этот чип назван 440LX и разрабатывается для взаимодействия с процессором Klamath. GART потенциально довольно велик. Описание 4 Мбайт текстурных данных требует 1024 записи по 4 байта каждая. Логическая спецификация AGP не описывает, как GART будет формироваться этим чипом. Взамен поставщик такого чипа должен обеспечить его драйвером, управляющим
GART согласно вызовам API Application Programming Interface, которые определены в AGP-спецификации. Такой подход должен помочь другим поставщикам в разработке AGP – устройств, совместимых с Intel на системном уровне. Итак, AGP – не универсальное решение, а средство оптимизации видеографики путем более полной реализации возможностей графических акселераторов. Это новшество никак не скажется на быстродействии шины
PCI. Литература 1. Михаил Гук Карманная энциклопедия. Аппаратные средства IBM PC Второе издание. Санкт-Петербург 1997. Изд. Питер Пресс 2. Питер Нортон, Кори Сандлер, Том Баджет ПК изнутри Изд. Бином Москва 1995 3. Мир ПК 2 97 с.178 180 4. КомпьюТерра 2декабря 47174 с.40 – 42 статья Л.Подбережного Интелвидение будущего 5. PC magazine 1 1994 с.61 – 68 статья Д.Роуэлла Локальная шина PCI