Усовершенствование материнской платы
Система команд процессора. В процессе работы процессор
обслуживает данные, находящиеся в его регистрах, в поле оперативной памяти, а
также данные, находящиеся во внешних портах процессора. Часть данных он
интерпретирует непосредственно как данные, часть данных - как адресные данные,
а часть - как команды.
Совокупность всех возможных команд, которые может
выполнить процессор над данными, образует так называемую систему команд
процессора. Процессоры, относящиеся к одному семейству, имеют одинаковые или
близкие системы команд.
Процессоры, относящиеся к разным семействам, различаются
по системе команд и невзаимозаменяемые. Процессоры с расширенной и сокращенной
системой команд. Чем шире набор системных команд процессора, тем сложнее его
архитектура, тем длиннее формальная запись команды (в байтах), тем выше средняя
продолжительность исполнения одной команды, измеренная в тактах работы
процессора. Так, например, система команд процессоров семейства Pentium в
настоящее время насчитывает более тысячи различных команд. Такие процессоры
называют процессорами с расширенной системой команд - CISС-процессорами (CISC -
Complex Instruction Set Computing).
В противоположность СISC-процессорам в середине 80-х
годов появились процессоры архитектуры RISC с сокращенной системой команд (RISC
- Reduced Instmction Set Computing). При такой архитектуре количество команд в
системе намного меньше и каждая из них выполняется намного быстрее. Таким
образом, программы, состоящие из простейших команд, выполняются этими процессорами
много быстрее.
Оборотная сторона сокращенного набора команд состоит в
том, что сложные операции приходится эмулировать далеко не эффективной последовательностью
простейших команд сокращенного набора.
В результате конкуренции между двумя подходами к
архитектуре процессоров сложилось следующее распределение их сфер применения:
- СISС-процессоры используют в универсальных
вычислительных системах;
- RISС-процессоры используют в специализированных
вычислительных системах или устройствах, ориентированных на выполнение
единообразных операций.
Персональные компьютеры платформы IВМ РС ориентированы
на использование CISC-процессоров.
Совместимость процессоров. Если два процессора имеют
одинаковую систему команд, то они полностью совместимы на программном уровне.
Это означает, что программа, написанная для одного процессора, может
исполняться и другим процессором. Процессоры, имеющие разные системы команд, как
правило, несовместимы или ограниченно совместимы на программном уровне.
Группы процессоров, имеющих ограниченную совместимость,
рассматривают как семейства процессоров. Так, например, все процессоры Intel
Pentium относятся к так называемому семейству x86. Родоначальником этого
семейства был 16-разрядный процессор Intel 8086, на базе которого собиралась
первая модель компьютера IBM PC. Впоследствии выпускались процессоры Intel
80286, Intel 80386, Intel 80486, несколько моделей Intel Pentium; несколько моделей
Intel Pentium ММХ, модели Intel Pentium Pro, Intel Pentium II, Intel Celeron,
Intel Xeon, Intel Pentium III, Intel Pentium 4 и другие. Все эти модели, и не
только они, а также многие модели процессоров компании AMD и некоторых других
производителей относятся к семейству х86 и обладают совместимостью по принципу
"сверху вниз".
Принцип совместимости "сверху вниз" - это
пример неполной совместимости, когда каждый новый процессор
"понимает" все команды своих предшественников, но не наоборот. Это
естественно, поскольку двадцать лет назад разработчики процессоров не могли
предусмотреть систему команд, нужную для современных программ. Благодаря такой
совместимости на современном компьютере можно выполнять любые программы,
созданные в последние десятилетия для любого из предшествующих компьютеров,
принадлежащего той же аппаратной платформ.
Основные параметры процессоров. Основными параметрами
процессоров являются: рабочее напряжение, разрядность, рабочая тактовая
частота, коэффициент внутреннего умножения тактовой частоты и размер
кэш-памяти.
Рабочее напряжение процессора обеспечивает материнская
плата, поэтому разным маркам процессоров соответствуют разные материнские платы
(их надо выбирать совместно). По мере развития процессорной техники происходит
постепенное понижение рабочего напряжения. Ранние модели процессоров х86 имели
рабочее напряжение 5 В. С переходом к процессорам Intel Pentium оно было
понижено до 3,3 В, а в настоящее время оно составляет менее 2 В. Понижение
рабочего напряжения позволяет уменьшить расстояния между структурными
элементами в кристалле процессора до десятитысячных долей миллиметра, не
опасаясь электрического пробоя. Пропорционально квадрату напряжения уменьшается
и тепловыделение в процессоре, а это позволяет увеличивать его производительность
без угрозы перегрева.
Разрядность процессора показывает, сколько бит данных он
может принять и обработать в своих регистрах за один раз (за один такт). Первые
процессоры xS6 были 16-разрядными. Начиная с процессора 80386 они имеют
32-разрядную архитектуру. Современные процессоры семейства Intel Pentium
остаются 32-разрядными, хотя и работают с 64-разрядной шиной данных
(разрядность процессора определяется не разрядностью шины данных, а
разрядностью командной шины). 64-разрядных процессоров на персональные
компьютеры.
В основе работы процессора лежит тот же тактовый
принцип, что и в обычных часах. Исполнение каждой команды занимает определенное
количество тактов. В настенных часах такты колебаний задает маятник; в ручных
механических часах их задает пружинный маятник; в электронных часах для этого
есть колебательный контур, задающий такты строго определенной частоты. В
персональном компьютере тактовые импульсы задает одна из микросхем, входящая в
микропроцессорный комплект (чипсет), расположенный на материнской плате. Чем
выше частота тактов, поступающих на процессор, тем больше команд он может
исполнить в единицу времени, тем выше его производительность. Первые процессоры
х86 могли работать с частотой не выше 4,77 МГц, а сегодня рабочие частоты
некоторых процессоров уже превосходят 4 миллиарда тактов в секунду (3 ГГц).
Тактовые сигналы процессор получает от материнской
платы, которая, в отличие от процессора, представляет собой не кристалл
кремния, а большой набор проводников и микросхем. По чисто физическим причинам
материнская плата не может работать со столь высокими частотами, как процессор.
Сегодня базовая частота материнской платы составляет около 400 МГц. Для
получения более высоких частот в процессоре происходит внутреннее умножение
частоты. Коэффициент внутреннего умножения в современных процессорах может
достигать 10-20 и выше. Обмен данными внутри процессора происходит в несколько
раз быстрее, чем обмен с другими устройствами, например с оперативной памятью.
Для того чтобы уменьшить количество обращений к оперативной памяти, внутри
процессора создают буферную область - кэш-память.
Нередко кэш-память распределяют по нескольким уровням.
Кэш первого уровня выполняется в том же кристалле, что и сам процессор, и имеет
объем порядка десятков Кбайт. Кэш второго уровня находится либо в кристалле
процессора, либо в том же узле, что и процессор, хотя и исполняется на
отдельном кристалле. Кэш-память первого и второго уровня работает на частоте,
согласованной с частотой ядра процессора.
Кэш-память третьего уровня выполняют на
быстродействующих микросхемах типа SRAM и размещают на материнской плате вблизи
процессора. Ее объемы могут достигать нескольких Мбайт, но работает она на
частоте материнской платы.
Процессор на материнской плате находится в специальных
колодках, которые носят название сокет или слот 1. Подавляющее большинства
моделей процессоров установлены именно в сокетах. Слот использовали 2 поколение
процессоров Пентиум и используют процессоры АМД.
В основе работы современных процессоров лежит вероятностная
модель. Её смысл заключается в том, что процессор предсказывает последующие
действия программы или пользователя, основываясь на их предыдущих действиях.
Немаловажным фактом при анализе процесса является фирма
изготовитель.
Существует несколько таких фирм, это: Intel, AMD, Cyrix,
IBM, Texas Instruments. (Размышления на тему процессоров). В принципе все фирмы
производители конфигурировали свои процессоры, таким образом, чтоб они были
Intel совместимы. Долгое время лидирующие места на рынке процессоров занимала
фирма Intel. В основном это связано с тем, что до шестого поколения процессор
фирмы AMD, у данных процессоров существовала серьезная проблема, связанная с
плавающей точкой. (Заключается в том, округления производимые компьютером при
вычислениях, при суммировании давали существенную ошибку). Сегодня эта ошибка
компанией AMD устранена. На сегодняшний день данной фирмой разработано и
выпущено в серийное производство семь поколений процессоров Pentium.
К первому поколению относятся процессоры 8086.
Второе поколение процессоров - это 286, 386, 486.
Третье поколение процессоров - Пентиум 1
Четвертое поколение - Пентиум ММХ
Пятое поколение - Пентиум 2
Шестое поколение - Пентиум 3
Седьмое поколение - Пентиум 4.
Современные процессоры Intel выпускаются в двух
модификациях полная модель и более дешевая модель, не имеющая кеша второго
уровня, которая называется Celeron, что отражается на производительности
компьютера. (Немного философии). Компания Intel выпускает 32-разрядные
процессоры, компанией AMD был выпущен 64-разрядный процессор, который имеет
удвоенную внутреннюю шину, за счет чего быстродействие его значительно
повысилось по сравнению с процессорами фирмы Intel. Что сделало процессоры
фирмы AMD более востребованными по сравнению с процессорами фирмы Intel. (Соотношение
цена -качество, однако только для бытовых целей).
Рассмотрим архитектуру современного компьютера фирмы
Intel.
Intel Pentium 4 - это первый процессор в семействе
32-битных процессор седьмого поколения от Intela. В след за ним в этом семействе
разработаны процессоры с кодовыми именами Foster (модифицированный Intel
Pentium 4, предназначенный для использования в серверах) и Northwood
(модификация Intel Pentium 4, изготавливаемая по 0,13 - микронной технологии).
Позиционируется Intel Pentium 4 как процессор
высокопроизводительных настольных компьютеров и рабочих станций начального
уровня.
Его основные характеристики:
- тактовая частота: 1,30-3,06 ГГц;
- технология производства - 0,18 мкм (но это все скоро
умрет вместе с кремнием, будущее за алюминием, в продаже пока нет);
- L1-кэш 200 Кбайт;
- L2-кэш 256 Кбайт, работает на тактовой частоте ядра,
интегрирован на одном кристалле с процессором, поддерживает ECC-механизм
обнаружения и коррекции ошибок при обмене данными с ядром процессора, обмен данными
с ядром процессора идет по 256-битной шине;
- частота системной шины: физическая - 100 МГц,
эффективная - 400МГц;
- напряжение питания ядра процессора 1,70 В;
- поддерживается SSE и SSE2 наборы SIMD-инструкции;
- исполнение: PGA-микросхема с 423 контактными ножками;
- процессорный разъем Socket 478.
Несмотря на то что Intel Pentium 4 сильно отличается от
архитектуры процессоров Р6 (в него входят процессоры Intel Pentium Pro, Intel
Pentium II, Intel Pentium III, Intel Celeron, Intel Xeon) и даже получило
специальное название - NetBurst. В числе основных новшеств, появившихся в
NetBurst - Hyper Pipelined Technology, Advanced Dynamic Execution, Trace Cache,
Rapid Execute Engine, Streaming SIND Extension 2 (SSE2).
Hyper Pipelined Technology.
Названием Hyper Pipelined Technology конвейер (буфер
содержащий команды процессора) Pentium 4 обязан своей длине - 20 стадий. Для
сравнения - длина конвейераPentium III составляет 10 стадий. Чего же достиг
Intel, так удлинив конвейер? Благодаря декомпозиции выполнения каждой команды
на более мелкие этапы, каждый из этих этапов теперь может выполняться быстрее,
что позволяет беспрепятственно увеличивать частоту процессора. Так, если при
используемом сегодня технологическом процессе 0.18 мкм предельная частота для
Pentium III составляет 1 ГГц (ну или, по более оптимистичным оценкам, 1.13
ГГц), Pentium 4 сможет достигнуть частоты 2 ГГц.
Однако, у чрезмерно длинного конвейера есть и свои
недостатки. Первый недостаток очевиден - каждая команда теперь, проходя большее
число стадий, выполняется дольше. Поэтому, чтобы младшие модели Pentium 4
превосходили по производительности старшие модели Pentium III, частоты Pentium4
начинаются с 1.4 ГГц. Если бы Intel выпустил бы Pentium 4 1 ГГц, то этот
процессор, несомненно, проиграл в производительности гигагерцовому PentiumIII.
Второй недостаток длинного конвейера вскрывается при ошибках в предсказании
переходов. Как и любой современный процессор, Pentium 4 может выполнять инструкции
не только последовательно, но и параллельно, соответственно не всегда в том
порядке, как они следуют в программе и не всегда доподлинно зная направления
условных переходов. Для того чтобы выбирать в таких случаях ветви программы для
дальнейшего выполнения, процессор прогнозирует результаты выполнения условных переходов
на основании накопленной статистики. Однако, иногда блок предсказания переходов
все же ошибается, и в этом случае приходится полностью очищать конвейер, сводя
на нет всю предварительно проделанную процессором работу по выполнению не той
ветви в программе. Естественно, при более длинном конвейере, его очистка
обходится дороже в том смысле, что на новое заполнение конвейера уходит больше
процессорных тактов, а, следовательно, и времени.
Advanced Dynamic Execution.
Целью ряда ухищрений в архитектуре Pentium 4, под общим
названием Advanced Dynamic Execution, как раз и является минимизация простоя
процессора при неправильном предсказании переходов и увеличение вероятности
правильных предсказаний. Для этого Intel улучшил блок выбор конструкций для
внеочередного выполнения и повысил правильность предсказания переходов. Правда,
для этого алгоритмы предсказания переходов были доработаны минимально, основным
же средством для достижения цели было выбрано увеличение размеров буферов, с
которыми работают соответствующие блоки процессора. Так, для выборки следующей
инструкции для исполнения используется теперь окно величиной в 126 команд
против 42 команд у процессора Pentium III. Буфер же, в котором сохраняются
адреса выполненных переходов и на основании которого процессор предсказывает
будущие переходы, теперь увеличен до 4 Кбайт, в то время как у Pentium III его
размер составлял всего 512 байт. Результатом этого, а также благодаря небольшой
доработке алгоритма, вероятность правильного предсказания переходов была улучшена
по сравнению с Pentium III на 33%. Это - очень хороший показатель, поскольку
теперь Pentium 4 предсказывает переходы правильно в 90-95% случаев.
Trace Cache.
Вместо обычного L1 кеша, который в Pentium III был
разделен на область инструкций и область данных в Pentium 4 применен новый
подход. Инструкции в L1 кэше не сохраняются, он предназначен теперь только для
данных. Для кэширования инструкций теперь используется Trace Cache, однако по
сравнению с обычным L1-кешем он имеет много преимуществ, направленных опять же
на минимизацию простоев процессора при выполнении неправильных предсказаний
переходов. Первое, и основное - в Trace Cache сохраняются уже декодированные
инструкции. Это значит, что в нем хранятся не классические x86 инструкции, а
так называемые микрокоманды, более простые операции, которыми непосредственно
оперирует процессорное ядро. Сохранение в Trace Cache микроопераций позволяет
избежать повторного декодирования x86 инструкций при повторном выполнении того
же участка программы или при неправильном предсказании переходов.
Второе преимущество Trace Cache заключается в том, что
микрооперации в нем сохраняются именно в том порядке, в каком они выполняются.
Правда, правильный порядок определяется на основании предсказания переходов,
однако вероятность того, что переходы предсказываются неправильно, достаточно
мала для того, чтобы отказаться от очевидного выигрыша, получаемого путем
отказа от повторных декодирований и предсказаний переходов.
Intel не раскрывает размеров своего Trace Cache в килобайтах,
однако, известно, что в нем может быть сохранено до 12000 микроопераций.
Rapid Execute Engine.
Наиболее простая часть современного процессора - это ALU
(арифметико-логическое устройство). Благодаря этому факту, Intel счел возможным
увеличить его тактовую частоту внутри Pentium 4 вдвое по отношению к самому
процессору. Таким образом, например, в 1.4 ГГц Pentium 4 ALU работает на
частоте 2.8 ГГц.
В ALU исполняются простые целочисленные инструкции,
поэтому, производительность нового процессора при операциях с целыми числами
должна быть очень высокой. Однако, на производительности Pentium 4 при
операциях с вещественными числами, MMX или SSE двукратное ускорение ALU никак
не сказывается.
Таким образом, латентность ALU существенно снижается. В
частности, на выполнение одной инструкции типа add Pentium 4 1.4 ГГц тратил
всего 0.35нс, в то время как выполнение этой команды у Pentium III 1 ГГц
занимает 1 нс.
SSE2.
Реализовав в своем процессоре Athlon новый конвейерный
FPU (флоуд Floud), AMD очень сильно обогнала интеловский Pentium III в
производительности при операциях с вещественными числами. Однако, Intel в своем
Pentium 4 не стал сосредотачиваться на совершенствовании своего FPU, а просто
увеличил возможности блока SSE. В результате, в Pentium 4 имеет место
расширенный набор команд SSE2, в котором к имеющемуся набору из 70 инструкций
было добавлено еще 144. Такое решение - результат NetBurst идеологии, основной
целью которой является увеличение скорости работы с потоками данных. Инструкции
SSE позволяли оперировать с восемью 128-битными регистрами XMM0..XMM7, в
которых хранились по четыре вещественных числа одинарной точности. При этом все
SSE операции проводились одновременно над четверками чисел, в результате чего
специально оптимизированные программы, в которых производилось большое
количество однотипных вычислений (а к ним, помимо обработки потоков данных в
какой-то мере относятся и 3D-игры), получали существенный прирост в
производительности.
SSE2 же оперирует с теми же самыми регистрами, и обратно
совместим с SSE процессора Pentium III. А столь впечатляющее расширение набора
команд вызвано тем, что теперь операции со 128-битными регистрами могут
выполняться не только как с четверками вещественных чисел двойной точности, но
и как с парами вещественных чисел двойной точности, с шестнадцатью
однобайтовыми целыми, с восемью короткими двухбайтовыми целыми, с четырьмя
четырехбайтовыми целыми, с двумя восьмибайтовыми целыми или с 16 байтовыми
целыми. То есть, теперь SSE2 представляя собой симбиоз MMX и SSE и позволяет
работать с любыми типами данных, влезающими в 128-битные регистры.
SSE2 гораздо более гибок, позволяя добиваться
впечатляющего прироста в производительности. Однако, использование нового
набора команд требует специальной оптимизации программ, поэтому ждать его
внедрения сразу после выхода нового процессора не стоит. Со временем же,SSE2
имеет достаточно большие перспективы. Поэтому, даже AMD собирается реализовать
SSE2 в своем новом семействе процессоров Hammer. Старые же программы, не
использующие SSE2, а полагающиеся на обычный арифметический сопроцессор,
никакого прироста в производительности при использовании Pentium 4 не получат.
Более того, несмотря на то, что Intel говорит о том, что блок FPU в Pentium 4
был слегка усовершенствован, время, необходимое на выполнение обычных операций
с вещественными числами возросло по сравнению с Pentium III в среднем на 2
такта.
L1 кэш
Что касается кеша первого уровня в Pentium 4, то
поскольку теперь команды хранятся в Trace Cache, он предназначен только для
хранения данных. Однако, его размер в Pentium 4, основанном на ядре Willamette
составляет всего 8 Кбайт. Intel был вынужден сократить объем кеша первого
уровня в Pentium 4, так как ядро этого процессорами без того получалось слишком
большим. Тем не менее, архитектура этого процессора может поддерживать L1-кеш и
большего размера, поэтому, скорее всего, при переходе на технологический
процесс 0.13 мкм и новое ядро Northwood, этот кэш будет увеличен.
Однако, для увеличения производительности, Intel
применил для доступа к L1-кешу новый алгоритм, чем уменьшил в Pentium 4
латентность этого кеша до двух процессорных тактов вместо трех тактов в Pentium
III. Таким образом, учитывая большую тактовую частоту Pentium 4, время реакции
его L1 кеша составляет всего 1.4нс для 1.4 ГГц модели против 3нс у L1 кеша
Pentium III 1 ГГц. Также как и в Pentium III, L1 кэш Pentium 4 является write
through и ассоциативным с 4областями ассоциативности. При этом длина одной
строки L1 кеша равна 64 байтам.
L2 Advanced Transfer Cache
Процессор Pentium 4 обладает Advanced Transfer Cache
второго уровня объемом 256 Кбайт. Так же, как и в Pentium III, L2-кеш имеет
широкую 256-битную шину, благодаря которой процессоры от Intel имеют более
высокую пропускную способность кеша, чем их конкуренты от AMD, использующие
64-битную шину кеша. Однако, в отличие от Athlon, в Pentium 4 (впрочем, также
как и в Pentium III) L2 кэш не является эксклюзивным, то есть он дублирует
данные, находящиеся в L1кэше.
Так как Pentium 4 рассчитан на обработку потоковых
данных, скорость работы L2-кеша для него является одним из ключевых моментов.
Поэтому, Intel увеличил пропускную способность кеша второго уровня в Pentium 4
в два раза. Это усовершенствование было сделано благодаря передаче данных из
L2-кеша на каждый процессорный такт, в то время, как данные из L2-кеша Pentium
III передаются только на каждый второй такт. Таким образом, пропускная
способность L2-кеша Pentium 4, работающего, например, с частотой 1.4 ГГц имеет
теперь внушительную величину 44.8 Гбайт/с. Для сравнения - пропускная способность
Advanced Transfer Cache у Pentium III 1 ГГц составляет 16 Гбайт/с.
2. УСОВЕРШЕНСТВОВАНИЕ МАТЕРИНСКОЙ ПЛАТЫ
2.1 Постановка задачи
Требуется произвести усовершенствование материнской
платы. Рассмотрим один из способов увеличения производительности материнской
платы.
Часто при разгоне видеокарты ограничивающим фактором
повышения частоты становится недостаток напряжения. Чтобы преодолеть этот
барьер, прибегают к вольтмоду систем питания.
Слово "вольтмод" взято из английского (voltmodification)
и означает "модификация напряжения". Это значит, что вольтмод
включает в себя любую модернизацию напряжения питания памяти или ядра (не
путать с изменением настроек BIOS материнской платы). В основном вольтмод
применяют для модернизации системы питания видеокарт или материнских плат.
Существует два основных типа вольтмода видеокарт:
программный и аппаратный. Программный вид применим к узкому кругу видеокарт. Он
включает в себя поднятие напряжения через специальные утилиты (например, ATI
Tool, Overclocker-x1k) или перепрошивку BIOS (например, NiBiTor, NVIDIA BIOS
Modifer). Обычно изменение напряжения столь мало, что особо не отражается на
разгоне, а иногда происходит занижение напряжения, что только пагубно
сказывается на поднятии частоты.
Аппаратный вид вольтмода – это физическое вмешательство
в питающую составляющую ядра или памяти. Всем известно, что напряжение, которое
подаётся на процессор, можно изменять из BIOS материнской платы, а видеокарты
(в большинстве своём) не имеют такой возможности. Если рассматривать аппаратный
вид, то тут можно выявить два метода: вольтмод с помощью резистора или вольтмод
с применением карандаша.
Увеличение напряжение само по себе еще не увеличивает
производительность, но ускоряет переходные процессы в кристалле, за счет чего
его предельная тактовая частота возрастает. А вместе с ней возрастает и
тепловыделение, причем греется не только основной кристалл, но и
вспомогательные элементы. Микросхемы, в штатном режиме работающие без
радиатора, могут потребовать охлаждения, также возможно придется доработать
схему фильтрации, добавив несколько дополнительных шунтирующих керамических
конденсаторов в обвязку электролитических, а сами электрические - заменить,
отобрав хорошие и качественные экземпляры с низким ESR. Пренебрежение этим
правилом обычно приводит к провалу всей операции и вольмод не удается - даже
при незначительном увеличении напряжения начинаются "глюки".
2.2 Метод с применением резистора
Рассмотрим один из способов вольтмонда – метод с
применением резистора. Подстроечные, или переменные, резисторы выглядят так как
изображено на рисунке 2.1.
Рисунок 2.1 – Подстроечные резисторы
Чтобы наиболее подробно представить переменный резистор,
рассмотрим рисунок 2.2.
Рисунок 2.2 - Принцип действия переменного резистора
Выбрав резистор для вольтмода, следуйте требованиям по
отбору проводов для него: они должны быть мягкими, тонкими, изолированными, не
очень ломкими и небольшой длины.
Для воспроизводства вольтмонда рассмотрим схему на
рисунке 2.3.
Рисунок 2.3 – Типовая схема микросхемы
На рисунке 2.3 представлена типовая схема фирмы RichTek
с маркировкой RT9232A. Обычно она устанавливается на платы Sapphire x1300/1600.
Чтобы провести вольтмод, надо припаять переменный резистор к FB (5-я нога,
feedback) и к GND (7-я нога, земля). Нумерация ног начинается от небольшой
ямочки на микросхеме и продолжается против часовой стрелки. Припаивать провода
резистора к ногам надо аккуратно, иначе возможны короткое замыкание и выход
микросхемы из строя.
Припаяв регулируемый резистор в нужном месте, мы с
лёгкостью сможем управлять значением сопротивления в цепи и тем самым изменять
напряжение. Но допустим, мы нашли нужную микросхему, а необходимый номинал
резистора и выходное напряжение нам неизвестны. В этом случае пользуются
несколькими расчётными формулами (Rmax – итоговое сопротивление после перепайки
переменного резистора):
Rmax = 1 / ( ( 1/Rfb) + (1/Rvr) ) (2.1)
где Rfb – это уже имеющееся сопротивление между FB и
GND, Rvr – сопротивление добавляемого переменного резистора, выставленное на
максимум.
Приблизительная оценка уровня минимального поднятия
напряжения находится так:
Vmin = Vdef * Rfb / Rmax (2.2)
Здесь значение Vdef – напряжение по умолчанию.
Таким образом, зная расчётные формулы, мы без особого
труда можем определить итоговое сопротивление и выходное напряжение.
2.3 Замена системы охлаждения перед усовершенствованием
В случае разгона с применением вольтмода к системе
охлаждения надо подходить особым образом. Ведь мы имеем дело с
полупроводниковыми материалами, а известно, что полупроводниковые приборы
весьма подвержены внешним факторам воздействия окружающей среды и при перегреве
могут выйти из строя. В основном при вольтмоде видеокарт охлаждать надо GPU и
память, но раз мы осуществляем вольтмод системы питания, то и силовые элементы
питания тоже желательно охладить. Об охлаждении памяти и графического ядра
многие производители уже позаботились, и в продаже имеется множество
эффективного охлаждения, которое можно применить при разгоне.
2.4 Вольтмод видеокарты Palit GeForce 7600GT
После того как была изложена теория, появилась
необходимость проверить всё в действии. Для опытов была взята видеокарта Palit
GeForce 7600GT. Ещё она была выбрана потому, что эта видеокарта пользуется
некоторой популярностью среди начинающих оверклокеров.
Palit 7600GT имеет частоты GPU/Mem – 560/1400.
Напряжение по умолчанию на GPU составляет 1.36В в 2D-режиме и 1.38В в 3D.
Память работает при напряжении питания 2.00 В. Показания напряжений снимались с
помощью недорогого цифрового мультиметра M830B. Температура GPU без нагрузки на
заводских частотах составляет 49°С, а в максимальной нагрузке 64°С.
Разгон чипа не осуществлялся на родном охлаждении, оно
сразу было заменено на более эффективное. Охладителем стал модернизированный
для установки на видеокарту кулер IceHammer-2800WFCA
После всех работ над охлаждением видеокарта стала
выглядеть так, как изображено на рисунке 2.4.
Рисунок 2.4 - Видеокарта с улучшенным охлаждением
Значения температур составили 43°С в покое, а в нагрузке
54°С. Теперь можно разгонять, не опасаясь перегрева карты. Поднятие частот
осуществлялось утилитой ATITool v0.27 beta1. Мониторинг вёлся утилитой
RivaTuner v2.0.1. Без вольтмода разгон по GPU составил 670MHz, а по памяти –
1600MHz.
Как уже говорилось ранее, GPU карты имеет напряжение
1.36В в 2D-режиме и 1.38В в 3D-режиме. Компоновка элементов у данной ревизии
карты не соответствует референсному дизайну 7600GT. Исследовав плату, мы нашли
два стабилизатора APW7065. Тот, что ближе к краю, – APW7065 – отвечает за
напряжение памяти, а тот, который ближе к центру, – за напряжение ядра.
2.4.1 Вольтмод GPU
Чтобы поднять напряжение питания видеоядра, необходимо
припаять переменное сопротивление на 10 кОм к 6-й и 3-й ноге APW7065 (для
вычисления максимального сопротивления используем формулы (2.1) и (2.2)).
Мониторинг напряжения GPU снимаем с плюсовых ног любого из конденсаторов CP2,
СР3, СР4.
2.4.2 Вольтмод питания памяти
Аналогично меняется схема питания памяти. Нужно припаять
переменное сопротивление номиналом 10 кОм к 6-й и 3-й ноге APW7065. Мониторинг
напряжения памяти снимаем с конденсатора CP7 (в обоих случаях резистор устанавливается
на максимальное значение).
В конечном итоге разгон по GPU составил 760MHz при
напряжении 1,58 В. А результат памяти – 1800MHz, напряжение 2.34 В.
2.5 Результаты тестов после всех работ
После вольтмода карты всегда интересно узнать, чего мы
добились. Для этого был собран тестовый стенд.
Материнская плата – Gigabyte GA-965P-S3, rev 3.3, BIOS
F6;
Процессор – Intel Pentium E2160 @3400MHz | напряжение
1.50V;
Память – 2x512Mb Hexon DDR2-667MHz @760MHz (4-4-4-12 |
2,1V)
Видеокарта – Palit GeForce 7600 GT;
Система охлаждения – TT Big Typhoon CPU Cooler ;
Термопаста – АлСил3;
Блок питания – FSP Optima 550W;
Операционная система – Windows XP SP2.
Настройки драйвера NVIDIA ForceWare:
Intellisample Settings: Performance
Trilinear Optimization: Off
Anisotropic mip filter optimization: Off
Anisotropic sample filter optimization: Off
VSync: Always Off
Тестирование проводилось с помощью известных бенчмарков:
3DMark03 v3.6.0 – 1024x768, NoAA/NoAF
3DMark05 v1.2.0 – 1024x768, NoAA/NoAF
3DMark06 v1.1.0 – 1280x1024, NoAA/NoAF
Результаты тестов приведены на рисунке 2.5
Рисунок 2.5 - Результаты теста 7600GT в 3DMark03;05;06
По итогам тестирования в популярных бенчмарках можно
заметить высокий прирост производительности с применением вольтмода. Это в
очередной раз показывает, что иногда вольтмод может сыграть особую роль в
достижении наилучшей производительности. Из приведённого примера разгона
видеокарты с применением вольтмода ясно, что вольтмод – это далеко не
бесполезная вещь. Что с умелыми руками и ясной головой можно добиться весьма
внушительных показателей.
2.6 Доработка стабилизатора материнских плат
Современные процессоры не просто потребляют энергию. Они
ее "кушают". Причем в очень больших количествах. Стабилизаторы
используют сложные схемы фильтрации, обрастая электролитическими конденсаторами
и дросселями. Чем их больше на плате - тем лучше.
Алюминиевые оксидные конденсаторы обладают большой
собственной индуктивностью, пропорциональной их емкости, и при работе на
высоких частотах сильно разогреваются, причем тем сильнее, чем выше их емкость.
Поэтому, параллельно им всегда устанавливаются керамические конденсаторы,
собственная индуктивность которых близка к нулю.
Если их количества окажется недостаточно, электролиты
начнут подсыхать, резко увеличивая уровень пульсаций. Система (особенно
разогнанная) начнет работать нестабильно, будет зависать, выдавать критически
ошибки, сваливаться в голубой экран или самопроизвольно перезагружаться.
Хорошие производители, как правило, кладут керамику с
запасом, однако никто не застрахован от просчетов. Отсюда и нагрев, быстро
выводящий плату из строя. Высохшие электролиты легко заменить, но лучше процесс
не затягивать, установив дополнительные керамические конденсаторы емкостью
порядка 2,2 мкФ с номинальным напряжением не менее 16 В, припаяв их к выводам
электролитических. Добавлять керамические конденсаторы следует до тех пор, пока
температура электролитов не стабилизируется (то есть, прекратится ее падение).
Теперь перейдем к дросселям, которые сильно греются. И
нагревают конденсаторы. Хорошие дросселя мотаются не цельным, а многожильным
проводом, что ослабляет так называемый "поверхностный эффект",
возникающий в результате "оттеснения" электронов из глубины
проводника к его "стенкам". Как следствие, эффективная площадь
сечения проводника резко сокращается, а его сопротивление возрастет. Поэтому
следует намотать дроссель толстым проводом – нагрев уменьшится.
Снизить нагрев можно и другим, намного более простым
путем. Берем алмазную пилу и делаем пропил сердечника шириной в ~1 мм. Это
снижает насыщение дросселя постоянной составляющей магнитного потока и качество
фильтрации переменной составляющей возрастет. Пропил уменьшает индуктивность
дросселя, для компенсации которой рекомендуется увеличить чисто витков.
Можно сделать краткий вывод, что для уменьшения нагрева
элементов питания плат, можно применить один из методов описанных выше или
применить все в комплексе.
3. ТЕХНИКО-ЭКОНОМИЧЕСКОЕ ОБОСНОВАНИЕ ОБЪЕКТА РАЗРАБОТКИ
Первичными исходными данными для определения стоимости
проекта являются показатели, которые используются на предприятии ГПО "МОНОЛИТ"
г. Харьков.
Эти показатели сведены в таблицу 3.1.
Таблица 3.1 - Данные предприятия ГПО "МОНОЛИТ"
г. Харьков состоянием на 01.01.2010 г.
Статьи
расходов |
Усл.обоз. |
Единицы
измер.
|
Величина |
1 |
2 |
3 |
4 |
Разработка
(проектирование) КД |
Тарифная
ставка конструктора - технолога |
Зсист
|
грн. |
1200 |
Тарифная
ставка обслуживающего персонала |
Зперс
|
грн. |
1200 |
Зарплата
других категорий рабочих, задействованных в процессе разработки КД |
Зин.роб.
|
грн. |
1500 |
Тариф
на электроэнергию |
Се/е
|
грн. |
0,56 |
Мощность
компьютера, модема, принтера и др. |
WМ |
квт
/час. |
0,3 |
Стоимость
ЭВМ, принтера, модема для базового и нового изделия (IBMPentium/32/200/ SVG) |
Втз
|
грн. |
3200,00 |
Амортизационные
отчисления |
Ааморт
|
% |
10 |
Стоимость
1-го часа использования ЭВМ |
Вг
|
грн. |
6,5 |
Норма
дополнительной зарплаты |
Нд
|
% |
10 |
Отчисление
на социальные мероприятия |
Нсоц
|
% |
37,2 |
Общепроизводственные
(накладные) расходы |
Ннакл
|
% |
25 |
Транспортно-заготовительные
расходы |
Нтрв
|
% |
4 |
Время
обслуживания систем ЭВМ |
То
|
час/год |
180 |
Норма
амортизационных отчислений на ЭВМ |
На
|
% |
10 |
Отчисление на
удерживание и ремонт ЭВМ |
Нр
|
% |
10 |
Страницы: 1, 2, 3, 4
|