Интересно, что AMD в последних продуктах пошла по пути Fermi и усложнила управляющая логику, чтобы добиться большей гибкости при использовании ресурсов. В последовательных графических расчетах небольшие упрощения Kepler не должны сыграть существенной роли, но эффективность неграфических вычислений в сравнении с Fermi может снизиться. В этот раз NVIDIA вообще не акцентирует внимание на неграфических возможностях процессора GK104, что намекает на отсутствие прогресса в этой области. По некоторым данным есть даже регресс, в вычислениях двойной точности GeForce GTX 680 слабее GeForce GTX 580. Главным приоритетом перед компанией была высокая энергоэффективность в сочетании с высокой игровой производительностью, для этого чем-то пришлось пожертвовать.Еще один неприятный момент — уменьшение кэш-памяти L2. Топовый процессор прошлого поколения нес на борту 768 КБ, а у нынешнего флагмана лишь 512 КБ. Но выросла его пропускная способность, озвучиваемая разница составляет 73%.
Вместо единого блока обработки геометрии у AMD графические процессоры NVIDIA имеют специальный блок PolyMorph Engine в каждом мультипроцессоре, которых у GK104 в два раза меньше чем у GF110, а значит и движков PolyMorph меньше. Компенсируется это их возросшей производительностью. PolyMorph Engine версии 2.0 обрабатывает за такт вдвое больше данных. Так что в итоге должен выйти паритет. Но в запасе у новичка большие частоты, поэтому новая видеокарта все равно окажется быстрее предшественника.Увеличение количества вычислительных блоков потребовало удвоения числа планировщиков (Warp Scheduler), каждый из которых связан с двумя диспетчерами (Dispatch Unit). Но при этом логика управления была упрощена, что сделано в угоду экономии площади чипа и общего снижения энергопотребления. В Fermi планировщик полностью отслеживал зависимости внутри исполняемого кода и перераспределял потоки, теперь часть этих функций выполняется на этапе компиляции кода. Порядок выполнения предопределяется заранее, а планировщик лишь распределяет потоки.
SMX намного производительнее старых SM. Один мультипроцессор теперь состоит из 192 стрим-процессоров (CUDA cores в интерпретации NVIDIA), 16 текстурных блоков, 32 блоков специальных фукций SFU и 32 LD/ST для загрузки и хранения данных. Один SM у старых GPU имел в своем активе лишь 32 потоковых процессора, четыре текстурных блока, четыре SFU и 16 LD/ST. Разница огромная. Связана она и с тем, что у Kepler все блоки работают на одной частоте. Удвоенная частота вычислительных блоков Fermi позволяла за один такт 16 ядрам выполнять 32 инструкции, т.е. обрабатывать так называемый warp, который распределяет между мультипроцессорами GigaThread Engine. Каждое CUDA ядро состоит из FPU и ALU. Даже с учетом удвоенной частоты вычислительных ядер у предшественников можно говорить о трехкратном росте вычислительной мощности мультипроцессора благодаря большему числу ядер. А 32 SFU обеспечивают четырехкратное преимущество в скорости выполнения сложных математических операций. Не изменился объем кэш-памяти L1, которыйпо прежнему 64 КБ у каждого мультипроцессора.
В бесконечной гонке за первенство на рынке графических ускорителей AMD удалось одержать очередную победу, выпустив на базе чипа, изготовленного по нормам 28-нм технологического процесса. За новоявленным одночиповым королем графики последовал младший брат в лице и видеокарты среднего ценового диапазона. Ситуация напоминает стремительную экспансию AMD во времена Radeon HD 5000. Пока NVIDIA рассказывала про чудесную архитектуру Fermi, конкуренты уже успешно продавали реальные видеокарты нового поколения. появился лишь спустя полгода после и вышел не только быстрее, но и значительно горячее и шумнее. В этот раз переход на новую архитектуру Kepler и новый техпроцесс у NVIDIA снова затянулся. Премьера флагмана опять грозила припоздниться на немалый срок, поэтому компания вначале даже планировала запуск новых продуктов в среднем ценовом сегменте. Однако после релиза старшего Radeon стратегия была изменена. Представители компании снисходительно заявили, что от Radeon HD 7900 они , а их новинка теперь уж точно будет супер-пупер и просто вне конкуренции. После этого начали появляться слухи о преобразовании продукта, который мог стать GeForce GTX 660, в ускоритель уровнем повыше — GeForce GTX 680.Все в итоге так и оказалось. Новый флагман NVIDIA базируется на графическом процессоре GK104. Сам индекс, оканчивающийся на 4, намекает на родство с и , давших жизнь многочисленным модификациям GeForce GTX 560/460.Архитектура Kepler напоминает Fermi. В основе графического процессора — независимые кластеры GPC (Graphics Processing Cluster). У GK104 их 4, как и у GF100/GF110. Но если старые процессоры содержали по четыре мультипроцессора (Streaming Multiprocessor) на один кластер, то у Kepler их два. Зато мультипроцессоры (которые теперь обозначены аббревиатурой SMX) значительно изменились.
1 - Немного об архитектуре Kepler2 - Zotac GeForce GTX 680 (ZT-60601-10P)3 - Методика тестирования4 - Результаты тестирования. Ч.15 - Результаты тестирования. Ч.2. ВыводыОтобразить одной страницей
Ответный удар: GeForce GTX 680. Тестирование видеокарты на базе ядра Kepler
» » Ответный удар: GeForce GTX 680. Тестирование видеокарты на базе ядра Kepler
Оверклокинг - скрытые возможности вашего железа
Видеокарты - Ответный удар: GeForce GTX 680. Тестирование видеокарты на базе ядра Kepler | Overclockers.ua
Комментариев нет:
Отправить комментарий