Intel Sandy Bridge: в новый год с новой процессорной микроархитектурой. Конфигурация участников тестирования по методике для мобильных систем

28.04.2019

Очередной обзор на тему нового продукта Intel, как правило, начинается с объяснения стратегии процессорного гиганта под названием Тик-Так. Смысл ее заключается в том, что каждые два года миру представляется новая архитектура с промежуточным переходом на более тонкий техпроцесс.


Благодаря ей, прогресс на рынке не останавливается и мы постоянно сталкиваемся с более функциональными и производительными решениями. Правда, некоторые нововведения не так сильно влияют на производительность, как того хотелось бы. Например, переход от архитектуры Core к Nehalem серьезной прибавки в скорости не принес, но позволил отказаться от привычной шины FSB и сделать ЦП более интегрированным, содержащим в себе не только контроллер памяти, но и графическое ядро. Последним оснащались очень медленные представители семейства Westmere. Следующий шаг Intel призван как раз исправить сложившуюся ситуацию и вывести будущие продукты на новый уровень производительности.

Семейство процессоров Intel, выполненных по 32-нм технологическим нормам (ядро Clarkdale) оказалось медленнее первых решений на базе архитектуры Nehalem (Bloomfield и Lynnfield). Исключением были шестиядерные Core i7-9xx (Gulftown), лишенные встроенного видеоядра. Такое поведение было обусловлено строением младших представителей Westmere, которые состояли из двух кристаллов. На одном из них располагались вычислительные блоки и кэш, а на другом — контроллеры памяти, шины PCI Express и графическое ядро. Связь между этими половинками осуществлялась за счет интерфейса QPI. Естественно, этот гибрид не смог демонстрировать чудес производительности, даже несмотря на поддержку технологии Hyper-Threading, благодаря которой он лишь конкурировал с младшими четырехъядерными моделями Core 2.

При такой высокой интеграции использование монолитного кристалла с внутренними широкими шинами для обмена информацией между блоками напрашивается само собой. Пройдя обкатку 32-нм техпроцесса, инженеры компании наконец-то смогли объединить все блоки в одном чипе и даже пересмотрели архитектуру, которая получила название Sandy Bridge.


Итак, что же в ней такого особенного? Во-первых, как уже отмечалось, все функциональные блоки теперь располагаются на одном кристалле, а количество ядер в производительных моделях процессоров увеличено до четырех. Во-вторых, разделяемая кэш-память третьего уровня стала общей для всех, включая видеоядро, и работает она на частоте процессора, что наилучшим образом скажется на производительности последнего. Кроме того, было увеличено быстродействие графического ядра, а часть северного моста, известная по старым процессорам как Uncore, теперь называется System Agent. И в-третьих, тактовый генератор встроен в чипсет и разгон по базовой частоте теперь потерял свою актуальность. Но обо всем по порядку.


Основные представители архитектуры Sandy Bridge содержат четыре ядра и поддерживают технологию Hyper-Threading, благодаря которой процессоры могут выполнять восемь потоков одновременно. Кэш-память третьего уровня (или LLC — last level cache, кэш последнего уровня) теперь работает на частоте процессора, имеет объем в восемь мегабайт и может использоваться всеми блоками ЦП, которые в нем нуждаются. Учитывая большое количество потребителей и возможный рост числа ядер в будущих процессорах, инженерам Intel пришлось отказаться от привычной топологии связи между узлами и отдать предпочтение 256-битной кольцевой шине, соединяющей вычислительные ядра, кэш, графический процессор и «системный агент». Пропускная способность такой шины за такт равна произведению количества процессорных ядер на ее ширину. Для четырехъядерного Sandy Bridge с 8 мегабайтами кэша и частотой 3,0 ГГц она составит 384 Гбайт в секунду (96 Гбайт/с на одно соединение), а для двухъядерного — лишь 192 Гбайт/с.


Объемы кэш-памяти остальных уровней остались без изменений (по 32 Кбайт для инструкций и данных, и 256 Кбайт второго уровня для каждого ядра), но скорость работы с ними теперь выше. Был еще добавлен так называемый L0-кэш на 1,5 тыс. декодированных микроопераций, позволяющий повысить быстродействие процессора и его энергоэффективность.

System Agent, пришедший на смену Uncore, является аналогом северного моста и содержит контроллеры памяти DDR3 и шин PCI Express, DMI, блок видеовыхода и модуль управления питанием (Power Control Unit, PCU). В отличие от того же Uncore, «системный агент» функционирует отдельно от L3-кэша и не зависит от его частоты и напряжения питания. Ранее связь с кэш-памятью третьего уровня накладывала сильные ограничения при разгоне процессоров, особенно на ядре Bloomfield. Двухканальный контроллер памяти был переработан и его производительность с латентностью теперь не хуже, чем у лучших представителей архитектуры Nehalem. Из поддерживаемой памяти заявлена DDR3-1066 и DDR3-1333, но при использовании материнских плат на чипсете Intel P67 Express можно будет устанавливать модули частотой до 2133 МГц. Количество линий PCI Express 2.0 по сравнению с предшественниками не изменилось и составляет 16 штук. При работе CrossFireX или SLI они могут комбинироваться по восемь линий для каждой видеокарты. «Системный агент», вычислительные ядра с кэшем и графический процессор трактуются отдельно друг от друга и имеют свои напряжения питания. Модуль PCU собирает данные по уровню энергопотребления и тепловыделения этих блоков и управляет их состоянием, переводя либо в экономичный режим работы, либо в производительный. Благодаря раздельной схеме тактования частот, ЦП и видеоядро за счет технологии Turbo Boost 2.0 могут разгоняться независимо друг от друга, и даже сверх нормы уровня TDP, но лишь на непродолжительное время и при условии, что процессор до этого простаивал некоторое время.


Помимо архитектурных изменений, в новых процессорах появилась поддержка 256-битных инструкций AVX (Advanced Vector Extensions), являющихся дальнейшим развитием SSE и позволяющих увеличить скорость вычислений с плавающей точкой в мультимедиа-приложениях, научных и финансовых задачах. Поддержка инструкций AES-NI, которые появились в Westmere и давали возможность повысить быстродействие шифрования и дешифрования по алгоритму AES, продолжила свое существование и в Sandy Bridge.

Новое графическое ядро Intel HD Graphics хоть и относится к новому поколению, но существенных архитектурных различий между ним и графическим процессором, встроенным в Clarkdale, нет. Это все те же 12 шейдерных блока (для HD Graphics 3000 и шесть для HD Graphics 2000), но уже с поддержкой DirectX 10.1 и OpenGL 3.0.


За счет переноса видеоядра на общий с процессором кристалл, выполненный по 32-нм технологическим нормам, стало возможным увеличивать тактовую частоту GPU до 1,35 ГГц. Это может положительно сказаться на быстродействии видеоподсистемы, вплоть до конкуренции с дискретными графическими адаптерами начального уровня AMD и NVIDIA. Но даже на такой частоте скорость в игровых приложениях все равно будет оставлять желать лучшего. В новой версии Intel HD Graphics скорее будет интересна возможность аппаратного кодирования видео формата MPEG2 и H.264, новые фильтры пост-обработки и поддержка HDMI 1.4 с Blu-Ray 3D.


Конечно, вышеперечисленные изменения призваны увеличить производительность новых решений, но самое серьезное нововведение в Sandy Bridge, пожалуй, будет перенесение генератора базовой частоты в набор системной логики. Он единственный и от него зависят все частоты различных узлов и блоков, как самого процессора, так и чипсета. По этой причине базовая частота составляет 100 МГц и при ее повышении будут расти частота не только процессора, но и всевозможных шин и контроллеров, а это серьезно скажется на стабильности системы во время разгона.


В связи с этим для новых процессоров потребовался и новый разъем — LGA 1155. И хотя он внешне похож на LGA 1156, в нем отсутствует один контакт, а ключ смещен ближе к краю разъема, что не позволяет вставить в него ЦП старого поколения.


Что качается разгона, то максимум чего можно добиться, так это поднятия базовой с номинальных 100 МГц до 105 МГц (+/- один-два мегагерца), чего явно будет недостаточно. Пожалуй, с таким подходом Intel энтузиасты могли бы поставить крест на платформе LGA1155, если бы не одно но — компания все же решила оставить возможность разгона своих процессоров, но только в K-серии и путем поднятия множителя, так как в них он не заблокирован (максимальный x57). Пользователи уже успели познакомиться с подобными моделями на ядрах Lynnfield и Clarkdale. Их аналогов на Sandy Bridge пока два и все они относятся к ценовому диапазону $200-300, что еще больше разочарует оверклокеров, большинство которых вряд ли смогут позволить себе такие процессоры.

Но для самых экономных все-таки была сделана поблажка — в любом обычном процессоре на базе новой архитектуры можно поднять множитель на четыре пункта, не считая турбо-режим. Например, если частота ЦП 3,1 ГГц, то он легко заработает на 3,5 ГГц, при этом технология Turbo Boost будет исправно функционировать. Это, конечно, не разгон в 1,5 раза по частоте, к которому уже привыкли, но все же лучше, чем ничего.


Помимо всего прочего, официальному разгону теперь поддается и графическое ядро, естественно, при использовании материнской платы на соответствующем чипсете. Для производительного ПК потребуется плата на Intel P67 Express, позволяющему разгонять сам процессор, а чтобы воспользоваться встроенным видеядром — на Intel H67 Express. К сожалению, последний лишен возможности управлять множителем ЦП.


Более подробно о них будет рассказано в ближайших материалах на нашем сайте, а в заключении об архитектуре Sandy Bridge стоит упомянуть о реализации поддержки памяти DDR3, максимальный объем которой доведен до 32 Гбайт. Дело в том, что с переходом на раздельное формирование частот основных блоков и разгон процессора путем повышения его множителя, частота памяти всегда постоянна и равна умножению определенного коэффициента на частоту 133 МГц, имеющую соотношение с базовой как 4:3. Количество множителей памяти позволяет использовать ее в режимах от DDR3-800 до DDR3-2400 с шагом 266 МГц. Если рабочая частота модулей не будет кратна 266, они автоматически (при использовании профилей XMP) переведутся в режим с ближайшей меньшей частотой.

После краткого описания архитектурных особенностей Sandy Bridge перейдем к продуктам на ее основе.

Наконец-то компания Intel официально анонсировала новые процессоры, работающие на новой микроархитектуре Sandy Bridge . Для большинства людей «анонс Sandy Bridge» всего лишь слова, но по большому счету, Intel Core ll поколения являются если не новой эпохой, то как минимум обновлением практически всего рынка процессоров.


Первоначально сообщалось о запуске всего семи процессоров, однако на полезнейшей страничке ark.intel.com уже появилась информация обо всех новинках. Процессоров, а точнее их модификаций, оказалось несколько побольше (в скобках я указал ориентировочную цену - во столько обойдется каждый процессор в партии из 1000 штук):

Мобильные:

Intel Core i5-2510E (~266$)
Intel Core i5-2520M
Intel Core i5-2537M
Intel Core i5-2540M

Наглядное детальное сравнение мобильных процессоров Intel Core i5 второго поколения.

Intel Core i7-2617M
Intel Core i7-2620M
Intel Core i7-2629M
Intel Core i7-2649M
Intel Core i7-2657M
Intel Core i7-2710QE (~378$)
Intel Core i7-2720QM
Intel Core i7-2820QM
Intel Core i7-2920XM Extreme Edition

Наглядное детальное сравнение мобильных процессоров Intel Core i7 второго поколения.

Настольные:

Intel Core i3-2100 (~117$)
Intel Core i3-2100T
Intel Core i3-2120 (138$)

Наглядное детальное сравнение настольных процессоров Intel Core i3 второго поколения.

Intel Core i5-2300 (~177$)
Intel Core i5-2390T
Intel Core i5-2400S
Intel Core i5-2400 (~184$)
Intel Core i5-2500K (~216$)
Intel Core i5-2500T
Intel Core i5-2500S
Intel Core i5-2500 (~205$)

Наглядное детальное сравнение настольных процессоров Intel Core i5 второго поколения.

Intel Core i7-2600K (~317$)
Intel Core i7-2600S
Intel Core i7-2600 (~294$)

Наглядное детальное сравнение настольных процессоров Intel Core i7 второго поколения.

Как видите, названия моделей теперь имеют четыре цифры в названии – это сделано для того, чтобы не было путаницы с процессорами предыдущего поколения. Модельный ряд получился достаточно полным и логичным – наиболее интересные серии i7 явно отделены от i5 наличием технологии Hyper Threading и увеличенным объемом кэша. А процессоры семейства i3 отличаются от i5 не только меньшим количеством ядер, но и отсутствием технологии Turbo Boost .

Наверное, вы так же обратили внимание на буквы в названиях процессоров, без которых модельный ряд сильно поредел. Так вот, буквы S и T говорят о пониженное энергопотребление, а К свободный множитель.

Наглядная структура новых процессоров:

Как видите, помимо графического и вычислительных ядер, кэш-памяти и контроллера памяти, присутствует так называемый System Agent – туда свалено много чего, например контроллеры DDR3-памяти и PCI-Express 2.0, модель управления питанием и блоки, отвечающие на аппаратном уровне за работы встроенного GPU и за вывод изображения в случае его использования.

Все «ядерные» компоненты (в том числе графический процессор) связаны между собой высокоскоростной кольцевой шиной с полноценным доступом к L3-кэшу, благодаря чему выросла общая скорость обмена данными в самом процессоре; что интересно – такой подход позволяет увеличивать производительность в дальнейшем, попросту увеличивая количество ядер, добавленных к шине. Хотя и сейчас всё обещает быть на высоте - по сравнению с процессорами предыдущего поколения, производительность новых является более адаптивной и по заявлению производителя, во многих задачах способна продемонстрировать 30-50% прирост в скорости выполнения задач!

Если есть желание узнать более подробно о новой архитектуре, то на русском языке могу посоветовать эти три статьи – , , .

Новые процессоры целиком и полностью выполнены согласно нормам 32-нм техпроцесса и впервые обладают «визуально умной» микроархитектурой, сочетающей в себе лучшую в классе вычислительную мощность и технологию обработки 3D-графики на одном кристалле. В графике Sandy Bridge появилось действительно много нововведений, нацеленных главным образом на увеличение производительности при работе с 3D. Можно долго спорить о «навязывании» интегрированной видеосистемы, но другого решения пока нет как такового. Зато есть такой вот слайд из официальной презентации, который претендует на правдоподобность в том числе в мобильных продуктах (ноутбуках):

Частично о новых технологиях второго поколения процессоров Intel Core я уже рассказывал , поэтому повторяться не буду. Остановлюсь лишь на разработке Intel Insider , появление которой были многие удивлены. Как я понял, это будет своего рода магазин, который даст владельцам компьютеров доступ к фильмам высокой четкости, непосредственно от создателей данных фильмов – то, что раньше появлялось лишь спустя некоторое время после анонса и появления дисков DVD или Blu-ray. Для демонстрации этой функции вице-президент Intel Мули Иден (Mooly Eden) пригласил на сцену Кевина Тсужихару (Kevin Tsujihara), президента Warner Home Entertainment Group. Цитирую:

«Warner Bros. находит персональные системы самой универсальной и распространенной платформой для доставки высококачественного развлекательного контента, а сейчас Intel делает эту платформу еще более надежной и безопасной. Отныне мы при помощи магазина WBShop, а также наши партнеры, такие как CinemaNow, сможем предоставлять пользователям ПК новые релизы и фильмы из нашего каталога в настоящем HD-качестве » - работу данной технологии Мули Иден продемонстрировал на примере фильма «Начало». В сотрудничестве с ведущими студиями индустрии и гигантами медиаиконтента (такими как Best Buy CinemaNow, Hungama Digital Media Entertainment, Image Entertainment, Sonic Solutions, Warner Bros. Digital Distribution и другими), Intel создает безопасную и защищенную от пиратства (на аппаратном уровне) экосистему для дистрибуции, хранения и воспроизведения высококачественного видео.

Работа упомянутой выше технологии будет совместимой с двумя не менее интересными разработках, которые так же присутствуют во всех моделях процессоров нового поколения. Я говорю о (Intel WiDi 2.0) и Intel InTru 3-D . Первая предназначена для беспроводной передачи HD-видео (с поддержкой разрешения вплоть до 1080p), вторая предназначена для отображения стереоконтента на мониторах или телевизорах высокой четкости через соединение HDMI 1.4 .

Еще две функции, для которых я не нашел в статье более подходящего места - Intel Advanced Vector Extensions (AVX). Поддержка процессорами этих команд повышает скорость работы приложений с интенсивной обработкой данных, таких как аудиоредакторы и программное обеспечение для профессионального редактирования фотографий.

… и Intel Quick Sync Video - благодаря совместной работе с такими софтверными компаниями, как CyberLink, Corel и ArcSoft, процессорному гиганту удалось поднять производительность при выполнении этой задачи (транскодирование между форматами H.264 и MPEG-2) в 17 раз по сравнению с производительностью встроенной графики прошлого поколения.

Допустим, процессоры есть – как их использовать? Всё правильно – вместе с ними были так же анонсированы новые чипсеты (наборы логики), которые являются представителями «шестидесятой» серией. Судя по всего, для жаждущих новинок Consumer-ов отведено всего два набора, это Intel H67 и Intel P67 , на которых и будет построено большинство новых материнских плат. H67 способен работать с интегрированным в процессор видеоядром, в то время как P67 наделили функцией Performance Tuning для разгона процессора. Все процессоры будут работать в новом сокете, 1155 .


Радует, что вроде как в новые процессоры заложили совместимость с сокетами процессоров Intel с архитектурой следующего поколения. Этот плюс пригодится как обычным пользователям, так и производителям, которым не придется заново проектировать и создавать новые устройства.

В общей сложности Intel представила более 20 чипов, чипсетов и беспроводных адаптеров, включая новые процессоры Intel Core i7, i5 и i3, чипсеты Intel 6 Series и адаптеры Intel Centrino Wi-Fi и WiMAX. Помимо упомянутых выше, на рынке могут появиться и таких «бейджики»:

В текущем году на новых процессорах ожидается выпуск более 500 моделей настольных компьютеров и ноутбуков ведущих мировых брендов.

Ну и напоследок еще раз awesome-ролик, вдруг кто не видел:

ВведениеЭтим летом компания Intel совершила странное: она умудрилась сменить целых два поколения процессоров, ориентированных на общеупотребительные персональные компьютеры. Сначала на смену Haswell пришли процессоры с микроархитектурой Broadwell, но затем в течение буквально пары месяцев они утратили свой статус новинки и уступили место процессорам Skylake, которые будут оставаться наиболее прогрессивными CPU как минимум ещё года полтора. Такая чехарда со сменой поколений произошла главным образом в связи с проблемами Intel, возникшими при внедрении нового 14-нм техпроцесса, который применяется при производстве и Broadwell, и Skylake. Производительные носители микроархитектуры Broadwell по пути в настольные системы сильно задержались, а их последователи вышли по заранее намеченному графику, что привело к скомканности анонса процессоров Core пятого поколения и серьёзному сокращению их жизненного цикла. В результате всех этих пертурбаций, в десктопном сегменте Broadwell заняли совсем узкую нишу экономичных процессоров с мощным графическим ядром и довольствуются теперь лишь небольшим уровнем продаж, свойственным узкоспециализированным продуктам. Внимание же передовой части пользователей переключилось на последователей Broadwell – процессоры Skylake.

Надо заметить, что в последние несколько лет компания Intel совсем не радует своих поклонников ростом производительности предлагаемых продуктов. Каждое новое поколение процессоров прибавляет в удельном быстродействии лишь по несколько процентов, что в конечном итоге приводит к отсутствию у пользователей явных стимулов к модернизации старых систем. Но выход Skylake – поколения CPU, по пути к которому Intel, фактически, перепрыгнула через ступеньку – внушал определённые надежды на то, что мы получим действительно стоящее обновление самой распространённой вычислительной платформы. Однако, ничего подобного так и не случилось: Intel выступила в своём привычном репертуаре. Broadwell был представлен общественности в качестве некого ответвления от основной линии процессоров для настольных систем, а Skylake оказались быстрее Haswell в большинстве приложений совсем незначительно .

Поэтому несмотря на все ожидания, появление Skylake в продаже вызвало у многих скептическое отношение. Ознакомившись с результатами реальных тестов, многие покупатели попросту не увидели реального смысла в переходе на процессоры Core шестого поколения. И действительно, главным козырем свежих CPU выступает прежде всего новая платформа с ускоренными внутренними интерфейсами, но не новая процессорная микроархитектура. И это значит, что реальных стимулов к обновлению основанных систем прошлых поколений Skylake предлагает немного.

Впрочем, мы бы всё-таки не стали отговаривать от перехода Skylake всех без исключения пользователей. Дело в том, что пусть Intel и наращивает производительность своих процессоров очень сдержанными темпами, с момента появления Sandy Bridge, которые всё ещё трудятся во многих системах, сменилось уже четыре поколения микроархитектуры. Каждый шаг по пути прогресса вносил свой вклад в увеличение производительности, и к сегодняшнему дню Skylake способен предложить достаточно существенный прирост в производительности по сравнению со своими более ранними предшественниками. Только чтобы увидеть это, сравнивать его надо не с Haswell, а с более ранними представителями семейства Core, появившимися до него.

Собственно, именно таким сравнением мы сегодня и займёмся. Учитывая всё сказанное, мы решили посмотреть, насколько выросла производительность процессоров Core i7 с 2011 года, и собрали в едином тесте старшие Core i7, относящиеся к поколениям Sandy Bridge, Ivy Bridge, Haswell, Broadwell и Skylake. Получив же результаты такого тестирования, мы постараемся понять, обладателям каких процессоров целесообразно затевать модернизацию старых систем, а кто из них может повременить до появления последующих поколений CPU. Попутно мы посмотрим и на уровень производительности новых процессоров Core i7-5775C и Core i7-6700K поколений Broadwell и Skylake, которые до настоящего момента в нашей лаборатории ещё не тестировались.

Сравнительные характеристики протестированных CPU

От Sandy Bridge до Skylake: сравнение удельной производительности

Для того, чтобы вспомнить, как же менялась удельная производительность интеловских процессоров в течение последней пятилетки, мы решили начать с простого теста, в котором сопоставили скорость работы Sandy Bridge, Ivy Bridge, Haswell, Broadwell и Skylake, приведённых к одной и той же частоте 4,0 ГГц. В этом сравнении нами были использованы процессоры линейки Core i7, то есть, четырёхъядерники, обладающие технологией Hyper-Threading.

В качестве основного тестового инструмента был взят комплексный тест SYSmark 2014 1.5, который хорош тем, что воспроизводит типичную пользовательскую активность в общеупотребительных приложениях офисного характера, при создании и обработке мультимедийного контента и при решении вычислительных задач. На следующих графиках отображены полученные результаты. Для удобства восприятия они нормированы, за 100 процентов принята производительность Sandy Bridge.



Интегральный показатель SYSmark 2014 1.5 позволяет сделать следующие наблюдения. Переход от Sandy Bridge к Ivy Bridge увеличил удельную производительность совсем незначительно – примерно на 3-4 процента. Дальнейший шаг к Haswell оказался гораздо более результативным, он вылился в 12-процентное улучшение производительности. И это – максимальный прирост, который можно наблюдать на приведённом графике. Ведь дальше Broadwell обгоняет Haswell всего лишь на 7 процентов, а переход от Broadwell к Skylake и вовсе наращивает удельную производительность лишь на 1-2 процента. Весь же прогресс от Sandy Bridge до Skylake выливается в 26-процентное увеличение производительности при постоянстве тактовых частот.

Более подробную расшифровку полученных показателей SYSmark 2014 1.5 можно посмотреть на трёх следующих графиках, где интегральный индекс производительности разложен по составляющим по типу приложений.









Обратите внимание, наиболее заметно с вводом новых версий микроархитектур прибавляют в скорости исполнения мультимедийные приложения. В них микроархитектура Skylake превосходит Sandy Bridge на целых 33 процента. А вот в счётных задачах, напротив, прогресс проявляется меньше всего. И более того, при такой нагрузке шаг от Broadwell к Skylake даже оборачивается небольшим снижением удельной производительности.

Теперь, когда мы представляем себе, что же происходило с удельной производительностью процессоров Intel в течение последних нескольких лет, давайте попробуем разобраться, чем наблюдаемые изменения были обусловлены.

От Sandy Bridge до Skylake: что изменилось в процессорах Intel

Сделать точкой отсчёта в сравнении разных Core i7 представителя поколения Sandy Bridge мы решили не просто так. Именно данный дизайн подвёл крепкий фундамент под всё дальнейшее совершенствование производительных интеловских процессоров вплоть до сегодняшних Skylake. Так, представители семейства Sandy Bridge стали первыми высокоинтегрированными CPU, в которых в одном полупроводниковом кристалле были собраны и вычислительные, и графическое ядра, а также северный мост с L3-кешем и контроллером памяти. Кроме того, в них впервые стала использоваться внутренняя кольцевая шина, посредством которой была решена задача высокоэффективного взаимодействия всех структурных единиц, составляющих столь сложный процессор. Этим заложенным в микроархитектуре Sandy Bridge универсальным принципам построения продолжают следовать все последующие поколения CPU без каких бы то ни было серьёзных корректив.

Немалые изменения в Sandy Bridge претерпела внутренняя микроархитектура вычислительных ядер. В ней не только была реализована поддержка новых наборов команд AES-NI и AVX, но и нашли применение многочисленные крупные улучшения в недрах исполнительного конвейера. Именно в Sandy Bridge был добавлен отдельный кеш нулевого уровня для декодированных инструкций; появился абсолютно новый блок переупорядочивания команд, основанный на использовании физического регистрового файла; были заметно улучшены алгоритмы предсказания ветвлений; а кроме того, два из трёх исполнительных порта для работы с данными стали унифицированными. Такие разнородные реформы, проведённые сразу на всех этапах конвейера, позволили серьёзно увеличить удельную производительность Sandy Bridge, которая по сравнению с процессорами предыдущего поколения Nehalem сразу выросла почти на 15 процентов. К этому добавился 15-процентный рост номинальных тактовых частот и отличный разгонный потенциал, в результате чего в сумме получилось семейство процессоров, которое до сих пор ставится в пример Intel, как образцовое воплощение фазы «так» в принятой в компании маятниковой концепции разработки.

И правда, подобных по массовости и действенности улучшений в микроархитектуре после Sandy Bridge мы уже не видели. Все последующие поколения процессорных дизайнов проводят куда менее масштабные усовершенствования в вычислительных ядрах. Возможно, это является отражением отсутствия реальной конкуренции на процессорном рынке, возможно причина замедления прогресса кроется в желании Intel сосредоточить усилия на совершенствовании графических ядер, а может быть Sandy Bridge просто оказался настолько удачным проектом, что его дальнейшее развитие требует слишком больших трудозатрат.

Отлично иллюстрирует произошедший спад интенсивности инноваций переход от Sandy Bridge к Ivy Bridge. Несмотря на то, что следующее за Sandy Bridge поколение процессоров и было переведено на новую производственную технологию с 22-нм нормами, его тактовые частоты совсем не выросли. Сделанные же улучшения в дизайне в основном коснулись ставшего более гибким контроллера памяти и контроллера шины PCI Express, который получил совместимость с третьей версией данного стандарта. Что же касается непосредственно микроархитектуры вычислительных ядер, то отдельные косметические переделки позволили добиться ускорения выполнения операций деления и небольшого увеличения эффективности технологии Hyper-Threading, да и только. В результате, рост удельной производительности составил не более 5 процентов.

Вместе с тем, внедрение Ivy Bridge принесло и то, о чём теперь горько жалеет миллионная армия оверклокеров. Начиная с процессоров этого поколения, Intel отказалась от сопряжения полупроводникового кристалла CPU и закрывающей его крышки посредством бесфлюсовой пайки и перешла на заполнение пространства между ними полимерным термоинтерфейсным материалом с очень сомнительными теплопроводящими свойствами. Это искусственно ухудшило частотный потенциал и сделало процессоры Ivy Bridge, как и всех их последователей, заметно менее разгоняемыми по сравнению с очень бодрыми в этом плане «старичками» Sandy Bridge.

Впрочем, Ivy Bridge – это всего лишь «тик», а потому особых прорывов в этих процессорах никто и не обещал. Однако никакого воодушевляющего роста производительности не принесло и следующее поколение, Haswell, которое, в отличие от Ivy Bridge, относится уже к фазе «так». И это на самом деле немного странно, поскольку различных улучшений в микроархитектуре Haswell сделано немало, причём они рассредоточены по разным частям исполнительного конвейера, что в сумме вполне могло бы увеличить общий темп исполнения команд.

Например, во входной части конвейера была улучшена результативность предсказания переходов, а очередь декодированных инструкций стала делиться между параллельными потоками, сосуществующими в рамках технологии Hyper-Threading, динамически. Попутно произошло увеличение окна внеочередного исполнения команд, что в сумме должно было поднять долю параллельно выполняемого процессором кода. Непосредственно в исполнительном блоке были добавлены два дополнительных функциональных порта, нацеленных на обработку целочисленных команд, обслуживание ветвлений и сохранение данных. Благодаря этому Haswell стал способен обрабатывать до восьми микроопераций за такт – на треть больше предшественников. Более того, новая микроархитектура удвоила и пропускную способность кеш-памяти первого и второго уровней.

Таким образом, улучшения в микроархитектуре Haswell не затронули лишь скорость работы декодера, который, похоже, на данный момент стал самым узким местом в современных процессорах Core. Ведь несмотря на внушительный список улучшений, прирост удельной производительности у Haswell по сравнению с Ivy Bridge составил лишь около 5-10 процентов. Но справедливости ради нужно оговориться, что на векторных операциях ускорение заметно гораздо сильнее. А наибольший выигрыш можно увидеть в приложениях, использующих новые AVX2 и FMA-команды, поддержка которых также появилась в этой микроархитектуре.

Процессоры Haswell, как и Ivy Bridge, сперва тоже не особенно понравились энтузиастам. Особенно если учесть тот факт, что в первоначальной версии никакого увеличения тактовых частот они не предложили. Однако спустя год после своего дебюта Haswell стали казаться заметно привлекательнее. Во-первых, увеличилось количество приложений, обращающихся к наиболее сильным сторонам этой архитектуры и использующих векторные инструкции. Во-вторых, Intel смогла исправить ситуацию с частотами. Более поздние модификации Haswell, получившие собственное кодовое наименование Devil’s Canyon, смогли нарастить преимущество над предшественниками благодаря увеличению тактовой частоты, которая, наконец, пробила 4-гигагерцовый потолок. Кроме того, идя на поводу у оверклокеров, Intel улучшила полимерный термоинтерфейс под процессорной крышкой, что сделало Devil’s Canyon более подходящими объектами для разгона. Конечно, не такими податливыми, как Sandy Bridge, но тем не менее.

И вот с таким багажом Intel подошла к Broadwell. Поскольку основной ключевой особенностью этих процессоров должна была стать новая технология производства с 14-нм нормами, никаких значительных нововведений в их микроархитектуре не планировалось – это должен был быть почти самый банальный «тик». Всё необходимое для успеха новинок вполне мог бы обеспечить один только тонкий техпроцесс с FinFET-транзисторами второго поколения, в теории позволяющий уменьшить энергопотребление и поднять частоты. Однако практическое внедрение новой технологии обернулось чередой неудач, в результате которых Broadwell досталась лишь экономичность, но не высокие частоты. В итоге те процессоры этого поколения, которые Intel представила для настольных систем, вышли больше похожими на мобильные CPU, чем на продолжателей дела Devil’s Canyon. Тем более, что кроме урезанных тепловых пакетов и откатившихся частот они отличаются от предшественников и уменьшившимся в объёме L3-кешем, что, правда, несколько компенсируется появлением расположенного на отдельном кристалле кэша четвёртого уровня.

На одинаковой с Haswell частоте процессоры Broadwell демонстрируют примерно 7-процентное преимущество, обеспечиваемое как добавлением дополнительного уровня кеширования данных, так и очередным улучшением алгоритма предсказания ветвлений вместе с увеличением основных внутренних буферов. Кроме того, в Broadwell реализованы новые и более быстрые схемы выполнения инструкций умножения и деления. Однако все эти небольшие улучшения перечёркиваются фиаско с тактовыми частотами, относящими нас в эпоху до Sandy Bridge. Так, например, старший оверклокерский Core i7-5775C поколения Broadwell уступает по частоте Core i7-4790K целых 700 МГц. Понятно, что ожидать какого-то роста производительности на этом фоне бессмысленно, лишь бы обошлось без её серьёзного падения.

Во многом именно из-за этого Broadwell и оказался непривлекательным для основной массы пользователей. Да, процессоры этого семейства отличаются высокой экономичностью и даже вписываются в тепловой пакет с 65-ваттными рамками, но кого это, по большому счёту, волнует? Разгонный же потенциал первого поколения 14-нм CPU оказался достаточно сдержанным. Ни о какой работе на частотах, приближающихся к 5-гигагерцовой планке речь не идёт. Максимум, которого можно добиться от Broadwell при использовании воздушного охлаждения пролегает в окрестности величины 4,2 ГГц. Иными словами, пятое поколение Core вышло у Intel, как минимум, странноватым. О чём, кстати, микропроцессорный гигант в итоге и пожалел: представители Intel отмечают, что поздний выход Broadwell для настольных компьютеров, его сокращённый жизненный цикл и нетипичные характеристики отрицательно сказались на уровне продаж, и больше компания на подобные эксперименты пускаться не планирует.

Новейший же Skylake на этом фоне представляется не столько как дальнейшее развитие интеловской микроархитектуры, сколько своего рода работа над ошибками. Несмотря на то, что при производстве этого поколения CPU используется тот же 14-нм техпроцесс, что и в случае Broadwell, никаких проблем с работой на высоких частотах у Skylake нет. Номинальные частоты процессоров Core шестого поколения вернулись к тем показателям, которые были свойственны их 22-нм предшественникам, а разгонный потенциал даже немного увеличился. На руку оверклокерам здесь сыграл тот факт, что в Skylake конвертер питания процессора вновь перекочевал на материнскую плату и снизил тем самым суммарное тепловыделение CPU при разгоне. Жаль только, что Intel так и не вернулась к использованию эффективного термоинтерфейса между кристаллом и процессорной крышкой.

Но вот что касается базовой микроархитектуры вычислительных ядер, то несмотря на то, что Skylake, как и Haswell, представляет собой воплощение фазы «так», нововведений в ней совсем немного. Причём большинство из них направлено на расширение входной части исполнительного конвейера, остальные же части конвейера остались без каких-либо существенных изменений. Перемены касаются улучшения результативности предсказания ветвлений и повышения эффективности блока предварительной выборки, да и только. При этом часть оптимизаций служит не столько для улучшения производительности, сколько направлена на очередное повышение энергоэффективности. Поэтому удивляться тому, что Skylake по своей удельной производительности почти не отличается от Broadwell, не следует.

Впрочем, существуют и исключения: в отдельных случаях Skylake могут превосходить предшественников в производительности и более заметно. Дело в том, что в этой микроархитектуре была усовершенствована подсистема памяти. Внутрипроцессорная кольцевая шина стала быстрее, и это в конечном итоге расширило полосу пропускания L3-кэша. Плюс к этому контроллер памяти получил поддержку работающей на высоких частотах памяти стандарта DDR4 SDRAM.

Но в итоге тем не менее получается, что бы там не говорила Intel о прогрессивности Skylake, с точки зрения обычных пользователей это – достаточно слабое обновление. Основные улучшения в Skylake сделаны в графическом ядре и в энергоэффективности, что открывает перед такими CPU путь в безвентиляторные системы планшетного форм-фактора. Десктопные же представители этого поколения отличаются от тех же Haswell не слишком заметно. Даже если закрыть глаза на существование промежуточного поколения Broadwell, и сопоставлять Skylake напрямую с Haswell, то наблюдаемый рост удельной производительности составит порядка 7-8 процентов, что вряд ли можно назвать впечатляющим проявлением технического прогресса.

Попутно стоит отметить, что не оправдывает ожиданий и совершенствование технологических производственных процессов. На пути от Sandy Bridge дo Skylake компания Intel сменила две полупроводниковых технологии и уменьшила толщину транзисторных затворов более чем вдвое. Однако современный 14-нм техпроцесс по сравнению с 32-нм технологией пятилетней давности так и не позволил нарастить рабочие частоты процессоров. Все процессоры Core последних пяти поколений имеют очень похожие тактовые частоты, которые если и превышают 4-гигагерцовую отметку, то совсем незначительно.

Для наглядной иллюстрации этого факта можно посмотреть на следующий график, на котором отображена тактовая частота старших оверклокерских процессоров Core i7 разных поколений.



Более того, пик тактовой частоты приходится даже не на Skylake. Максимальной частотой могут похвастать процессоры Haswell, относящиеся к подгруппе Devil’s Canyon. Их номинальная частота составляет 4,0 ГГц, но благодаря турбо-режиму в реальных условиях они способны разгоняться до 4,4 ГГц. Для современных же Skylake максимум частоты – всего лишь 4,2 ГГц.

Всё это, естественно, сказывается на итоговой производительности реальных представителей различных семейств CPU. И далее мы предлагаем посмотреть, как всё это отражается на быстродействии платформ, построенных на базе флагманских процессоров каждого из семейств Sandy Bridge, Ivy Bridge, Haswell, Broadwell и Skylake.

Как мы тестировали

В сравнении приняли участие пять процессоров Core i7 разных поколений: Core i7-2700K, Core i7-3770K, Core i7-4790K, Core i7-5775C и Core i7-6700K. Поэтому список комплектующих, задействованных в тестировании, получился достаточно обширным:

Процессоры:

Intel Core i7-2600K (Sandy Bridge, 4 ядра + HT, 3,4-3,8 ГГц, 8 Мбайт L3);
Intel Core i7-3770K (Ivy Bridge, 4 ядра + HT, 3,5-3,9 ГГц, 8 Мбайт L3);
Intel Core i7-4790K (Haswell Refresh, 4 ядра + HT, 4,0-4,4 ГГц, 8 Мбайт L3);
Intel Core i7-5775C (Broadwell, 4 ядра, 3,3-3,7 ГГц, 6 Мбайт L3, 128 Мбайт L4).
Intel Core i7-6700K (Skylake, 4 ядра, 4,0-4,2 ГГц, 8 Мбайт L3).

Процессорный кулер: Noctua NH-U14S.
Материнские платы:

ASUS Z170 Pro Gaming (LGA 1151, Intel Z170);
ASUS Z97-Pro (LGA 1150, Intel Z97);
ASUS P8Z77-V Deluxe (LGA1155, Intel Z77).

Память:

2x8 Гбайт DDR3-2133 SDRAM, 9-11-11-31 (G.Skill F3-2133C9D-16GTX);
2x8 Гбайт DDR4-2666 SDRAM, 15-15-15-35 (Corsair Vengeance LPX CMK16GX4M2A2666C16R).

Видеокарта: NVIDIA GeForce GTX 980 Ti (6 Гбайт/384-бит GDDR5, 1000-1076/7010 МГц).
Дисковая подсистема: Kingston HyperX Savage 480 GB (SHSS37A/480G).
Блок питания: Corsair RM850i (80 Plus Gold, 850 Вт).

Тестирование выполнялось в операционной системе Microsoft Windows 10 Enterprise Build 10240 с использованием следующего комплекта драйверов:

Intel Chipset Driver 10.1.1.8;
Intel Management Engine Interface Driver 11.0.0.1157;
NVIDIA GeForce 358.50 Driver.

Производительность

Общая производительность

Для оценки производительности процессоров в общеупотребительных задачах мы традиционно используем тестовый пакет Bapco SYSmark, моделирующий работу пользователя в реальных распространённых современных офисных программах и приложениях для создания и обработки цифрового контента. Идея теста очень проста: он выдаёт единственную метрику, характеризующую средневзвешенную скорость компьютера при повседневном использовании. После выхода операционной системы Windows 10 этот бенчмарк в очередной раз обновился, и теперь мы задействуем самую последнюю версию – SYSmark 2014 1.5.



При сравнении Core i7 разных поколений, когда они работают в своих номинальных режимах, результаты получаются совсем не такие, как при сопоставлении на единой тактовой частоте. Всё-таки реальная частота и особенности работы турбо-режима оказывает достаточно существенное влияние на производительность. Например, согласно полученным данным, Core i7-6700K быстрее Core i7-5775C на целых 11 процентов, но при этом его преимущество над Core i7-4790K совсем незначительно – оно составляет всего лишь порядка 3 процентов. При этом нельзя обойти вниманием и то, что новейший Skylake оказывается существенно быстрее процессоров поколений Sandy Bridge и Ivy Bridge. Его преимущество над Core i7-2700K и Core i7-3770K достигает 33 и 28 процентов соответственно.

Более глубокое понимание результатов SYSmark 2014 1.5 способно дать знакомство с оценками производительности, получаемое в различных сценариях использования системы. Сценарий Office Productivity моделирует типичную офисную работу: подготовку текстов, обработку электронных таблиц, работу с электронной почтой и посещение Интернет-сайтов. Сценарий задействует следующий набор приложений: Adobe Acrobat XI Pro, Google Chrome 32, Microsoft Excel 2013, Microsoft OneNote 2013, Microsoft Outlook 2013, Microsoft PowerPoint 2013, Microsoft Word 2013, WinZip Pro 17.5 Pro.



В сценарии Media Creation моделируется создание рекламного ролика с использованием предварительно отснятых цифровых изображений и видео. Для этой цели применяются популярные пакеты Adobe Photoshop CS6 Extended, Adobe Premiere Pro CS6 и Trimble SketchUp Pro 2013.



Сценарий Data/Financial Analysis посвящён статистическому анализу и прогнозированию инвестиций на основе некой финансовой модели. В сценарии используются большие объёмы численных данных и два приложения Microsoft Excel 2013 и WinZip Pro 17.5 Pro.



Результаты, полученные нами при различных сценариях нагрузки, качественно повторяют общие показатели SYSmark 2014 1.5. Обращает на себя внимание лишь тот факт, что процессор Core i7-4790K совсем не выглядит устаревшим. Он заметно проигрывает новейшему Core i7-6700K только в расчётном сценарии Data/Financial Analysis, а в остальных случаях либо уступает своему последователю на совсем малозаметную величину, либо вообще оказывается быстрее. Например, представитель семейства Haswell опережает новый Skylake в офисных приложениях. Но процессоры более старых годов выпуска, Core i7-2700K и Core i7-3770K, выглядят уже несколько устаревшими предложениями. Они проигрывают новинке в разных типах задач от 25 до 40 процентов, и это, пожалуй, является вполне достаточным основанием, чтобы Core i7-6700K можно было рассматривать в качестве достойной им замены.

Игровая производительность

Как известно, производительность платформ, оснащенных высокопроизводительными процессорами, в подавляющем большинстве современных игр определяется мощностью графической подсистемы. Именно поэтому при тестировании процессоров мы выбираем наиболее процессорозависимые игры, а измерение количества кадров выполняем дважды. Первым проходом тесты проводятся без включения сглаживания и с установкой далеко не самых высоких разрешений. Такие настройки позволяют оценить, насколько хорошо проявляют себя процессоры с игровой нагрузкой в принципе, а значит, позволяют строить догадки о том, как будут вести себя тестируемые вычислительные платформы в будущем, когда на рынке появятся более быстрые варианты графических ускорителей. Второй проход выполняется с реалистичными установками – при выборе FullHD-разрешения и максимального уровня полноэкранного сглаживания. На наш взгляд такие результаты не менее интересны, так как они отвечают на часто задаваемый вопрос о том, какой уровень игровой производительности могут обеспечить процессоры прямо сейчас – в современных условиях.

Впрочем, в этом тестировании мы собрали мощную графическую подсистему, основанную на флагманской видеокарте NVIDIA GeForce GTX 980 Ti. И в результате в части игр частота кадров продемонстрировала зависимость от процессорной производительности даже в FullHD-разрешении.

Результаты в FullHD-разрешении с максимальными настройками качества


















Обычно влияние процессоров на игровую производительность, особенно если речь идёт о мощных представителях серии Core i7, оказывается незначительным. Однако при сопоставлении пяти Core i7 разных поколений результаты получаются совсем не однородными. Даже при установке максимальных настроек качества графики Core i7-6700K и Core i7-5775C демонстрируют наивысшую игровую производительность, в то время как более старые Core i7 от них отстают. Так, частота кадров, которая получена в системе с Core i7-6700K превышает производительность системы на базе Core i7-4770K на малозаметный один процент, но процессоры Core i7-2700K и Core i7-3770K представляются уже ощутимо худшей основой геймерской системы. Переход с Core i7-2700K или Core i7-3770K на новейший Core i7-6700K даёт прибавку в числе fps величиной в 5-7 процентов, что способно оказать вполне заметное влияние на качество игрового процесса.

Увидеть всё это гораздо нагляднее можно в том случае, если на игровую производительность процессоров посмотреть при сниженном качестве изображения, когда частота кадров не упирается в мощность графической подсистемы.

Результаты при сниженном разрешении


















Новейшему процессору Core i7-6700K вновь удаётся показать наивысшую производительность среди всех Core i7 последних поколений. Его превосходство над Core i7-5775C составляет порядка 5 процентов, а над Core i7-4690K – около 10 процентов. В этом нет ничего странного: игры достаточно чутко реагируют на скорость подсистемы памяти, а именно по этому направлению в Skylake были сделаны серьёзные улучшения. Но гораздо заметнее превосходство Core i7-6700K над Core i7-2700K и Core i7-3770K. Старший Sandy Bridge отстаёт от новинки на 30-35 процентов, а Ivy Bridge проигрывает ей в районе 20-30 процентов. Иными словами, как бы ни ругали Intel за слишком медленное совершенствование собственных процессоров, компания смогла за прошедшие пять лет на треть повысить скорость работы своих CPU, а это – очень даже ощутимый результат.

Тестирование в реальных играх завершают результаты популярного синтетического бенчмарка Futuremark 3DMark.









Вторят игровым показателям и те результаты, которые выдаёт Futuremark 3DMark. При переводе микроархитектуры процессоров Core i7 c Sandy Bridge на Ivy Bridge показатели 3DMark выросли на величину от 2 до 7 процентов. Внедрение дизайна Haswell и выпуск процессоров Devil’s Canyon добавил к производительности старших Core i7 дополнительные 7-14 процентов. Однако потом появление Core i7-5775C, обладающего сравнительно невысокой тактовой частотой, несколько откатило быстродействие назад. И новейшему Core i7-6700K, фактически, пришлось отдуваться сразу за два поколения микроархитектуры. Прирост в итоговом рейтинге 3DMark у нового процессора семейства Skylake по сравнению с Core i7-4790K составил до 7 процентов. И на самом деле это не так много: всё-таки самое заметное улучшение производительности за последние пять лет смогли привнести процессоры Haswell. Последние же поколения десктопных процессоров, действительно, несколько разочаровывают.

Тесты в приложениях

В Autodesk 3ds max 2016 мы тестируем скорость финального рендеринга. Измеряется время, затрачиваемое на рендеринг в разрешении 1920x1080 с применением рендерера mental ray одного кадра стандартной сцены Hummer.



Ещё один тест финального рендеринга проводится нами с использованием популярного свободного пакета построения трёхмерной графики Blender 2.75a. В нём мы измеряем продолжительность построения финальной модели из Blender Cycles Benchmark rev4.



Для измерения скорости фотореалистичного трёхмерного рендеринга мы воспользовались тестом Cinebench R15. Maxon недавно обновила свой бенчмарк, и теперь он вновь позволяет оценить скорость работы различных платформ при рендеринге в актуальных версиях анимационного пакета Cinema 4D.



Производительность при работе веб-сайтов и интернет-приложений, построенных с использованием современных технологий, измеряется нами в новом браузере Microsoft Edge 20.10240.16384.0. Для этого применяется специализированный тест WebXPRT 2015, реализующий на HTML5 и JavaScript реально использующиеся в интернет-приложениях алгоритмы.



Тестирование производительности при обработке графических изображений происходит в Adobe Photoshop CC 2015. Измеряется среднее время выполнения тестового скрипта, представляющего собой творчески переработанный Retouch Artists Photoshop Speed Test, который включает типичную обработку четырёх 24-мегапиксельных изображений, сделанных цифровой камерой.



По многочисленным просьбам фотолюбителей мы провели тестирование производительности в графической программе Adobe Photoshop Lightroom 6.1. Тестовый сценарий включает пост-обработку и экспорт в JPEG с разрешением 1920x1080 и максимальным качеством двухсот 12-мегапиксельных изображений в RAW-формате, сделанных цифровой камерой Nikon D300.



В Adobe Premiere Pro CC 2015 тестируется производительность при нелинейном видеомонтаже. Измеряется время рендеринга в формат H.264 Blu-Ray проекта, содержащего HDV 1080p25 видеоряд с наложением различных эффектов.



Для измерения быстродействия процессоров при компрессии информации мы пользуемся архиватором WinRAR 5.3, при помощи которого с максимальной степенью сжатия архивируем папку с различными файлами общим объёмом 1,7 Гбайт.



Для оценки скорости перекодирования видео в формат H.264 используется тест x264 FHD Benchmark 1.0.1 (64bit), основанный на измерении времени кодирования кодером x264 исходного видео в формат MPEG-4/AVC с разрешением 1920x1080@50fps и настройками по умолчанию. Следует отметить, что результаты этого бенчмарка имеют огромное практическое значение, так как кодер x264 лежит в основе многочисленных популярных утилит для перекодирования, например, HandBrake, MeGUI, VirtualDub и проч. Мы периодически обновляем кодер, используемый для измерений производительности, и в данном тестировании приняла участие версия r2538, в которой реализована поддержка всех современных наборов инструкций, включая и AVX2.



Кроме того, мы добавили в список тестовых приложений и новый кодер x265, предназначенный для транскодирования видео в перспективный формат H.265/HEVC, который является логическим продолжением H.264 и характеризуется более эффективными алгоритмами сжатия. Для оценки производительности используется исходный 1080p@50FPS Y4M-видеофайл, который перекодируется в формат H.265 с профилем medium. В этом тестировании принял участие релиз кодера версии 1.7.



Преимущество Core i7-6700K над ранними предшественниками в различных приложениях не подлежит сомнению. Однако больше всего выиграли от произошедшей эволюции два типа задач. Во-первых, связанные с обработкой мультимедийного контента, будь то видео или изображения. Во-вторых, финальный рендеринг в пакетах трёхмерного моделирования и проектирования. В целом, в таких случаях Core i7-6700K превосходит Core i7-2700K не менее, чем на 40-50 процентов. А иногда можно наблюдать и гораздо более впечатляющее улучшение скорости. Так, при перекодировании видео кодеком x265 новейший Core i7-6700K выдаёт ровно вдвое более высокую производительность, чем старичок Core i7-2700K.

Если же говорить о том приросте в скорости выполнения ресурсоёмких задач, которую может обеспечить Core i7-6700K по сравнению с Core i7-4790K, то тут уже столь впечатляющих иллюстраций к результатам работы интеловских инженеров привести нельзя. Максимальное преимущество новинки наблюдается в Lightroom, здесь Skylake оказался лучше в полтора раза. Но это скорее – исключение из правила. В большинстве же мультимедийных задач Core i7-6700K по сравнению с Core i7-4790K предлагает лишь 10-процентное улучшение производительности. А при нагрузке иного характера разница в быстродействии и того меньше или же вообще отсутствует.

Отдельно нужно сказать пару слов и о результате, показанном Core i7-5775C. Из-за небольшой тактовой частоты этот процессор медленнее, чем Core i7-4790K и Core i7-6700K. Но не стоит забывать о том, что его ключевой характеристикой является экономичность. И он вполне способен стать одним из лучших вариантов с точки зрения удельной производительности на каждый ватт затраченной электроэнергии. В этом мы легко убедимся в следующем разделе.

Энергопотребление

Процессоры Skylake производятся по современному 14-нм технологическому процессу с трёхмерными транзисторами второго поколения, однако, несмотря на это, их тепловой пакет вырос до 91 Вт. Иными словами, новые CPU не только «горячее» 65-ваттных Broadwell, но и превосходят по расчётному тепловыделению Haswell, выпускаемые по 22-нм технологии и уживающиеся в рамках 88-ваттного теплового пакета. Причина, очевидно, состоит в том, что изначально архитектура Skylake оптимизировалась с прицелом не на высокие частоты, а на энергоэффективность и возможность использования в мобильных устройствах. Поэтому для того, чтобы десктопные Skylake получили приемлемые тактовые частоты, лежащие в окрестности 4-гигагерцевой отметки, пришлось задирать напряжение питания, что неминуемо отразилось на энергопотреблении и тепловыделении.

Впрочем, процессоры Broadwell низкими рабочими напряжениями тоже не отличались, поэтому существует надежда на то, что 91-ваттный тепловой пакет Skylake получили по каким-то формальным обстоятельствам и, на самом деле, они окажутся не прожорливее предшественников. Проверим!

Используемый нами в тестовой системе новый цифровой блок питания Corsair RM850i позволяет осуществлять мониторинг потребляемой и выдаваемой электрической мощности, чем мы и пользуемся для измерений. На следующем ниже графике приводится полное потребление систем (без монитора), измеренное «после» блока питания и представляющее собой сумму энергопотребления всех задействованных в системе компонентов. КПД самого блока питания в данном случае не учитывается. Для правильной оценки энергопотребления мы активировали турборежим и все имеющиеся энергосберегающие технологии.



В состоянии простоя качественный скачок в экономичности настольных платформ произошёл с выходом Broadwell. Core i7-5775C и Core i7-6700K отличаются заметно более низким потреблением в простое.



Зато под нагрузкой в виде перекодирования видео самыми экономичными вариантами CPU оказываются Core i7-5775C и Core i7-3770K. Новейший же Core i7-6700K потребляет больше. Его энергетические аппетиты находятся на уровне старшего Sandy Bridge. Правда, в новинке, в отличие от Sandy Bridge, есть поддержка инструкций AVX2, которые требуют достаточно серьёзных энергетических затрат.

На следующей диаграмме приводится максимальное потребление при нагрузке, создаваемой 64-битной версией утилиты LinX 0.6.5 с поддержкой набора инструкций AVX2, которая базируется на пакете Linpack, отличающемся непомерными энергетическими аппетитами.



И вновь процессор поколения Broadwell показывает чудеса энергетической эффективности. Однако если смотреть на то, сколько электроэнергии потребляет Core i7-6700K, то становится понятно, что прогресс в микроархитектурах обошёл стороной энергетическую эффективность настольных CPU. Да, в мобильном сегменте с выходом Skylake появились новые предложения с чрезвычайно соблазнительным соотношением производительности и энергопотребления, однако новейшие процессоры для десктопов продолжают потреблять примерно столько же, сколько потребляли их предшественники за пять лет до сегодняшнего дня.

Выводы

Проведя тестирование новейшего Core i7-6700K и сравнив его с несколькими поколениями предшествующих CPU, мы вновь приходим к неутешительному выводу о том, что компания Intel продолжает следовать своим негласным принципам и не слишком стремится наращивать быстродействие десктопных процессоров, ориентированных на высокопроизводительные системы. И если по сравнению со старшим Broadwell новинка предлагает примерно 15-процентное улучшение производительности, обусловленное существенно лучшими тактовыми частотами, то в сравнении с более старым, но более быстрым Haswell она уже не кажется столь же прогрессивной. Разница в производительности Core i7-6700K и Core i7-4790K, несмотря на то, что эти процессоры разделяет два поколения микроархитектуры, не превышает 5-10 процентов. И это очень мало для того, чтобы старший десктопный Skylake можно было бы однозначно рекомендовать для обновления имеющихся LGA 1150-систем.

Впрочем, к столь незначительным шагам Intel в деле повышения скорости работы процессоров для настольных систем стоило бы давно привыкнуть. Прирост быстродействия новых решений, лежащий примерно в таких пределах, – давно сложившаяся традиция. Никаких революционных изменений в вычислительной производительности интеловских CPU, ориентированных на настольные ПК, не происходит уже очень давно. И причины этого вполне понятны: инженеры компании заняты оптимизацией разрабатываемых микроархитектур для мобильных применений и в первую очередь думают об энергоэффективности. Успехи Intel в адаптации собственных архитектур для использования в тонких и лёгких устройствах несомненны, но адептам классических десктопов при этом только и остаётся, что довольствоваться небольшими прибавками быстродействия, которые, к счастью, пока ещё не совсем сошли на нет.

Однако это совсем не значит, что Core i7-6700K можно рекомендовать лишь для новых систем. Задуматься о модернизации своих компьютеров вполне могут обладатели конфигураций, в основе которых лежит платформа LGA 1155 с процессорами поколений Sandy Bridge и Ivy Bridge. В сравнении с Core i7-2700K и Core i7-3770K новый Core i7-6700K выглядит очень неплохо – его средневзвешенное превосходство над такими предшественниками оценивается в 30-40 процентов. Кроме того, процессоры с микроархитектурой Skylake могут похвастать поддержкой набора инструкций AVX2, который к настоящему моменту нашел достаточно широкое применение в мультимедийных приложениях, и благодаря этому в некоторых случаях Core i7-6700K оказывается быстрее гораздо сильнее. Так, при перекодировании видео мы даже видели случаи, когда Core i7-6700K превосходил Core i7-2700K в скорости работы более чем в два раза!

Есть у процессоров Skylake и целый ряд других преимуществ, связанных с внедрением сопутствующей им новой платформы LGA 1151. И дело даже не столько в появившейся в ней поддержке DDR4-памяти, сколько в том, что новые наборы логики сотой серии наконец-то получили действительно скоростное соединение с процессором и поддержку большого количества линий PCI Express 3.0. В результате, передовые LGA 1151-системы могут похвастать наличием многочисленных быстрых интерфейсов для подключения накопителей и внешних устройств, которые лишены каких-либо искусственных ограничений по пропускной способности.

Плюс к тому, оценивая перспективы платформы LGA 1151 и процессоров Skylake, в виду нужно иметь и ещё один момент. Intel не будет спешить с выводом на рынок процессоров следующего поколения, известных как Kaby Lake. Если верить имеющейся информации, представители этой серии процессоров в вариантах для настольных компьютеров появятся на рынке только в 2017 году. Так что Skylake будет с нами ещё долго, и система, построенная на нём, сможет оставаться актуальной в течение очень продолжительного промежутка времени.

В начале января компания Intel официально представила процессоры семейства Intel Core второго поколения, известные под кодовым наименованием Sandy Bridge, а также чипсеты Intel 6-й серии для них.

Новые процессоры семейства Intel Core второго поколения (2 nd Generation Intel Core Processor Family), известные также под кодовым наименованием Sandy Bridge, без преувеличения можно назвать одним из наиболее долгожданных продуктов. Без сомнения, они станут самыми популярными процессорами в 2011 году. Компания AMD готовит свой ответ в виде процессоров на базе новой микроархитектуры Bulldozer, но, во-первых, пока не понятно, когда эти процессоры появятся, а во-вторых, уже сейчас можно утверждать, что они не смогут конкурировать с процессорами Sandy Bridge ни по производительности, ни по соотношению «цена/производительность». Вообще, забегая вперед, отметим, что новые процессоры Intel получились настолько удачными, что продукция конкурентов в сравнении с ними просто меркнет.

О новой процессорной микроархитектуре Sandy Bridge мы уже подробно рассказывали на страницах нашего журнала, поэтому в данной статье не станем повторяться, а ознакомим читателей с модельным рядом новых процессоров и чипсетов, а также расскажем об их разгонных возможностях и результатах тестирования их производительности.

Прежде всего напомним, что процессоры Intel Core второго поколения, как и процессоры Intel Core первого поколения, составят три семейства: Intel Core i7, Core i5 и Core i3. Чтобы отличать процессоры Intel Core второго поколения от процессоров первого поколения, изменена система их маркировки. Если процессоры первого поколения маркировались трехзначным числом (например, Intel Core i5-650), то процессоры второго поколения маркируются четырехзначным числом, причем первая цифра - 2 - указывает на второе поколение.

Итак, всего компания Intel одновременно анонсировала 29 новых моделей процессоров семейства Sandy Bridge для настольных ПК и ноутбуков, а также десять новых чипсетов. Среди 29 новых моделей процессоров 15 моделей - это мобильные процессоры, а остальные 14 моделей предназначены для настольных компьютеров. Среди десяти новых чипсетов пять ориентированы на ноутбуки, а остальные пять - на ПК.

Прежде чем более детально ознакомиться с модельным рядом мобильных и десктопных процессоров Sandy Bridge, приведем общие сведения о них.

Особенности процессоров Sandy Bridge

Все процессоры Sandy Bridge первоначально будут производиться по 32-нм техпроцессу. В дальнейшем, когда состоится переход на 22-нм техпроцесс, процессоры на базе микроархитектуры Sandy Bridge получат кодовое на-именование Ivy Bridge.

Отличительной особенностью всех процессоров Sandy Bridge станет наличие в них интегрированного графического ядра нового поколения (Intel HD Graphics 2000/3000). Причем если в процессорах предыдущего поколения (Clarkdale и Arrandale) вычислительные ядра процессора и графическое ядро размещались на разных кристаллах и, более того, производились по разным техпроцессам, то в процессорах Sandy Bridge все компоненты процессора изготавливаются по 32-нм техпроцессу и располагаются на одном кристалле.

Важно подчеркнуть, что идеологически графическое ядро процессора Sandy Bridge можно рассматривать как пятое ядро процессора (в случае четырехъядерных процессоров). Причем графическое ядро, так же как и вычислительные ядра процессора, имеет доступ к кэшу L3.

Точно так же, как и процессоры предыдущего поколения (Clarkdale и Arrandale), процессоры Sandy Bridge будут иметь интегрированный интерфейс PCI Express 2.0 для использования дискретных видеокарт. Причем все процессоры поддерживают 16 линий PCI Express 2.0, которые могут быть сгруппированы либо как один порт PCI Express x16, либо как два порта PCI Express x8.

Также нужно отметить, что все процессоры Sandy Bridge будут иметь интегрированный двухканальный контроллер памяти DDR3. Выпуск вариантов с трехканальным контроллером памяти пока не планируется.

Еще одна особенность процессоров на базе микроархитектуры Sandy Bridge заключается в том, что вместо шины QPI (Intel QuickPath Interconnect), которая раньше использовалась для связи отдельных компонентов процессора друг с другом, теперь применяется принципиально иной интерфейс, называемый кольцевой шиной (Ring Bus).

Архитектура процессора Sandy Bridge вообще подразумевает модульную, легко масштабируемую структуру.

Еще одна особенность микроархитектуры Sandy Bridge заключается в том, что в ней реализована поддержка набора инструкций Intel AVX (Intel Advanced Vector Extension).

Intel AVX представляет собой новый набор расширений для архитектуры Intel, предусматривающий 256-битные векторные вычисления с плавающей запятой на базе SIMD (Single Instruction, Multiple Data).

Говоря о процессорной микроархитектуре Sandy Bridge, нужно отметить, что она является развитием микроархитектуры Nehalem или Intel Core (поскольку сама микроархитектура Nehalem является развитием микроархитектуры Intel Core). Различия между Nehalem и Sandy Bridge довольно существенные, но всё же назвать эту микроархитектуру принципиально новой, какой в свое время была микроархитектура Intel Core, нельзя. Это именно модифицированная микроархитектура Nehalem.

Модельный ряд мобильных процессоров Intel Core второго поколения

В семействе мобильных процессоров было представлено 15 моделей: десять моделей семейства Core i7, четыре модели семейства Core i5 и одна модель - Core i3.

В семействе мобильных процессоров присутствуют как четырех­, так и двухъядерные модели. Причем все мобильные процессоры имеют встроенное графическое ядро Intel HD Graphics 3000 и поддерживают режим Hyper-Threading. Разница между отдельными моделями заключается в энергопотреблении, штатной тактовой частоте и максимальной частоте в режиме Turbo Boost, размере кэша L3, частоте поддерживаемой памяти, частоте графического ядра в штатном режиме и в режиме Turbo Boost.

Так, из десяти моделей в семействе Core i7 пять являются четырехъядерными (в обозначении четырехъядерных процессов присутствует буква Q или X). Причем одна модель - Intel Core i7-2920XM - относится к серии Extreme Edition. Это топовая и самая дорогая модель в сегменте мобильных процессоров. Вряд ли производители будут в массовом порядке выпус­кать ноутбуки на процессоре Core i7-2920XM, поскольку его стоимость превышает 1000 долл. Скорее всего, на нем будут основаны только эксклюзивные модели ноутбуков под заказ.

Следующая по стоимости и по производительности модель процессора - Core i7-2820QM. Ее отличие от модели Core i7-2920XM заключается лишь в том, что в ней штатная тактовая частота на две ступени ниже (в процессорах Sandy Bridge частота системной шины составляет 100 МГц, соответственно одна ступень изменения тактовой частоты равна 100 МГц). Так, для процессора Core i7-2920XM штатная тактовая частота равна 2,5 ГГц, а для модели Core i7-2820QM - 2,3 ГГц. В режиме Turbo Boost максимальная частота процессора Core i7-2920XM может равняться 3,5 ГГц, а процессора Core i7-2820QM - 3,4 ГГц. Еще одно различие между процессорами Core i7-2920XM и Core i7-2820QM заключается в том, что TDP модели Core i7-2920XM составляет 55 Вт, а модели Core i7-2820QM - 45 Вт. Все остальные характеристики процессоров Core i7-2920XM и Core i7-2820QM совпадают. Это четырехъядерные модели с L3-кэшем 8 Мбайт. Обе модели поддерживают память DDR3-1600 и имеют графический контроллер Intel HD Graphics 3000 с частотой 650 МГц в штатном режиме и 1300 МГц в режиме Turbo Boost.

Как видите, процессоры Core i7-2920XM и Core i7-2820QM по своим характеристикам, в том числе по производительности, мало чем отличаются друг от друга. А вот по стоимости - почти в два раза. Именно поэтому мы предполагаем, что именно модель Core i7-2820QM будет топовым решением, а Core i7-2920XM останется неким эксклюзивом, который, скорее всего, продаваться не будет.

Все остальные четырехъядерные модели мобильных процессоров (Core i7-2720QM, i7-2635QM, i7-2630QM) наделены L3-кэшем 6 Мбайт. Модель Core i7-2720QM поддерживает память DDR3-1600, а остальные процессоры - память DDR3-1333. Модели i7-2635QM и i7-2630QM вообще практически не отличаются друг от друга - разница лишь в максимальной частоте графического ядра в режиме Turbo Boost. Однако, на наш взгляд, обращать внимание на характеристики интегрированного графического ядра в случае четырехъядерных моделей процессоров вообще не имеет смысла, поскольку ноутбуки на базе таких мощных процессоров без дискретной графики вряд ли будут выпускаться (это было бы просто нелогично).

Теперь рассмотрим двухъядерные модели мобильных процессоров Sandy Bridge. Все двухъядерные модели семейства Core i7 имеют кэш L3 размером 4 Мбайт и поддерживают память DDR3-1333. Собственно, разница между отдельными двухъядерными моделями процессоров семейства Core i7 заключается в их энергопотреблении (различное значение TDP), штатной тактовой частоте и максимальной тактовой частоте ядер процессора и графического ядра в режиме Turbo Boost.

Двухъядерные модели мобильных процессоров семейства Core i5 (всего их четыре) имеют кэш L3 размером уже 3 Мбайт. Все эти процессоры поддерживают память DDR3-1333 и отличаются друг от друга энергопотреблением, штатной тактовой частотой и максимальной тактовой частотой ядер процессора и графического ядра в режиме Turbo Boost.

Как уже отмечалось, младшее семейство процессоров Core i3 представлено всего одной моделью - Core i3-2310M. Отличительной особенностью процессоров семейства Core i3 является то обстоятельство, что они не поддерживают режим Turbo Boost для ядер процессора (режим Turbo Boost поддерживается для графического ядра). Во всем остальном эти процессоры схожи с моделями семейства Core i5. Так, в модели Core i3-2310M размер кэша L3 составляет 3 Мбайт и он поддерживает память DDR3-1333.

Технические характеристики мобильных процессоров Sandy Bridge представлены в табл. 1 .

Модельный ряд десктопных процессоров Intel Core второго поколения

Модельный ряд десктопных процессоров Sandy Bridge также представлен тремя семействами: Core i7, Core i5 и Core i3.

Все десктопные процессоры семейства Core i7 являются четырехъядерными, поддерживают режим Hyper-Threading и память DDR3-1333 и имеют кэш L3 размером 8 Мбайт. Собственно, в настоящее время семейство Core i7 представлено всего одной моделью, но в трех вариантах: Core i7-2600K, Core i7-2600 и Core i7-2600S. Базовая модель - Core i7-2600. Этот четырехъядерный процессор имеет TDP 95 Вт и базовую тактовую частоту 3,4 ГГц. Максимальная тактовая частота в режиме Turbo Boost составляет 3,8 ГГц. Процессор Core i7-2600 имеет встроенное графическое ядро Intel HD Graphics 2000 с максимальной тактовой частотой до 1350 МГц в режиме Turbo Boost.

Модель Core i7-2600K отличается от Core i7-2600 прежде всего тем, что она разблокирована. Все процессоры с буквой «К» в маркировке имеют разблокированный коэффициент умножения и ориентированы на разгон. О разгонных особенностях десктопных процессоров Sandy Bridge мы еще расскажем, а пока заметим, что процессор Core i7-2600K имеет интегрированное графическое ядро Intel HD Graphics 3000 с максимальной тактовой частотой до 1350 МГц в режиме Turbo Boost.

Вообще, нужно отметить, что если во всех мобильных процессорах интегрировано графическое ядро Intel HD Graphics 3000, то в десктопных процессорах может быть интегрировано графическое ядро как Intel HD Graphics 3000, так и Intel HD Graphics 2000. Во всех разблокированных процессорах (с буквой «К» в маркировке) интегрировано графическое ядро Intel HD Graphics 3000, а во всех остальных процессорах - ядро Intel HD Graphics 2000. Различия между ядрами Intel HD Graphics 3000 и 2000 мы еще обсудим, но, забегая вперед, скажем, что ядро Intel HD Graphics 3000 более производительное и решение интегрировать более производительное графическое ядро в разблокированные процессоры кажется нам абсолютно нелогичным. Дело в том, что разгон процессоров возможен только на материнских платах на базе чипсета Intel P67 Express. Но именно эти платы как раз не поддерживают встроенного в процессор графического ядра (то есть в платах на базе чипсета Intel P67 Express нет возможности воспользоваться встроенным графическим ядром). Использовать интегрированное графическое ядро можно только на платах с чипсетом Intel H67 Express, однако они не позволяют осуществлять разгон ядер процессора (об особенностях чипсетов мы расскажем чуть позже). Естественно, разблокированные процессоры K-серии имеет смысл применять только с платами на базе чипсета Intel P67 Express, но в этом случае нельзя использовать встроенное в них графическое ядро, и какой смысл оснащать более производительным графическим ядром именно разблокированные процессоры - совершенно непонятно.

Процессор Core i7-2600S отличается от двух других моделей семейства Core i7 пониженным энергопотреблением. Его TDP составляет 65 Вт. Ну и, кроме того, в этой модели процессора меньше базовая тактовая частота (2,8 ГГц), однако в режиме Turbo Boost тактовая частота может быть такой же, как и в моделях Core i7-2600 и Core i7-2600K, то есть 3,8 ГГц. Попутно отметим, что если в маркировке процессора присутствует буква «S», то это означает, что речь идет о процессоре с пониженным энергопотреблением.

Теперь рассмотрим семейство десктопных процессоров Core i5. Оно довольно странное, поскольку в него входят как двух-, так и четырехъядерные процессоры как с поддержкой Hyper-Threading, так и без нее. Точнее, если бы не модель Core i5-2390T, то всё было бы логично и Intel Core i5 можно было бы охарактеризовать как семейство четырехъядерных процессоров без поддержки технологии Hyper-Threading с L3-кэшем 6 Мбайт. Однако модель Core i5-2390T портит всю систему классификации, поскольку это двухъядерный процессор с поддержкой технологии Hyper-Threading и кэшем L3 размером 3 Мбайт. Возникает впечатление, что этот процессор попал в семейство Core i5 просто по ошибке - ему место в семействе Core i3. Однако отличительным признаком всех процессоров Core i3 является отсутствие поддержки режима Turbo Boost для ядер процессора, а модель Core i5-2390T поддерживает Turbo Boost. Одним словом, модель процессора Core i5-2390T просто не вписывается ни в одно семейство. Поэтому охарактеризуем Core i5 как семейство четырехъядерных процессоров без поддержки технологии Hyper-Threading с L3-кэшем 6 Мбайт, но с одним исключением в виде модели Core i5-2390T.

В семейство Core i5 сегодня входят три базовые модели в различных вариациях. Так, базовая модель Core i5-2500 представлена в четырех видах: Core i5-2500K, Core i5-2500, Core i5-2500S и Core i5-2500T. Модель Core i5-2500K - это разблокированный вариант процессора Core i5-2500, да еще с графикой Intel HD Graphics 3000.

Модель Core i5-2500S - это вариант процессора Core i5-2500 с пониженным энергопотреблением. Так, если для модели Core i5-2500 TDP составляет 95 Вт, то для модели Core i5-2500S - 65 Вт.

Модель Core i5-2500T - это процессор с еще более сниженным энергопотреблением. TDP этого процессора составляет 45 Вт, а кроме того, у него снижена частота ядер в штатном режиме и в режиме Turbo Boost.

Процессор Core i5-2400 представлен в двух вариантах: Core i5-2400 и i5-2400S. Разница между ними заключается в энергопотреблении и тактовой частоте.

А вот процессор Core i5-2300 вариаций пока не имеет.

Семейство процессоров Core i3 представлено в настоящее время тремя моделями. Все процессоры этого семейства являются двухъядерными, поддерживают режим Hyper-Threading, имеют кэш L3 размером 3 Мбайт и, как уже отмечалось, не поддерживают режим Turbo Boost для ядер процессора. Встроенное графическое ядро HD Graphics 2000 имеет максимальную частоту (в режиме Turbo Boost) 1100 МГц.

Технические характеристики всех десктопных процессоров Sandy Bridge представлены в табл. 2 .

Особенности графических ядер Intel HD Graphics 2000/3000

Как уже отмечалось, все процессоры Sandy Bridge имеют встроенное графическое ядро нового поколения, которое идеологически можно рассматривать как еще одно ядро процессора. Во всех мобильных процессорах, а также в десктопных процессорах K-серии (с разблокированным коэффициентом умножения) интегрируется графическое ядро Intel HD Graphics 3000, а в остальных процессорах - графическое ядро Intel HD Graphics 2000.

Конечно, графическое ядро в процессорах Sandy Bridge не может сравниться по производительности с дискретной графикой (кстати, поддержка DirectX 11 для нового ядра даже не заявлена), но справедливости ради отметим, что это ядро и не позиционируется как игровое.

Разница между ядрами Intel HD Graphics 3000 и Intel HD Graphics 2000 заключается в количестве исполнительных блоков (Execution Unit, EU). Так, в ядре Intel HD Graphics 3000 насчитывается 12 исполнительных блоков, а в ядре Intel HD Graphics 2000 - только 6.

Отметим, что исполнительные блоки в графических ядрах Intel HD Graphics 3000/2000 нельзя сравнивать с унифицированными шейдерными процессорами в графических процессорах NVIDIA или AMD, где их насчитываются сотни. Графическое ядро Intel ориентировано прежде всего не на 3D-игры, а на аппаратное декодирование и кодирование видео (включая HD-видео). То есть в конфигурацию графического ядра входят аппаратные декодеры. Их дополняют средства изменения разрешения (scaling), шумоподавления (denoise filtering), обнаружения и удаления чередования строк (deinterlace/film-mode detection) и фильтры улучшения детализации. Постобработка, позволяющая улучшить изображение при воспроизведении, включает функции STE (улучшение передачи телесных тонов), ACE (адаптивное повышение контраста) и TCC (общее управление цветом).

Мультиформатный аппаратный кодек поддерживает форматы MPEG-2, VC1 и AVC, выполняя все этапы декодирования с помощью специализированных аппаратных средств, тогда как в интегрированных графических процессорах текущего поколения за эту функцию отвечают универсальные исполнительные блоки EU (рис. 1).

Рис. 1. Сравнение возможностей по аппаратному декодированию графических
контроллеров нового и предыдущего поколений

Вообще, если сравнивать графические контроллеры Intel предыдущего поколения, интегрированные в процессоры Clarkdale/Arrandale, и графические контроллеры, интегрированные в процессоры Sandy Bridge, то нужно отметить, что разница между ними не только в поддержке аппаратного декодирования. Сравнение технических характеристик и функциональных возможностей графических контроллеров нового и предыдущего поколений представлено на рис. 2 и 3.

Рис. 2. Сравнение функциональных возможностей графических контроллеров нового
и предыдущего поколений

Рис. 3. Сравнение технических характеристик графических контроллеров нового и предыдущего поколений

Разгонные возможности декстопных процессоров Sandy Bridge

В семействе десктопных процессоров Sandy Bridge имеются как разблокированные процессоры, ориентированные на разгон, так и обычные процессоры. Однако обычные процессоры также можно (и нужно) разгонять. Вообще, все десктопные процессоры Sandy Bridge более правильно делить не на обычные и разблокированные, а на полностью разблокированные (Fully Unlocked) и ограниченно разблокированные (Limited Unlocked). Собственно, это одна из интереснейших особенностей процессоров Sandy Bridge - все они являются разблокированными в той или иной степени.

Прежде всего, во всех процессорах полностью разблокирована возможность по разгону памяти. В BIOS платы можно выбрать коэффициент умножения для памяти (8,00; 10,66; 13,33; 16,00; 18,66; 21,33). С учетом того, что штатная частота системной шины составляет 100 МГц, выбирая, к примеру, множитель 16,00, мы получим частоту памяти 1600 МГц.

Естественно, полностью разблокированной на всех процессорах является возможность устанавливать напряжение питания памяти и ядер процессора. Собственно, так было всегда.

Ну а теперь о главном. В полностью разблокированных процессорах (процессоры K-серии) можно устанавливать любой коэффициент умножения для тактовой частоты ядер процессора. Точнее, максимальный коэффициент умножения может быть равным 57, соответственно максимальная тактовая частота ядер процессора может достигать 5,7 ГГц (теоретически). В частично разблокированных процессорах (то есть в процессорах не К-серии) также можно менять коэффициент умножения, однако в меньшем диапазоне. Правило здесь работает такое. Максимальный коэффициент умножения для частично разблокированных процессоров может быть на четыре единицы выше, чем коэффициент умножения для максимальной частоты процессора в режиме Turbo Boost в штатном режиме.

Рассмотрим, к примеру, частично разблокированный процессор Core i5-2400. Его штатная тактовая частота составляет 3,1 ГГц, а в режиме Turbo Boost максимальная тактовая частота может быть равна 3,4 ГГц (при одном активном ядре). Соответственно для этого процессора коэффициент умножения для максимальной частоты в режиме Turbo Boost составляет 34. Значит, максимальный коэффициент умножения, который можно задать, равен 38.

И полностью разблокированные, и частично разблокированные процессоры Sandy Bridge позволяют настраивать режим Turbo Boost. То есть для процессоров Sandy Bridge можно задавать коэффициенты умножения для ядер процессора в режиме Turbo Boost. В случае четырехъядерных процессоров имеется возможность задавать коэффициенты умножения для четырех, трех, двух и одного активного ядра. Для полностью разблокированных процессоров коэффициенты умножения могут быть любыми (но менее 57), а для частично разблокированных процессоров действует то же правило: максимальный коэффициент умножения на четыре единицы выше, чем коэффициент умножения для максимальной частоты процессора в режиме Turbo Boost в штатном режиме (рис. 4).

Рис. 4. Сравнение разгонных возможностей полностью
и частично разблокированных процессоров Sandy Bridge

Рассмотрим для примера всё тот же частично разблокированный процессор Core i5-2400. По умолчанию (в штатном режиме) режим Turbo Boost для этого процессора настроен следующим образом. Если активны все четыре ядра, то коэффициент умножения может быть равным 32 (если не превышены ограничения по максимальному току и TDP процессора). Если активны три или два ядра процессора, то коэффициент умножения может быть равным 33, а если активно только одно ядро, то коэффициент умножения может достигать значения 34.

Поскольку максимальный коэффициент умножения для этого процессора на 4 единицы выше 34, то есть равен 38, режим Turbo Boost можно настроить так, чтобы для всех случаев активности ядер коэффициент умножения был не выше 38. К примеру, для одного активного ядра - 38, для двух - 37, для трех - 36 и для четырех - 35. А можно и так, чтобы для случаев одного, двух, трех и четырех активных ядер коэффициент умножения был равен 38.

Еще одна особенность настройки режима Turbo Boost заключается в том, что и для полностью разблокированных, и для частично разблокированных процессоров можно устанавливать значения максимального тока и энергопотребления. Напомним, что режим динамического разгона Turbo Boost реализуется лишь в том случае, если не превышен предел по максимальному току и энергопотреблению процессора. Так вот, значения максимального тока и энергопотребления можно устанавливать самостоятельно.

Говоря о разгонных возможностях процессоров Sandy Bridge, нужно отметить, что они действительно впечатляют. У нас была возможность протестировать три десктопных процессора: Core i7-2600K, Core i5-2500K и Core i5-2400, и нужно сказать, что все они отлично разгонялись. К примеру, процессор Core i7-2600K прекрасно работал на частоте 4,6 ГГц (при штатной частоте 3,4 ГГц), а час­тично разблокированный процессор Core i5-2400 при штатной частоте 3,1 ГГц отлично работал на частоте 3,8 ГГц. Более подробно о производительности и разгонных возможностях указанных процессоров мы расскажем в следующем номере нашего журнала. Напомним, что разгонять десктопные процессоры Sandy Bridge можно лишь в том случае, если используется материнская плата на базе чипсета Intel P67 Express. Платы на базе остальных чипсетов не позволяют разгонять процессоры.

Теперь самое время подробнее ознакомиться с новыми чипсетами для процессоров Sandy Bridge.

Чипсеты Intel 6-й серии

Компания Intel представила сразу десять чипсетов 6-й серии, из которых пять моделей - это чипсеты для ПК (P67, H67, Q65, Q67, B65), а еще пять (QS67, QM67, HM67, HM65, UM67) для ноутбуков.

Все новые чипсеты, или, в терминологии компании Intel, платформенные хабы (Platform Controller Hub, PCH), представляют собой однокристальные решения, которые заменяют собой традиционные северный и южный мосты.

В процессорах Sandy Bridge взаимодействие между процессором и чипсетом реализуется по шине DMI. Соответственно в чипсетах Intel 6-й серии имеется контроллер DMI.

Чипсеты для настольных ПК

Если говорить о чипсетах для настольных ПК, то наиболее широкое распространение получат чипсеты Intel P67 Express (P67) и Intel H67 Express (H67). Именно они ориентированы на домашние компьютеры. Остальные чипсеты (Q65, Q67, B65) предназначены для корпоративного сегмента рынка и не представляют интереса для конечных пользователей, а потому мы сосредоточимся прежде всего на рассмотрении чипсетов P67 и H67.

Как уже неоднократно упоминалось, ключевая разница между чипсетами P67 и H67 заключается в том, что чипсет P67, во-первых, позволяет разгонять процессоры, а во-вторых, не дает использовать встроенный в процессор графический контроллер. Чипсет H67, наоборот, не обеспечивает разгона процессоров, но позволяет применять встроенный в процессор графический контроллер. Для этого в чипсете H67 предусмотрена шина Intel FDI (Flexible Display Interface), по которой чипсет взаимодействует с процессором. А вот в чипсете P67 такой шины нет, и именно по этой причине воспользоваться встроенным графическим ядром процессора Sandy Bridge на платах с чипсетом P67 не удастся.

Остальные функциональные возможности чипсетов P67 и H67 практически совпадают. Оба чипсета поддерживают 14 портов USB 2.0. Кроме того, в них встроен 6-портовый SATA-контроллер, который поддерживает два порта SATA 6 Гбит/с (SATA III) и четыре порта SATA 3 Гбит/с (SATA II). Этот контроллер поддерживает технологию Intel RST с возможностью создания RAID-массивов уровня 0, 1, 5, 10 или JBOD.

Чипсеты P67 и H67 поддерживают восемь полноскоростных линий PCI Express 2.0, которые могут использоваться интегрированными на материнскую плату контроллерами и для организации слотов PCI Express 2.0 x1 и PCI Express 2.0 x4. А вот традиционную шину PCI чипсеты P67 и H67 не поддерживают.

Отметим также, что в чипсеты P67 и H67 уже встроен MAC-уровень гигабитного сетевого контроллера.

Структурные схемы чипсетов P67 и H67 показаны на рис. 5 и 6. В табл. 3 приведены технические характеристики чипсетов P67 и H67, а также чипсетов Q67 и B65.

Рис. 5. Структурная схема чипсета Intel P67 Express

Рис. 6. Структурная схема чипсета Intel H67 Express

Чипсеты для мобильных ПК

Из пяти чипсетов для мобильных ПК модели QM67 иQS67 ориентированы на корпоративный сегмент рынка и в ноутбуках для домашних пользователей встречаться не будут. А вот чипсеты HM67, HM65 и UM67 будут использоваться как раз в ноутбуках для домашних пользователей.

Вообще, если посмотреть на характеристики всех мобильных чипсетов (см. табл. 3), то можно заметить, что их характеристики различаются весьма незначительно. К примеру, чипсеты HM67 и UM67 отличаются друг от друга лишь разницей в энергопотреблении в 0,5 Вт, а их функциональные возможности полностью совпадают.

Все мобильные чипсеты имеют шину Intel FDI (Flexible Display Interface) и поддерживают интегрированный в процессор графический контроллер. Кроме того, эти чипсеты поддерживают выходы DVI, VGA, Display Port, HDMI 1.4 и LVD. Кроме того, поддерживаются технологии Intel Wireless Display, PAVP и SDVO.

Чипсеты QM67, QS67, HM67 и UM67 поддерживают 14 портов USB 2.0, а чипсет HM65 - только 12 портов. Однако напомним, что речь идет о ноутбуках и физически реализовать более четырех портов USB весьма проблематично. Так что разницу в количестве поддерживаемых портов USB в данном случае можно не принимать во внимание.

Кроме того, все мобильные чипсеты имеют встроенный 6-портовый SATA-контроллер, который поддерживает два порта SATA 6 Гбит/с (SATA III) и четыре порта SATA 3 Гбит/с (SATA II). В чипсетах QM67, QS67 и HM67 поддерживается технология Intel RST с возможностью создания RAID-массивов уровней 0 и 1, а чипсеты QM67 и HM67 поддерживают также создание RAID-массивов уровней 5 и 10, правда не очень понятно, зачем это нужно в ноутбуках.

Все мобильные чипсеты поддерживают восемь полноскоростных линий PCI Express 2.0, которые могут использоваться интегрированными контроллерами. Отметим также, что в мобильные чипсеты встроен MAC-уровень гигабитного сетевого контроллера.

Технические характеристики всех мобильных чипсетов представлены в

Отличие между «полностью» и «частично» разблокированными процессорами

Что в результате? Опробовав Turbo Boost на прошлых поколениях процессоров, Intel решила сделать из него инструмент для реального ценового позиционирования своих продуктов друг относительно друга. Если раньше энтузиасты чаще всего покупали младшие процессоры в серии, зачастую легко разгоняя их до уровня старших моделей, то теперь разница в 400 МГц между i3-2100 и i3-2120 стоит 21 доллар США, и ничего вы с этим не сделаете.

Оба разблокированных процессора будут стоить немного дороже, чем обычные модели. Разница эта будет меньше, чем в случае предыдущих поколений - $11 для 2500 модели и $23 для 2600. Intel всё же не хочет слишком сильно отпугивать оверклокеров. Однако теперь $216 - это порог для вступления в клуб. Разгон - развлечение, за которое нужно платить. Понятно, что такая позиция может перетянуть некоторых пользователей в стан AMD, у которой бюджетные процессоры разгоняются очень неплохо.

Сам разгон в целом стал проще - снизились требования к материнской плате и оперативной памяти, меньше мороки с таймингами и различными коэффициентами. Но экстремальщикам есть, где развернуться - про подстройку BCLK наверняка будут написаны целые трактаты.

Графическое ядро и Quick Sync

Intel начала подтягивать производительность своего встроенного графического ядра еще с анонсом Clarkdale и Arrandale, но в тот раз обогнать конкурентов не получилось. Дальнейшую планку установила компания AMD, которая собирается уничтожить рынок дискретной графики начального уровня. Решение Intel появилось раньше, но сможет ли оно справиться с поставленной задачей?

Начнем с того, что решений два. Называются они HD 2000 и HD 3000, а отличие между ними заключается в различном количестве исполнительных блоков (EU). В первом случае их 6, а во втором - 12. 12 их было и у GMA HD, но рост производительности за счет интеграции и переработанной архитектуры получился очень значительный. В модельном ряду настольных процессоров Intel продвинутой графики удостоилась только пара процессоров с разблокированным множителем. Это именно те модели, в которых встроенная графика будет использоваться с наименьшей вероятностью. Такое решение кажется нам очень странным. Остается надеяться, что в будущем Intel выпустит также модификации младших процессоров с полностью разблокированным графическим ядром.

К счастью, все новые мобильные процессоры компании оснащаются HD 3000. Intel твердо решила изо всех сил давить на конкурентов в этом сегменте, ведь достигнуть уровня производительности решений начального уровня здесь должно быть проще.

Производительность встроенной графики зависит не только от количества EU. Все десктопные Sandy обладают одинаковой базовой частотой (850 МГц), но у старших (2600 и 2600K) выше максимальная частота Turbo Boost - 1350 МГц против 1100 у остальных. На результате также будет в некоторой степени сказываться мощность вычислительных ядер CPU, но куда сильнее - объем его кэш-памяти. Ведь одной из основных особенностей новой графики является совместное с вычислительными ядрами использование кэш-памяти третьего уровня, реализованное благодаря кольцевой шине LLC.

Как и в процессорах Clarkdale, в новинках используется аппаратное ускорение для декодирования MPEG, VC-1 и AVC. Однако процесс этот теперь осуществляется существенно быстрее. Как и во «взрослой» дискретной графике, в процессорах Sandy Bridge есть отдельный блок, занимающийся кодированием/декодированием видео. В отличие от процессоров прошлого поколения, он полностью берет на себя эту задачу. Использование аппаратного ускорения гораздо выгоднее с точки зрения энергоэффективности, да и производительность в случае SNB оказывается очень высокой. Intel обещает возможность одновременного декодирования более двух 1080p потоков. Такая производительность может быть нужна для быстрого перекодирования имеющегося видео в подходящий для мобильного устройства формат. К тому же богатые мультимедийные возможности делают SNB лучшим выбором при построении HTPC-системы.

Разработкой графических решений для процессоров Intel занимается отдельное подразделение компании. Новые разработки этого подразделения также очень актуальны для мобильных процессоров компании. Пока проект Larrabee в том или ином виде не получит должного развития, Intel придется мириться с «не-x86» компонентами в своих CPU.

Intel Core i5-2400 и Core i5-2500K

К нам попало 2 процессора, основанных на архитектуре Sandy Bridge. Интерес в первую очередь представляет модель 2500K, так как она обладает разблокированным множителем. В будущем, возможно, отдельно будут опубликованы бенчмарки двухъядерных моделей и процессоров серии i7.

Похожие статьи