Содержание статьи
Текущее положение на рынке серверных ЦП
Сегодня обработка данных чаще всего производится на стороне сервера. Клиентские устройства (планшеты, ПК, ноутбуки, смартфоны), количество которых растет в геометрической прогрессии, только получают результат. Поэтому рынок серверов постоянно растет, а сами серверы становятся все быстрее. Это ставит сразу несколько проблем. С одной стороны, количество мест для установки уменьшается, растет энергопотребление и необходимость в отводе тепла. Частично проблема решается за счет увеличения плотности серверов в стойке и более эффективной системы управления энергопотреблением (как правило, CPU). Однако любой современный сервер состоит из большого числа жестких дисков, сетевых устройств и прочих интерфейсов. Все они в масштабах дата‑центра тратят впустую сотни мегаватт. С другой стороны, разные приложения требуют свою нагрузку, для одних ее рассчитать очень проблемно и железо берут на вырост, для других она определена более точно. В последнее время проблему запаса мощности решали при помощи виртуализации, навешивая на один сервер десятки VM. Но это опять же добавляет стоимости и увеличивает сложность в администрировании. Идеала, как видим, нет. Нужны небольшие, экономичные системы, которые можно включать по мере необходимости.
Именно поэтому в 2013 году все больший интерес стала вызывать новая концепция микросерверов, которые представляют собой экономичные по питанию модули, созданные по технологии system on a chip (SoC). То есть готовое одночиповое решение с низкой латентностью многих операций, к которому необходимо лишь добавить ОЗУ, HDD и подключить сеть. Как правило, SoC уже содержит несколько гигабитных Ethernet-портов и PCIe.
Такие серверы очень востребованы для легких нишевых задач, там, где нет нужды в больших вычислительных мощностях или характеристики заранее известны (веб‑приложения, хостинг начального уровня, Memcached, управление сетью, хранение данных и тому подобное). Например, провайдер, вместо того чтобы «нарезать» VDS, может просто добавить в слот новый сервер нужной мощности. То есть микросервер — это тонкий инструмент, разрабатываемый под конкретные нагрузки, что его отличает от традиционного подхода, пропагандируемого Intel сегодня. Миниатюрность и меньшее энергопотребление позволяет уменьшить количество блоков питания, вентиляторов охлаждения и проводов. Например, 1600 микросерверов Calxeda EnergyCore занимают половину стандартной серверной стойки и стоят на 63% дешевле, чем обычная стойка с серверами такой же мощности. Если необходима большая мощность, такие миниатюрные серверы можно объединять в кластеры, распараллеливая вычисления. Именно так сегодня представляют дата‑центы будущего. Хотя следует отметить, что в категории микросерверов не существует универсального системного дизайна. Поэтому здесь можно встретить разные конфигурации, различной мощности и возможностей.
Прогнозы специалистов расходятся. В исследованиях компании IC Insights подсчитали, что продажи микросерверов в период с 2014 до 2017 года будут расти ежегодно в среднем на 70% (в 2014-м на 139%). Аналитики Intel (которая, кстати, продает 92% серверных процессоров) считают, что микросерверы будут занимать незначительную часть рынка (до 6%), Gartner дает цифру до 15%.
ЦП для микросерверов
Новая идея требует иного оборудования. Стандартные серверные процессоры AMD Opteron и Intel Xeon для микросерверов не подходят. Компании выпустили специальные продукты. Так, Intel представила однокристальные системы линейки Intel Atom S1200 (ранее известные как Centerton), предназначенные для использования в микросерверах, системах хранения данных и сетевом оборудовании. Новое семейство процессоров изготавливается по техпроцессу 32 нм и будет включать три модели процессоров с тактовой частотой от 1,6 до 2,0 ГГц. Среди ключевых особенностей новых SoC Intel называет поддержку 64-битных приложений и наличие соответствующего набора микрокоманд, поддержку ECC и VT-x. Однокристальная система имеет два физических ядра и поддерживает четыре вычислительных потока благодаря технологии Intel Hyper-Threading. Она также имеет контроллер памяти с поддержкой до 8 Гб памяти DDR3 (на каждый CPU) и восемь каналов PCI Express 2.0. Это пока не совсем SoC, например, мы видим, что нет Ethernet и USB, они появятся на чипе только в следующем поколении 22 нм чипов Atom Avoton (платформа Edisonville), которые планируется представить в следующем году. При этом Avoton будет содержать от 2 до 8 ядер, кеш‑память второго уровня 1 Мб будет распределена между каждой парой ядер. Максимальная частота CPU ожидается в 2,4 ГГц, при помощи специальной технологии Turbo Boost можно увеличить ее до 2,7 ГГц. Уровень энергопотребления новинок будет лежать в пределах 5–20 Вт.
Но самое главное — низкое энергопотребление: значения TDP колеблются от 6,1 до 8,5 Вт в зависимости от модели. Самая доступная однокристальная система новой линейки — Atom S1220, ее оптовая цена объявлена равной 54 долларам, самая дорогая платформа, Atom S1260, оценена в 64 доллара. Для примера: TDP Intel Xeon E5 на основе дизайна Sandy Bridge-EP составляет от 60 до 150 Вт и стоит от 202 до 2614 долларов. По данным Intel, серия Atom S1200 используется в микросерверах и сетевом оборудовании таких компаний, как Accusys, CETC, Dell, HP, Huawei, Inspur, Microsan, Qsan, Quanta, Supermicro и Wiwynn. Не секрет, что Atom многие считали не очень удачным для встроенных устройств, в первую очередь из‑за софта, но вот для серверов такой проблемы нет, поэтому у Intel есть все основания полагать, что линейка S1200 будет весьма популярна. Но и конкуренты не спят.
AMD представила процессоры AMD Opteron серии X Kyoto архитектуры x86, которые стали обеспечивать очень высокую плотность и энергоэффективность. Поставляются в двух вариантах. Например, AMD Opteron X2150 является серверным однокристальным гибридным процессором, в котором сочетаются CPU и GPU (на базе AMD Radeon HD 8000, до 128), версия X1150 не содержит GPU. Ориентируются X2150 для обработки мультимедиа, X1150 для распределенных нагрузок и SoC-серверов. Используется ядро x86, известное как Jaguar, которое содержит четыре ядра, работающих с частотой 2 ГГц, кеш L2 2 Мб, встроенный порт SATA (у S1200 его нет) и поддерживает до 32 Гб DRAM на CPU. По CPU-тестам производительность Opteron X в два раза выше Atom S. При этом TDP составляет 22 Вт. Доступны по цене 99 и 64 доллара.
Но новый тренд привел к тому, что стали возрождаться MIPS- и RISC-процессоры. Например, AMD еще полтора года назад объявила о разработке Opteron A-серии (Seattle) с весьма интересными характеристиками: четыре и восемь ядер x64, тактовая частота выше 2 ГГц, поддержка 128 Гб DRAM. В начале 2014 года обществу был представлен AMD Opteron A1100, в котором используются первые реализации 64-битного чипа ARM Cortex-A57, выполненные по техпроцессу 28 нм и работающие на частоте выше 2 ГГц. Старшая модель будет содержать восемь ядер, 8 Мб кеш‑памяти третьего уровня и поддерживать до 128 Гб ОЗУ с ECC. Причем для Opteron А1100 AMD специально разработала новый контроллер памяти, способный поддерживать как DDR3, так и DDR4. Каждая пара ядер разделяет кеш 1 Мб L2, в общей сложности до 4 Мб кеш‑памяти L2 для чипа. В них также будет встроена поддержка двух портов Ethernet 10 Гбит/с и восьми портов SATA 6 Гбит/с (SoC способен обеспечить полную полосу пропускания для всех восьми SATA). Как видим, графических ядер в составе этих решений нет, и в ближайшее время не планируется. Данная разработка предназначается для высокоинтегрированных SoC и оптимизирована для плотных, энергетически эффективных серверов. Изготавливается Opteron A по техпроцессу 28 нм, поэтому у него отличное соотношение производительности к потребляемой мощности — TDP равна 25 Вт. Стоимость ожидают в районе 100 долларов. По данным производителя, восемь ядер Opteron A1100 обеспечивают производительность в 2–4 раза выше, чем у четырехъядерного процессора Opteron X2150, при равной стоимости и TDP.
Серверы на базе нового чипа, как ожидается, будут объявлены в четвертом квартале 2014 года. Параллельно AMD передает проекту Open Compute Project спецификацию нового микросервера — AMD Open CS 1.0 Common Slot и сотрудничает с лидерами отрасли в создании экосистемы 64-разрядного ПО для систем на архитектуре ARM: компиляторы, эмуляторы, гипервизоры, ОС и прикладные программы, для всех возможных задач, решаемых серверами в вычислительных центрах. Такой шаг вполне способствует его дальнейшему продвижению другими разработчиками. Так что процессоры AMD с ядром ARM в ближайшее время вряд ли встретим в планшетах, но зато они вполне смогут обеспечить работу облачного сервиса.
Кстати, пару лет назад AMD планировала покупку MIPS Technologies, которой принадлежат лицензии на архитектуру MIPS, но в 2013 году большая часть патентов была передана Bridge Crossing (ARM один из членов).
Три волшебные буквы ARM
Первые чипы ARM появились в апреле 1985 года стараниями британской компании Acorn Computers (сейчас ARM Limited). Но долгое время в популярности уступали универсальным х86, хотя отличались энергоэффективностью и в некоторых задачах большей производительностью. Например, Citrix считает, что Xen работает на ARM лучше, чем на Intel. Также чипы ARM популярны во встраиваемых системах, сетевом оборудовании, платежных терминалах и разного рода измерительных приборах. Но все изменилось с массовым появлением мобильных гаджетов, в 90% которых сегодня используются именно разработки ARM. За основу ARM взята 32-битная RISC-архитектура (отсюда и сокращение Advanced или Acorn RISC Machine), которая была и упрощена и усложнена одновременно, но, по сути, также использовала набор простых команд, обрабатываемых с минимальными затратами. В отличие от традиционных CPU, ARM — это не процессор, это чип или SoC, который может содержать все необходимое: контроллер RAM, графический ускоритель, видео- и аудиодекодер, сетевые модули и USB. Здесь, кстати, нужно понимать, что сам набор инструкций ARM не сильно влияет на энергопотребление. Главная суть низкой TDP — именно использование архитектуры SoC.
Сегодня ARM Limited занимается в основном разработкой и лицензированием процессорных архитектур, отдав создание конкретных моделей чипов или отдельных компонентов сторонним компаниям. Например, компании Qualcomm и Apple создали собственные модификации на основе ARMv7, которые получили название Scorpion, Krait и Swift. Самая современная разработка — чип Cortex-А57 на сегодня лицензирован в AMD, Broadcom, HiSilicon, STMicroelectronics, Samsung, MediaTek и Huawei.
Начиная с ARM7 определены три профиля, поддерживающих свой набор инструкций, позволяющие легко определить назначение чипа:
- A (Application) — для высокопроизводительных устройств, выполняющих тяжелые приложения;
- R (real time) — для приложений, работающих в реальном времени;
- M (microcontroller) — для встраиваемых устройств и микроконтроллеров.
За почти 30 лет было разработано несколько поколений ARM и расширений набора команд. Кроме стандартных 32-битных инструкций, появился, например, режим Thumb (T32), позволяющий выполнять 16-битный набор инструкций. В 2003 году он был расширен Thumb-2 с дополнительными 32-битными командами, позволяя достичь обычной производительности ARM при выполнении 16-битных инструкций. Технология Jazelle (чипы с индексом J) позволяет байт‑коду Java исполняться непосредственно в архитектуре ARM. Кроме этого, набор команд может быть расширен при помощи сопроцессоров. Вот некоторые из них:
- технология NEON, представляет собой комбинированный 64- и 128-битный набор команд SIMD (Single Instruction Multiple Data), обеспечивающий ускорение для медиаприложений и обработки сигнала. В частности, с его помощью можно декодировать MP3 и работать с речевым кодеком GSM AMR;
- расширение сопроцессора VFP (Vector Floating Point, вектора чисел с плавающей запятой) — производит низкозатратные вычисления над числами с плавающей запятой одинарной/двойной точности, соответствующие стандарту ANSI/IEEE Std 754—1985. И используется в широком спектре приложений для обработки звука, трехмерной графики и так далее;
- TrustZone Technology — расширения безопасности (от ARMv6KZ и более поздних) — обеспечивает простую альтернативу добавлению специального ядра безопасности, обеспечивая два виртуальных процессора, поддерживаемых аппаратным контролем доступа. Ядра приложения могут переключаться между двумя состояниями (называются миры), обеспечивая защиту информации.
Позже появились процессоры с двумя и более ядрами. В Cortex A9 два ядра, а в A15 — четыре. В итоге чипам Cortex-A15 уже удалось сравняться по быстродействию с Intel Atom.
Несмотря на то что в x86 уже давно перешли на 64-битную архитектуру, ARM не спешила с таким шагом. Сама по себе разрядность мало сказывается на производительности, а необходимости в адресации памяти более 4 Гб не было. Хотя в 2010 году в ARMv7 (Cortex-A15 и Cortex-A7) было представлено расширение LPAE (Large Physical Address Extension), предназначенное для более эффективного управления гипервизорами и разделения данных. Оно позволяло адресовать память, большую 4 Гб. Но приложения, нуждающиеся в такой адресации, фактически отсутствовали. Сегодня ситуация изменилась, все больше и больше ОС и приложений стали доступными только в 64-битной сборке. Поэтому в октябре 2011-го представлена архитектура ARMv8-A, содержащая определение AArch64, позволяющее выполнять 64-битные команды. Допускается исполнение 32-битных приложений в 64-битной ОС и запуск виртуализованной 32-битной ОС при помощи 64-битного гипервизора. Кроме этого, в ARMv8-A добавлены криптографические инструкции для работы с AES, SHA-1 и SHA-256.
В настоящее время ARMv8-A реализована в высокопроизводительных чипах серии Cortex-A50, представленной двумя наработками: Cortex-A53 и Cortex-A57. Первый — энергоэффективный, а второй — высокопроизводительный, но оба способны работать с большими объемами оперативной памяти.
Процессоры с ядрами ARM Cortex-A57 соответствуют стандартам Open Compute Project и Common Slot Architecture, продвигаемым Facebook. Это позволяет использовать их вместе с традиционными процессорами семейства x86 на существующих ОС уже сейчас, пока не появилось оптимизированное ПО. Также в январе 2014-го ARM выпустила спецификацию Server Base System Architecture (SBSA), разработанную совместно с производителями ОС и ПО (Canonical, Citrix, Linaro, Microsoft, Red Hat и SUSE) и оборудования (Dell, HP, Broadcom). В SBSA определяются минимальные стандарты для лучшей совместимости, переносимости и интеграции в действующие дата‑центры.
Как обычно, поначалу большую проблему развития представляет низкая готовность софтверной части. В этом направлении работа ведется, драйверы пишут уже сейчас, происходит адаптация SDK и портирование программ. Понятно, что на это уйдут месяцы. Но в случае ARM сильно выручают кросс‑платформенные решения, которые могут выполняться на любой аппаратной платформе.
Архитектура ARM поддерживается множеством операционных систем. Например, ARMv8 поддерживается в ядре Linux начиная с версии 3.7. Все недавние релизы Ubuntu 14.04 LTS и Red Hat поддерживают 64-битную ARM. Кроме этого, ARM будет работать в BSD (FreeBSD, NetBSD, OpenBSD), QNX, Android и других.
Вывод
В 2013 году было продано около 13 миллионов серверных процессоров x86 и более 8 миллиардов процессоров ARM. По мнению AMD, через пять лет 25% всех серверов в мире будут работать на платформе ARM. Хотя никто из специалистов не решается спрогнозировать, что будет с рынком вообще. Пока ARM при продвижении на рынок сталкивается, по сути, с теми же проблемами, которые испытала и Intel при попытке ворваться на рынок мобильных процессоров. Здесь придется действовать против сильного конкурента, который хорошо закрепился и имеет глубокие связи с клиентами. Но участие AMD, имеющих свою базу клиентов, вполне может сыграть положительную роль в увеличении спроса. Поэтому вполне вероятно, что 64-битный производительный и энергоэкономный чип найдет своего покупателя. Во всяком случае, ARM рассчитывает в течение пяти лет получить 40%-ю долю рынка чипов для масштабируемых веб‑серверов (около 10 миллиардов долларов).