Не­боль­шой опти­мизи­рован­ный набор команд чипов ARM иде­ален для мобиль­ных устрой­ств. Бла­года­ря мень­шему энер­гопот­ребле­нию он сегод­ня очень популя­рен для исполь­зования в смар­тфо­нах и план­шетах. Но в пос­леднее вре­мя серь­езно загово­рили о при­ходе чипов ARM в ту сфе­ру, в которой без­раздель­но гос­подс­тву­ет Intel, — на сер­веры.
 

Текущее положение на рынке серверных ЦП

Се­год­ня обра­бот­ка дан­ных чаще все­го про­изво­дит­ся на сто­роне сер­вера. Кли­ент­ские устрой­ства (план­шеты, ПК, ноут­буки, смар­тфо­ны), количес­тво которых рас­тет в геомет­ричес­кой прог­рессии, толь­ко получа­ют резуль­тат. Поэто­му рынок сер­веров пос­тоян­но рас­тет, а сами сер­веры ста­новят­ся все быс­трее. Это ста­вит сра­зу нес­коль­ко проб­лем. С одной сто­роны, количес­тво мест для уста­нов­ки умень­шает­ся, рас­тет энер­гопот­ребле­ние и необ­ходимость в отво­де теп­ла. Час­тично проб­лема реша­ется за счет уве­личе­ния плот­ности сер­веров в стой­ке и более эффектив­ной сис­темы управле­ния энер­гопот­ребле­нием (как пра­вило, CPU). Одна­ко любой сов­ремен­ный сер­вер сос­тоит из боль­шого чис­ла жес­тких дис­ков, сетевых устрой­ств и про­чих интерфей­сов. Все они в мас­шта­бах дата‑цен­тра тра­тят впус­тую сот­ни мегаватт. С дру­гой сто­роны, раз­ные при­ложе­ния тре­буют свою наг­рузку, для одних ее рас­счи­тать очень проб­лемно и железо берут на вырост, для дру­гих она опре­деле­на более точ­но. В пос­леднее вре­мя проб­лему запаса мощ­ности решали при помощи вир­туали­зации, навеши­вая на один сер­вер десят­ки VM. Но это опять же добав­ляет сто­имос­ти и уве­личи­вает слож­ность в адми­нис­три­рова­нии. Иде­ала, как видим, нет. Нуж­ны неболь­шие, эко­номич­ные сис­темы, которые мож­но вклю­чать по мере необ­ходимос­ти.

Имен­но поэто­му в 2013 году все боль­ший инте­рес ста­ла вызывать новая кон­цепция мик­росер­веров, которые пред­став­ляют собой эко­номич­ные по питанию модули, соз­данные по тех­нологии system on a chip (SoC). То есть готовое одно­чипо­вое решение с низ­кой латен­тностью мно­гих опе­раций, к которо­му необ­ходимо лишь добавить ОЗУ, HDD и под­клю­чить сеть. Как пра­вило, SoC уже содер­жит нес­коль­ко гигабит­ных Ethernet-пор­тов и PCIe.

Микросервер
Мик­росер­вер

Та­кие сер­веры очень вос­тре­бова­ны для лег­ких нишевых задач, там, где нет нуж­ды в боль­ших вычис­литель­ных мощ­ностях или харак­терис­тики заранее извес­тны (веб‑при­ложе­ния, хос­тинг началь­ного уров­ня, Memcached, управле­ние сетью, хра­нение дан­ных и тому подоб­ное). Нап­ример, про­вай­дер, вмес­то того что­бы «нарезать» VDS, может прос­то добавить в слот новый сер­вер нуж­ной мощ­ности. То есть мик­росер­вер — это тон­кий инс­тру­мент, раз­рабаты­ваемый под кон­крет­ные наг­рузки, что его отли­чает от тра­дици­онно­го под­хода, про­паган­диру­емо­го Intel сегод­ня. Мини­атюр­ность и мень­шее энер­гопот­ребле­ние поз­воля­ет умень­шить количес­тво бло­ков питания, вен­тилято­ров охлажде­ния и про­водов. Нап­ример, 1600 мик­росер­веров Calxeda EnergyCore занима­ют полови­ну стан­дар­тной сер­верной стой­ки и сто­ят на 63% дешев­ле, чем обыч­ная стой­ка с сер­верами такой же мощ­ности. Если необ­ходима боль­шая мощ­ность, такие мини­атюр­ные сер­веры мож­но объ­еди­нять в клас­теры, рас­парал­леливая вычис­ления. Имен­но так сегод­ня пред­став­ляют дата‑цен­ты будуще­го. Хотя сле­дует отме­тить, что в катего­рии мик­росер­веров не сущес­тву­ет уни­вер­саль­ного сис­темно­го дизай­на. Поэто­му здесь мож­но встре­тить раз­ные кон­фигура­ции, раз­личной мощ­ности и воз­можнос­тей.

Прог­нозы спе­циалис­тов рас­ходят­ся. В иссле­дова­ниях ком­пании IC Insights под­счи­тали, что про­дажи мик­росер­веров в пери­од с 2014 до 2017 года будут рас­ти еже­год­но в сред­нем на 70% (в 2014-м на 139%). Ана­лити­ки Intel (которая, кста­ти, про­дает 92% сер­верных про­цес­соров) счи­тают, что мик­росер­веры будут занимать нез­начитель­ную часть рын­ка (до 6%), Gartner дает циф­ру до 15%.

 

ЦП для микросерверов

Но­вая идея тре­бует ино­го обо­рудо­вания. Стан­дар­тные сер­верные про­цес­соры AMD Opteron и Intel Xeon для мик­росер­веров не под­ходят. Ком­пании выпус­тили спе­циаль­ные про­дук­ты. Так, Intel пред­ста­вила однокрис­таль­ные сис­темы линей­ки Intel Atom S1200 (ранее извес­тные как Centerton), пред­назна­чен­ные для исполь­зования в мик­росер­верах, сис­темах хра­нения дан­ных и сетевом обо­рудо­вании. Новое семей­ство про­цес­соров изго­тав­лива­ется по тех­про­цес­су 32 нм и будет вклю­чать три модели про­цес­соров с так­товой час­тотой от 1,6 до 2,0 ГГц. Сре­ди клю­чевых осо­бен­ностей новых SoC Intel называ­ет под­дер­жку 64-бит­ных при­ложе­ний и наличие соот­ветс­тву­юще­го набора мик­рокоманд, под­дер­жку ECC и VT-x. Однокрис­таль­ная сис­тема име­ет два физичес­ких ядра и под­держи­вает четыре вычис­литель­ных потока бла­года­ря тех­нологии Intel Hyper-Threading. Она так­же име­ет кон­трол­лер памяти с под­дер­жкой до 8 Гб памяти DDR3 (на каж­дый CPU) и восемь каналов PCI Express 2.0. Это пока не сов­сем SoC, нап­ример, мы видим, что нет Ethernet и USB, они появят­ся на чипе толь­ко в сле­дующем поколе­нии 22 нм чипов Atom Avoton (плат­форма Edisonville), которые пла­ниру­ется пред­ста­вить в сле­дующем году. При этом Avoton будет содер­жать от 2 до 8 ядер, кеш‑память вто­рого уров­ня 1 Мб будет рас­пре­деле­на меж­ду каж­дой парой ядер. Мак­сималь­ная час­тота CPU ожи­дает­ся в 2,4 ГГц, при помощи спе­циаль­ной тех­нологии Turbo Boost мож­но уве­личить ее до 2,7 ГГц. Уро­вень энер­гопот­ребле­ния новинок будет лежать в пре­делах 5–20 Вт.

Но самое глав­ное — низ­кое энер­гопот­ребле­ние: зна­чения TDP колеб­лются от 6,1 до 8,5 Вт в зависи­мос­ти от модели. Самая дос­тупная однокрис­таль­ная сис­тема новой линей­ки — Atom S1220, ее опто­вая цена объ­явле­на рав­ной 54 дол­ларам, самая дорогая плат­форма, Atom S1260, оце­нена в 64 дол­лара. Для при­мера: TDP Intel Xeon E5 на осно­ве дизай­на Sandy Bridge-EP сос­тавля­ет от 60 до 150 Вт и сто­ит от 202 до 2614 дол­ларов. По дан­ным Intel, серия Atom S1200 исполь­зует­ся в мик­росер­верах и сетевом обо­рудо­вании таких ком­паний, как Accusys, CETC, Dell, HP, Huawei, Inspur, Microsan, Qsan, Quanta, Supermicro и Wiwynn. Не сек­рет, что Atom мно­гие счи­тали не очень удач­ным для встро­енных устрой­ств, в пер­вую оче­редь из‑за соф­та, но вот для сер­веров такой проб­лемы нет, поэто­му у Intel есть все осно­вания полагать, что линей­ка S1200 будет весь­ма популяр­на. Но и кон­курен­ты не спят.

AMD пред­ста­вила про­цес­соры AMD Opteron серии X Kyoto архи­тек­туры x86, которые ста­ли обес­печивать очень высокую плот­ность и энер­гоэф­фектив­ность. Пос­тавля­ются в двух вари­антах. Нап­ример, AMD Opteron X2150 явля­ется сер­верным однокрис­таль­ным гиб­ридным про­цес­сором, в котором сочета­ются CPU и GPU (на базе AMD Radeon HD 8000, до 128), вер­сия X1150 не содер­жит GPU. Ори­енти­руют­ся X2150 для обра­бот­ки муль­тимедиа, X1150 для рас­пре­делен­ных наг­рузок и SoC-сер­веров. Исполь­зует­ся ядро x86, извес­тное как Jaguar, которое содер­жит четыре ядра, работа­ющих с час­тотой 2 ГГц, кеш L2 2 Мб, встро­енный порт SATA (у S1200 его нет) и под­держи­вает до 32 Гб DRAM на CPU. По CPU-тес­там про­изво­дитель­ность Opteron X в два раза выше Atom S. При этом TDP сос­тавля­ет 22 Вт. Дос­тупны по цене 99 и 64 дол­лара.

Но новый тренд при­вел к тому, что ста­ли воз­рождать­ся MIPS- и RISC-про­цес­соры. Нап­ример, AMD еще пол­тора года назад объ­яви­ла о раз­работ­ке Opteron A-серии (Seattle) с весь­ма инте­рес­ными харак­терис­тиками: четыре и восемь ядер x64, так­товая час­тота выше 2 ГГц, под­дер­жка 128 Гб DRAM. В начале 2014 года общес­тву был пред­став­лен AMD Opteron A1100, в котором исполь­зуют­ся пер­вые реали­зации 64-бит­ного чипа ARM Cortex-A57, выпол­ненные по тех­про­цес­су 28 нм и работа­ющие на час­тоте выше 2 ГГц. Стар­шая модель будет содер­жать восемь ядер, 8 Мб кеш‑памяти треть­его уров­ня и под­держи­вать до 128 Гб ОЗУ с ECC. При­чем для Opteron А1100 AMD спе­циаль­но раз­работа­ла новый кон­трол­лер памяти, спо­соб­ный под­держи­вать как DDR3, так и DDR4. Каж­дая пара ядер раз­деля­ет кеш 1 Мб L2, в общей слож­ности до 4 Мб кеш‑памяти L2 для чипа. В них так­же будет встро­ена под­дер­жка двух пор­тов Ethernet 10 Гбит/с и вось­ми пор­тов SATA 6 Гбит/с (SoC спо­собен обес­печить пол­ную полосу про­пус­кания для всех вось­ми SATA). Как видим, гра­фичес­ких ядер в сос­таве этих решений нет, и в бли­жай­шее вре­мя не пла­ниру­ется. Дан­ная раз­работ­ка пред­назна­чает­ся для высоко­интегри­рован­ных SoC и опти­мизи­рова­на для плот­ных, энер­гетичес­ки эффектив­ных сер­веров. Изго­тав­лива­ется Opteron A по тех­про­цес­су 28 нм, поэто­му у него отличное соот­ношение про­изво­дитель­нос­ти к пот­ребля­емой мощ­ности — TDP рав­на 25 Вт. Сто­имость ожи­дают в рай­оне 100 дол­ларов. По дан­ным про­изво­дите­ля, восемь ядер Opteron A1100 обес­печива­ют про­изво­дитель­ность в 2–4 раза выше, чем у четырехъ­ядер­ного про­цес­сора Opteron X2150, при рав­ной сто­имос­ти и TDP.

Сравнение AMD Opteron X2150 и A1100
Срав­нение AMD Opteron X2150 и A1100

Сер­веры на базе нового чипа, как ожи­дает­ся, будут объ­явле­ны в чет­вертом квар­тале 2014 года. Парал­лель­но AMD переда­ет про­екту Open Compute Project спе­цифи­кацию нового мик­росер­вера — AMD Open CS 1.0 Common Slot и сот­рудни­чает с лидера­ми отрасли в соз­дании эко­сис­темы 64-раз­рядно­го ПО для сис­тем на архи­тек­туре ARM: ком­пилято­ры, эму­лято­ры, гипер­визоры, ОС и прик­ладные прог­раммы, для всех воз­можных задач, реша­емых сер­верами в вычис­литель­ных цен­трах. Такой шаг впол­не спо­собс­тву­ет его даль­нейше­му прод­вижению дру­гими раз­работ­чиками. Так что про­цес­соры AMD с ядром ARM в бли­жай­шее вре­мя вряд ли встре­тим в план­шетах, но зато они впол­не смо­гут обес­печить работу облачно­го сер­виса.

Кста­ти, пару лет назад AMD пла­ниро­вала покуп­ку MIPS Technologies, которой при­над­лежат лицен­зии на архи­тек­туру MIPS, но в 2013 году боль­шая часть патен­тов была переда­на Bridge Crossing (ARM один из чле­нов).

 

Три волшебные буквы ARM

Пер­вые чипы ARM появи­лись в апре­ле 1985 года ста­рани­ями бри­тан­ской ком­пании Acorn Computers (сей­час ARM Limited). Но дол­гое вре­мя в популяр­ности усту­пали уни­вер­саль­ным х86, хотя отли­чались энер­гоэф­фектив­ностью и в некото­рых задачах боль­шей про­изво­дитель­ностью. Нап­ример, Citrix счи­тает, что Xen работа­ет на ARM луч­ше, чем на Intel. Так­же чипы ARM популяр­ны во встра­иваемых сис­темах, сетевом обо­рудо­вании, пла­теж­ных тер­миналах и раз­ного рода изме­ритель­ных при­борах. Но все изме­нилось с мас­совым появ­лени­ем мобиль­ных гад­жетов, в 90% которых сегод­ня исполь­зуют­ся имен­но раз­работ­ки ARM. За осно­ву ARM взя­та 32-бит­ная RISC-архи­тек­тура (отсю­да и сок­ращение Advanced или Acorn RISC Machine), которая была и упро­щена и усложне­на одновре­мен­но, но, по сути, так­же исполь­зовала набор прос­тых команд, обра­баты­ваемых с минималь­ными зат­ратами. В отли­чие от тра­дици­онных CPU, ARM — это не про­цес­сор, это чип или SoC, который может содер­жать все необ­ходимое: кон­трол­лер RAM, гра­фичес­кий уско­ритель, видео- и ауди­оде­кодер, сетевые модули и USB. Здесь, кста­ти, нуж­но понимать, что сам набор инс­трук­ций ARM не силь­но вли­яет на энер­гопот­ребле­ние. Глав­ная суть низ­кой TDP — имен­но исполь­зование архи­тек­туры SoC.

Се­год­ня ARM Limited занима­ется в основном раз­работ­кой и лицен­зирова­нием про­цес­сорных архи­тек­тур, отдав соз­дание кон­крет­ных моделей чипов или отдель­ных ком­понен­тов сто­рон­ним ком­пани­ям. Нап­ример, ком­пании Qualcomm и Apple соз­дали собс­твен­ные модифи­кации на осно­ве ARMv7, которые получи­ли наз­вание Scorpion, Krait и Swift. Самая сов­ремен­ная раз­работ­ка — чип Cortex-А57 на сегод­ня лицен­зирован в AMD, Broadcom, HiSilicon, STMicroelectronics, Samsung, MediaTek и Huawei.

Лицензирование Cortex-А57
Ли­цен­зирова­ние Cortex-А57

На­чиная с ARM7 опре­деле­ны три про­филя, под­держи­вающих свой набор инс­трук­ций, поз­воля­ющие лег­ко опре­делить наз­начение чипа:

  • A (Application) — для высокоп­роиз­водитель­ных устрой­ств, выпол­няющих тяжелые при­ложе­ния;
  • R (real time) — для при­ложе­ний, работа­ющих в реаль­ном вре­мени;
  • M (microcontroller) — для встра­иваемых устрой­ств и мик­рокон­трол­леров.

За поч­ти 30 лет было раз­работа­но нес­коль­ко поколе­ний ARM и рас­ширений набора команд. Кро­ме стан­дар­тных 32-бит­ных инс­трук­ций, появил­ся, нап­ример, режим Thumb (T32), поз­воля­ющий выпол­нять 16-бит­ный набор инс­трук­ций. В 2003 году он был рас­ширен Thumb-2 с допол­нитель­ными 32-бит­ными коман­дами, поз­воляя дос­тичь обыч­ной про­изво­дитель­нос­ти ARM при выпол­нении 16-бит­ных инс­трук­ций. Тех­нология Jazelle (чипы с индексом J) поз­воля­ет байт‑коду Java исполнять­ся непос­редс­твен­но в архи­тек­туре ARM. Кро­ме это­го, набор команд может быть рас­ширен при помощи соп­роцес­соров. Вот некото­рые из них:

  • тех­нология NEON, пред­став­ляет собой ком­биниро­ван­ный 64- и 128-бит­ный набор команд SIMD (Single Instruction Multiple Data), обес­печива­ющий уско­рение для меди­апри­ложе­ний и обра­бот­ки сиг­нала. В час­тнос­ти, с его помощью мож­но декоди­ровать MP3 и работать с речевым кодеком GSM AMR;
  • рас­ширение соп­роцес­сора VFP (Vector Floating Point, век­тора чисел с пла­вающей запятой) — про­изво­дит низ­козат­ратные вычис­ления над чис­лами с пла­вающей запятой оди­нар­ной/двой­ной точ­ности, соот­ветс­тву­ющие стан­дарту ANSI/IEEE Std 754—1985. И исполь­зует­ся в широком спек­тре при­ложе­ний для обра­бот­ки зву­ка, трех­мерной гра­фики и так далее;
  • TrustZone Technology — рас­ширения безопас­ности (от ARMv6KZ и более поз­дних) — обес­печива­ет прос­тую аль­тер­нативу добав­лению спе­циаль­ного ядра безопас­ности, обес­печивая два вир­туаль­ных про­цес­сора, под­держи­ваемых аппа­рат­ным кон­тро­лем дос­тупа. Ядра при­ложе­ния могут перек­лючать­ся меж­ду дву­мя сос­тояниями (называ­ются миры), обес­печивая защиту информа­ции.

Поз­же появи­лись про­цес­соры с дву­мя и более ядра­ми. В Cortex A9 два ядра, а в A15 — четыре. В ито­ге чипам Cortex-A15 уже уда­лось срав­нять­ся по быс­тро­дей­ствию с Intel Atom.

Нес­мотря на то что в x86 уже дав­но переш­ли на 64-бит­ную архи­тек­туру, ARM не спе­шила с таким шагом. Сама по себе раз­рядность мало ска­зыва­ется на про­изво­дитель­нос­ти, а необ­ходимос­ти в адре­сации памяти более 4 Гб не было. Хотя в 2010 году в ARMv7 (Cortex-A15 и Cortex-A7) было пред­став­лено рас­ширение LPAE (Large Physical Address Extension), пред­назна­чен­ное для более эффектив­ного управле­ния гипер­визора­ми и раз­деления дан­ных. Оно поз­воляло адре­совать память, боль­шую 4 Гб. Но при­ложе­ния, нуж­дающиеся в такой адре­сации, фак­тичес­ки отсутс­тво­вали. Сегод­ня ситу­ация изме­нилась, все боль­ше и боль­ше ОС и при­ложе­ний ста­ли дос­тупны­ми толь­ко в 64-бит­ной сбор­ке. Поэто­му в октябре 2011-го пред­став­лена архи­тек­тура ARMv8-A, содер­жащая опре­деле­ние AArch64, поз­воля­ющее выпол­нять 64-бит­ные коман­ды. Допус­кает­ся исполне­ние 32-бит­ных при­ложе­ний в 64-бит­ной ОС и запуск вир­туали­зован­ной 32-бит­ной ОС при помощи 64-бит­ного гипер­визора. Кро­ме это­го, в ARMv8-A добав­лены крип­тогра­фичес­кие инс­трук­ции для работы с AES, SHA-1 и SHA-256.

Поколения чипов ARM
По­коле­ния чипов ARM

В нас­тоящее вре­мя ARMv8-A реали­зова­на в высокоп­роиз­водитель­ных чипах серии Cortex-A50, пред­став­ленной дву­мя наработ­ками: Cortex-A53 и Cortex-A57. Пер­вый — энер­гоэф­фектив­ный, а вто­рой — высокоп­роиз­водитель­ный, но оба спо­соб­ны работать с боль­шими объ­ема­ми опе­ратив­ной памяти.

Про­цес­соры с ядра­ми ARM Cortex-A57 соот­ветс­тву­ют стан­дартам Open Compute Project и Common Slot Architecture, прод­вига­емым Facebook. Это поз­воля­ет исполь­зовать их вмес­те с тра­дици­онны­ми про­цес­сорами семей­ства x86 на сущес­тву­ющих ОС уже сей­час, пока не появи­лось опти­мизи­рован­ное ПО. Так­же в янва­ре 2014-го ARM выпус­тила спе­цифи­кацию Server Base System Architecture (SBSA), раз­работан­ную сов­мес­тно с про­изво­дите­лями ОС и ПО (Canonical, Citrix, Linaro, Microsoft, Red Hat и SUSE) и обо­рудо­вания (Dell, HP, Broadcom). В SBSA опре­деля­ются минималь­ные стан­дарты для луч­шей сов­мести­мос­ти, перено­симос­ти и интегра­ции в дей­ству­ющие дата‑цен­тры.

Чип Cortex-A57
Чип Cortex-A57

Как обыч­но, понача­лу боль­шую проб­лему раз­вития пред­став­ляет низ­кая готов­ность соф­твер­ной час­ти. В этом нап­равле­нии работа ведет­ся, драй­веры пишут уже сей­час, про­исхо­дит адап­тация SDK и пор­тирова­ние прог­рамм. Понят­но, что на это уйдут месяцы. Но в слу­чае ARM силь­но выруча­ют кросс‑плат­формен­ные решения, которые могут выпол­нять­ся на любой аппа­рат­ной плат­форме.

Ар­хитек­тура ARM под­держи­вает­ся мно­жес­твом опе­раци­онных сис­тем. Нап­ример, ARMv8 под­держи­вает­ся в ядре Linux начиная с вер­сии 3.7. Все недав­ние релизы Ubuntu 14.04 LTS и Red Hat под­держи­вают 64-бит­ную ARM. Кро­ме это­го, ARM будет работать в BSD (FreeBSD, NetBSD, OpenBSD), QNX, Android и дру­гих.

Ubuntu Server 14.04 LTS поддерживает 64-битный ARM
Ubuntu Server 14.04 LTS под­держи­вает 64-бит­ный ARM
 

Вывод

В 2013 году было про­дано око­ло 13 мил­лионов сер­верных про­цес­соров x86 и более 8 мил­лиар­дов про­цес­соров ARM. По мне­нию AMD, через пять лет 25% всех сер­веров в мире будут работать на плат­форме ARM. Хотя ник­то из спе­циалис­тов не реша­ется спрог­нозиро­вать, что будет с рын­ком вооб­ще. Пока ARM при прод­вижении на рынок стал­кива­ется, по сути, с теми же проб­лемами, которые испы­тала и Intel при попыт­ке вор­вать­ся на рынок мобиль­ных про­цес­соров. Здесь при­дет­ся дей­ство­вать про­тив силь­ного кон­курен­та, который хорошо зак­репил­ся и име­ет глу­бокие свя­зи с кли­ента­ми. Но учас­тие AMD, име­ющих свою базу кли­ентов, впол­не может сыг­рать положи­тель­ную роль в уве­личе­нии спро­са. Поэто­му впол­не веро­ятно, что 64-бит­ный про­изво­дитель­ный и энер­гоэко­ном­ный чип най­дет сво­его покупа­теля. Во вся­ком слу­чае, ARM рас­счи­тыва­ет в течение пяти лет получить 40%-ю долю рын­ка чипов для мас­шта­биру­емых веб‑сер­веров (око­ло 10 мил­лиар­дов дол­ларов).

Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии