Начало войны ARM vs x86. Детальный анализ энергопотребления Atom, Krait, Cortex A15.Часть 2

12 января 2013, суббота 20:56
для раздела Блоги

Данный материал – продолжение перевода статьи об исследовании энергопотребления актуальных на сегодня мобильных SoC. В данной части к участникам тестирования добавляется  устройство на базе Cortex A15 в лице планшета Nexus 10 и проводится его сравнение с Atom`ом и Krait.

Первая часть.
Оригинал статьи - http://www.anandtech.com/show/6536/arm-vs-x86-the-real-showdown/
Что дальше? Cortex A15
Сравнение с APQ8060A дает нам представление о том, как выглядит Atom в настоящее время. Как и Intel, Qualcomm придерживается приоритетов в однопотоковой производительнсоти и разрабатывает свои SoC на основе передовых LP (low-power) техпроцессов. Если бы сейчас была середина 2012-го года, то мы могли остановиться на данном этапе. Но уже наступил новый год и появился новый игрок: Cortex A15 от ARM.
В то время, как 5-и летнее ядро Atom`a по-прежнему может превзойти большинство ARM процессоров на рынке, Cortex A15 с легкостью превосходит и его. Но как же обстоят дела с энергопотреблением у данного решения ?
Чтобы выяснить это, мы взяли Google Nexus 10 с процессором Samsung Exynis 5250. Данная SoC ( Exynos 5 Dual) представляет собой два процессора ARM Cortex A15, работающих на частоте до 1.7 Ghz. В качестве графического ядра выступает Mali-T604. Методика тестирования прежняя.
Режим простоя
Так как Nexus 10 работает не на Windows RT, нам нет необходимости ждать, пока «плитки» перейдут в неактивный режим. «Домашний» экран Android`a статичный и все колебания на графиках больше относятся к работающему WiFi:

В простое,  Nexus 10 демонстрирует наибольший «аппетит» среди других планшетов. Но не стоит удивляться, так как стоит учитывать, что дисплей устройства требует намного больше энергии. Чтобы увидеть результаты интересующей нас SoC посмотрим на потребление CPU и GPU:

Несмотря на то, что система содержит более “прожорливые» ядра, в режиме бездействия ARM Cortex A15 демонстрирует такой же уровень энергопотребления, как  Atom и Krait.

Mali-T604 выглядит превосходно в данном тесте. Когда на экране ничего не происходит, GPU абсолютно бездействует и это видно на графике. Будем надеяться, что в этом есть также заслуга самсунговского техпроцесса 32nm LP (HK+MG).
Выключаем WiFi и ситуация выглядит схожим образом. Потребление всего устройства (Nexus`a 10) как и прежде остается наивысшим среди участников из-за более «голодного» экрана, но на уровне SoC в режиме простоя видим вполне конкурентоспособные данные. Потребление GPU продолжает нас удивлять.



Cortex A15: SunSpider 0.9.1
Производительность теста SunSpider в Chrome на Nexus 10 не столь выдающаяся, именно поэтому кривая Exynos 5250 длиннее, чем у соперников. Я бы не стал уделять этому много внимания, так как производительность в данном тесте больше зависит от оптимизации Chrom`a, но взглянем на потребление Cortex A15:

И хотя эти графики достаточно четко отображают картину происходящего, нужно уточнить что происходит на самом деле. Именно поэтому далее, после каждого графика, будут представлены диаграммы, которые будут отображать количество потребленной энергии за время теста/бенчмарка в Джоулях.

Данные на этой диаграмме отображают картину, которую мы видели на графике. Acer/Intel смогли обойти Dell/Qualcomm в плане потребления устройства в целом. Что же касается Nexus 10, то он очень плохо справился с данной задачей. Возможно это проблемы с оптимизацией программного обеспечения либо ещё какая-то проблема.

Потребление CPU просто зашкаливает. Пики потребления – в районе 3 Вт, в то время, как у соперников в районе 1 Вт.

На диаграмме видим, что Qualcomm по потреблению CPU вырывается в лидеры, но не забывайте о том, что у нас нет данных о потреблении L2 кэша.

Даже потребление GPU довольно высоко, по сравнению с остальными участниками (не считая Tegra 3).

SunSpiderMax, Avg, Min Power
Для вашего удобства, следующие диаграммы представляют данные о максимальном, среднем и минимальном  потреблении устройств на протяжении бенчмарка (исключая начало/конец теста и простой).



Average Power Draw



Minimum Power Draw



Cortex A15: Kraken
В то время, как SunSpider не был достаточно «раскрывающей» нагрузкой для Exynos 5259,  Kraken демонстрирует совершенно другую картину. Cortex A15 завершает тест значительно быстрее, чем соперники, и, в результате, достигает вполне приемлемый уровень потребленной энергии, хоть и в пиках потребления у него намного выше.


Несмотря на то, что Nexus 10 и A15 в пиках потребляют больше, общий уровень потребленной энергии остается на самом низком уровне из участников, так как Exynos 5250 закончил тест значительно быстрее остальных. Intel следует за ним по пятам, а замыкает тройку Qualcomm.

И снова мы видим пик потребления CPU в районе 3 Вт, в то время, как у других участников < 1,5 Вт. Преимущество в производительности достаточно для оправдания настолько большего потребления, хотя мне очень интересно как обстояли бы дела в устройствах, которые не способны рассеять столько тепла (например, в смартфонах).

Потребление отдельно взятых CPU выглядит примерно одинаково, однако на этот раз лидерство вырывает Qualcomm.


Находясь большую часть времени в простое, Mali-T604 на самсунговском 32nm LP (HK+MG) техпроцессе потребляет совсем малые «крохи энергии».
Kraken - Max, Avg, Min Power



Average Power Draw



Minimum Power Draw



Cortex A15: RIABench
В  RIABench ситуация не сильно отличается от других тестов, хотя пиковое потребление у A15 немного ниже здесь.  Промежуток между A15 и Atom/Krait остается достаточно большим. Большой прирост производительности приводит к значительно большему расходу энергии.






RIABench - Max, Avg, Min Power



Average Power Draw



Minimum Power



WebXPRT 2013
Из-за того, что у нас нет Android версии тестового пакета TouchXPRT не можем провести данное тестирование, но, к счастью, у нас есть WebXPRT, который доступен для всех платформ. Exynos 5250 захватывает лидерство и показывает один из высочайших результатов , что мы видели (246), и хотя мы использовали разные браузеры, вполне возможно, что производительность была раскрыта не в полной мере. Преимущество в производительность над Atom`om составляет около 9% , но это достигается за счет значительно большего энергопотребления.



И  опять же пиковое потребление CPU впечатляет нас. Мы видим пики на уровне 4 Вт для Cortex A15 в то время, как Intel и Qualcomm демонстрируют <1,5 Вт .



WebXPRT 2013 CP1 - Max, Avg, Min Power



Average Power Draw



Minimum Power Draw



Потребление GPU – нагрузка 3D приложениями
Графический процессор Mali-T604 - достаточно производительное решение, но так же, как и Cortex A15 может потребовать из-за этого довольно много энергии. Пиковое потребление GPU находится в пределах 4-х Вт, по сравнению с 1 Вт у Adreno 225. Даже CPU A15 в данном тесте показал достаточно умеренный уровень потребления по сравнению со своими конкурентами. Похоже на то, что 4 Вт является обычным уровнем потребления для Exynos 5250, что превосходит от 1 до 4-х раз Atom Z2760 и APQ8060A.






За преимущество в производительности Mali-T604 приходится расплачиваться довольно дорого: общий уровень потребленной энергии намного выше конкурирующих решений.
Потребление GPU - Max, Avg, Min Power



Average Power Draw



Minimum Power Draw



Определяем TDP у Exynos 5 Dual
На протяжении тестирования Cortex A15 мы упирались в значения около 4 Вт для CPU и GPU, но мы редко видели работу обоих блоков в одно время. Инженеры Intel посоветовали мне провести данный тест для того, чтобы увидеть что будет происходить, когда мы заставим и CPU и GPU работать в полную силу одновременно. График ниже разделен на 5 различных секций, каждая из которых выделена своим цветом. На этом графике отображены отдельные линии для потреблений GPU (зеленый цвет), CPU (синий) и потребление всей платформы, включая дисплей, измеренное на батарее устройства (красный).

На первом участке (желтый) мы запустили игру Modern Combat 3 – требовательный к GPU шутер от первого лица. Потребление GPU лишь немного не дотянуло до 4 Вт, в то время, как потребление CPU оставалось на уровне ниже одного ватта. После минуты игры, мы свернули игру, что вы можете увидеть по падению потребления CPU и GPU. На следующем участке (оранжевый), мы запустили многопотоковое приложение CoreMark – небольшой бенчмарк для CPU и позволили ему работать определенное время. Теперь уже CPU оказался в районе 4 Вт, в то время, как GPU оставался на низком уровне.
Далее, во время работы CoreMark на обоих ядрах, мы переключились обратно на Modern Combat 3 (розовый участок). Напряжение GPU подросло и уровень потребления достиг 4 Вт, но взгляните что произошло с процессором: ядра CPU переключились на более низкое напряжение/частоту как для фонового процесса (800 Mhz вместо 1.7 Ghz). Общее TDP SoC подскочил выше 4 Вт, но контроллер питания быстро скорректировал ситуацию понизив напряжение/частоту CPU для того, чтобы удержаться на уровне 4 Вт. Для того, чтобы убедиться, что CoreMark по-прежнему работает, мы переключались обратно на него (синий участок) и вы видите, что производительность CPU снова выросла как только нагрузка на GPU спала. Наконец, мы переключились обратно на MC3, и увидели пиковое потребление связки CPU+GPU на уровне 8 Вт, прежде, чем CPU сбросил частоты.
 И хоть данный сценарий выглядит слишком невероятным при обычном использовании планшета, нам нужно было понять поведение Exynos 5250 в таких ситуациях. SoC позволено достигать 8 Вт, но на очень малые периоды. Типичным же TDP при работе для системы является уровень 4 Вт. Почему эти цифры столь важны? С выходом Haswell, Intel продемонстрирует нам системы, которые могут иметь до 8 Вт TDP. На самом же деле, Intel достаточно будет доставлять около половины от этого значения для того, чтобы SoC можно было использовать в устройстве вроде Nexus 10. Samsung решили эту проблему сбрасывание частоты/напряжения на CPU при совместной работе CPU и GPU и было бы крайне любопытно увидеть что происходило бы с 8 Вт Haswell`om в подобной ситуации.
Заключение и выводы
И хотя после предыдущей статьи больше ничего не остается добавить (Atom Z2760 быстрее и энергоэффективнее чем Tegra 3), после добавления в тест А15 появилось что обсудить. Мы выяснили, что Atom быстрее, чем Krait, но с точки зрения энергопотребления обе системы являются очень и очень конкурентоспособны. Ну уровне платформы (по крайній мере в Acer W510) Intel лидирует в общей энергоэффективности. Не забывайте, что это преимущество может быть обусловлено  дисплеем и другими оптимизациями, а вовсе не преимуществом SoC.
Рассматривая же работу CPU ядер в целом, видим, что Qualcomm лидирует, хоть мы и не знаем как бы изменилась картина будь у нас данные о потреблении L2 кэша. Но все же рискнем предположить, что ситуация не поменялась бы.
Со стороны GPU видим, что Intel/Imagination выигрывает в энергоэффективности, хоть и Adreno 225 удерживает лидерство в производительности. Для современных графических интерфейсов PowerVX 545 хорош, но Adreno 225 определенно быстрее в 3D.  Intel значительно снизили параметры своих ультра мобильных графических процессоров, так что большая часть энергоэффективности достигается более низкой производительностью.  Хотя в 2D и графических интерфейсах данное ухищрение довольно актуально.
Qualcomm удалось достичь более низкого уровня потребления в простое, что показывает, что 32nm  техпроцесс Intel`a  SoC уже порядком задержался. Техпроцессы  28nm от TSMC и 32nm LP  от Samsung демонстрируют нам просто невероятно низкий уровень потребления в простое. Я по-прежнему удивлен, что 5-и летняя архитектура Atom`a в паре с 3-х летним техпроцессом может быть хоть сколь-нибудь конкурентоспособной. В ближайшие 9-12 месяцев мы наконец-то увидим обновленную архитектуру Atom`a на новом 22nm LP техпроцессе от Intel`a.  И это то, что должно принести определенные инновации и улучшения. У Intel довольно хорошие шансы закрепиться в данном сегменте, если они будут уделять внимание актуальным разработкам.

Если в предыдущей статье мы разрушали миф о потреблении x86, то что становится ясно из этой статьи, так это то, что развитие SoC от Intel идет в правильном направлении. Кривая потребления у Atom выглядит практически так же, как и у Qualcomm, и лишь немного не дотягивает до Apple.
Данные относительно А15 оказались наиболее интригующими. Я не уверен относительно того, что первые SoC на А15 для смартфонов будут тягаться с Exynos 5 Dual по энергопотреблению, но основываясь на данных проведенного исследования, мы видим, что Cortex A15 выступает в «своей лиге».  В зависимости от задачи, вам по-прежнему нужна платформа, которая способна рассеивать до 4-х раз большее количество энергии, чем у нынешних SoC изготовленных Intel и Qualcomm. Очевидно, что Cortex A15 для планшетов крайне удачное решение, но совершенно неясно что будет, когда такую систему «упакуют» в форм-фактор смартфона. С более низкими напряжениями/частотами и хорошо настроенным турборежимом удастся достигнуть приемлемой длительности работы от батареи, но очевидно, что установка Exynos 5 Dual из Nexus`a 10 в смартфон не очень хорошая идея. Теперь понятно, почему ARM придумали схему big.LITTLE и почему Apple придумали Swift.

Я много раз слышал о том, что Haswell станет решением проблемы с ARM, по крайней мере в отношении к А15. Данные же здесь помогли понять, о чем говорилось. При интенсивной нагрузке на GPU и CPU Exynos 5 Dual потребляет около 4 Вт, а пиковый уровень TDP близок к 8 Вт. Если вы вспомните IDF, то там Intel говорила о 8 Вт, как о потенциальном ориентире TDP для Haswell`a. В реальности же, стоит ожидать, что блоки Haswell`a будут работать с меньшим уровнем потребления.  И создается впечатление, что Intel всерьез рассматривает перспективу втиснуть Haswell в рамки 4 Вт. Может не в рамках 22nm, но после освоения 14nm точно. Мы знаем, что архитектура Core может работать с TDP ниже 8 Вт в рамках 22nm, и если удастся снизить уровень до 4 Вт, то мы увидим абсолютно новый класс высокопроизводительных архитектур.
Скорее всего, так и произойдет. Core – будет в области от 4 Вт и выше, а Atom – для остальных целей. Но не рассчитывайте на то, что увидите Core в смартфонах раньше, чем будут освоены 10nm (~2017 год). Ко времени освоения 10nm мы будем видеть уровень производительности Sandy/Ivy Bridge в смартфонах.
В результате, мы видим, что шансы Intel в долгосрочной перспективе выглядят довольно обещающе. Intel по-прежнему нуждается в Nexus и iPad или в подобных выигрышных разработках, но при этом и технология должна развиваться в правильном направлении к 2014-ому году. Это зависит от того, будет ли разработана правильная бизнес стратегия Полом Отеллини или же его наследником.
С дальнейшим развитием смартфонов, количество проболем увеличивается. Intel крайне остро нуждается в правильной стратегии развития в этом направлении, чего не удалось обеспечить приобритением Infineon. Компании предстоит ещё огромное количество работы, чтобы соревноваться с бесспорным лидером рынка Qualcomm. Обе компании в скором времени обновят свои архитектуры и это будет ещё более интересно увидеть. Если ARM это новая AMD, то Krait – новый Athlon 64. Единственная разница лишь в том, что на этот раз Intel не делает Pentium 4…
Вот и подошла к концу данная статья. Надеюсь, что вам она также показалась достаточно интересной. Пишите, пожалуйста, стоит ли продолжать практику переводов с подобными интересными статьями. 
Ссылка на оригинал статьи - http://www.anandtech.com/show/6536/arm-vs-x86-the-real-showdown/
Оценитe материал

Возможно вас заинтересует

Популярные новости

Сейчас обсуждают