Маркетинговые штучки: сноб-потребитель и AMD+Intel.

<img src="http://grizlyk1.narod.ru/other/athlon2/FX/snob_cons-prod.png" border="1" vspace="3"> "Механизм сбыта в процессе отладки". Картина неизвестного художника. Содержание. 1. Суперчип z68. 2. Там у них гнездо! Итак, начнем потихонечку. 1. Суперчип z...

11 января 2012, среда 17:37

grizlyk [ ] для раздела Блоги

"Механизм сбыта в процессе отладки".
Картина неизвестного художника.
Содержание.
1. Суперчип z68.
2. Там у них гнездо!
Итак, начнем потихонечку.

1. Суперчип z68.
Процессоры Интел на сокете 1156 гонятся шиной, при этом двухядерные впишутся в потребление сокета для четырехядерного, что станется с AMD FX4100 и с атлоном если разогнать интеловский двухядерный clarkdale до 4ГГц? Это даже страшно себе представить.
Однако, обласканая вниманием поклонников, Интел выпустила совершенно гениальные чипсеты серий h и p, причем для двух сокетов подряд. Мы не можем обойти вниманием такое достижение и предложим какому-либо стратегу из Интел приобрести себе две системы - одну на базе чипсета h, а другую, соответственно, на базе чипсета p и поставить одну над другой, возможно созерцание этой гармонии сочетаний рыночных секторов поможет скрасить чувство утраты, которое возникло от того, что я не купил систему на базе чипсета от Интел.
Качество реализации функций в чипсетах Интел не страдает проблемами, c какими знакомы чипсеты от АМД, но набор интерфейсов должен быть богаче, в чем смысл качественно реализованного деревянного велосипеда?
Апгрейдить систему на базе Интел и обвешивать ее улучшающей жизнь периферией намного сложнее, чем для АМД, фактически, гарантированно в чипсет интел можно установить только видеокарту, которая по молодости соответствует поколению процессора, со всем остальным, даже с дисковыми накопителями, могут возникнуть проблемы, неразрешимые может быть даже заменой матплаты.
Вероятно кто-то посчитал, что большинство потребителей ничего кроме видеокарты и не поставят, но какова стоимость какого-либо "бесполезного" узла на интегральной микросхеме? Таких мелких монет не существует!

2. Там у них гнездо!
Размещаю ранее анонсированную и достаточно благосклонно встреченную конспирологическую версию последних достижений АМД.
Смысл версии можно выразить очень кратко - где-то в АМД засел крот (кротовое гнездо) от Интел и согласует развитие АМД с интересами Интел за бочку варенья и корзину печенья.
А теперь подробнее. Я понимаю, что задача АМД заработать деньги, что рынок ПК не резиновый и т.д., но этот вопрос не рассматриваем, я в этом слабо разбираюсь, посмотрим на технические параметры:
Улика №1. Уничтожен чипсетный видеоконтролер 9х0G/GX для сокета AM3+, тем самым расчищена дорога не только для офисных моделей 1155, но даже и 1156.
Я знаю, есть теории, что 1156 это, дескать, был тупик и т.д., но на деле это был тупик в чьей-то голове, поскольку на протяжении полутора лет в продаже это был единственный современный сокет Интел, процессоры на котором несравнимо лучше "прогрессивно развивающегося" LGA775.
Пока еще распродаются остатки 880G/890GX, которые не только закончатся в следующем году, но это и чипы, которые не предназначены для FX официально. Чипсетное офисное видео реально конкурировало с интеловскими HDxxxx, стоило 10уе, потребляло 10 ватт и единственное, чем бы его надо снабдить, так это OpenCL, версией UVDx с полным видео кодеком и хотя бы 64 битами для side-port памяти.
Но даже без этих переделок миллион плюсов и _ни одного недостатка_. Невероятно, взять и прекратить выпуск такого продукта, который в тому же активно выпускается Интелом!
Улика №2. Чудовищный сокет FM1 - объединяет посредственную видеокарту и слабейший процессор по огромной цене.
По стоимости A8 (160уе) + плата (100уе) стоит разовой выплатой дороже!, чем моя связка купленных постепенно в течении года: атлон х3(75уе)+дискретный редвуд(60уе)+чипсетное видео(100уе), при этом FM1 проигрывает по числу подключаемых мониторов, по производительности как процессорной, так и видео. Невероятно.
Причем у меня сайлент редвуд от HIS, видеокарта занимает один слот и может работать без вентилятора, а на gddr5 двухслотовый дискретный редвуд _за те же деньги_ в несколько раз (до четырех раз) производительней A8.
Прекрасная идея объединения видео и процессора под одним кулером требует не столько технологии общего кремневого кристалла, сколько энергоэффективных центральных процессоров и если не пытаться устранить потери площади кристалла и потери энергии от "лишней" связи, свободно можно было бы соединить два кристалла под одной крышкой, тем же гипертранспортом не делая почти ничего. Но.
Первая проблема - на столько эффективных процессоров нет даже у Интел, не говоря уж об АМД. Интел может попытаться такое реализовать с двухядерными моделями и динамическими частотами, т.е. задав в биосе приоритет видео или ЦП можно было бы снижать частоты низкоприоритетного блока при перегрузке.
Вторая проблема - работающий графический процессор в играх очень активно обращается к памяти, а это крайне негативно скажется на одновременной работе ЦП, который вовсе не уходит в спячку во время отрисовки картинок на экране, а задействует одно и более ядер на 100%, им вдвоем просто не хватит пропускной способности шины системной памяти для работы без потерь в производительности.
Даже простая регенерация экрана из системной памяти от офисного видео при нескольких мониторах на высоких разрешениях сразу заметна на тестах и речь тут идет о десяти! процентах потерь пропускной способности памяти, а в играх же графический процессор редвуд с удовольствием задействует все 100% пропускной способности gddr5.
Зависимость производительности графической системы (измеренная в FPS) от производительности памяти при графическом процессоре видна на любом тесте одного и того-же графического процессора с разным типом памяти. В худших случаях разница между ddr3 и gddr5 достигает 4-х! (20/80FPS).
К тому же, локальная память графического процессора (память на видеокарте) используется для хранения данных, за которыми графический процессор не обращается к системной памяти, что позволяет центральному процессору работать параллельно практически без помех. Зависимость качества текстур от количества локальной памяти графического процессора также хорошо известна по играм, что позволяет сделать вывод об объемах данных, используемых графическим процессором.
Это все значит, что при совместной работе графического и центрального процессора на одной шине памяти сильно пострадает игровая производительность, т.е. то, ради чего и устанавливается игровая видеокарта в сокет FM1.
Чтобы обойти проблему производительности памяти, надо ставить еще каналы памяти для графики, а если ставить каналы, то надо ставить уже на gddr и т.д.
FM1 - дешевизны нет (это самое главное, интел затевала перестановки с встроеным в процесор видео для того, чтобы удешевить и снизить энергопотребление системы процессор+офис_видео - это ответ с форума Интел), производительности нет, целевая аудитория непонятна.
Программирование на OpenCL это та еще вещь, вряд ли старые тупые программисты проникнутся к ней любовью с первого взгляда с соответствующими последствиями для использования OpenCL в программах, но и для GPGPU вычислений гораздо легче расширить полосу пропускания гипертранспорта и PCIex для графического процессора на PCIex, тем более, что для части алгоритмов OpenCL наличие гигабайтов локальной памяти GPU скажется только положительно.
Гибкость у сокета FM1 как раз и теряется, несмотря на гибкость в названии, кому-то надо офисное видео, кому-то надо мощный процессор, выбор чипсета, процессора и дискретной карты в произвольной комбинации все решит, а тут что?
Есть только одно но - если бы свое встроенное видео АМД раздавало бесплатно, т.е. оно стоило бы как чипсетное офисное видео и в спокойном состоянии не мешало ЦП тепловыделением, то разговор был бы другим, его можно было бы _успешно проигнорировать_, как иногда игнорируют видео на сокетах 1155/1156 и даже как-то запользовать на начальном этапе, но этого нет, а платить за встроенное в FM1 видео стоимость полноценной дискретной видеокарточки при таких проблемах совершенно неправильно.
Получается, что у сокета FM1 нет никаких достоинств? На десктопе никаких. А в мобильных компьютерах? Может быть есть экономия на размере платы, на меньшем потреблении UMI и отсутствующей выделенной памяти для графического контроллера?
При цене мобильного компьютера в несколько сотен уе, пара гигабайт ddr3 памяти стоит 10уе, квадратный дециметр печатной платы стоит с десяток уе., северный мост тоже стоит что-то. Что же, согласимся, что в принципе на сокете FM1 пару десятков уе наэкономить можно - в принципе.
Про потребление. По известному мне опыту - один и тот же мобильный компьютер пытаются использовать в двух случаях:
а) либо как мобильный десктоп, в этом случае лишние 10 ватт потребления вообще никакой роли не играют, компьютер питают от розетки и значение имеют только максимальная производительность и способность быстро переместиться от розетки к розетке - ясно, что производительностью FM1 не блещет даже по сравнению с десктопным АМД и никаких выгод не сулит.
б) либо как автономное устройство, в этом случае имеет значение только энергопотребление, чем оно меньше, чем дольше полноценная работа от батареи, тем лучше (ориентировочное значение гарантированной непрерывной работы, которое не выводит пользователя из себя - 12 часов, на мобильных компьютерах, которые мне были доступны, за это время придется поменять штук пять батарей) - ясно что какая-либо производительность от FM1 в этой ситуации просто не нужна.
Казалось бы вот в последнем случае и место для FM1, но по моему опыту это всегда сугубо офисная работа и офисное видео вполне справляется с ней, любая 3Д игра в автономном режиме потребит настолько много энергии, что разница между встроенной и дискретной картой будет измеряться минутами, если не секундами, что не стоит внимания. Т.е. FM1 опять не у дел.
Опять же, даже в мобильном исполнении большую роль играет цена. Если бы АМД предлагала свою супер-карту внутри FM1 по цене офисного видео, то разговор бы был другим.
Улика №3. И конечно FX бульдозер - процессор без L1 кэша. Хоть стой, хоть падай. Интеловцы наверняка еще в шоке до сих пор, ну а потребители (снобы) точно поражены.
Удаление кэша некоторыми объяснялось аномально высоким траффиком синхронизации для поддержания когеррентности кэшей. Даже не знаю что сказать на это. Использование кэша в много-мастерной конфигурации конечно требует поддержания целостности данных, но эти проблемы давно уже успешно решаются, а на x86 со времен 386-х процессоров.
Согласимся, что само-кэширующий-неизвестно-как кэш неизвестно-какую память со времен тех же 386-х ориентирован на существенно однопотоковую нагрузку.
Но я думаю, что для повышения эффективности на многопотоке нужно не аппаратно исключать локальные контексты (даже набор регистров это локальный контекст, который на многопотоке бесполезен), а вводить явное управление программистом этими кэшами, т.е. программист должен явно исключать локальный контекст для общих данных на многопотоке и оставлять на однопотоке, поскольку память уже много лет реально аппаратно неоднородна по скорости и чем-либо заменить локальный контекст для однопотока кажется технически невозможным, компенсировать же вычислительные потери от локальных контекстов однопотока можно простым увеличением количества ядер, увеличением числа входов в кэш, наложением фаз смены регистрового контекста одного однопотока и исполнения другого однопотока на одном ядре (несколько регистровых контекстов на одно ядро) и т.д..
Тот же компилятор в состоянии прозрачно для программиста группировать данные по кэш линиям и генерировать для этих кэш линий правильное размещение при чтении и записи.
Например, для небольших по объему локальных данных функции возможен такой цикл, инициированный компилятором: "по данному адресу пометить кэш линию L1 на замену данных в памяти без чтения памяти (полная замена данных в памяти случайными данными из кэша без траффика)" - "частичное или полное чтение-запись данных в эту кэш линию во время работы функции (кэш L1 успешно подменяет память)" - "по данному адресу пометить кэш линию L1 как свободную без записи в память (память опять объявляется владельцем правильных данных и опять без траффика)". Функция будет работать быстро, а если процесс принудительно не вытесняется из ядра или адреса локальных данных не передаются другим ядрам, то вообще без траффика между кэшами. Я думаю, примерно 20% данных в программах пройдут по такому циклу.
По тесту cctc v0.05, разогнанный до жути FX4100

05:    32K: 5.379960e+005: 1.287072e-004s:      14917583.03Kb/s (   14567.95Mb/s,  14.23Gb/s )

дает в районе L1 кэша 14Gb/s, это атлон 2.2ГГц или тише (при такой частоте кушает атлон очень мало, много меньше чем FX), т.е. конкретно по L1 кэшу FX4100 конкурировать разве что с этим самым A8 (у FX L2 кэш работает на такой скорости).
Да о чем говорить, посмотри что советуют проинтеловские сайты и сделай строго наоброт и будет удача.
Так что если у АМД все пойдет по прежнему и единственной альтернативой выбора будет FM1+бульдозер_без_кэша_L1 (зачем бульдозеру кэш L1, когда ему нужен ковш?), то какой-нибудь маркетолог АМД может уже заготовить на своем рабочем столе место под установку своей чудо-платформы vision, которую он купит заместо меня

.
- - - -
Обсуждение этой заметки в форуме.

Создано: 11.01.12
Последний раз отредактировано: 11.01.12
Ссылка на оригинал этой статьи.

Оценитe материал

Добавить в закладки Спасибо автору

предыдущая запись

следующая запись

Маркетинговые штучки: сноб-потребитель и AMD+Intel.

реклама

реклама

Лента материалов

Популярные новости

Популярные статьи

Сейчас обсуждают