Быстрый взгляд на архитектуру ядра Intel Xeon Phi (Knights Corner)

Редакция

Новости Hardware 29 авг 2012, 11:27 GreenCo

Кое-что официально.

На конференции Hot Chips, начавшей на днях свою работу, компания Intel раскрыла часть деталей архитектуры процессора Xeon Phi (кодовое имя — Knights Corner, хотя задумывался как графический проект Larrabee). Чуть ранее мы знакомились с неофициальной информацией об общих характеристиках нескольких моделей этих ускорителей расчётов. Сегодня Intel предлагает взглянуть на официальную блок-схему строения одного из 50-60 ядер Xeon Phi.

Каждое из свыше 50-ядер процессора Xeon Phi содержит ядра класса "Pentium" с 512-разрядным блоком векторных вычислений, двумя скалярными блоками и выделенной 512-Кбайт кэш-памятью второго уровня. Столь большой объём кэш-памяти L2, считают в Intel, даст возможность разработке выйти на вычисления нового уровня. Поскольку Xeon Phi — это, по сути, математические сопроцессоры, большой кэш будет им весьма кстати, как и морально устаревшие, но подходящие для обработки массивных потоков конвейеры с последовательным исполнением команд, которых в каждом ядре Xeon Phi по четыре штуки. Все ядра, добавим, соединены тройной кольцевой шиной — это "типичная" симметричная x86-совместимая многопроцессорная система, на что компания Intel постоянно делает акцент.

Представитель компании на конференции вновь подтвердил, что программировать для Xeon Phi будет легче, чем для NVIDIA CUDA. Эффективности в вычислениях, мол, можно достичь на стандартном (читай — x86-совместимом) программном обеспечении без необходимости изучать специфические модели программирования. Тем не менее, отметим, что по сведениям самой Intel x86-совместимая логика занимает в каждом ядре Xeon Phi менее 2%. В основном площадь ядра съедает гигантская кэш-память, но и новых блоков там не мало, так что подозрения о том, что модель программирования для Xeon Phi будет не совсем такая, как для Intel Xeon, имеют под собой некоторые основания. Впрочем, Intel говорит о совместимости ускорителей с OpenMP, MPI, OpenCL, Pthreads и с пакетами FFT и Monte Carlo.

Что касается эффективности работы ускорителей Xeon Phi, то компания приводит следующие цифры. Система Discovery с ускорителями Xeon Phi занимает 150 строчку в списке 500 лучших серверов. При этом потребление системы составляет 72,5 кВт (1400 мегафлопс/Вт), а одна из систем с использованием GPGPU-ускорителей NVIDIA Tesla, которая расположилась на 177 месте, потребляет 81,5 кВт. Иначе говоря, оказалась медленнее и горячее. Звучит заманчиво. Остаётся дождаться официального анонса Xeon Phi, который должен состояться этой осенью.