Ретроклокинг: обзор мэйнфреймов и суперкомпьютеров (страница 2)
реклама
В 1999 году назрел апгрейд Intel ASCI Red и тендер опять выиграла Intel. Благодаря этому событию на свет появился уникальный процессор с разъемом Socket 8 и мощью Pentium II – Pentium II OverDrive с частотою 333 МГц.
«Заряженный» Intel ASCI Red версии 2.0 с 9632 процессорами после апгрейда обеспечил производительность на уровне 2.38 TFLOPS в тесте Linpack. Такие качественные характеристики позволили Intel ASCI Red удерживать звание самого быстрого суперкомпьютера с июня 1997 до июня 2000 года.
Но процессорных мощностей никогда не бывает мало, и поэтому по заказу правительства США в рамках развития суперкомпьютерных технологий при третьем этапе программы «Advanced Simulation and Computing Program – ASCI» был объявлен тендер на построение еще более мощного суперкомпьютера.
Здесь стоит отметить, что каждый этап программы предполагал увеличение мощности нового суперкомпьютера относительно предыдущего примерно в 2.5 раза. И на сей раз честь быть творцом нового покорителя терафлопсов выпала IBM. В феврале 1998 года было официально объявлено, что компания IBM получила контракт на постройку нового суперкомпьютера, который будет называться ASCI White.
реклама
15 августа 2001 года он был официально сдан заказчику и установлен в Ливерморской национальной лаборатории.
Что же представлял собою ASCI White, который стоил 110 миллионов долларов? Это кластер из SMP-серверов, состоящий из 512 машин, связанных новой коммуникационной технологией «Colony» с пропускной способностью около 500 Мбайт/с.
Суммарное количество процессоров IBM Power3 с тактовой частотою 375 МГц равнялось 8192 экземплярам. В распоряжении суперкомпьютера находились 6 Тбайт оперативной памяти и 160 Тбайт дискового пространства. Размеры ASCI White были сопоставимы с площадью двух баскетбольных площадок, а масса всего оборудования составляла 106 тонн.
Общая длина кабелей для соединения компонентов достигла 64.3 км. Для их укладки пришлось надстроить пол на высоту 60 см для возможности прокладки шлейфов.
Потребляемая мощность ASCI White составляла 3 МВт электроэнергии, и еще столько же требовалось на охлаждение. Вся эта мощь показала результат в тесте Linpack в 7.3 TFLOPS.
реклама
В 2002 году майка лидера вновь ушла в Страну восходящего солнца. По заказу японского правительства компания NEC построила суперкомпьютер с реальной мощностью 35.86 TFLOPS. Модель с названием «Earth Simulator» («Симулятор Земли») была разработана специально для японского агентства науки и технологии для проведения климатических, тектонических, атмосферных и других расчетов.
По факту была построена маленькая модель нашей планеты для прогнозирования различных природных явлений и катастроф.
NEC Earth Simulator получился в пять раз быстрее IBM ASCI White и в три с половиной раза дороже (на разработку было потрачено 350 миллионов долларов США). Для его установки был построен двухэтажный павильон 65 метров в длину и 50 в ширину.
640 узлов с восемью векторными процессорами и 16 гигабайтами оперативной памяти в каждом узле суммарно объединяли 5120 процессоров и 10 терабайт оперативной памяти. Частота каждого процессора составляла 500 МГц, но некоторые его компоненты поддерживали работу на частоте 1 ГГц.
Система памяти на жестких дисках состояла из моделей HDD суммарным объемом 700 Тбайт, плюс к этому объему добавлялась ленточная библиотека StorageTek 9310 объемом 1.6 петабайт. Количество потребляемой энергии – 6.4 МВт; и это без учета затрат на охлаждение, поэтому рядом была построена небольшая подстанция на 20 Мвт.
Для соединения всех компонентов потребовалось 83 200 кабелей суммарной длиной 2400 км. Скорость двунаправленной передачи данных по каждому каналу, соединяющему процессорные узлы с переключателем, равнялась 12.3 Гбайт/с. В 2009 и далее в 2015 году NEC выпустила второе и третье поколение «Симулятора Земли». К слову, последнее поколение Earth Simulator обеспечивает производительность 35.61 TFLOPS.
Первым суперкомпьютером, впервые в истории преодолевшим порог в один петафлопс, стал IBM Roadrunner, построенный, что естественно, самой IBM и установленный в Лос-Аламосской национальной лаборатории (США) для исследований в области ядерного вооружения в 2008 году. Кроме того, это был первый гибридный суперкомпьютер, использующий одновременно две различные процессорные архитектуры.
В состав IBM Roadrunner входили, гармонично работая друг с другом 6 480 двухъядерных процессоров AMD Opteron 2210 с частотой 1.9 ГГц и 12 960 процессоров IBM PowerXCell 8i с частотой 3.2 ГГц (наподобие тех, что использовались в Sony PlayStation 3).
Этот суперкомпьютер, как и Intel ASCI Red, изготавливался из общедоступных комплектующих – в его состав вошли блейд-серверы IBM Model QS22, которые разместились в 278 шкафах. Для связи использовалось 10 000 соединений Infiniband и около 90 км волоконно-оптического кабеля.
реклама
Суммарный объем оперативной памяти этого монстра равнялся 98 терабайт, масса – 226 тонн, потребляемая мощность – 3.9 Мвт, на разработку ушло более 120 миллионов долларов США.
Стандартная обработка (например, ввода / вывода файловой системы) происходит процессорами AMD Opteron, математические и процессорные вычисления обрабатываются процессорами Cell. IBM Roadrunner работал с программным обеспечением Linux с открытым исходным кодом Red Hat.
Но уже с 2008 года началась гонка за покорение петафлопс. В конце 2009 года суперкомпьютер Cray XT5 (известный как «Jaguar») в тесте Linpack показал производительность в 1.759 PFLOPS. В 2010 суперкомпьютер из Китайской Народной Республики Tianhe-1A обеспечил производительность в 2.57 PFLOPS. В 2011 японский суперкомпьютер K Computer продемонстрировал результат в 8.16 квадриллиона операций в секунду. Но нам более интересен суперкомпьютер с названием Titan, построенный компанией Cray.
По сути суперкомпьютер Titan или Cray XK7 был апгрейдом Jaguar, который работал в национальной лаборатории Министерства энергетики США.
Обновление ценой в 60 миллионов долларов включало 18 688 шестнадцатиядерных AMD Opteron 6274 (Socket G34, микроархитектура – Bulldozer, цена на момент анонса – $639) c частотою 2.2 ГГц и 18 688 серверных GPU Nvidia Tesla K20X (микроархитектура – Kepler, стоимость на момента анонса – $3199, близкий игровой аналог – GeForce GTX Titan первого поколения). Мощность одной Tesla K20X с шестью гигабайтами памяти на борту составляла 1.31 TFLOPS.
Такое разнородное соседство компонентов позволило продемонстрировать впечатляющую производительность в 17.6 PFLOPS.
Суммарный объем оперативной памяти Titan’a составлял 710 Тбайт, объем дисковой подсистемы был равен 40 Пбайт, а потребление электроэнергии было на уровне 8.2 МВт.
В настоящее время Titan, выпущенный Cray, несмотря на прошедшие с момента его запуска до наших дней пять с половиной лет, занимает пятую строчку мирового рейтинга TOP-500. И на данный момент времени пятерка лидеров выглядит следующим образом:
Первую строчку занимает суперкомпьютер из Китая с умопомрачительным количеством вычислительных ядер – Sunway TaihuLight, который в тесте Linpack продемонстрировал результат 93 PFLOPS!
В основе данной машины лежат китайские разработки: используются 260-ти ядерные 64-битные RISC-процессоры собственного производства с тактовой частотой 1.45 ГГц. Sunway TaihuLight в общей сложности задействует 10 миллионов процессорных ядер, при этом каждое ядро способно выполнять несколько инструкций.
Объем оперативной памяти составляет 1.31 Пбайт, потребляемая мощность – 15 МВт. Суммарный объем дискового пространства равен 20 Пбайт. Конструктивно суперкомпьютер состоит из 40 стоек с водяным охлаждением с пиковой производительностью каждой стойки в 3 PFLOPS.
Суперкомпьютер Sunway TaihuLight является разработкой специалистов Национального исследовательского центра параллельных компьютерных вычислений и технологий и установлен в Национальном суперкомпьютерном центре в Уси. Для разработки данного устройства было затрачено 273 миллиона долларов.
Сейчас Китай строит новый высокопроизводительный компьютер следующего поколения – Tianhe-3, который будет как минимум в десять раз быстрее, чем Sunway TaihuLight.
Будущий суперкомпьютер должен преодолеть новый рубеж производительности в 1 эксафлопс (1 000 000 000 000 000 000, миллион триллионов) операций с плавающей запятой в секунду. Предположительно, строительство закончится в 2020 году, осталось дождаться этого момента.
Процессоры суперкомпьютеров
Как вы уже могли заметить, процессоры для суперкомпьютеров использовались разные:
- Набор бесчисленного множества микросхем на печатной плате;
- Серийно выпускаемые и свободно встречающиеся в обыденной рознице модели;
- Специально изготовленные для построения суперкомпьютеров.
Последние представляют наибольший интерес. Как правило, такие решения содержат несколько процессорных ядер на одной подложке, кристаллы которых, если удастся снять защитное крепление, засверкают всеми цветами радуги. Приведу несколько таких примеров.
Выше на снимке можно увидеть процессор IBM Power5+ в упаковке QCM (Quad Chip Module). Его восемь ядер работают на частоте 1.8 ГГц, а рядом с ними расположены 72 Мбайт кэш-памяти третьего уровня (L3 Cache).
У Pentium Pro похожая упаковка, но единственное процессорное ядро и кэш второго уровня (L2) находятся на разных кристаллах.
А так выглядит IBM Power4 CPU без теплораспределительной крышки:
Корпус процессора изготовлен из прочной керамики, и отсоединить такую же керамическую крышку – дело далеко не простое. Приходится использовать грубую силу и специальный инструмент.
По мере продвижения прогресса количество кристаллов под крышкой таких процессоров увеличивалось, а сами размеры CPU росли. Они обзаводились массивными стальными рамками, причем некоторые модели предоставляли возможность подключения водяного охлаждения.
Выше на фото представлен процессор IBM Z10, выпущенный специально для мэйнфреймов в 2008 году. Этот «модульник» включает пять четырехъядерных CPU с частотой 4.4 ГГц, а также два контроллера памяти. Кэш-память второго уровня равна 3 Мбайт для каждого ядра; в дополнение к ней в зависимости от модели может быть еще от 40 до 48 Мбайт кэш-памяти третьего уровня. Размеры такого процессора впечатляют.
Ниже можно увидеть еще одного «монстра» - IBM Z196.
Данный процессор представляет собой многочиповый модуль и был специально разработан IBM для своих супермашин еще в 2010 году. Чип площадью 512.3 мм2 состоит из 1.4 миллиарда транзисторов. Технология производства – 45 нм, тактовые частоты – до 5.2 ГГц.
Помимо 24 Мбайт общего кэша L3, на процессорном модуле есть два специальных выделенных чипа-компаньона, называемых Shared Cache. Каждый из них добавляет кэш-память L4 на 96 Мбайт, что суммарно увеличивает общий объем L4 кэша до 192 Мбайт.
Ну а далее нас ждут просто настоящие исполины:
Для удобства установки таких процессоров используются готовые модули с ручкой.
Разобрать такой процессорный модуль непростая задача, порою для этой процедуры нужно обладать набором инструментов, представленных ниже на снимке, и даже газовая горелка не помешает.
Кстати, метод с тисками, применимый для десктопных ЦП, тут не пройдет. В качестве примера приведем разборку IBM Power4 в картинках:
Мэйнфрейм дома
Можно ли использовать такую машину как суперкомпьютер дома? А почему бы и нет. Главное – желание, а мэйнфрейм найдется .
Возможно, не все знают, но пару лет назад Сеть облетела новость о том, что 18-летний студент колледжа в Мэриленде Коннор Крукоски (Connor Krukosky) собрал в подвале своего дома мэйнфрейм IBM z890, который в 2004 году стоил более $300 000. Удалось ему это благодаря участию в аукционе на сайте GovDeals, где один из университетов избавлялся от устаревшего «железа». Помимо единственной ставки Коннора Круковски в $237 других участников не было, и он приобрел бывший в употреблении мэйнфрейм по номинальной цене – за $237.
Масса и размеры IBM z890 немаленькие, ведь это не персональный компьютер. При габаритах 79 х 158 х 195 см и массе 680 кг данное вычислительное устройство нелегко транспортировать и разместить в помещении. Но нет ничего невозможного.
После операции по транспортировке в подвал мэйнфрейм был собран и подключен.
В результате благодаря публикации автора эксперимента в интернете его пригласили в IBM сначала на экскурсию, а затем попросили прочитать лекцию, поскольку 19-тилетний подросток обладал такими знаниями по мэйнфреймам производства IBM, которыми не могут похвастать некоторые специалисты.
А в последующем ему предложили совмещать дальнейшую учебу и работу в IBM. Так что иногда простое увлечение перерастает в профессию. Фотографии процесса сборки и транспортировки можно посмотреть по ссылке.
Производительность
Настало время сравнить производительность суперкомпьютеров и мэйнфреймов в TFLOPS. А чтобы было интереснее, подберем им компаньонов из числа обыкновенных компьютерных устройств, которые можно встретить в обыденной жизни.
|
терафлопс |
Sunway TaihuLight |
|
Cray Titan |
|
IBM Roadrunner |
|
NEC Earth Simulator |
|
VR-Ready Workstation with 4xNvidia Tesla V100 |
|
Nvidia Tesla V100 (Volta with HBM2) |
|
ASCI White |
|
Sony PlayStation 4 |
|
Intel ASCI Red |
|
Intel Core i9-7980XE overclocked (18 Cores, LGA 2066) |
|
AMD Ryzen R7 1800X |
|
Sony PlayStation 3 |
|
Hitachi SR2201/1024 |
|
Nvidia GeForce GTX 780 Ti |
|
Numerical Wind Tunnel |
|
Intel Core i7 980 XE |
|
Sony PlayStation 2 |
|
Intel Pentium 4 3.4 ГГц |
|
Qualcomm Snapdragon 820 |
|
Cray-2 |
|
Cray-1 |
|
Заключение
Я, если можно так сказать, кратко попытался взглянуть на историю развития самых быстрых вычислительных машин и те цифры, которыми они оперировали. Возможно, через 10-20 лет любой смартфон или компьютер достигнут той же производительности, что и занимающий сейчас первое место в TOP-500 Sunway TaihuLight, если не превзойдут его. Поживем-увидим.
И, конечно, мне бы хотелось собрать свой собственный мэйнфрейм и дополнительно его разогнать, поскольку информации о разгоне этих машин на просторах интернета я не встречал . Может быть, когда-то это и удастся реализовать…
До скорых встреч!
реклама
Страницы материала
Лента материалов раздела
Соблюдение Правил конференции строго обязательно!
Флуд, флейм и оффтоп преследуются по всей строгости закона!
Комментарии, содержащие оскорбления, нецензурные выражения (в т.ч. замаскированный мат), экстремистские высказывания, рекламу и спам, удаляются независимо от содержимого, а к их авторам могут применяться меры вплоть до запрета написания комментариев и, в случае написания комментария через социальные сети, жалобы в администрацию данной сети.
Комментарии Правила