У всех нас есть компьютеры, которые мы так любим разгонять, но встречаются и более производительные варианты в виде серверов с двумя или даже четырьмя процессорными разъемами. И однажды мне стало интересно: а что еще быстрее?
Ответ на вопрос приводит к отдельному классу вычислительных машин: суперкомпьютерам и мэйнфреймам. Как развивался данный класс компьютерного оборудования, каким был в прошлом и чего достиг сейчас, какими цифрами производительности оперировал и можно ли использовать такие машины дома – обо всем этом я расскажу в данной статье.
С прочими моими материалами, посвященными ретроклокингу, можно ознакомиться по этой ссылке.
Для начала нужно определить, чем суперкомпьютер отличается от мэйнфрейма и что из них быстрее. Итак, суперкомпьютерами называют самые быстрые компьютеры. Их основное отличие от мэйнфреймов состоит в том, что все вычислительные ресурсы такого устройства направлены на решение одной глобальной задачи за минимально возможное время. Ну а мэйнфреймы, наоборот, решают сразу массу задач.
В итоге суперкомпьютеры находятся на самой вершине любых компьютерных чартов и, как следствие, быстрее мэйнфреймов.
Человечество всегда нуждалось в быстром решении различных задач, но толчком к появлению супербыстрых машин послужила гонка вооружений известных сверхдержав и нужда в ядерных расчетах для проектирования и моделирования ядерных взрывов и вооружений. Для создания атомного оружия требовалась колоссальная вычислительная мощь, поскольку ни физики, ни математики были уже не в состоянии просчитывать и делать долгосрочные прогнозы, оперируя колоссальными объемами данных.
Для таких целей требовался компьютерный «разум». Но далее военные задачи плавно переходили в биологические, химические, астрономические метеорологические и другие. Все это заставило изобрести не просто компьютер, а нечто большее. Так появились первые мэйнфреймы и суперкомпьютеры.
Начало производства сверхбыстрых машин приходится на середину 60-х годов прошлого века. И важным критерием любого устройства была его производительность. Здесь на слуху у каждого оверклокера известная аббревиатура «FLOPS». Большинство тех, кто разгонял и тестировал процессор на стабильность, с большей долей вероятности использовал утилиту «LinX», которая выдает конечный результат производительности в гигафлопсах.
«FLOPS» (русское «флопс», акроним от английского FLoating-point Operations Per Second) является внесистемной единицей, используемой для измерения производительности любых компьютеров и показывающей, сколько операций с плавающей запятой в секунду выполняет данная вычислительная система.
LinX это бенчмарк «Intel Linpack», снабженный удобной графической оболочкой и предназначенный для упрощения проверки производительности и стабильности системы с использованием теста Intel Linpack (Math Kernel Library).
В свою очередь Linpack является самым популярным программным продуктом для оценки производительности суперкомпьютеров и мэйнфреймов, входящих в рейтинг суперкомпьютеров TOP500. Два раза в год его составляют специалисты в США из Национальной лаборатории имени Лоуренса в Беркли и Университета Теннесси.
При соотнесении результатов в гига-, мега- и терафлопсах следует помнить, что результаты быстродействия суперкомпьютеров всегда указывают над числами 64-разрядного формата, в то время как в обыденной жизни производители процессоров или видеокарт могут указывать производительность на 32-х разрядных данных, тем самым результат может казаться увеличенным в два раза.
И поскольку мы уже разобрались с единицей производительности самых быстрых компьютеров, стоит напомнить о разработчике популярной утилиты LinX.
Возможно, для кого-то будет открытием, возможно – нет, но автором лучшего бенчмарка всех времен и народов является участник нашего форума Александр Гусев, известный также под псевдонимом Dualist. Так что LinX можно назвать отечественным стратегическим продуктом
Тема самого проекта находится тут, а помериться производительностью своего разогнанного процессора вы можете с другими оверклокерами в этой теме нашей конференции.
Первый мэйнфрейм был разработан небезызвестной компанией IBM в 1964 году, при этом затраты на его создание составили 5 миллиардов долларов. Для перевода в современные американские денежные знаки эту сумму нужно умножить где-то на шесть.
Назывался он просто – IBM System/360. Суперкомпьютер не был заключен в привычный монолитный корпус, а состоял из различных модулей и весил не одну тонну. Всего IBM анонсировала шесть моделей своей системы и 40 наименований различной периферии.
Производительность такого мэйнфрейма в зависимости от модели составляла от нескольких тысяч до миллиона операций в секунду. Сердцем системы являлись интегральные схемы, в которых использовалось от десятков до сотен миллионов транзисторов.
Объем оперативной памяти в зависимости от модели был от 16 до 1024 Кбайт, хотя в максимальной комплектации он достигал 16 Мбайт. Вся обрабатываемая информация хранилась на гигантских бобинах с магнитной лентой, которые содержали девять дорожек. Были выпущены накопители на жестких дисках, объем которых составлял единицы мегабайт, а масса – пару десятков килограммов. Доступен был и вариант хранения информации на памяти с магнитными сердечниками объемом пару мегабайт.
По нынешним меркам характеристики микроскопические, но с них-то все началось. С анонсом IBM System/360 были введены многие современные стандарты, которые и поныне ими остаются. Впервые один байт равнялся восьми битам, ввели байтовую адресацию памяти и 32-х битные слова. А в старших моделях была реализована технология динамической трансляции адресов (dynamic address translation), которая известна нам под названием «виртуальная память».
Несмотря на немалую стоимость (до трех миллионов долларов), продажи IBM System/360 шли на ура. За первый месяц IBM поступило заказов более чем на тысячу экземпляров, а за шесть лет существования данного семейства было продано более 33 тысяч таких машин. Таким образом мэйнфрейм IBM System/360 заложил фундамент и дальнейшие тенденции развития компьютерной техники.
Первым суперкомпьютером в полном понимании этого слова можно назвать построенную в 1976 году Сеймуром Крэем высокопроизводительную и эстетически привлекательную машину с названием Cray-1. Ее разработка обошлась в $8.86 млн (~$35 млн по нынешнему курсу).
Первый экземпляр новой супермашины отправился в Лос-Аламосскую национальную лабораторию для расчетов проектирования ядерного оружия. И пусть его стоимость составила 8.86 млн долларов, но последующие машины были лишь на пару сотен тысяч долларов дешевле.
Cray-1 представлял собою векторно-конвейерную вычислительную систему. Центральный процессор включал 500 печатных плат, на которых находилось 144 000 микросхем, они в свою очередь работали на частоте 80 МГц. Поставщиком микросхем стала компания Fairchild, из которой в последующем вышли основатели Intel и AMD. Объем оперативной памяти равнялся 8 мегабайтам.
Все платы устанавливались в башенный корпус с двенадцатью секциями, при виде сверху форма суперкомпьютера напоминала очертание буквы «C».
Для повышения производительности и уменьшения задержек при прохождении сигнала Сеймур Крэй придумал и спроектировал специальную форму своей машины. Главная идея сводилась к уменьшению расстояния между платами, поэтому форма основного скелета была выбрана в виде многогранника, что давало возможность окружить процессор по периметру чипами оперативной памяти, в результате чего время доступа к каждому из них было одинаковым.
Кроме того, такое расположение плат позволяло сократить длину проводов и обеспечить лучший теплоотвод. Несмотря на эти оптимизации, количество проводов внутри Cray-1 поражало воображение.
Лично мне башенный дизайн Cray-1 чем-то напомнил цилиндрический Apple Mac Pro, только в гораздо уменьшенном виде.
Производительность системы превосходила 100 MFLOPS, а в оптимизированных для векторного процессора задачах достигала 150 MFLOPS. Масса Cray-1 была равна 5.25 тонны, высота – около двух метров, суммарное энергопотребление – 250 кВт (135 кВт приходились на компрессорную систему охлаждения, работающую на жидком фреоне).
Жидкий фреон циркулировал по двенадцати стальным магистральным трубкам внутри корпуса системы, забирая тепло от плат с микросхемами, к которым примыкали медные пластины с тефлоновым покрытием для более эффективного отвода тепла. А в нижней части Cray-1 находилась холодильная установка.
Ниже представлен пример плат Cray-1, которые сейчас продают на всемирном аукционе eBay как реликвии. При выходе из строя одной микросхемы менялась вся плата целиком, ремонт вышедшего из строя компонента системной платы не предусматривался.
Особенность архитектуры Cray-1 состояла в том, что она обладала способностью адаптации к структуре решаемой задачи: допускалась параллельная работа и самих конвейеров, и элементарных блоков обработки в пределах любого конвейера.
Система была способна выполнять как скалярные, так и векторные операции, причем одновременно могло выполняться несколько скалярных и векторных операций. В качестве операционной системы выступала COS (Cray Operating System), которая обеспечивала режим пакетной обработки до 63 задач.
Для покупателей этого суперкомпьютера был доступен своеобразный моддинг – заказчик мог выбрать цвет граней на свое усмотрение. А для тех, у кого не хватало финансов на покупку, предусматривалась аренда супермашины. К примеру, месячный абонемент стоил 210 500 долларов.
С момента выпуска первого экземпляра суперкомпьютера до конца его производства компания Сеймура Крэя продала 85 систем Cray-1, став мировым лидером по выпуску самых производительных вычислительных систем.
Весной 1985 года Сеймур Крэй представил новый и самый быстрый в мире компьютер Cray-2, построенный по заказу Министерства обороны США. Он удерживал пальму первенства среди всех супермашин до 1990 года и существенно отличался от своего предшественника.
За десять лет производительность заметно выросла и достигла 1.9 GFLOPS. Объем оперативной памяти составлял 2 Гбайт. Количество процессоров достигало четырех штук, и к каждому из них помимо векторных регистров была добавлена локальная оперативная память объемом 128 Кбайт. Тактовая частота одного процессора составляла 244 МГц, вычислительная мощность равнялась 488 MFLOPS.
Внешне новинка выглядела в виде все того же цилиндра, правда, его размеры и масса уменьшились. Высота машины составляла 1.15 м, масса – 2500 кг. Энергопотребление – 195 кВт.
Стоимость одной машины была установлена в районе 17.5 млн долларов, по нынешним меркам примерно $36 млн.
Из-за уменьшения размеров и более плотной компоновки плат фреоновую систему охлаждения применить было уже невозможно. И тогда Сеймур Крэй в очередной раз предложил инновационный подход в виде использования жидкостной системы охлаждения.
Внутрь герметичного корпуса Cray-2 заливалась специальная инертная охлаждающая жидкость (разработка компании 3М), которая забирала на себя все тепло, выделяемое суперкомпьютером. Объем жидкости доходил до 760 литров, что составляло около трети всей массы устройства. При нагревании элементов на прозрачных стенках Cray-2 появлялись многочисленные пузырьки, и с современной RGB подсветкой этот суперкомпьютер смотрелся бы намного лучше
Но у данной жидкости было одно негативное свойство. При ее закипании выделялся опасный для здоровья человека газ, поэтому должна была соблюдаться полная герметичность корпуса.
Cray-2 получил возможность подключения к другому такому же суперкомпьютеру для увеличения вычислительных мощностей. Подключение осуществлялось через специальную выделенную сеть с пропускной способностью 1.6 Гбит/с.
С середины 1980-х годов роль программного обеспечения начала возрастать, а затраты на его проектирование – расти. Так, на разработку ПО для Cray-2 было потрачено столько же средств, сколько на его аппаратное обеспечение. В качестве операционной системы Cray-2 использовалась операционная система UNICOS на основе Unix.
В 1990 году специально для Ливерморской национальной лаборатории был построен в единственном экземпляре восьмипроцессорный Cray-2 стоимостью 19 миллионов долларов, который сейчас находится в Музее компьютерной истории в штате Калифорния, США.
После этого все усилия были брошены на разработку следующей модели суперкомпьютера Cray-3, однако из-за возникшего ряда проблем был построен только один экземпляр Cray-3. Его вычислительная мощность составляла 5 GFLOPS.
Интересно, что Cray-3 моделировался на компьютерах Apple, а компания Apple в свою очередь приобрела суперкомпьютер Cray для проектирования дизайна собственных ПК.
Модели Cray были использованы не только для военных целей, их мощности применялись в NASA, а также для создания спецэффектов в киноиндустрии. Последняя уже начинала отходить от макетных моделей и использовала всю мощь суперкомпьютеров для создания спецэффектов. Мощности Cray-2 задействовались в таких блокбастерах, как «Звездные войны», «Парк юрского периода», «Терминатор 2: Судный день» и других.
С момента зарождения рынка суперкомпьютеров на нем господствовали американские компании, но с начала 90-х годов прошлого века в конкурентную борьбу начали включаться японские производители. Одним из них была компания Fujitsu, создавшая в 1993 году свой векторный параллельный суперкомпьютер Numerical Wind Tunnel при сотрудничестве с японской Национальной аэрокосмической лабораторией.
В тесте Linpack Numerical Wind Tunnel показал производительность 124.2 GFLOPS. В его основе лежали 140 векторных процессоров с тактовой частотой 105 МГц, произведенных самой Fujitsu. В последующем их количество было увеличено до 166 штук. Объем общей оперативной памяти составлял 44.5 Гбайт или 256 Мбайт на узел. Суммарная потребляемая мощность системы равнялась 498 кВт. Система охлаждения была двухкаскадной, первый охлаждал платы с микросхемами, а второй выводил тепло за пределы здания.
В марте 1996 года японская компания Hitachi выпустила свой суперкомпьютер с незамысловатым названием SR2201/1024. В данной системе использовались сразу 1024 скалярных процессора HARP-1E на основе архитектуры PA-RISC 1.1 с тактовой частотой 150 МГц, которые были способны развить производительность в 220.4 GFLOPS. Эти процессоры производились по заказу компанией Hewlett-Packard.
Каждый из 1024 узлов получал в свое распоряжение 256 Мбайт оперативной памяти, что суммарно давало 256 Гбайт, и сообщался с другими узлами по скоростному интерфейсу, способному обеспечить передачу данных на уровне 300 Мбайт/с. Объем дискового пространства был равен 72 Гбайт. Данный суперкомпьютер размещался в Токийском университете.
Первым суперкомпьютером, который преодолел рубеж в 1000 GFLOPS или 1 терафлопс, был Intel ASCI Red, построенный в 1997 году.
В его основе лежали известные каждому 9152 обычных, свободно продававшихся в то время в рознице процессоров Intel Pentium Pro с тактовой частотой 200 МГц (разъем Socket 8). Каждый узел содержал два таких процессора и 128 Мбайт оперативной памяти.
Пара таких узлов устанавливалась на общей плате с коммуникационным модулем, а те в свою очередь размещались в 85 шкафах-стойках. Суммарный объем оперативной памяти у Intel ASCI Red составлял 594 гигабайта, дисковая подсистема состояла из 640 жестких дисков с суммарным объемом дискового пространства 2 терабайта.
Этот «терафлопсный» суперкомпьютер был построен самой Intel по заказу правительства США, стоимость компонентов была в районе $55 млн. Главный архитектурный критерий заключался в использовании общедоступных компонентов, поэтому были выбраны стандартные серверные компоненты того времени, но за исключением коммуникационных модулей, разработанных специально для ASCI Red.
А главная задача машины заключалась в мониторинге ядерного арсенала США после объявления в октябре 1992 года моратория на проведение ядерных испытаний.
Все оборудование размещалось на площади в 150 кв. м и потребляло 850 кВт энергии; еще 500 кВт требовалось на кондиционирование помещения для поддержания оптимальной температуры работы суперкомпьютера. В тесте Linpack он показал результат 1.338 TFLOPS.
В 1999 году назрел апгрейд Intel ASCI Red и тендер опять выиграла Intel. Благодаря этому событию на свет появился уникальный процессор с разъемом Socket 8 и мощью Pentium II – Pentium II OverDrive с частотою 333 МГц.
«Заряженный» Intel ASCI Red версии 2.0 с 9632 процессорами после апгрейда обеспечил производительность на уровне 2.38 TFLOPS в тесте Linpack. Такие качественные характеристики позволили Intel ASCI Red удерживать звание самого быстрого суперкомпьютера с июня 1997 до июня 2000 года.
Но процессорных мощностей никогда не бывает мало, и поэтому по заказу правительства США в рамках развития суперкомпьютерных технологий при третьем этапе программы «Advanced Simulation and Computing Program – ASCI» был объявлен тендер на построение еще более мощного суперкомпьютера.
Здесь стоит отметить, что каждый этап программы предполагал увеличение мощности нового суперкомпьютера относительно предыдущего примерно в 2.5 раза. И на сей раз честь быть творцом нового покорителя терафлопсов выпала IBM. В феврале 1998 года было официально объявлено, что компания IBM получила контракт на постройку нового суперкомпьютера, который будет называться ASCI White.
15 августа 2001 года он был официально сдан заказчику и установлен в Ливерморской национальной лаборатории.
Что же представлял собою ASCI White, который стоил 110 миллионов долларов? Это кластер из SMP-серверов, состоящий из 512 машин, связанных новой коммуникационной технологией «Colony» с пропускной способностью около 500 Мбайт/с.
Суммарное количество процессоров IBM Power3 с тактовой частотою 375 МГц равнялось 8192 экземплярам. В распоряжении суперкомпьютера находились 6 Тбайт оперативной памяти и 160 Тбайт дискового пространства. Размеры ASCI White были сопоставимы с площадью двух баскетбольных площадок, а масса всего оборудования составляла 106 тонн.
Общая длина кабелей для соединения компонентов достигла 64.3 км. Для их укладки пришлось надстроить пол на высоту 60 см для возможности прокладки шлейфов.
Потребляемая мощность ASCI White составляла 3 МВт электроэнергии, и еще столько же требовалось на охлаждение. Вся эта мощь показала результат в тесте Linpack в 7.3 TFLOPS.
В 2002 году майка лидера вновь ушла в Страну восходящего солнца. По заказу японского правительства компания NEC построила суперкомпьютер с реальной мощностью 35.86 TFLOPS. Модель с названием «Earth Simulator» («Симулятор Земли») была разработана специально для японского агентства науки и технологии для проведения климатических, тектонических, атмосферных и других расчетов.
По факту была построена маленькая модель нашей планеты для прогнозирования различных природных явлений и катастроф.
NEC Earth Simulator получился в пять раз быстрее IBM ASCI White и в три с половиной раза дороже (на разработку было потрачено 350 миллионов долларов США). Для его установки был построен двухэтажный павильон 65 метров в длину и 50 в ширину.
640 узлов с восемью векторными процессорами и 16 гигабайтами оперативной памяти в каждом узле суммарно объединяли 5120 процессоров и 10 терабайт оперативной памяти. Частота каждого процессора составляла 500 МГц, но некоторые его компоненты поддерживали работу на частоте 1 ГГц.
Система памяти на жестких дисках состояла из моделей HDD суммарным объемом 700 Тбайт, плюс к этому объему добавлялась ленточная библиотека StorageTek 9310 объемом 1.6 петабайт. Количество потребляемой энергии – 6.4 МВт; и это без учета затрат на охлаждение, поэтому рядом была построена небольшая подстанция на 20 Мвт.
Для соединения всех компонентов потребовалось 83 200 кабелей суммарной длиной 2400 км. Скорость двунаправленной передачи данных по каждому каналу, соединяющему процессорные узлы с переключателем, равнялась 12.3 Гбайт/с. В 2009 и далее в 2015 году NEC выпустила второе и третье поколение «Симулятора Земли». К слову, последнее поколение Earth Simulator обеспечивает производительность 35.61 TFLOPS.
Первым суперкомпьютером, впервые в истории преодолевшим порог в один петафлопс, стал IBM Roadrunner, построенный, что естественно, самой IBM и установленный в Лос-Аламосской национальной лаборатории (США) для исследований в области ядерного вооружения в 2008 году. Кроме того, это был первый гибридный суперкомпьютер, использующий одновременно две различные процессорные архитектуры.
В состав IBM Roadrunner входили, гармонично работая друг с другом 6 480 двухъядерных процессоров AMD Opteron 2210 с частотой 1.9 ГГц и 12 960 процессоров IBM PowerXCell 8i с частотой 3.2 ГГц (наподобие тех, что использовались в Sony PlayStation 3).
Этот суперкомпьютер, как и Intel ASCI Red, изготавливался из общедоступных комплектующих – в его состав вошли блейд-серверы IBM Model QS22, которые разместились в 278 шкафах. Для связи использовалось 10 000 соединений Infiniband и около 90 км волоконно-оптического кабеля.
Суммарный объем оперативной памяти этого монстра равнялся 98 терабайт, масса – 226 тонн, потребляемая мощность – 3.9 Мвт, на разработку ушло более 120 миллионов долларов США.
Стандартная обработка (например, ввода / вывода файловой системы) происходит процессорами AMD Opteron, математические и процессорные вычисления обрабатываются процессорами Cell. IBM Roadrunner работал с программным обеспечением Linux с открытым исходным кодом Red Hat.
Но уже с 2008 года началась гонка за покорение петафлопс. В конце 2009 года суперкомпьютер Cray XT5 (известный как «Jaguar») в тесте Linpack показал производительность в 1.759 PFLOPS. В 2010 суперкомпьютер из Китайской Народной Республики Tianhe-1A обеспечил производительность в 2.57 PFLOPS. В 2011 японский суперкомпьютер K Computer продемонстрировал результат в 8.16 квадриллиона операций в секунду. Но нам более интересен суперкомпьютер с названием Titan, построенный компанией Cray.
По сути суперкомпьютер Titan или Cray XK7 был апгрейдом Jaguar, который работал в национальной лаборатории Министерства энергетики США.
Обновление ценой в 60 миллионов долларов включало 18 688 шестнадцатиядерных AMD Opteron 6274 (Socket G34, микроархитектура – Bulldozer, цена на момент анонса – $639) c частотою 2.2 ГГц и 18 688 серверных GPU Nvidia Tesla K20X (микроархитектура – Kepler, стоимость на момента анонса – $3199, близкий игровой аналог – GeForce GTX Titan первого поколения). Мощность одной Tesla K20X с шестью гигабайтами памяти на борту составляла 1.31 TFLOPS.
Такое разнородное соседство компонентов позволило продемонстрировать впечатляющую производительность в 17.6 PFLOPS.
Суммарный объем оперативной памяти Titan’a составлял 710 Тбайт, объем дисковой подсистемы был равен 40 Пбайт, а потребление электроэнергии было на уровне 8.2 МВт.
В настоящее время Titan, выпущенный Cray, несмотря на прошедшие с момента его запуска до наших дней пять с половиной лет, занимает пятую строчку мирового рейтинга TOP-500. И на данный момент времени пятерка лидеров выглядит следующим образом:
Первую строчку занимает суперкомпьютер из Китая с умопомрачительным количеством вычислительных ядер – Sunway TaihuLight, который в тесте Linpack продемонстрировал результат 93 PFLOPS!
В основе данной машины лежат китайские разработки: используются 260-ти ядерные 64-битные RISC-процессоры собственного производства с тактовой частотой 1.45 ГГц. Sunway TaihuLight в общей сложности задействует 10 миллионов процессорных ядер, при этом каждое ядро способно выполнять несколько инструкций.
Объем оперативной памяти составляет 1.31 Пбайт, потребляемая мощность – 15 МВт. Суммарный объем дискового пространства равен 20 Пбайт. Конструктивно суперкомпьютер состоит из 40 стоек с водяным охлаждением с пиковой производительностью каждой стойки в 3 PFLOPS.
Суперкомпьютер Sunway TaihuLight является разработкой специалистов Национального исследовательского центра параллельных компьютерных вычислений и технологий и установлен в Национальном суперкомпьютерном центре в Уси. Для разработки данного устройства было затрачено 273 миллиона долларов.
Сейчас Китай строит новый высокопроизводительный компьютер следующего поколения – Tianhe-3, который будет как минимум в десять раз быстрее, чем Sunway TaihuLight.
Будущий суперкомпьютер должен преодолеть новый рубеж производительности в 1 эксафлопс (1 000 000 000 000 000 000, миллион триллионов) операций с плавающей запятой в секунду. Предположительно, строительство закончится в 2020 году, осталось дождаться этого момента.
Как вы уже могли заметить, процессоры для суперкомпьютеров использовались разные:
Последние представляют наибольший интерес. Как правило, такие решения содержат несколько процессорных ядер на одной подложке, кристаллы которых, если удастся снять защитное крепление, засверкают всеми цветами радуги. Приведу несколько таких примеров.
Выше на снимке можно увидеть процессор IBM Power5+ в упаковке QCM (Quad Chip Module). Его восемь ядер работают на частоте 1.8 ГГц, а рядом с ними расположены 72 Мбайт кэш-памяти третьего уровня (L3 Cache).
У Pentium Pro похожая упаковка, но единственное процессорное ядро и кэш второго уровня (L2) находятся на разных кристаллах.
А так выглядит IBM Power4 CPU без теплораспределительной крышки:
Корпус процессора изготовлен из прочной керамики, и отсоединить такую же керамическую крышку – дело далеко не простое. Приходится использовать грубую силу и специальный инструмент.
По мере продвижения прогресса количество кристаллов под крышкой таких процессоров увеличивалось, а сами размеры CPU росли. Они обзаводились массивными стальными рамками, причем некоторые модели предоставляли возможность подключения водяного охлаждения.
Выше на фото представлен процессор IBM Z10, выпущенный специально для мэйнфреймов в 2008 году. Этот «модульник» включает пять четырехъядерных CPU с частотой 4.4 ГГц, а также два контроллера памяти. Кэш-память второго уровня равна 3 Мбайт для каждого ядра; в дополнение к ней в зависимости от модели может быть еще от 40 до 48 Мбайт кэш-памяти третьего уровня. Размеры такого процессора впечатляют.
Ниже можно увидеть еще одного «монстра» - IBM Z196.
Данный процессор представляет собой многочиповый модуль и был специально разработан IBM для своих супермашин еще в 2010 году. Чип площадью 512.3 мм2 состоит из 1.4 миллиарда транзисторов. Технология производства – 45 нм, тактовые частоты – до 5.2 ГГц.
Помимо 24 Мбайт общего кэша L3, на процессорном модуле есть два специальных выделенных чипа-компаньона, называемых Shared Cache. Каждый из них добавляет кэш-память L4 на 96 Мбайт, что суммарно увеличивает общий объем L4 кэша до 192 Мбайт.
Ну а далее нас ждут просто настоящие исполины:
Для удобства установки таких процессоров используются готовые модули с ручкой.
Разобрать такой процессорный модуль непростая задача, порою для этой процедуры нужно обладать набором инструментов, представленных ниже на снимке, и даже газовая горелка не помешает.
Кстати, метод с тисками, применимый для десктопных ЦП, тут не пройдет. В качестве примера приведем разборку IBM Power4 в картинках:
Можно ли использовать такую машину как суперкомпьютер дома? А почему бы и нет. Главное – желание, а мэйнфрейм найдется
Возможно, не все знают, но пару лет назад Сеть облетела новость о том, что 18-летний студент колледжа в Мэриленде Коннор Крукоски (Connor Krukosky) собрал в подвале своего дома мэйнфрейм IBM z890, который в 2004 году стоил более $300 000. Удалось ему это благодаря участию в аукционе на сайте GovDeals, где один из университетов избавлялся от устаревшего «железа». Помимо единственной ставки Коннора Круковски в $237 других участников не было, и он приобрел бывший в употреблении мэйнфрейм по номинальной цене – за $237.
Масса и размеры IBM z890 немаленькие, ведь это не персональный компьютер. При габаритах 79 х 158 х 195 см и массе 680 кг данное вычислительное устройство нелегко транспортировать и разместить в помещении. Но нет ничего невозможного.
После операции по транспортировке в подвал мэйнфрейм был собран и подключен.
В результате благодаря публикации автора эксперимента в интернете его пригласили в IBM сначала на экскурсию, а затем попросили прочитать лекцию, поскольку 19-тилетний подросток обладал такими знаниями по мэйнфреймам производства IBM, которыми не могут похвастать некоторые специалисты.
А в последующем ему предложили совмещать дальнейшую учебу и работу в IBM. Так что иногда простое увлечение перерастает в профессию. Фотографии процесса сборки и транспортировки можно посмотреть по ссылке.
Настало время сравнить производительность суперкомпьютеров и мэйнфреймов в TFLOPS. А чтобы было интереснее, подберем им компаньонов из числа обыкновенных компьютерных устройств, которые можно встретить в обыденной жизни.
Сравнение производительности в Linpack| Тип устройства | Результат, терафлопс |
| Sunway TaihuLight | 93 000 |
| Cray Titan | 17 590 |
| IBM Roadrunner | 1 042 |
| NEC Earth Simulator | 35.86 |
| VR-Ready Workstation with 4xNvidia Tesla V100 | 30.00 |
| Nvidia Tesla V100 (Volta with HBM2) | 7.50 |
| ASCI White | 7.30 |
| Sony PlayStation 4 | 1.84 |
| Intel ASCI Red | 1.338 |
| Intel Core i9-7980XE overclocked (18 Cores, LGA 2066) | 1.00 |
| AMD Ryzen R7 1800X | 0.2362 |
| Sony PlayStation 3 | 0.228 |
| Hitachi SR2201/1024 | 0.22 |
| Nvidia GeForce GTX 780 Ti | 0.21 |
| Numerical Wind Tunnel | 0.124 |
| Intel Core i7 980 XE | 0.1076 |
| Sony PlayStation 2 | 0.0062 |
| Intel Pentium 4 3.4 ГГц | 0.0032 |
| Qualcomm Snapdragon 820 | 0.0027 |
| Cray-2 | 0.0019 |
| Cray-1 | 0.0001 |
Я, если можно так сказать, кратко попытался взглянуть на историю развития самых быстрых вычислительных машин и те цифры, которыми они оперировали. Возможно, через 10-20 лет любой смартфон или компьютер достигнут той же производительности, что и занимающий сейчас первое место в TOP-500 Sunway TaihuLight, если не превзойдут его. Поживем-увидим.
И, конечно, мне бы хотелось собрать свой собственный мэйнфрейм и дополнительно его разогнать, поскольку информации о разгоне этих машин на просторах интернета я не встречал
До скорых встреч!