Компания Intel продолжает расширять линейку серверных процессоров, делая акцент на энергоэффективных ядрах. Представленный чип Clearwater Forest отличается не только количеством ядер, но и глубокой модернизацией архитектуры.
В новой линейке Intel Xeon Clearwater Forest используются исключительно ядра E-Core. Они ориентированы на задачи с высокой плотностью вычислений и горизонтальным масштабированием. В отличие от серии P-Core Diamond Rapids, предназначенной для ресурсоемких сценариев, здесь сделан упор на баланс между энергопотреблением и производительностью.
Процессор построен на техпроцессе Intel 18A, где применяются затворы-всем-рядом и металлическая основа задней стороны. Эти решения уменьшают емкость затвора, повышают плотность ячеек и сокращают задержки. В итоге инженеры добились более низких потерь питания — до 5%.

Архитектура Darkmont стала развитием E-Core из Sierra Forest. В ней обновлен интерфейс, улучшен предсказатель ветвлений, а декодеры обеспечивают до девяти инструкций за цикл. Механизм внеочередного исполнения расширен: 8 портов выдачи, 16 портов приема, окно OOE увеличено на 60%. Всего предусмотрено 26 портов выполнения, что дает заметный прирост параллельности.
Существенные изменения коснулись и подсистемы памяти. Пропускная способность подсистемы возросла на 50%. Каждый четырехъядерный кластер получил 4 МБ L2-кэша с удвоенной пропускной способностью — до 400 ГБ/с. Общий объем L2 может достигать 288 МБ, а LLC — 576 МБ. В тестах SpecIntRate’17 прирост IPC составил 17%.

Чип выполнен в модульной компоновке: 12 вычислительных чиплетов на 18A, три базовые плитки на узле Intel 3 и два модуля ввода-вывода на Intel 7. Для соединения используется технология EMIB. В Clearwater Forest реализована сетчатая структура межсоединений, что позволило сократить длину маршрутов и повысить эффективность обмена данными.
Поддержка памяти расширена до 12 каналов DDR5-8000. В двухсокетной системе это дает до 3 ТБ ОЗУ и пропускную способность около 1300 ГБ/с. По сравнению с Sierra Forest, где использовалась DDR5-6400, прирост заметен. Конфигурация с 576 ядрами и 1152 МБ LLC может выдавать до 59 TF/с и обеспечивать суммарную пропускную способность в 5000 ГБ/с.

