Как сообщает веб-ресурс CNews в материале Первый в мире «экзафлопсный» суперкомпьютер строится на секретной архитектуре Intel», суперкомпьютер Aurora, в который уже инвестировано 0,5 млрд долл, станет первой в США системой с рекордной производительностью «более экзафлопса». Субподрядчик Cray намерен применить свою платформу Shasta на базе секретной архитектуры Xe от основного подрядчика Intel.


Первый американский «экзафлопс»

США официально включились в мировую гонку по запуску первого в мире суперкомпьютера с производительностью более 1 экзафлопс. Представители Министерства энергетики США (U.S. Department of Energy), которое выступает заказчиком, официально подтвердили, что создаваемый компаниями Intel и Cray суперкомпьютер Aurora, способный «обеспечить устойчивую производительность порядка одного экзафлопса», будет запущен в строй в Аргоннской национальной лаборатории (Argonne National Laboratory) ближе к концу 2021 г.

Производительность системы Aurora в один экзафлопс, соответствующая выполнению 1018 (квинтиллион, или миллион триллионов) операций с плавающей запятой в секунду, планируется обеспечить с помощью новой секретной архитектуры Intel Xe (в маркетинговых целях пишется как Xe — «икс в степени экспоненты») следующего поколения, о которой до сих пор известно очень мало.

Впервые завеса секретности над проектом Intel Xe была в самых общих чертах приоткрыта в рамках суперкомпьютерной конференции SC18 в конце прошлого года. Первые подробности были озвучены 15 марта на специальном закрытом брифинге Intel для профильных специалистов.

Финальная версия контракта на создание суперкомпьютера Aurora (в ранних описаниях контракта проект фигурировал под названием CORAL) подразумевает инвестиции в сумме более $500 млн. Несмотря на ряд изменений в контракте, компания Intel по-прежнему фигурирует в качестве основного подрядчика, компания Cray заявлена субподрядчиком проекта.

Инфраструктура проекта Aurora

Конструкция суперкомпьютера Aurora базируется на базе двух сотен унифицированных кластерных систем Cray Shasta, объединенных межузловой шиной (интерконнектом) Cray Slingshot и программным стеком Shasta.

Каждая система Shasta базируется на процессорах Intel Xeon Scalable нового поколения, вычислительной архитектуре Intel Xe, энергонезависимой памяти Intel Optane Datacenter Persistent Memory нового поколения, с использованием программного стека Intel One API.

Как отмечают в Cray, сочетание программных компонентов Intel и системного ПО Cray для систем Shasta обеспечит модульность суперкомпьютера Aurora и удобства по дальнейшему наращиванию его системных ресурсов в любое время. Унифицированные вычислительные стойки Shasta с интерконнектом Slingshot в сочетании с единой инфраструктурой управления и разработки приложений позволят, по задумке разработчиков, оптимизировать рабочие нагрузки суперкомпьютера и сэкономить время ученых и других пользователей.

Выручка Cray по этому контракту, оцениваемая более чем в $100 млн, станет одной из крупнейших в истории компании. Создание суперкомпьютера Aurora станет вторым крупным внедрением систем Shasta за последние полгода. Первым стал контракт на $146 млн по строительству системы Perlmutter для Федерального научного энергетического вычислительного центра США (National Energy Research Scientific Computing Center, NERSC) в Беркли, Калифорния.

Архитектура Xe: «будет круто», но пока все расплывчато

Изначально, в момент анонса архитектуры Xe на форуме SC18, ряд сетевых обозревателей поспешили окрестить ее как «новый бренд графических ускорителей Intel». Рассказывая на закрытом брифинге об архитектуре Xe, Раджиб Хазра (Rajeeb Hazra), вице-президент Intel и глава подразделений Data Center Group и Enterprise and Government Group, так и не представил никаких технических подробностей о проекте. Ни слова о строении архитектуры или о роли, занимаемой в ней графическими ускорителями Intel, отмечают обозреватели HPCwire.

Использование новой архитектуры в рамках проекта Aurora представители Intel описали как «новые техпроцессы, разработка эффективного кремния и, что наиболее важно, новые способы… упаковки кремния».

Как было отмечено в рамках презентации проекта, «Xe представляет огромный объем научно-исследовательских работ и инноваций для соответствия современным рабочим нагрузкам, в частности, возникающим на стыке задач HPC, искусственного интеллекта и аналитики данных».

Тем не менее, Крис Хук (Chris Hook), отвечающий за маркетинг в подразделении Intel по разработке графических систем, внес уточнение, пояснив, что Xe представляет собой «переход Intel от экономичной графической архитектуры Gen к полностью масштабируемой графической архитектуре Xe».

«Это не название бренда вроде Radeon или GeForce», отметил Крис Хук на своей странице в Twitter. Сегодня, упомянув официальный запуск проекта суперкомпьютера Aurora, Крис Хук также написал «наш первый заказчик Xe!».

Таким образом, архитектура Xe вне всяких сомнений имеет прямое отношение к графическим ускорителям Intel нового поколения. Вопрос лишь в том, что архитектура этих ускорителей до сих пор остается закрытой для широкой публики.

Как ранее рассказали в Intel, графические решения на базе архитектуры Xe будут развиваться двумя самостоятельными архитектурными потоками – в виде дискретных и интегрированных решений для рынка бытовых систем, и в виде дискретных карт для ЦОДов и HPC. Появление графики нового поколения было обещано Intel ближе к 2020 г., по мере освоения техпроцесса 10 нм.

Согласно официальным заявлениям Intel, графические решения на базе архитектуры Xe будут обеспечивать производительность «от терафлопсов до петафлопсов». Тем не менее, число таких решений на архитектуре Xe в составе суперкомпьютера Aurora пока не оценено даже приблизительно.

Чем будет заниматься Aurora

По словам представителей партнеров проекта — Минэнергетики США, Аргоннской лаборатории, Intel и Cray, суть проекта не только в достижении «горизонта экзаскейла», основная роль проекта Aurora – в ускорении сближения высокопроизводительных вычислений с традиционными методиками моделирования с применением анализа данных и искусственного интеллекта.

По словам Рика Стивенса (Rick Stevens), замдиректора Арагоннской лаборатории по вычислениям и компьютерным наукам, Aurora будет «эксклюзивно сконфигурирована» в качестве лучшей платформы для глубокого машинного обучения.

Комментируя огромный скачок, который придется совершить в приросте Aurora (более экзафлопа, или более 1000 петафлопс) по сравнению с самой мощной на сегодня системой Summit (порядка 150 петафлопс) всего за три года, Рик Стивенс отметил: «Исследования и разработки для достижения «экзаскейла» велись более десятилетия… да, система появится только через три года, но за это время потребуется сделать рывок с ускорением для создания архитектуры и ПО под такую производительность».

По словам Рика Стивенса, вычислительные возможности нового суперкомпьютера в сочетании с технологиями аналитики данных позволят Аргоннской лаборатории расширить сотрудничество с Национальным институтом исследований и предотвращения рака (National Institute of Cancer Prevention and Research) и Администрацией по делам ветеранов. В рамках этих исследований, в частности, предполагается использовать машинное обучение и анализ больших данных для оценки риск-факторов и разработки стратегий в случаях суицидальных наклонностей у пациентов, для глубокого изучения природы сердечных приступов и последствий черепно-мозговых травм.

Со стороны Минэнергетики США предполагается расширение программ по материаловедению, в том числе, в плане разработки материалов для улучшенных электрических батарей, более эффективных фотогальванических элементов для солнечной энергетики, новых материалов для ветроэнергетических установок и ядерных реакторов. В списке проектов также числятся расширенные исследования в области угрозы землетрясений, улучшения эффективности турбин, предсказания погоды и т.д.

Перспективы «экзаскейла» в мире

В прошлом году Министерство энергетики США уже получило в свое распоряжение два суперкомпьютера, с ходу занявших первую и вторую строчки в мировом рейтинге суперкомпьютеров Top500.

Занявшая первую строчку система Summit на базе модулей IBM Power System AC922 с процессорами IBM POWER9 22C 3,07 ГГц и графическими ускорителями NVIDIA Volta GV100, установленная в национальной лаборатории Oak Ridge, показала производительность на уровне 143,5 петафлопс (пиковая 200,8 петафлопс). На второй строчке расположилась система Sierra Ливерморской лаборатории на базе систем IBM Power System S922LC с процессорами IBM POWER9 22C 3,1GHz и графическими ускорителями NVIDIA Volta GV100, обеспечившая производительность 94,6 петафлопс (на пике до 125,7 петафлопс).

С запуском систем Summit и Sierra США вернули себе лидерство в Top500, уступленное несколько лет назад китайским суперкомпьютерам Sunway TaihuLight и Tianhe-2A.

Китай также не теряет время даром: еще в начале 2017 г. КНР сообщила о начале разработки суперкомпьютера с производительностью в один экзафлопс, с запуском системы в работу уже в 2020 г.

По заявлению разработчиков, новый суперкомпьютер Tianhe-3 будет полностью изготовлен в КНР «от процессоров до операционной системы». Система, как сообщалось, будет доступна «для публичного использования», помогая в решении научных вопросов и «закрепляя за Китаем звание мирового лидера в сфере компьютерного оборудования». В частности, планируется его использование для анализа последовательностей генов и белковых структур, что может в итоге привести к открытию новых лекарств. Экономическая выгода Китаю от работы суперкомпьютера предположительно составит 10 млрд юаней ($1,49 млрд).

Летом 2016 г. планы по созданию компьютера мощностью в один экзафлопс также объявила японская Fujitsu. Ожидается, что машина будет создана на базе архитектуры ARM.

О намерении создать экзафлопсную систему также ранее заявляли в американской корпорации Intel и саровском ядерном центре (РФЯЦ-ВНИИЭФ), Россия.