Высокопроизводительные вычисления, такие как High Performance Computing (High Performance Computing), — технология, использующая возможности суперкомпьютеров или высокопроизводительных компьютеров для достижения параллельных вычислений для обработки данных, которые не могут быть выполненными на стандартных рабочих станциях. Современные HPC, с разработкой чипов и разработкой технологии ии, также продвигаются по совершенно новому пути, обеспечивая устойчивый рост на рынке HPC во всем мире. Тенденции на рынке HPC — устойчивый рост спроса и политики привели к устойчивому росту рынка, который, согласно статистике, достигнет 569,8 миллионов долларов США в 2023 году, по прогнозам, к 2028 году достигнет 967,9 миллионов долларов США, а за прогнозируемый период совокупного прироста в 11,18 %. В последние годы новый спрос на HPC был вызван вспыхами эпидемии, катастрофическим климатом и другими событиями. По мере того как HPC развертывается в облаках и спрос растет, искусственный интеллект, анализ данных также сталкивается с растущим спросом на быструю обработку данных, более высокую точность, включая науку жизни, автомобили, финансы и космическую авиацию. С точки зрения завода по производству кристаллических полей в верхнем течение по состоянию на 2023 год, сбор доходов от батальонов, вносимых HPC, стабилизировался больше, чем в смартфонах. Возьмем, к примеру, электроэнергию, которая в прошлом году составила 43% от общего объема доходов в лагере HPC, уже более чем 2 года подряд. По прогнозам президента КНР вейчхоля, производство полупроводниковой промышленности в этом году вырастет более чем на 10% в этом году, а отрасль промышленности в области металлургической промышленности вырастет на 20% в течение года, и ожидается, что в 2024 году, при помощи спроса на искусственный интеллект (ии) и HPC, годовой доход базы вырастет более чем на 20%. Помимо рыночного спроса, политические стимулы также способствуют развитию рынка HPC. Например, в внутригосударственном плане 14 — го пятилетнего плана говорится о Том, что ускорение строительства новой инфраструктуры, строительство супервычислительных центров класса E и 10E, а также создание высокопроизводительных вычислительных центров в удобрениях, сямынь, тайване и других местах. США также опубликовали руководящую статью, в которой говорится о Том, что необходимо реализовать инвестиции и проекты, связанные с HPC в чипе и научном законопроекте, с тем чтобы увеличить финансирование суперпроектов министерства энергетики и регионального центра инноваций. Требования производительности для различных приложений HPC — не только сила вычисления, ввода/вывода также важна, как и время, когда HPC предлагает решения для вычисления вычислительной мощности сверхвысокой плавучесть, которые могут быть использованы для вычислительных потребностей в различных операциях, таких как обработка данных, таких как различные традиционные научные операции, Распространенные области применения включают базовые научные исследования, метеорологические исследования, моделирование, вычисления материалов, науку жизни, геофизику и т.д. Кроме того, широко применяются различные области бизнеса, такие как анимация рендеринга, биофармацевтика и секвенирование генов. В отличие от других универсальных вычислительных систем, HPC часто требует особой оптимизации единого приложения, как аппаратной, так и программного обеспечения. Таким образом, отсутствие эластичного развертывания системы HPC в то же время представляет собой экстремальную производительность. Различные приложения часто предлагают совершенно разные требования к производительности системы HPC. Например, в анимационном изображении ключевые параметры являются суммой силы плавающей точки, производительности ввода/вывода, что связано с 1. 3D рендер с тяжёлой и трудной активами, с сильным давлением на кэш-слой и ввод-выработку. 2. Необходимо быстрое поставку вычислительной силы, чтобы сократить производственный цикл, как, например, «мост ватермен озера нагацу», «мост ватерлоо — 2», «три тела», и все они были использованы для больших вычислительных сил в центре гаан. Ключевые параметры в метеорологических исследованиях — плавающая сила, длительность сети. Поскольку разрешение на проведение метеорологических наблюдений увеличилось, количество данных в метеорологической отрасли резко выросло, а обрабатывающая способность еще предстоит увеличить. Прогноз на короткие интервалы менее точный и требует более низкой продолжительности времени. В инженерной симуляции время и пропускная способность памяти имеют решающее значение. Поскольку в процессе работы более чем 1,3 измерения взаимодействуют друг с другом и требуют более высокой продолжительности времени и более высокого доступа, более высокая пропуска памяти может быть значительно более эффективной. * HPC верхняя производственная цепь —x86 по-прежнему доминирует на рынке HPC, а Arm поднимается в основном в качестве вычислительного ресурса для систем HPC, в Том числе процессоров, GPU, DPU и других ускорителей. Средняя вода, в свою очередь, охватывает серверы, а также сопутствующие ресурсы, включая хранение, сетевое оборудование, питание, охлаждающее оборудование и т.д. Ниже по течению реки находятся дислокаторы, которые вносят системы HPC в свои приложения, в Том числе производители облачных услуг, гипервычислительные центры и научно-исследовательские учреждения. В промышленной цепи HPC нет ничего более важного, чем процессоры и GPU. Производители процессоров включают в себя intel, AMD, nvidia, IBM, shinwey и другие семейства. GPU включает в себя производителей nvidia, AMD, intel и т.д. Бод то врем как nvidia, AMD, intel, electricite амазонк, ал-баб, леопард интеллект, ZhiLian туман. Кроме того, HPC system иногда интегрируется в другие ускорительные устройства, такие как google NPU, процессор с кристаллической круговой степеней AI в Cerebras, микроскопический модуль разработки макросов и т.д. С точки зрения сравнения, процессор x86 по-прежнему доминирует в системе HPC, в которой специализированная продукция преобладает в основном процессорами Xeon серии xeon и EPYC серии AMD. Кроме того, что сама по себе она достаточно эффективна, не меньше, чем накопление x86 в экологической системе HPC за последние годы. Тем не менее, с инновациями в дизайне Arm, связанные с этим продукты продолжают накапливаться, такие как nvidia CPU, разработанная на основе ядра Neoverse, invidia 710, hua pan 920, или фуjitsu A64FX — процессор с самосовершенствованием, S5000C. Кроме того, Arm завершили разработку высокопроизводительной вычислительной экологии, и соответствующие вычислительные библиотеки и программное обеспечение были последующими. Помимо этих двух архитектур, процессор других архитектур также имеет многообещающие позиции в области гипервычислений, таких как архитектура RISC-V, а также другие архитектуры RISC- c и другие архитектуры risc, но за исключением архитектуры Power IBM, связанные с аппаратным и программным обеспечением экология не совершенна. B200 GPU/nvidia обладает абсолютным господством в катализаторе, который используется в HPC системах, где рынок имеет наибольшую долю, когда nvidia производит высокопроизводительную продукцию GPU. В системе HPC, которая в настоящее время находится в раннем рейтинге производительности, интегрирована продукция, выпускаемая компанией nvidia в течение нескольких лет, начиная от Tesla 100 до H100, и экология CUDA от nvidia, которая также используется в HPC программах. Кроме того, nvidia создала свой собственный сверхсчетный Earth-2 для прогнозирования погоды. Во-вторых, Instinct series AMD использует в полной мере CДНК архитектуру AMD и обеспечивает мощную вычислительную производительность для HPC систем. Первая в мире сверхвычислительная система Frontier использует MI250X GPU AMD. Наконец, в серии intel data center GPU Max не так много HPC-систем, использующих серию GPU, в основном Xeon-процессор, поставляемый покупателям в качестве пакета с данными. Следует отметить, что в настоящее время существует только три системы GPU, которые используются для HPC, поскольку они обеспечивают точную поддержку FP64, необходимой для основных приложений HPC. В то время как GPU, выпущенная в последние годы, поддерживалась только до FP32, поскольку была сосредоточена на вычислениях и применении потребительского уровня. В то же время, как Ай повышало требования к хранению и электроснабжению в HPC-системах, на долю рынка также вносились два наиболее высоких производителя HPE и dell, помимо ассоциаций, волн, зари в центре, IBM, Atos, fojitsu и NEC, были предложены соответствующие решения. В программах памяти HPC часто решения предоставляются производителями серверов, в Том числе дейл, IBM, HPE, ассоциации, DDN и Сидней, в связи с особыми файловыми системами HPC. В конце концов, имеется вспомогательное оборудование, например, источник питания HPC, который в основном состоит из тайваньских поставщиков, включая teldar electronics, opel technology, concu, группы электричества, kembro и т.д. AI и HPC сливаются друг с другом, и новые требования к хранилищам HPC, например, в интерфейсе, хотя POSIX остается основным решением. Но поскольку nvidia GPU широко используется в системах AI HPC, существуют также программы хранения, которые поддерживают интерфейс GDS (прямое хранение GPU). Кроме того, у AI HPC часто возникает потребность в обработке большого количества маленьких файлов, а расширение систем хранения требует большего. И для того, чтобы получить временные результаты, вычисляемые при сохранении, необходимо определенное количество временных потребностей в хранении. Согласно развитию системы HPC, текущая тенденция заключается в удвоении энергозатрат процессора каждые два года. Пик тока в 2000A сейчас широко распространён. Но поскольку энергопотребление системы HPC продолжает увеличиваться, мы сталкиваемся с более высокими требованиями пуэ. Например, серверы, которые мы собираемся построить, меньше 1,3. Это создает новые проблемы не только с эффективностью питания, но и с более высокими требованиями к программам по отоплению, которые в будущем могут стать основными программами по распространению тепла в системе HPC. Кроме того, питание класта AI HPC требует большего. Источник питания в системе Ай-ХПК достиг интервала между 3kW и 4kW, который в будущем может быть поддерживается до 10kW уровня, поскольку технология нитрида Галлия и карбида кремния широко распространена в секторе питания сервера. Изменение и инвариантное использование супервычислительных компьютеров в качестве подмножества высокопроизводительных вычислений представляет собой наиболее мощную вычислительную систему на рынке. Они выделяются в выполнении конкретных научных операций общего назначения, но их производительность не выделяется при работе с общей вычислительной работой. Согласно прогнозам mordorintelligence, к 2024 году ожидается, что рынок суперкомпьютеров достигнет 120 миллионов долларов США, а к 2029 году — 125 миллионов долларов, а ежегодный рост составит всего 0,09%. Несмотря на то, что казалось, что рынки не растут, и правительства, и корпорации продолжают вкладывать средства в сверхрасчётное развертывание. Суперкомпьютеры внесли значительный вклад в развитие науки в стране и в национальную безопасность, в то время как энергетические центры и супервычислительные центры используют гиперарифметику для обработки рабочей нагрузки. Кроме того, ультра-калькуляция используется для создания страны с использованием сверх-расчетного интернета, доступа к приложениям третьей стороны, данным, моделям услуг, обеспечения коммерческого использования научных вычислений, промышленной имитации, обучения модели искусственного интеллекта и облегчения противоречивого спроса и предложения вычислительной силы. Когда дело касается корпоративных инвестиций, производители облачных услуг увеличивают свои вложения, особенно в гипервычислительную систему, связывающую HPC с Ай вычислениями, и она стала основным участником роста рынка HPC. Для решения проблем с низким уровнем использования гипервычислительной системы, производители облачных сервисов ввели новый дизайн для планирования ресурсов серверов и гибкого развертывания. Затем мы переходим к топ — 10 в списке сверхкомпьютеров TOP500, который был опубликован в ноябре 23 года, и как можно видеть из списка 500 сверх-расчетов TOP500, Китай уже получил самые высокие оценки, когда-либо достигнутые, а shintay lake lights вышли из топ — 10. Конечно, это произошло из-за многогранных факторов, на самом деле в стране уже было по крайней мере два суперкласса е, которые не были представлены по различным причинам. Существует несколько частных HPC систем, которые уже работают на полной скорости, и нет необходимости тратить время на тесты LINPACK. Действительно, начиная с 2017 года количество представлений на TOP500 уменьшается каждый год, за исключением самых быстрых обновлений системы TOP10, поскольку новые сверх-расчетные развертывания становятся все более дорогостоящими, и более чем за последние два года ресурсы аппаратного обеспечения HPC были отданы приоритет разработке приложений, связанных с AIGC. В настоящее время перед HPC стоят две основные технологические изменения: Ай и облачное развертывание. Ии усилил анализ набора данных, чтобы получить результаты быстрее с одинаковой точностью. Из числа недавно развертываемых аппаратных конфигураций HPC system можно увидеть, что соотношение вычислительной силы, предоставляемое GPU, становится все более высоким, так что существует также список, в котором HPC-MxP тестирует исключительно производительность ии, что, как видно из этого списка, означает, что универсальная вычислительная сила и сила AI — это не одно и то же. В перечне HPC-MxP, который считается Ай как в научных исследованиях, так и в коммерческих приложениях, уже появился соответствующий ии интегрированный HPC, включая 1. Анализ финансовых услуг, логистика и производственные вычисления 2. Визуализация и моделирование высокоэнергетической физики. Прогноз погоды, метеорология и т.д. Неудивительно, что в последние годы скорость и скорость роста GPU значительно выше, чем в CPU, хотя система HPC, в отличие от использования GPT и LLM в этих пожарах, часто не преследует новейшие GPU-устройства по двум причинам: 1. Поскольку HPC кластеров больше, для доставки заказа производителя GPU также требуется некороткий срок сдачи заказа производителя, а последние GPU в настоящее время часто доставляются производителям облачных сервисов; 2. Сегодняшний подъем GPU в вычислительной силе с высокой точностью не является таким, как низкий уровень вычислительной силы, вследствие того, что в настоящее время наиболее актуальными являются или применяются различные виды больших моделей, которые имеют дело с более низкой точностью данных. Вторая тенденция заключается в облачном развертывании, где традиционные приложения HPC часто используют закрытые модели и специализированные архитектуры, в Том числе фуюэ, shinway take light и т. д., которые по-прежнему имеют большое преимущество в использовании вычислительных плотных классов, которые остаются широко распространены в научных и исследовательских областях. Тем не менее, использование HPC для облачного развертывания становится все более популярным в коммерческих областях. Но, как отмечалось выше, новые системы стоят все больше и больше, не только стоимость оборудования, но и стоимость обслуживания. Добавьте к этому трудности расширения, более низкий уровень использования ресурсов, преобразование системы HPC в цифровые ресурсы и внедрение облачного развертывания в новую тенденцию. * AWS, Azure, google, aliyun и hua — группы HPC, которые были введены для облаков. Облачное развертывание упрощает процесс развертывания и расширения приложений HPC, а также гибкую конфигурацию и почти бесконечную расширенность scale out, что делает его оптимальным решением для многих приложений HPC, будь то по затратам или производительности. Конечно, для таких подразделений, как национальный исследовательский центр, местные системы HPC остаются основным вариантом развертывания в целях обеспечения безопасности информации. Проблемы, стоящие перед HPC — стена затрат и электричества, все еще стоят перед рынками HPC, несмотря на различные инновации. Во-первых, увеличение стоимости оборудования, присоединение ии, позволило совокупным израсходам системы HPC подняться на новую ступень. Для того чтобы повысить общий вычислительный потенциал и увеличить вычислительную силу ии, использование GPU является практически единственным выходом. И в настоящее время, когда возможности ии GPU ограничены, доступ к ним намного сложнее для некоторых исследовательских подразделений HPC. Возьмем, например, H100 GPU, где Meta, microsoft, google, Oracle, tesla и другие частные облачные компании имеют более высокий уровень владения частными облаками. В верхней десятке ультрачисловых рейтингов можно увидеть, что многие страны HPC либо используют AMD или intel GPU, либо используют A100 или GV100, например, продукцию предыдущего поколения, как, например, Meta, при помощи почти 600 000 долларов гпу