На днях AMD представила карту ускорения Alveo V80, адаптацию Versal FPGA к HBM, обрабатываемые вычисления, а также загрузки с интенсивной памятью для высокопроизводительных вычислений, анализа данных, финансовых технологий, сжатия памяти и т.д. Почему на этот раз Alveo V80 использует высокоскоростную память HBM, самоадаптацию AMD и встроенный анализ старшего менеджера по вопросам вычислительной техники (AECG) шиям чандер, который легко формирует узкое место в традиционной архитектуре процессора, как в памяти, так и в сети. Сетевой интерфейс поддерживает только 25G и 100G, а память использует DDR и FPGA с гораздо большей частотой, чем предоставляет память. Тогда Alveo V80 был оптимизирован в отношении этих двух проблем, что привело к значительному повышению производительности. Память использует память с высокой пропускной способностью HBM2e, обеспечивающую ширину памяти 820 GB/s с мощностью 32GB. При доступе к сети с помощью QSFP56 оптоволоконных модулей можно поддерживать пропускную полосу от 10G до 800G, поддерживать 4X200G и другие рабочие модели, такие как 4X10G/25G/40G/50G. Карта ускорения использует полностью высокие, 3/4 (FH-L) метрические спецификации, поддерживаемые адаптивной SoC компанией AMD Versal HBM, FPGA архитектура с 2 600 000 лутологических единиц, 10 848 вычислительных логических элементов DSP, а также пропускная способность памяти 820 GB/s. По сравнению с предыдущими моделями AMD Alveo U55C, логическая плотность Alveo V80 может быть увеличена до более высокой, пропуска памяти до более высокой, а сетевая пропуска может быть в четыре раза выше, а также оптимизирована карта, количество серверов и пространство на картах. Alveo V80 также оснащён панелями расширения 32GB DDR DIMM, портами расширения MCIO, которые могут быть соединены непосредственно с NVMe drive, реализация карты памяти. Шина системного соединения поддерживает интерфейс PCIe 5.0, который позволяет передавать 64GB/ сек. Полная мощность карты 300W, с пассивным тепловым рассеиванием, а общая тепловая проектная мощность TDP зависит от приборов и серверов. V80 интегрированная сеть с высокой частотой 600 гигабайт ethernet и 400 гигабайтовым двигателем шифрования, жесткая инфраструктура включает в себя контроллер DDR, PCIe 5.0, поддерживающий DMA, сеть программируемых программ. Shyam Chander заявил, что, основываясь на этих жёстких функциях, пользователи не должны использовать гибкие IP для развертывания. Обычно для того, чтобы традиционные карты ускорения (например, GPU) были соединены с процессором, они ограничивают количество карт-ускорителей, которые могут использоваться. Однако V80 смог избежать узких узлов процессора в PCle, которые были введены в ускоренную карту, с низкой задержкой для обработки входящих данных в сеть, устраняя диверсификационные сетевые карты, реализовывая максимальную плотность на каждый сервер. В то же время, управление входящими данными в соответствии с требованиями в режиме ограничения скорости сети, включая онлайн шифрование, мониторинг пакетов данных, обработка сенсоров и т.д. Традиционная архитектура — это фиксированный кэш-уровень для считывания и записи данных, а нерегулярные модели доступа снижают эффективность. В то время как самоадаптивные вычисления V80 имеют гибкую архитектуру, распределяющую оперативную память вблизи вычислений, таким образом уменьшая задержки и более низкие энергоресурсы, могут быть гибкими для адаптации к самоопределенным тимам данных и миграции данных. AMD также предоставляет проектный пример AVED, доступный на GitHub, а также для пользователей, которые могут продолжать использовать дизайны Vivado, с тем чтобы разработчики оборудования могли быстрее работать на земле, помогая им сократить время разработки на рынке. Крупномасштабное ускорение загрузки загрузки Alveo V80 на работу с интенсивной памятью может справиться с большим количеством загрузки данных, включая высокопроизводительные вычисления, включая геномную и сенсорную обработка, анализ данных (например, обнаружение мошенничества); Финансовые технологии, в Том числе анализ рисков и торговля алгоритмами; И сетевая безопасность, как мониторинг пакетов данных; Накопитель, это очень важная нагрузка. Кроме того, в области вычислительной техники, включая рекомендуемые двигатели и большие языковые модели и т.д. Таким образом, это может помочь клиенту в массовом ускорении нагрузки выше, ускорить процесс обработки данных и в то же время получить возможность видеть и анализировать данные в реальном времени. Например, федеральная организация научных и промышленных исследований (CSIRO), являющаяся национальной исследовательской организацией в австралии, участвует в создании крупнейшей в мире радиоастрономической антенны, которая в настоящее время содержит 420 карточек ускорителя Alveo U55C, предназначенных для обработки радиоволн для изучения ранней вселенной и изучения эволюции галактик. CSIRO планирует сокращать площадь и стоимость пластин с помощью алвео V80 и сокращать количество требуемых карт до 66%, одновременно выполняя задачи по обработке новых сигналов от 131,000 антенн телескопа. В связи с потенциальным сокращением карт, серверов, пространства для станков и энергозатрат, ожидается, что скачок в расчетной силе на одну карту может привести к снижению общей стоимости (TCO) на 20%. Также есть примеры узлов памяти серверов, которые имеют функции сжатия и анализа данных, сжатые через Alveo V80, используя архитектуру FPGA и AMD для сжатия IP, которые могут быть расширены для расширения узлов памяти, а также для ускорения запросов и т.д. Анализ с точки зрения общих затрат, таких как хранение данных 10Pb, без сжатия требует 55 серверов, 1303 SSD-дисков и примерно 427 киловатт-час в год. В случае сжатия такой же информации, как и 10Pb, требуется всего 21 сервер, 504 SSD-диска, около 233 КВТ-час в год, с 42 картами AMD Alveo V80 в год, с общей стоимостью более чем в три года, которые могут быть сокращены на 56%, Кроме того, количество серверов, стоимость серверов и энергопотребление также значительно сократились. Карты ускорения также имеют GPU, ASIC и т. Shyam Chander отметил, что GPU хорош в плавающей, параллельной, стационарной, FPGA хорош в обработке реального времени онлайн-доступа, а также в низкой продолжительности времени и гибкой деформации с очень богатыми архитектурными ресурсами памяти. Производство AMD Alveo направлено главным образом на внутренние сети, обработку в реальном времени, как, например, обработка сенсоров в реальном времени, спрос на финансовые технологии, и их призыв заключается в низкой продолжительности времени и гибкой деформации, а адаптивная SoC FPGA является превосходным решением. Кроме того, несмотря на то, что цены на HBM выше, чем у DDR, в конечном счете можно достичь конкурентного преимущества в отношении высоких цен, если правильно распределить ресурсы FPGA. На маршруте продукции следует рассматривать требования к комплексной рабочей нагрузке, а также рассмотреть вопрос о внедрении хранения данных, таких как HBM3.

TRICONEX 3703E

TRICONEX 3703E