Опубликованы обзор вычислительной мощности AIGC и отчет о тенденциях! В одной статье интерпретируется состав вычислительной мощности AIGC, отраслевая цепочка и пять новых суждений о тенденциях.

Источник: Кубит

Вычислительная мощность ИИ никогда не была такой привлекательной, как сейчас.

С момента появления тенденции больших моделей количество и масштабы больших моделей резко увеличились всего за несколько месяцев.

Десятки миллиардов сотен миллиардов больших моделей выросли до десятков, и официально родилась большая модель с триллионами параметров.

При таких масштабных изменениях спрос на вычислительную мощность резко меняется.

Компании модельного уровня скупают услуги вычислительной мощности почти любой ценой.Рыночная стоимость Nvidia когда-то превышала один триллион долларов США, а рынок облачных вычислений меняется ускоренными темпами...

Нет сомнения, что вычислительная мощность является такой же базовой энергией, как гидроэнергетика и нефть для развития промышленности АИГК.

После прелюдии к эре AIGC особое значение имеет понимание индустрии вычислительной мощности.

Какая вычислительная мощность нужна предприятию? Какие изменения произойдут в индустрии вычислительной мощности в связи с появлением AIGC? Каков текущий состав рынка вычислительной мощности?

"Панорама вычислительной мощности AIGC и отчет о тенденциях" поможет вам разобраться в этих вопросах.

В отчете аналитический центр qubit систематически проанализировал состав вычислительной мощности AIGC и производственной цепочки, а также указал пять новых тенденций вычислительной мощности AIGC** и прогноз развития трех этапов .

Основные идеи включают в себя:

  • Управляемые AIGC чипы конкурируют за высокую производительность и большую вычислительную мощность, а также внедряют новую вычислительную архитектуру;
  • Сервер ИИ закрутился внезапно, и бонусная кривая сначала обучается, а потом рассуждает;
  • MaaS меняет парадигму облачных услуг, замкнутый цикл бизнес-модели AIGC;
  • Модель AI «все в одном» готова к выходу, а традиционная индустрия «из коробки»;
  • Интеллектуальный вычислительный центр сопровождает работу AIGC, а модель лизинга вычислительной мощности стала новым решением; ……

Давайте рассмотрим детали одну за другой.

Рост бизнеса отечественных производителей серверов превышает 30%

Исходя из анализа текущего состояния дел в отрасли, основная часть отрасли в основном включает:

  • чип
  • AI-сервер (кластер)
  • облачные вычисления

Уровень чипа: два маршрута AIGC обеспечивают вычислительную мощность

Что касается вычислительных чипов, в настоящее время в отрасли существует два основных направления для удовлетворения потребностей в вычислительной мощности отрасли AIGC.

Одним из них является маршрут графического процессора, представленный Nvidia, который называется универсальный чип.

Другой — это маршрут ASIC, представленный Huawei и Cambrian, который называется маршрут специального чипа.

В настоящее время эти два маршрута объединяют игроков разных типов, и вычислительные задачи, которые они решают, также различаются.

Под чипом общего назначения он может выполнять различные вычислительные задачи и подходит для крупномасштабных параллельных вычислений.

То есть чип общего назначения (GPU) больше подходит для текущих вычислительных мощностей AIGC.

Преимущество выделенного маршрута выражается в лучшем коэффициенте энергоэффективности в конкретных сценариях. Поскольку микросхемы специального назначения предназначены для выполнения специализированных или настраиваемых задач, они могут обеспечить более высокий коэффициент энергоэффективности и вычислительную эффективность, чем микросхемы общего назначения, в определенных сценариях**.

Просто потому, что выделенные чипы могут обеспечить более высокую вычислительную эффективность в определенных сценариях, они также стали техническим путем, выбранным Интернетом и другими поставщиками облачных вычислений при разработке своих собственных чипов.

Обычно чипы собственной разработки производителей интернет-облаков в основном обслуживают собственные продукты, делая упор на максимальное высвобождение производительности чипов в собственной экологии.

### Серверный уровень: рост бизнеса очевиден, в основном за счет интернет-клиентов

Спрос AIGC на высокопроизводительные вычисления сделал серверы ИИ самым быстрорастущим сегментом в области серверов.

Обучение больших моделей, таких как GPT-3, требует много вычислительных ресурсов и памяти и обычно включает использование тысяч или даже десятков тысяч графических процессоров для ускорения обучения.

Поскольку эти вычисления предъявляют очень высокие требования к производительности чипа, для поддержки массивно-параллельных вычислений и высокоскоростной передачи данных требуется специальное аппаратное и программное обеспечение.

Серверы ИИ — это серверы, специально разработанные для обработки рабочих нагрузок искусственного интеллекта с использованием специализированных аппаратных ускорителей (например, графических процессоров, TPU и т. д.), а также высокоскоростных сетевых подключений и хранилищ для обеспечения высокопроизводительных вычислительных возможностей.

Напротив, ЦП (серверы общего назначения) обычно не могут удовлетворить потребности AIGC в экстремальной вычислительной мощности, а их вычислительная мощность, память и емкость хранения обычно невелики. Кроме того, процессоры обычно не имеют специальных аппаратных ускорителей для обеспечения высокоскоростных вычислений.

Следовательно, крупномасштабное обучение модели должно полагаться на кластеры серверов ИИ для предоставления вычислительных услуг.

Согласно исследованию Qubit Think Tank, после вспышки AIGC в этом году отечественные производители серверов в целом увеличили свой бизнес более чем на 30%**.

Недавно TrendForce также увеличила совокупный годовой темп роста поставок серверов ИИ с 2022 по 2026 год до 22%. Несмотря на всплеск бизнеса серверов ИИ, крупнейшими покупателями по-прежнему являются интернет-компании.

В 2022 году крупные производители, такие как ByteDance, Tencent, Alibaba, Baidu и т. д., станут основными покупателями в доле закупок серверов ИИ. В этом году энтузиазм в отношении крупномасштабных исследований и разработок моделей стимулировал покупательский спрос со стороны нижестоящих интернет-компаний, что сделало их крупнейшим покупателем серверов ИИ.

### Облачные вычисления: MaaS меняет модель обслуживания, старые и новые игроки реструктурируют конкурентоспособность

Модель MaaS была впервые предложена Али, а затем крупные интернет-компании и компании, занимающиеся искусственным интеллектом (такие как SenseTime), представили модель MaaS.

Кроме того, такие компании, как интернет-гиганты и Huawei, уже использовали микросхемы собственной разработки при построении баз MaaS.

В 2023 году ведущие отечественные производители облачных сервисов последовательно запустят собственные платформы MaaS, основанные на больших модельных базах, для предоставления универсальных услуг MaaS предприятиям с ограниченными вычислительными ресурсами и отсутствием профессионального опыта.

Для поставщиков облачных услуг основной целью услуг MaaS является помощь клиентам в быстром создании крупных отраслевых моделей. Исходя из этого, размер конкуренции между поставщиками облачных услуг изменился на инфраструктуру вычислительной мощности, общие возможности крупномасштабных моделей и возможности платформы/инструмента ИИ.

### Статус Интеллектуального вычислительного центра: источник вычислительной мощности ИИ на уровне инфраструктуры, создающий новый двигатель регионального экономического роста

С точки зрения распределения вычислительного оборудования на рынке серверов и серверов ИИ Пекин, Гуандун, Чжэцзян, Шанхай и Цзянсу входят в пятерку лидеров с общей долей рынка (серверов и серверов ИИ) 75% и 90%. (данные 2021 г.).

С точки зрения предложения, большинство интеллектуальных вычислительных центров расположены в Восточной и Центральной провинциях, а бизнесу AIGC необходимо обрабатывать массивные данные, что приводит к высокой стоимости ресурсов вычислительной мощности в Восток**.

Перенос задач с высокими вычислительными требованиями, таких как обучение крупномасштабных моделей, в западный регион формирует «East Data Training», который может эффективно снизить затраты и достичь оптимальной комплексной стоимости вычислительных сетевых ресурсов.

В частности, для решения таких проблем, как несбалансированное предложение и спрос на вычислительную мощность, необходимо перенести задачи вычислительной мощности и обработки данных на востоке в западный регион с меньшими затратами за счет планирования вычислительной мощности. Среди них оптимизация сети взаимосвязи между востоком и западом и сети прямого соединения между узловыми узлами является ключом к повышению уровня планирования вычислительной мощности.

С точки зрения спроса спрос на вычислительную мощность AIGC в основном исходит от производителей, которые разрабатывают большие модели AIGC, в основном распределенные в регионе Пекин-Тяньцзинь-Хэбэй, дельте реки Янцзы и районе Большого залива.

Назревает революция чип-серверов

Тенденция к большим моделям выдвигает новые требования к вычислительной мощности и приводит к новым изменениям в базовом оборудовании. Давайте рассмотрим два уровня чипов и серверов:

уровень чипа

На данный момент среди высокопроизводительных чипов абсолютное преимущество у Nvidia A100, а у A100 есть только запасы в Китае, но без увеличения.Внутренний рынок даст отечественным производителям GPU больше возможностей**.

Кроме того, на уровне литейного производства микросхем в настоящее время нет отечественного литейного производства, которое могло бы выполнять техпроцессы 7 нм и выше, и большинство производителей графических процессоров выбирают зрелый техпроцесс + передовые упаковочные решения для достижения более высоких показателей производительности.

На уровне кластера серверов высокопроизводительные вычисления реализуются за счет многопроцессорных параллельных вычислений и высокопроизводительной сети.

Поскольку аппаратный продукт + экология CUDA, построенная Nvidia, сложно пробиться через 10 лет, в будущем, когда высокопроизводительный GPU будет ограничен, аналитики прогнозируют, что для аппаратного уровня будет два основных решения, последнее - разработайте технологию GPU + inter-chip Interconnect для реализации массово-параллельных вычислений**.

Второй — выйти за рамки архитектуры фон Неймана и разработать интегрированную архитектуру хранения и вычислений, чтобы интегрировать вычислительные блоки и блоки хранения, чтобы достичь повышения энергоэффективности вычислений на порядок.

На программном уровне разреженные вычисления и построение высокопроизводительной сети в настоящее время являются двумя решениями.

Новаторство разреженных вычислений отражено на уровне алгоритма: путем удаления недействительных или избыточных данных (таких данных обычно много) объем вычислений данных значительно сокращается, тем самым ускоряя вычисление.

Целью построения высокопроизводительной сети является сокращение времени обучения больших моделей. При построении высокопроизводительной сети каждый вычислительный узел имеет сверхвысокую пропускную способность связи, что в несколько раз повышает производительность трафика, тем самым сокращая время обучения больших моделей.

### Уровень сервера

Спрос на вычислительную мощность больших моделей ИИ растет в геометрической прогрессии, что делает серверы ИИ с более высокими конфигурациями основным носителем вычислительной мощности AIGC.

По сравнению с традиционными серверами возможности вычислений, хранения и сетевой передачи серверов ИИ могут достигать более высокого уровня.

Например, конфигурация сервера NVIDIA DGX A100 с 8 GPU и 2 CPU намного выше, чем у традиционных серверов с 1~2 CPU.

В моей стране Интеллектуальный вычислительный центр является общедоступной инфраструктурной платформой, которая предоставляет ресурсы вычислительной мощности для искусственного интеллекта (крупные модели), а его вычислительные мощности представляют собой в основном серверы обучения ИИ и серверы рассуждений ИИ.

По мере развития больших моделей основной спрос на будущие серверы ИИ сместится с обучения на логические выводы. По прогнозу IDC, к 2026 году 62,2% вычислительной мощности AIGC будет использоваться для рассуждений моделей.

Изменения в отрасли открывают новые возможности для бизнеса

Кроме того, тенденция крупномасштабных моделей ИИ открывает новые возможности для индустрии вычислительной мощности, появляются новые парадигмы, новые продукты и новые инфраструктуры.

Новые правила игры: MaaS меняет парадигму облачных сервисов, замкнутый цикл бизнес-модели AIGC

MaaS (модель как услуга) встраивает большие модели в вычислительную мощность, алгоритмы и уровни приложений, интегрирует приложения с интеллектуальными базами и унифицирует внешний вывод.

Суть MaaS заключается в доработке и интеграции общих базовых технологий в отрасли в услуги для удовлетворения потребностей различных сценариев приложений.

В процессе коммерциализации возможности крупномасштабных моделей и вспомогательные инструменты промежуточного программного обеспечения станут новыми аспектами, которые предприятия должны учитывать для поставщиков облачных вычислений.

Дискриминант возможностей служб облачных вычислений сместился с уровня вычислительной мощности на возможность «интеграции облачных вычислений» В дополнение к инфраструктуре вычислительной мощности, основная конкурентоспособность изменилась на способность создавать вычислительную мощность, модели и приложения сцены. в стандартизированные продукты.

### **Новый вид: машина «все в одном» модели AI готова к выходу, традиционные отрасли «из коробки» **

Модель AI «все в одном» глубоко интегрирует программное и аппаратное обеспечение.В соответствии с различными потребностями предприятий соответствующие продукты или решения заранее развертываются на сервере AI и упаковываются для формирования полного набора решений.

Ценовое преимущество универсальной машины модели ИИ в основном отражено в следующих трех пунктах:

    1. Суммарная цена покупки ниже, чем цена отдельной покупки ПО + оборудование;
    1. Предприятию требуется много времени, чтобы приобрести сервер отдельно и передать его предприятию ИИ для развертывания программного обеспечения.Машина модели ИИ «все в одном» может использоваться «из коробки», снижение стоимости доставки;
    1. Количество необходимых серверов значительно уменьшено, что экономит затраты на пространство для клиентов.

### Новая инфраструктура: Интеллектуальный вычислительный центр сопровождает операции AIGC, режим аренды вычислительной мощности становится новым решением

Модель лизинга вычислительной мощности может эффективно снизить порог для крупномасштабной разработки модели.Для небольших модельных компаний в вертикальных отраслях, у которых нет сил для покупки достаточного количества серверов ИИ, базовая платформа общедоступных вычислительных мощностей поможет малым и средним предприятиям. построить свои собственные необходимые модели.

Предприятиям не нужно покупать серверы, но они могут получить доступ к центру вычислительной мощности через браузер и использовать услуги вычислительной мощности.

Малым и средним предприятиям не нужно полагаться на большую модельную базу, созданную поставщиками облачных услуг для вторичной разработки, а нужно разрабатывать небольшие модели вертикальных отраслей, арендуя ресурсы вычислительной мощности с общедоступных платформ вычислительной мощности.

Прогноз развития отрасли

Подводя итог, аналитический центр qubit прогнозирует будущее развитие AIGC, которое можно разделить на три этапа:

  • Период инфраструктуры AIGC
  • Период развития AIGC
  • Операционный период AIGC

Период инфраструктуры AIGC

В настоящее время большинство компаний уровня модели AIGC находятся на стадии предварительного обучения, а основным источником спроса на чипы являются графические процессоры.

На начальном этапе больше всего выиграют от этого производители высокопроизводительных графических процессоров.

Однако в настоящее время между отечественными производителями графических процессоров и Nvidia существует большой разрыв, и первым бенефициаром является доминирующая сторона на фондовом рынке.

Поэтому отечественные производители серверов ИИ на данном этапе являются сильными поставщиками. В настоящее время отечественных серверов ИИ не хватает.

### Период разработки AIGC

На среднесрочном этапе (в течение 5 лет) слой вычислительной мощности представляет собой процесс перехода от обучения к рассуждению.

На этом этапе чипы рассуждений станут основной стороной спроса. По сравнению с высокой вычислительной мощностью и высоким энергопотреблением графического процессора и соответствующей потерей вычислительной мощности, микросхема логического вывода уделяет больше внимания коэффициенту вычислительной эффективности микросхемы и лучше контролирует энергопотребление и стоимость. Кроме того, на этом этапе также будет возможность для инновационных чипов.

Аналитики ожидают больше рыночных возможностей для интегрированных чипов для вычислений с памятью, чипов на основе мозга и кремниево-оптических чипов.

На этапе вывода у периферийных вычислений будет больше возможностей, чем у облачных вычислений на этапе обучения.

Во-первых, приложения, соответствующие стадии логического вывода, имеют тенденцию быть диверсифицированными, а разнообразные требования заставляют облачные вычисления генерировать больше растраты вычислительной мощности и низкой эффективности вычислений.

Во-вторых, граничные вычисления могут обеспечить достаточную вычислительную мощность для рассуждений больших моделей.

На этом этапе период дивидендов производителей серверов ИИ постепенно достигнет своего пика, и спрос сместится на более дешевые серверы общего назначения; чипы также перейдут от GPU к NPU/ASIC/FPGA/CPU, и другие формы сосуществуют. Среди маршрутов отечественных инновационных чипов ** с оптимизмом смотрит на развитие интегрированной архитектуры хранения и вычислений**.

### Рабочий период AIGC

Основные инновационные преимущества чипов начали проявляться, и производители чипов с действительно инновационными технологиями, такими как интеграция хранения и вычислений, фотонные чипы и мозгоподобные чипы, увеличили свою роль на рынке.

Типы микросхем, необходимых для вычислительной мощности AIGC, более разнообразны.

Предприятия на этом этапе более комплексно рассматривают вычислительную мощность, не только учитывая размер вычислительной мощности, энергопотребление и стоимость могут превышать размер вычислительной мощности и становиться показателями, которые заботят компании на каждом уровне модели.

Получить отчет

Нажмите на ссылку ниже:

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить