Informe de tendencia y panorama de potencia de computación de AIGC ¡Publicado! Un artículo interpreta la composición del poder de cómputo de AIGC, la cadena industrial y cinco nuevos juicios de tendencias.
El poder de cómputo de la IA nunca ha sido tan llamativo como ahora.
Desde el surgimiento de la tendencia de los modelos grandes, el número y la escala de los modelos grandes han aumentado de forma espectacular en tan solo unos meses.
Las decenas de miles de millones de cientos de miles de millones de modelos grandes se han disparado a docenas, y el modelo grande de billones de parámetros ha nacido oficialmente.
Bajo tales cambios de magnitud, la demanda de poder de cómputo muestra cambios drásticos.
Las empresas de nivel modelo están adquiriendo servicios de potencia informática a casi todos los costos. El valor de mercado de Nvidia alguna vez superó el billón de dólares estadounidenses, y el mercado de la computación en la nube se está remodelando a un ritmo acelerado...
No hay duda de que el poder de cómputo es la misma energía básica que la energía hidroeléctrica y el petróleo para el desarrollo de la industria AIGC.
Después del preludio de la era AIGC, la forma de entender la industria de la potencia informática es particularmente importante.
¿Qué tipo de potencia informática necesita la empresa? ¿Qué cambios ocurrirán en la industria de la potencia informática debido al auge de AIGC? ¿Cuál es la composición actual del mercado de potencia informática?
"AIGC Computing Power Panorama and Trend Report" está aquí para ayudarlo a comprender estos problemas.
En el informe, el grupo de expertos sobre qubit analizó sistemáticamente la composición del poder de cómputo de AIGC y la cadena industrial, y señaló además las cinco nuevas tendencias del poder de cómputo de AIGC** y el pronóstico de desarrollo de tres etapas .
Las ideas centrales incluyen:
Impulsados por AIGC, los chips compiten por el alto rendimiento y la gran potencia informática, e introducen una nueva arquitectura informática;
El servidor de IA ha surgido repentinamente, y la curva de bonificación se entrena primero y luego se razona;
MaaS remodela el paradigma del servicio en la nube, modelo de negocio AIGC de ciclo cerrado;
La máquina todo en uno modelo AI está lista para salir, y la industria tradicional está "lista para usar";
El Centro de Cómputo Inteligente acompaña la operación de AIGC, y el modelo de arrendamiento de potencia informática se ha convertido en una nueva solución;
……
Veamos los detalles uno por uno.
El crecimiento comercial de los fabricantes de servidores nacionales supera el 30 %
Del análisis del status quo actual de la industria, el cuerpo principal de la industria incluye principalmente:
chip
Servidor AI (clúster)
computación en la nube
Capa de chips: AIGC dos rutas proporcionan potencia informática
En chips informáticos, actualmente hay dos rutas principales en la industria para satisfacer las necesidades de potencia informática de la industria AIGC.
Una es la ruta GPU representada por Nvidia, que se llama chip universal.
La otra es la ruta ASIC representada por Huawei y el Cambrian, que se llama ruta de chip especial.
En la actualidad, estas dos rutas reúnen a diferentes tipos de jugadores, y las tareas informáticas que realizan también son diferentes.
Bajo la ruta del chip de uso general, puede completar diversas tareas informáticas y es adecuado para la informática paralela a gran escala.
Es decir, el chip de uso general (GPU) es más adecuado para la potencia informática actual de AIGC.
La ventaja de la ruta dedicada se refleja en la mejor relación eficiencia energética en escenarios específicos. Dado que los chips para propósitos especiales están diseñados para realizar tareas especializadas o personalizadas, pueden lograr una mejor relación de eficiencia energética y eficiencia informática que los chips para propósitos generales en escenarios específicos**.
Solo porque los chips dedicados pueden generar una mayor eficiencia informática en escenarios específicos, también se ha convertido en la ruta técnica elegida por Internet y otros proveedores de nube al desarrollar sus propios chips.
Por lo general, los chips de desarrollo propio de los fabricantes de la nube de Internet sirven principalmente a sus propios productos, enfatizando la máxima liberación del rendimiento del chip en su propia ecología.
### Capa de servidor: el crecimiento del negocio es evidente, principalmente basado en los clientes de Internet
La demanda de AIGC de computación de alto rendimiento ha convertido a los servidores de IA en el segmento de más rápido crecimiento en el campo de los servidores.
El entrenamiento de modelos grandes, como GPT-3, requiere una gran cantidad de recursos informáticos y memoria y, por lo general, implica el uso de miles o incluso decenas de miles de GPU para acelerar el entrenamiento.
Debido a que estos cálculos tienen requisitos muy altos en el rendimiento del chip, se requieren hardware y software especializados para admitir la computación paralela masiva y la transmisión de datos de alta velocidad.
Los servidores de IA son servidores especialmente diseñados para manejar cargas de trabajo de inteligencia artificial, utilizando aceleradores de hardware especializados (como GPU, TPU, etc.), así como conexiones de red de alta velocidad y almacenamiento para proporcionar capacidades informáticas de alto rendimiento.
Por el contrario, las CPU (servidores de propósito general) por lo general no pueden satisfacer la demanda de potencia informática extrema de AIGC, y su potencia informática, memoria y capacidad de almacenamiento suelen ser bajas. Además, las CPU generalmente no tienen aceleradores de hardware dedicados para proporcionar computación de alta velocidad.
Por lo tanto, el entrenamiento de modelos a gran escala debe depender de los clústeres de servidores de IA para proporcionar servicios informáticos.
Según la investigación de Qubit Think Tank, después del estallido de AIGC este año, los fabricantes de servidores domésticos, en general, han aumentado su negocio en más del 30 %**.
Recientemente, TrendForce también elevó la tasa de crecimiento anual compuesta de los envíos de servidores de IA de 2022 a 2026 al 22 %. Detrás del aumento en el negocio de los servidores de IA, los mayores compradores siguen siendo las empresas de Internet.
En 2022, grandes fabricantes como ByteDance, Tencent, Alibaba, Baidu, etc. se convertirán en los principales compradores en la proporción de adquisición de servidores de IA. Este año, el entusiasmo por la investigación y el desarrollo de modelos a gran escala ha impulsado la demanda de compra de las empresas de Internet, lo que las convierte en el mayor comprador de servidores de IA.
### Computación en la nube: modelo de servicio de remodelación de MaaS, jugadores antiguos y nuevos reestructuran la competitividad
El modelo MaaS fue propuesto por primera vez por Ali, y luego las principales empresas de Internet y las empresas de inteligencia artificial (como SenseTime) introdujeron el modelo MaaS.
Además, empresas como gigantes de Internet y Huawei ya han utilizado chips de desarrollo propio en la construcción de bases MaaS.
En 2023, los principales fabricantes nacionales de nube lanzarán sucesivamente sus propias plataformas MaaS, basadas en bases de modelos grandes, para proporcionar servicios MaaS integrales para empresas con recursos informáticos limitados y falta de experiencia profesional.
Para los proveedores de la nube, el propósito principal de los servicios de MaaS es ayudar a los clientes a construir rápidamente modelos grandes específicos de la industria. En base a esto, la dimensión de la competencia entre los proveedores de la nube ha cambiado a la infraestructura de potencia informática, las capacidades generales del modelo a gran escala y las capacidades de la plataforma/herramienta de IA.
### Estado del Centro de Cómputo Inteligente: fuente de alimentación de cómputo de IA a nivel de infraestructura, creando un nuevo motor para el crecimiento económico regional
Desde la perspectiva de la distribución de equipos informáticos, en el mercado de servidores y servidores de IA, Beijing, Guangdong, Zhejiang, Shanghái y Jiangsu se encuentran entre los cinco primeros, con una cuota de mercado total (servidor y servidor de IA) del 75 % y el 90 %. (datos de 2021) .
Desde el punto de vista del suministro, la mayoría de los centros de cómputo inteligente están ubicados en las provincias del Este y el Centro, y el negocio de AIGC necesita procesar cantidades masivas de datos, lo que resulta en un alto costo de los recursos de potencia de cómputo en el este**.
Mover tareas con altos requisitos informáticos, como la capacitación de modelos a gran escala, a la región occidental forma "East Data Training", que puede reducir los costos de manera efectiva y lograr el costo integral óptimo de los recursos de la red informática.
Específicamente, para resolver problemas como la oferta y la demanda desequilibradas de la demanda de potencia de cómputo, es necesario transferir la potencia de cómputo y las tareas de procesamiento de datos en el este a la región occidental con costos más bajos a través de la programación de potencia de cómputo. Entre ellos, optimizar la red de interconexión entre el este y el oeste y la red de conexión directa entre los nodos centrales es la clave para mejorar el nivel de programación de la potencia informática.
Desde la perspectiva de la demanda, la demanda de poder de cómputo AIGC proviene principalmente de los fabricantes que desarrollan modelos AIGC grandes, distribuidos principalmente en la región de Beijing-Tianjin-Hebei, el delta del río Yangtze y la Gran Área de la Bahía.
La revolución del servidor de chips está surgiendo
La tendencia de los modelos grandes plantea nuevos requisitos de potencia informática y conduce a nuevos cambios en el hardware subyacente. Veamos dos niveles de chips y servidores:
nivel de chip
En la actualidad, entre los chips de alto rendimiento, Nvidia A100 tiene una ventaja absoluta, y A100 solo tiene existencias en China, pero no aumenta. El mercado nacional brindará a los fabricantes de GPU nacionales más oportunidades **.
Además, a nivel de fundición de chips, actualmente no hay una fundición nacional que pueda realizar procesos de 7nm y superiores, y la mayoría de los fabricantes de GPU eligen procesos maduros + soluciones de empaquetado avanzadas para lograr indicadores de rendimiento más altos.
A nivel de clúster de servidores, la computación de alto rendimiento se realiza a través de la computación paralela de múltiples tarjetas y múltiples máquinas y la red de alto rendimiento.
Dado que la ecología del producto de hardware + CUDA construida por Nvidia es difícil de superar en 10 años, en el futuro, cuando la GPU de alto rendimiento sea limitada, los analistas predicen que habrá dos soluciones principales para la capa de hardware, la última es desarrollar GPU + tecnología de interconexión entre chips para lograr computación paralela masiva**.
La otra es salirse de la arquitectura von Neumann y desarrollar una arquitectura informática y de almacenamiento integrada para integrar unidades informáticas y unidades de almacenamiento para lograr una mejora de orden de magnitud en la eficiencia energética informática.
A nivel de software, la computación dispersa y la construcción de una red de alto rendimiento son actualmente dos soluciones.
La innovación de la computación dispersa se refleja en el nivel del algoritmo Al eliminar datos no válidos o redundantes (dichos datos suelen ser enormes), la cantidad de cálculo de datos se reduce considerablemente, lo que acelera el cálculo.
El propósito de construir una red de alto rendimiento es reducir el tiempo de entrenamiento de modelos grandes. Al construir una red de alto rendimiento, cada nodo informático tiene un ancho de banda de comunicación ultra alto, lo que brinda una mejora varias veces mayor en el rendimiento del tráfico y, por lo tanto, acorta el tiempo de entrenamiento de los modelos grandes.
### Nivel de servidor
La demanda de poder de cómputo de los modelos grandes de IA está aumentando exponencialmente, lo que convierte a los servidores de IA con configuraciones más altas en el principal portador del poder de cómputo AIGC.
En comparación con los servidores tradicionales, las capacidades informáticas, de almacenamiento y de transmisión de red de los servidores de IA pueden alcanzar un nivel superior.
Por ejemplo, la configuración del servidor NVIDIA DGX A100 con 8 GPU y 2 CPU es mucho mayor que la de los servidores tradicionales con 1~2 CPU.
En mi país, el Centro de Cómputo Inteligente es una plataforma de infraestructura pública que proporciona recursos de potencia de cómputo para inteligencia artificial (modelos grandes), y sus unidades de potencia de cómputo son principalmente servidores de entrenamiento de IA y servidores de razonamiento de IA.
Con la evolución de los modelos grandes, la principal demanda de futuros servidores de IA pasará del entrenamiento a la inferencia. Según la previsión de IDC, para 2026, el 62,2 % de la potencia informática de AIGC se utilizará para el razonamiento de modelos.
Los cambios en la industria generan nuevas oportunidades comerciales
Además, la tendencia de los modelos a gran escala de IA brinda nuevas oportunidades a la industria de la potencia informática y están surgiendo nuevos paradigmas, nuevos productos y nuevas infraestructuras.
Nuevas reglas del juego: MaaS remodela el paradigma del servicio en la nube, bucle cerrado del modelo de negocio AIGC
MaaS (Model as a Service) incorpora grandes modelos en potencia informática, algoritmos y capas de aplicación, integra aplicaciones con bases inteligentes y unifica la salida externa.
La esencia de MaaS es refinar e integrar tecnologías básicas comunes en la industria en servicios para satisfacer las necesidades de varios escenarios de aplicación.
En el proceso de comercialización, las capacidades del modelo a gran escala y las herramientas de soporte intermedio se convertirán en nuevas dimensiones que las empresas tendrán en cuenta para los proveedores de computación en la nube.
El discriminante de las capacidades del servicio de computación en la nube ha pasado del nivel de potencia informática a la capacidad de "integración de inteligencia en la nube". Además de la infraestructura de potencia informática, la competitividad central ha cambiado a la capacidad de crear potencia informática, modelos y aplicaciones de escena. en productos estandarizados.
### **Nueva especie: la máquina todo en uno modelo AI está lista para salir, industrias tradicionales "listas para usar" **
La máquina todo en uno modelo AI integra profundamente el software y el hardware. De acuerdo con las diferentes necesidades de las empresas, los productos o soluciones correspondientes se implementan en el servidor AI con anticipación y se empaquetan para formar un conjunto completo de soluciones.
La ventaja de costo de la máquina todo en uno modelo AI se refleja principalmente en los siguientes tres puntos:
El precio de compra total es inferior al precio de compra por separado de software + hardware;
La empresa tarda mucho tiempo en comprar el servidor por separado y entregárselo a la empresa de IA para implementar el software.La máquina todo en uno del modelo de IA se puede usar de forma inmediata, reduciendo el costo de entrega;
La cantidad de servidores requeridos se reduce considerablemente, ahorrando costos de espacio para los clientes.
### Nueva infraestructura: el Centro de Cómputo Inteligente acompaña las operaciones de AIGC, el modo de arrendamiento de energía informática se convierte en una nueva solución
El modelo de arrendamiento de potencia informática puede reducir efectivamente el umbral para el desarrollo de modelos a gran escala. Para las pequeñas empresas modelo en industrias verticales que no tienen la fuerza para comprar suficientes servidores de IA, la plataforma básica de potencia informática pública ayudará a las pequeñas y medianas empresas. construir sus propios modelos requeridos.
Las empresas no necesitan comprar servidores, pero pueden acceder al centro de poder de cómputo a través de un navegador y usar los servicios de poder de cómputo.
Para las pequeñas y medianas empresas, no es necesario depender de la gran base de modelos creada por los proveedores de la nube para el desarrollo secundario, sino desarrollar modelos pequeños de industrias verticales mediante el alquiler de recursos de potencia informática de plataformas públicas de potencia informática.
Pronóstico de desarrollo de la industria
En resumen, el think tank qubit predice el desarrollo futuro de AIGC, que se puede dividir en tres etapas:
Período de infraestructura AIGC
Período de desarrollo de AIGC
Período comercial AIGC
Período de infraestructura AIGC
En la actualidad, la mayoría de las empresas en la capa del modelo AIGC se encuentran en la etapa de precapacitación, y la principal fuente de demanda de chips es GPU.
En la etapa inicial, los fabricantes de GPU de alto rendimiento se convertirán en los mayores beneficiarios.
Sin embargo, actualmente existe una gran brecha entre los fabricantes de GPU nacionales y Nvidia, y el primer beneficiario es la parte dominante en el mercado de valores.
Por lo tanto, los fabricantes nacionales de servidores de IA son proveedores fuertes en esta etapa. En la actualidad, el campo del servidor de IA doméstico ha sido escaso.
### Período de desarrollo de AIGC
En la etapa de mediano plazo (dentro de 5 años), la capa de poder de cómputo es un proceso de pasar del entrenamiento al razonamiento.
En esta etapa, los chips de razonamiento se convertirán en el principal lado de la demanda. En comparación con la alta potencia informática y el alto consumo de energía de la GPU y el correspondiente desperdicio de potencia informática, el chip de inferencia presta más atención a la relación de eficiencia computacional del chip y tiene un mejor control sobre el consumo de energía y el costo. Además, esta etapa también será una oportunidad para chips innovadores.
Los analistas esperan más oportunidades de mercado para chips integrados de computación de memoria, chips inspirados en el cerebro y chips ópticos de silicio.
En la fase de inferencia, el edge computing tendrá más oportunidades que el cloud computing en la fase de entrenamiento.
En primer lugar, las aplicaciones correspondientes a la etapa de inferencia tienden a ser diversificadas, y los diversos requisitos hacen que la computación en la nube genere más desperdicio de poder de cómputo y baja eficiencia de cómputo.
En segundo lugar, la computación perimetral puede proporcionar suficiente poder de cómputo para el razonamiento de modelos grandes.
En esta etapa, el período de dividendos de los fabricantes de servidores de IA alcanzará gradualmente su punto máximo y la demanda se trasladará a servidores de propósito general de menor costo; los chips también se trasladarán de GPU a NPU/ASIC/FPGA/CPU y coexistirán otras formas. Entre las rutas de chips innovadores nacionales, ** se muestra optimista sobre el desarrollo de la arquitectura integrada de computación y almacenamiento**.
### Período comercial AIGC
Las ventajas de innovación subyacentes de los chips han comenzado a surgir, y los fabricantes de chips con tecnologías verdaderamente innovadoras, como la integración de almacenamiento y computación, los chips fotónicos y los chips similares al cerebro, han aumentado su papel en el mercado.
Los tipos de chips necesarios para la potencia informática AIGC son más diversos.
Las empresas en esta etapa tienen una consideración más integral de la potencia de cómputo, no solo considerando el tamaño de la potencia de cómputo, el consumo de energía y el costo pueden exceder el tamaño de la potencia de cómputo y convertirse en los indicadores que preocupan a las empresas en cada capa del modelo.
Informe Obtener
Haga clic en el enlace de abajo:
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
Informe de tendencia y panorama de potencia de computación de AIGC ¡Publicado! Un artículo interpreta la composición del poder de cómputo de AIGC, la cadena industrial y cinco nuevos juicios de tendencias.
Fuente: Qubit
El poder de cómputo de la IA nunca ha sido tan llamativo como ahora.
Desde el surgimiento de la tendencia de los modelos grandes, el número y la escala de los modelos grandes han aumentado de forma espectacular en tan solo unos meses.
Las decenas de miles de millones de cientos de miles de millones de modelos grandes se han disparado a docenas, y el modelo grande de billones de parámetros ha nacido oficialmente.
Bajo tales cambios de magnitud, la demanda de poder de cómputo muestra cambios drásticos.
Las empresas de nivel modelo están adquiriendo servicios de potencia informática a casi todos los costos. El valor de mercado de Nvidia alguna vez superó el billón de dólares estadounidenses, y el mercado de la computación en la nube se está remodelando a un ritmo acelerado...
Después del preludio de la era AIGC, la forma de entender la industria de la potencia informática es particularmente importante.
¿Qué tipo de potencia informática necesita la empresa? ¿Qué cambios ocurrirán en la industria de la potencia informática debido al auge de AIGC? ¿Cuál es la composición actual del mercado de potencia informática?
"AIGC Computing Power Panorama and Trend Report" está aquí para ayudarlo a comprender estos problemas.
En el informe, el grupo de expertos sobre qubit analizó sistemáticamente la composición del poder de cómputo de AIGC y la cadena industrial, y señaló además las cinco nuevas tendencias del poder de cómputo de AIGC** y el pronóstico de desarrollo de tres etapas .
Veamos los detalles uno por uno.
El crecimiento comercial de los fabricantes de servidores nacionales supera el 30 %
Del análisis del status quo actual de la industria, el cuerpo principal de la industria incluye principalmente:
Capa de chips: AIGC dos rutas proporcionan potencia informática
En chips informáticos, actualmente hay dos rutas principales en la industria para satisfacer las necesidades de potencia informática de la industria AIGC.
Una es la ruta GPU representada por Nvidia, que se llama chip universal.
La otra es la ruta ASIC representada por Huawei y el Cambrian, que se llama ruta de chip especial.
En la actualidad, estas dos rutas reúnen a diferentes tipos de jugadores, y las tareas informáticas que realizan también son diferentes.
Bajo la ruta del chip de uso general, puede completar diversas tareas informáticas y es adecuado para la informática paralela a gran escala.
Es decir, el chip de uso general (GPU) es más adecuado para la potencia informática actual de AIGC.
La ventaja de la ruta dedicada se refleja en la mejor relación eficiencia energética en escenarios específicos. Dado que los chips para propósitos especiales están diseñados para realizar tareas especializadas o personalizadas, pueden lograr una mejor relación de eficiencia energética y eficiencia informática que los chips para propósitos generales en escenarios específicos**.
Solo porque los chips dedicados pueden generar una mayor eficiencia informática en escenarios específicos, también se ha convertido en la ruta técnica elegida por Internet y otros proveedores de nube al desarrollar sus propios chips.
Por lo general, los chips de desarrollo propio de los fabricantes de la nube de Internet sirven principalmente a sus propios productos, enfatizando la máxima liberación del rendimiento del chip en su propia ecología.
La demanda de AIGC de computación de alto rendimiento ha convertido a los servidores de IA en el segmento de más rápido crecimiento en el campo de los servidores.
El entrenamiento de modelos grandes, como GPT-3, requiere una gran cantidad de recursos informáticos y memoria y, por lo general, implica el uso de miles o incluso decenas de miles de GPU para acelerar el entrenamiento.
Debido a que estos cálculos tienen requisitos muy altos en el rendimiento del chip, se requieren hardware y software especializados para admitir la computación paralela masiva y la transmisión de datos de alta velocidad.
Los servidores de IA son servidores especialmente diseñados para manejar cargas de trabajo de inteligencia artificial, utilizando aceleradores de hardware especializados (como GPU, TPU, etc.), así como conexiones de red de alta velocidad y almacenamiento para proporcionar capacidades informáticas de alto rendimiento.
Por el contrario, las CPU (servidores de propósito general) por lo general no pueden satisfacer la demanda de potencia informática extrema de AIGC, y su potencia informática, memoria y capacidad de almacenamiento suelen ser bajas. Además, las CPU generalmente no tienen aceleradores de hardware dedicados para proporcionar computación de alta velocidad.
Por lo tanto, el entrenamiento de modelos a gran escala debe depender de los clústeres de servidores de IA para proporcionar servicios informáticos.
Según la investigación de Qubit Think Tank, después del estallido de AIGC este año, los fabricantes de servidores domésticos, en general, han aumentado su negocio en más del 30 %**.
Recientemente, TrendForce también elevó la tasa de crecimiento anual compuesta de los envíos de servidores de IA de 2022 a 2026 al 22 %. Detrás del aumento en el negocio de los servidores de IA, los mayores compradores siguen siendo las empresas de Internet.
En 2022, grandes fabricantes como ByteDance, Tencent, Alibaba, Baidu, etc. se convertirán en los principales compradores en la proporción de adquisición de servidores de IA. Este año, el entusiasmo por la investigación y el desarrollo de modelos a gran escala ha impulsado la demanda de compra de las empresas de Internet, lo que las convierte en el mayor comprador de servidores de IA.
El modelo MaaS fue propuesto por primera vez por Ali, y luego las principales empresas de Internet y las empresas de inteligencia artificial (como SenseTime) introdujeron el modelo MaaS.
Además, empresas como gigantes de Internet y Huawei ya han utilizado chips de desarrollo propio en la construcción de bases MaaS.
En 2023, los principales fabricantes nacionales de nube lanzarán sucesivamente sus propias plataformas MaaS, basadas en bases de modelos grandes, para proporcionar servicios MaaS integrales para empresas con recursos informáticos limitados y falta de experiencia profesional.
Para los proveedores de la nube, el propósito principal de los servicios de MaaS es ayudar a los clientes a construir rápidamente modelos grandes específicos de la industria. En base a esto, la dimensión de la competencia entre los proveedores de la nube ha cambiado a la infraestructura de potencia informática, las capacidades generales del modelo a gran escala y las capacidades de la plataforma/herramienta de IA.
Desde la perspectiva de la distribución de equipos informáticos, en el mercado de servidores y servidores de IA, Beijing, Guangdong, Zhejiang, Shanghái y Jiangsu se encuentran entre los cinco primeros, con una cuota de mercado total (servidor y servidor de IA) del 75 % y el 90 %. (datos de 2021) .
Desde el punto de vista del suministro, la mayoría de los centros de cómputo inteligente están ubicados en las provincias del Este y el Centro, y el negocio de AIGC necesita procesar cantidades masivas de datos, lo que resulta en un alto costo de los recursos de potencia de cómputo en el este**.
Mover tareas con altos requisitos informáticos, como la capacitación de modelos a gran escala, a la región occidental forma "East Data Training", que puede reducir los costos de manera efectiva y lograr el costo integral óptimo de los recursos de la red informática.
Específicamente, para resolver problemas como la oferta y la demanda desequilibradas de la demanda de potencia de cómputo, es necesario transferir la potencia de cómputo y las tareas de procesamiento de datos en el este a la región occidental con costos más bajos a través de la programación de potencia de cómputo. Entre ellos, optimizar la red de interconexión entre el este y el oeste y la red de conexión directa entre los nodos centrales es la clave para mejorar el nivel de programación de la potencia informática.
Desde la perspectiva de la demanda, la demanda de poder de cómputo AIGC proviene principalmente de los fabricantes que desarrollan modelos AIGC grandes, distribuidos principalmente en la región de Beijing-Tianjin-Hebei, el delta del río Yangtze y la Gran Área de la Bahía.
La revolución del servidor de chips está surgiendo
La tendencia de los modelos grandes plantea nuevos requisitos de potencia informática y conduce a nuevos cambios en el hardware subyacente. Veamos dos niveles de chips y servidores:
nivel de chip
En la actualidad, entre los chips de alto rendimiento, Nvidia A100 tiene una ventaja absoluta, y A100 solo tiene existencias en China, pero no aumenta. El mercado nacional brindará a los fabricantes de GPU nacionales más oportunidades **.
Además, a nivel de fundición de chips, actualmente no hay una fundición nacional que pueda realizar procesos de 7nm y superiores, y la mayoría de los fabricantes de GPU eligen procesos maduros + soluciones de empaquetado avanzadas para lograr indicadores de rendimiento más altos.
A nivel de clúster de servidores, la computación de alto rendimiento se realiza a través de la computación paralela de múltiples tarjetas y múltiples máquinas y la red de alto rendimiento.
Dado que la ecología del producto de hardware + CUDA construida por Nvidia es difícil de superar en 10 años, en el futuro, cuando la GPU de alto rendimiento sea limitada, los analistas predicen que habrá dos soluciones principales para la capa de hardware, la última es desarrollar GPU + tecnología de interconexión entre chips para lograr computación paralela masiva**.
La otra es salirse de la arquitectura von Neumann y desarrollar una arquitectura informática y de almacenamiento integrada para integrar unidades informáticas y unidades de almacenamiento para lograr una mejora de orden de magnitud en la eficiencia energética informática.
A nivel de software, la computación dispersa y la construcción de una red de alto rendimiento son actualmente dos soluciones.
La innovación de la computación dispersa se refleja en el nivel del algoritmo Al eliminar datos no válidos o redundantes (dichos datos suelen ser enormes), la cantidad de cálculo de datos se reduce considerablemente, lo que acelera el cálculo.
El propósito de construir una red de alto rendimiento es reducir el tiempo de entrenamiento de modelos grandes. Al construir una red de alto rendimiento, cada nodo informático tiene un ancho de banda de comunicación ultra alto, lo que brinda una mejora varias veces mayor en el rendimiento del tráfico y, por lo tanto, acorta el tiempo de entrenamiento de los modelos grandes.
La demanda de poder de cómputo de los modelos grandes de IA está aumentando exponencialmente, lo que convierte a los servidores de IA con configuraciones más altas en el principal portador del poder de cómputo AIGC.
En comparación con los servidores tradicionales, las capacidades informáticas, de almacenamiento y de transmisión de red de los servidores de IA pueden alcanzar un nivel superior.
Por ejemplo, la configuración del servidor NVIDIA DGX A100 con 8 GPU y 2 CPU es mucho mayor que la de los servidores tradicionales con 1~2 CPU.
En mi país, el Centro de Cómputo Inteligente es una plataforma de infraestructura pública que proporciona recursos de potencia de cómputo para inteligencia artificial (modelos grandes), y sus unidades de potencia de cómputo son principalmente servidores de entrenamiento de IA y servidores de razonamiento de IA.
Con la evolución de los modelos grandes, la principal demanda de futuros servidores de IA pasará del entrenamiento a la inferencia. Según la previsión de IDC, para 2026, el 62,2 % de la potencia informática de AIGC se utilizará para el razonamiento de modelos.
Los cambios en la industria generan nuevas oportunidades comerciales
Además, la tendencia de los modelos a gran escala de IA brinda nuevas oportunidades a la industria de la potencia informática y están surgiendo nuevos paradigmas, nuevos productos y nuevas infraestructuras.
Nuevas reglas del juego: MaaS remodela el paradigma del servicio en la nube, bucle cerrado del modelo de negocio AIGC
MaaS (Model as a Service) incorpora grandes modelos en potencia informática, algoritmos y capas de aplicación, integra aplicaciones con bases inteligentes y unifica la salida externa.
La esencia de MaaS es refinar e integrar tecnologías básicas comunes en la industria en servicios para satisfacer las necesidades de varios escenarios de aplicación.
En el proceso de comercialización, las capacidades del modelo a gran escala y las herramientas de soporte intermedio se convertirán en nuevas dimensiones que las empresas tendrán en cuenta para los proveedores de computación en la nube.
El discriminante de las capacidades del servicio de computación en la nube ha pasado del nivel de potencia informática a la capacidad de "integración de inteligencia en la nube". Además de la infraestructura de potencia informática, la competitividad central ha cambiado a la capacidad de crear potencia informática, modelos y aplicaciones de escena. en productos estandarizados.
La máquina todo en uno modelo AI integra profundamente el software y el hardware. De acuerdo con las diferentes necesidades de las empresas, los productos o soluciones correspondientes se implementan en el servidor AI con anticipación y se empaquetan para formar un conjunto completo de soluciones.
La ventaja de costo de la máquina todo en uno modelo AI se refleja principalmente en los siguientes tres puntos:
El modelo de arrendamiento de potencia informática puede reducir efectivamente el umbral para el desarrollo de modelos a gran escala. Para las pequeñas empresas modelo en industrias verticales que no tienen la fuerza para comprar suficientes servidores de IA, la plataforma básica de potencia informática pública ayudará a las pequeñas y medianas empresas. construir sus propios modelos requeridos.
Las empresas no necesitan comprar servidores, pero pueden acceder al centro de poder de cómputo a través de un navegador y usar los servicios de poder de cómputo.
Para las pequeñas y medianas empresas, no es necesario depender de la gran base de modelos creada por los proveedores de la nube para el desarrollo secundario, sino desarrollar modelos pequeños de industrias verticales mediante el alquiler de recursos de potencia informática de plataformas públicas de potencia informática.
Pronóstico de desarrollo de la industria
En resumen, el think tank qubit predice el desarrollo futuro de AIGC, que se puede dividir en tres etapas:
Período de infraestructura AIGC
En la actualidad, la mayoría de las empresas en la capa del modelo AIGC se encuentran en la etapa de precapacitación, y la principal fuente de demanda de chips es GPU.
En la etapa inicial, los fabricantes de GPU de alto rendimiento se convertirán en los mayores beneficiarios.
Sin embargo, actualmente existe una gran brecha entre los fabricantes de GPU nacionales y Nvidia, y el primer beneficiario es la parte dominante en el mercado de valores.
Por lo tanto, los fabricantes nacionales de servidores de IA son proveedores fuertes en esta etapa. En la actualidad, el campo del servidor de IA doméstico ha sido escaso.
En la etapa de mediano plazo (dentro de 5 años), la capa de poder de cómputo es un proceso de pasar del entrenamiento al razonamiento.
En esta etapa, los chips de razonamiento se convertirán en el principal lado de la demanda. En comparación con la alta potencia informática y el alto consumo de energía de la GPU y el correspondiente desperdicio de potencia informática, el chip de inferencia presta más atención a la relación de eficiencia computacional del chip y tiene un mejor control sobre el consumo de energía y el costo. Además, esta etapa también será una oportunidad para chips innovadores.
Los analistas esperan más oportunidades de mercado para chips integrados de computación de memoria, chips inspirados en el cerebro y chips ópticos de silicio.
En la fase de inferencia, el edge computing tendrá más oportunidades que el cloud computing en la fase de entrenamiento.
En primer lugar, las aplicaciones correspondientes a la etapa de inferencia tienden a ser diversificadas, y los diversos requisitos hacen que la computación en la nube genere más desperdicio de poder de cómputo y baja eficiencia de cómputo.
En segundo lugar, la computación perimetral puede proporcionar suficiente poder de cómputo para el razonamiento de modelos grandes.
En esta etapa, el período de dividendos de los fabricantes de servidores de IA alcanzará gradualmente su punto máximo y la demanda se trasladará a servidores de propósito general de menor costo; los chips también se trasladarán de GPU a NPU/ASIC/FPGA/CPU y coexistirán otras formas. Entre las rutas de chips innovadores nacionales, ** se muestra optimista sobre el desarrollo de la arquitectura integrada de computación y almacenamiento**.
Las ventajas de innovación subyacentes de los chips han comenzado a surgir, y los fabricantes de chips con tecnologías verdaderamente innovadoras, como la integración de almacenamiento y computación, los chips fotónicos y los chips similares al cerebro, han aumentado su papel en el mercado.
Los tipos de chips necesarios para la potencia informática AIGC son más diversos.
Las empresas en esta etapa tienen una consideración más integral de la potencia de cómputo, no solo considerando el tamaño de la potencia de cómputo, el consumo de energía y el costo pueden exceder el tamaño de la potencia de cómputo y convertirse en los indicadores que preocupan a las empresas en cada capa del modelo.
Informe Obtener
Haga clic en el enlace de abajo: