Todo el mundo habla del modelo grande, que es un fiel retrato del mundo de la tecnología en la primera mitad de este año.
A juzgar por la emoción del mercado, los modelos a gran escala se han convertido en una pista para que varios fabricantes de tecnología se apresuren, ya sean gigantes de Internet, empresas de tecnología o incluso instituciones de investigación, todos se han unido a este tumulto de modelos a gran escala. -Los modelos a escala se han convertido en "campo de batalla".
Justo cuando el mercado nacional de modelos a gran escala está en pleno apogeo, ChatGPT, que ha impulsado la popularidad de los modelos a gran escala de un solo golpe, ha experimentado una disminución en las visitas. Según los últimos datos de SimilarWeb, una agencia de monitoreo de terceros, en mayo de este año, ChatGPT comenzó a mostrar una desaceleración en el crecimiento, con una tasa de crecimiento de solo 2.8% en ese mes, mientras que los primeros cuatro meses de 2023 fueron 131.6 %, 62,5%, 55,8%, 12,6%. Esta es la primera vez que ChatGPT experimenta un crecimiento de tráfico negativo desde su lanzamiento el 30 de noviembre de 2022.
Este fenómeno puede reflejar una tendencia importante de la industria: todas las partes están cambiando del entusiasmo técnico inicial por los modelos grandes a pensar tranquilamente en la comercialización. Y el aterrizaje de modelos a gran escala también es un tema que todas las empresas de modelos a gran escala deben considerar seriamente.
** "JD.com cree que el valor de un modelo grande = algoritmo × potencia informática × datos × cuadrado del grosor de la industria", dijo Xu Ran, director ejecutivo de JD.com. JD.com no solo persigue el avance de la tecnología, sino que también presta especial atención al espesor de la industria: valora cuántos escenarios industriales la tecnología se puede aplicar de manera práctica y puede crear varios valores para la sociedad. **
El 13 de julio, JD.com lanzó un modelo grande de Yanxi. Según JD.com, este es un modelo de nueva generación con parámetros que alcanzan los cientos de miles de millones de dólares, y será muy utilizado en el comercio minorista, las finanzas, la logística, la salud, la industria y otros escenarios industriales en el futuro.
Cuando la eficiencia industrial y la expansión de los límites industriales mejoren cualitativamente, el modelo grande tendrá un valor práctico y un significado más importantes. En el ajetreo y el bullicio de los modelos grandes, debemos volver a la racionalidad y considerar seriamente el verdadero valor de los modelos grandes. ¿Qué tipo de gran modelo necesita la industria? ¿Cómo se debe poner en uso comercial el modelo grande para reducir costos y aumentar la eficiencia de la industria?
Compitiendo por el gran modelo: el consenso de general a la industria
De la noche a la mañana, los modelos domésticos a gran escala "surgieron" uno tras otro.
Según el "Informe de investigación de mapas modelo a gran escala de inteligencia artificial de China" publicado por el Instituto de Información Científica y Tecnológica de China del Ministerio de Ciencia y Tecnología, al 28 de mayo, al menos 79 modelos básicos a gran escala con una escala de Se han publicado más de mil millones de parámetros en China. El número de modelos grandes desarrollados en mi país ocupa el segundo lugar en el mundo.
Sin embargo, detrás del creciente número de I+D, vale la pena explorar cómo obtener el valor comercial de los modelos grandes.
En la actualidad, están saliendo más modelos grandes de propósito general.Este tipo de modelo a gran escala tiene una poderosa comprensión del lenguaje natural, generación de lenguaje y capacidades de reconocimiento de voz, y funciona bien en escenarios con fuertes atributos generales, como chat y entretenimiento. , estos escenarios son aún difíciles de lograr la comercialización a gran escala.
En escenarios industriales subdivididos, la precisión de la respuesta del modelo grande general es baja. Esto se debe a que la industria en sí tiene un tamaño de muestra pequeño, una distribución de datos desigual y escenarios de aplicación cambiantes, lo que hace que el modelo grande no pueda optimizarse ni mejorarse a sí mismo. La precisión, naturalmente, no es alta.
Desde la perspectiva de la comercialización, es posible que las empresas no necesiten un modelo a gran escala de uso general "completo", sino un modelo industrial a gran escala que apunte a escenarios de campo subdivididos y resuelva problemas prácticos.
Wu Hequan, académico de la Academia de Ingeniería de China, señaló una vez que "los modelos grandes similares a chats han desencadenado una nueva ronda de aumento, pero el diálogo, la escritura de poesía y la pintura no son todos de modelos grandes. Necesitamos Piense profundamente en la dirección de aplicación de modelos grandes, y realmente debemos poner modelos grandes en En los campos del desarrollo urbano, la tecnología financiera, la biomedicina, la fabricación industrial y la investigación científica, también se necesitan empresas y organizaciones profesionales para acelerar su implementación en el industria real, aportando valor real a las necesidades inmediatas de la industria y realmente sirviendo a la sociedad a gran escala".
Hoy en día, se está formando un consenso en el mercado de modelos a gran escala de que los modelos a gran escala que no se pueden poner en uso comercial son solo "herramientas de entretenimiento", y solo los modelos a gran escala que profundizan en la industria y resuelven problemas prácticos tienen valor. Pensando profundamente en el valor de los modelos grandes, una fórmula propuesta por JD.com está más en línea con la tendencia del mercado de modelos grandes, a saber: el valor de los modelos grandes = algoritmo × potencia informática × datos × cuadrado del grosor de la industria.
** A partir de la fórmula de valor del modelo grande, podemos ver que el modelo grande industrial y el modelo grande general no están en oposición. El modelo grande industrial se basa en el modelo grande general y está entrenado. El contenido está más en línea con las necesidades de los escenarios verticales industriales y más específicos. **
En términos de la ruta de evolución del modelo grande, no sorprende que JD.com tenga visión de futuro. Desde su establecimiento, Jingdong se ha arraigado en la industria y, naturalmente, presta más atención al valor de los modelos grandes en la industria.
"Jingdong considera los modelos grandes y otras innovaciones tecnológicas. Además de perseguir la naturaleza avanzada de la tecnología, también presta especial atención al grosor de la industria: en cuántos escenarios industriales se puede aplicar la tecnología en la práctica para crear valor real para la sociedad. ", dijo Xu Ran, CEO de Jingdong.
**De hecho, el desarrollo de modelos grandes en esta etapa está pasando de "universal" a "industrial". **
El último informe de investigación publicado por Minsheng Securities mencionó que después del período intensivo de lanzamiento de modelos grandes de febrero a marzo, el período de desarrollo de productos de abril a mayo y la dirección de la política se aclararon gradualmente, los productos y aplicaciones de modelos grandes comenzarán en junio. Se espera que marque el comienzo de un lanzamiento centralizado. La nueva ola de lanzamientos se basa en productos de aplicaciones modelo a gran escala, y las actualizaciones a gran escala han comenzado a estar en línea, preparándose para ingresar a miles de hogares.
Recientemente, la mayoría de los últimos modelos a gran escala lanzados por empresas de tecnología nacionales están destinados a industrias verticales. En el extranjero, varias empresas han lanzado sucesivamente modelos de industria a gran escala de diferentes escalas, con el propósito de aplicarlos al campo industrial.
A partir de las tendencias reales de los principales fabricantes nacionales y extranjeros, no es difícil ver que el modelo industrial podrá ayudar más a los socios industriales a completar la transformación digital, reducir costos y aumentar la eficiencia, y crear un mayor valor para la industria y la sociedad. .
Gran modelo industrial, es difícil sentar una base sólida para la industria
La dificultad de construir modelos industriales a gran escala es mucho mayor que la de los modelos a gran escala de propósito general.
Si el modelo general a gran escala prueba el poder de cómputo y la acumulación de algoritmos de la empresa, entonces el modelo industrial a gran escala prueba el acceso de la empresa y la comprensión de los escenarios comerciales, así como la acumulación y aplicación de datos industriales.
Un consenso de la industria es que en el entrenamiento de grandes modelos industriales, lo más difícil de obtener son los datos industriales. Los datos industriales a menudo están en manos de las empresas. Debido a la seguridad de los datos y otras consideraciones, pocas empresas están dispuestas a divulgar datos privados. Sin embargo, estos datos industriales a menudo afectan directa o indirectamente la velocidad de iteración técnica, la precisión del modelo y la profesionalidad comercial del modelo industrial grande.
"Los datos industriales también se pueden dividir en datos estáticos y datos dinámicos. Los datos estáticos son relativamente estables, no cambiarán de inmediato y la ruta de adquisición es relativamente clara. Los datos dinámicos son los datos generados en cada momento en diferentes escenarios industriales. Esta parte del Los datos son datos de escenas 'vivas'. No es fácil de obtener, pero es uno de los elementos necesarios del modelo industrial", enfatizó He Xiaodong, presidente del Instituto de Investigación JD y presidente del Departamento de Productos y Servicios Inteligentes de JD Technology.
Sin embargo, el entrenamiento de grandes modelos industriales no solo puede usar datos industriales, sino que aún necesita usar una gran cantidad de datos generales para proporcionar conocimiento de sentido común. Las razones son las siguientes: en primer lugar, la generalización de los datos industriales es insuficiente y el modelo grande debe volver a entrenarse cada vez que se cambia la escena, lo cual es costoso; Atascado en un estado atascado.
He Xiaodong comparó la capacitación de un gran modelo industrial con la capacitación de una persona: "Si una persona sale a trabajar directamente después de graduarse de la escuela secundaria, parece estar bien, pero el profesionalismo será menos profesional. Si puede terminar un programa de cuatro años Licenciatura antes de salir a trabajar, tienes tanto conocimiento general Habilidad como conocimiento profesional suficiente son las capacidades que debe poseer un gran modelo industrial.”
Por esta razón, los datos del modelo grande de JD Yanxi se componen de un 70 % de datos generales y un 30 % de datos sin procesar del crecimiento de la escena de la cadena de suministro.
Cabe mencionar que estos datos industriales provienen del propio JD.com. JD.com en sí es una empresa basada en la cadena de suministro. Tiene sus raíces en una amplia gama de industrias. No solo tiene datos prácticos en comercio minorista, logística, finanzas, salud, industria y otras industrias, sino que también tiene datos sobre ciudades, asuntos gubernamentales, finanzas, manufactura, industria, aviación, transporte, etc. Los datos insensibilizados de industrias como parques industriales, parques industriales y energía, y los datos de alta calidad generados cada año alcanzan los 10 mil millones de piezas.
Además del suministro continuo de datos industriales de alta calidad, el modelo industrial grande también necesita comprender el know-how de la industria, es decir, tener un conocimiento único sobre la industria y tener mayores requisitos de comprensión. Por ejemplo, la industria minorista presta más atención al efecto del marketing y la recomendación, y la industria financiera presta más atención al efecto del control de riesgos, la confiabilidad y la seguridad.
Para esta demanda, la cadena de suministro de inteligencia digital a largo plazo de JD.com ha jugado un papel clave y se ha convertido en el foco de los esfuerzos de JD.com en la aplicación de modelos grandes. El modelo grande también puede basarse en la inteligencia digital de la cadena de suministro y profundizar en la industria física.
Se informa que la cadena de suministro de inteligencia digital de JD.com ha cubierto más de 10 millones de SKU de productos autooperados de JD.com, sirviendo a más de 8 millones de clientes corporativos activos, incluido más del 90% de las 500 empresas más importantes del mundo en China, y casi el 70% de las nuevas PYMES especiales especializadas del país. Al mismo tiempo, la cadena de suministro de inteligencia digital de JD.com todavía está en el país y tiene una cooperación profunda con más de 2000 cinturones industriales.
Este tipo de cadena de suministro de inteligencia digital con vínculos más largos, escenarios más complejos y datos más ricos es un excelente "campo de entrenamiento" para modelos grandes. Desde el punto de vista de JD Cloud, el valor del modelo grande solo se puede obtener comprendiendo a fondo la cadena de suministro y permitiendo que el modelo grande "se ejecute" en la cadena de suministro.
Además de la acumulación en el lado industrial, no se debe subestimar la fortaleza de JD.com en algoritmos básicos y poder de cómputo.
En 2021, JD Discovery Research Institute lanzó el primer clúster de computación a gran escala del país basado en la arquitectura DGX SuperPOD en Chongqing-Tianqin α, que aumentó la velocidad de razonamiento en 6,2 veces y redujo el costo del razonamiento en un 90 %. Esto proporciona a JD.com la garantía más básica para la formación de modelos a gran escala.
En el mismo año, JD.com lanzó el modelo K-PLUG de mil millones de niveles. La copia del producto generada por K-PLUG ha cubierto más de 3000 categorías en JD.com, generando un total de 3 mil millones de palabras, y la tasa de aprobación de revisión manual supera el 95%. Para 2022, el modelo grande de JD.com se actualizará a un modelo Vega de decenas de miles de millones, que se puede usar ampliamente en varias tareas de procesamiento de lenguaje natural posteriores, como análisis de sentimientos, coincidencia semántica, corrección de errores gramaticales, respuesta inteligente a preguntas y sentido común. razonamiento.
Gracias a la acumulación anterior, JD.com logró otro avance tecnológico este año y lanzó una nueva generación del modelo a gran escala de JD.com con cientos de miles de millones de parámetros, centrándose en varias tareas importantes, como la generación de contenido, el diálogo hombre-máquina, comprensión de la intención del usuario, extracción de información y clasificación de emociones. , realizó el ajuste fino del modelo base + modelo de dominio vertical, y aplicó escenarios verticales en profundidad como comercio minorista, logística, finanzas, salud y asuntos gubernamentales.
En la actualidad, el modelo industrial grande representado por JD.com está entrenando el modelo grande a través de sus datos y conocimientos industrializados y basados en escenarios acumulados, y corrigiendo el modelo grande en función de su conocimiento industrial acumulado, para mejorar el rendimiento de los modelos grandes. en industrias específicas y escenarios de aplicación, y para mejorar la capacidad de control. Esto es equivalente a completar una "educación general" para la IA.
**El gran modelo de Jingdong se está adentrando gradualmente en varias industrias para mejorar el nivel de inteligencia de la cadena de suministro. Por el contrario, la actualización de la inteligencia digital de la cadena de suministro también está promoviendo la transformación industrial, lo que a su vez proporciona un suelo de datos más rico para modelos grandes, formando un ciclo positivo. **
"Cortar en el modelo a gran escala desde el lado industrial es como escalar el Monte Everest técnico desde la ladera norte: aunque el camino es más difícil, hay paisajes más magníficos. Jingdong insiste en hacer 'cosas difíciles pero correctas', insistiendo en hacer práctico, valioso y es un asunto a largo plazo. En el campo técnico y en el modelo grande, este es nuestro compromiso constante ", dijo Xu Ran.
** Las "cosas difíciles y correctas" necesitan acumulación a largo plazo. Sin embargo, en cuanto a la construcción del modelo industrial, JD.com claramente ha sentado las bases. **
Jingdong, nacido en la industria, crea valor industrial con modelos grandes
"En la era del gran modelo, vale la pena volver a hacer cualquier cosa con el gran modelo".
Bajo la ola de modelos grandes, la industria alcanzó rápidamente el consenso anterior. Sin embargo, mientras que otros fabricantes importantes están buscando modelos comerciales a través de diversas estrategias, la dirección de la industria de aterrizaje de Jingdong nunca ha cambiado.
"Los atributos industriales son las características distintivas de la tecnología de JD.com. Cada tecnología desarrollada por JD.com surge de necesidades industriales, experiencias en escenarios industriales y crea valor industrial", dijo Xu Ran.
En la actualidad, el modelo a gran escala de JD Yanxi avanza de acuerdo con la estrategia de "tres pasos": en la actualidad, JD Cloud ha creado un modelo a gran escala de propósito general basado en prácticas internas; para fines de este año, JD. Servicios industriales sólidos; se espera que a principios de 2024, las capacidades del modelo a gran escala se abran a escenarios comerciales serios externos.
Desde un punto de vista práctico, el modelo grande de JD.com ha alcanzado el segundo paso. JD.com está utilizando las capacidades del modelo grande para los escenarios más familiares, como comercio minorista, finanzas, logística y salud, y ha penetrado en varios Enlaces.
Por ejemplo, Jingdong está mejorando la capacidad del servicio al cliente inteligente a través de modelos grandes. El campo del servicio al cliente es diferente de los chats y conversaciones diarias, es una escena de diálogo basada en tareas serias que necesita resolver varios problemas complejos entre compradores y vendedores en el mundo real.
"Cuando un usuario habla con ChatGPT, no importa si la respuesta es incorrecta, y no afectará ninguna toma de decisiones. Pero si en un escenario comercial serio, el servicio de atención al cliente inteligente responde mal, las consecuencias serán inimaginables". Por lo tanto, la precisión de la respuesta es muy importante ", dijo el Comité Técnico del Grupo Jingdong, Cao Peng, presidente y presidente de la división JD Cloud.
Para escenarios de servicio al cliente inteligente, JD.com no solo creó un modelo grande con comprensión semántica básica y lógica de preguntas y respuestas, sino que también perfeccionó un modelo pequeño para escenarios específicos. Si el problema del cliente involucra devoluciones y cambios comunes, etc., el servicio al cliente inteligente llamará a un modelo grande más general. Y una vez que la pregunta involucre la política de garantía y las reglas de protección de precios de productos específicos, el servicio de atención al cliente inteligente llamará a un modelo pequeño más específico para dar la respuesta. Diferentes modelos pueden asumir diferentes responsabilidades.
Ahora, el servicio de atención al cliente inteligente está funcionando dentro de JD.com, ayudando a más de 20 000 empleados de atención al cliente propios a reducir costos y aumentar la eficiencia, y optimizar continuamente la experiencia de atención al cliente. JD.com también ha abierto sus capacidades de servicio al cliente inteligente al mundo exterior para ayudar a más agencias gubernamentales y empresas a llevar a cabo la transformación y actualización digital e inteligente.
En términos de servicios externos para modelos grandes, JD.com todavía mantiene su propio ritmo "lento" y no tiene prisa por "vender" modelos grandes a empresas. La razón es que la inteligencia artificial es un cambio tecnológico muy serio: si se usa bien, puede transformar la industria, pero si se usa incorrectamente, también puede tener graves consecuencias. Bajo tales circunstancias, Jingdong se adhiere a la mentalidad a largo plazo y es una excelente opción.
"JD.com no servirá platos que no hayan logrado 'color, sabor y sabor completos'. Una vez que el modelo a gran escala haya completado la experiencia y la práctica en escenas internas clave, se abrirá a los socios para ayudar a toda la industria a reducir costos. y aumentar la eficiencia." Xu Ran express.
En el plan de JD.com, el modelo grande de Yanxi se convertirá en el soporte técnico de más bajo nivel. Según sus capacidades, el campo producirá una serie de productos, y los productos en el mismo campo se agregarán a una plataforma y, finalmente, generarán valor para la industria.
Por ejemplo, en el campo de la generación de contenido, JD.com ha creado la plataforma de marketing de contenido JD Cloud AIGC. Basado en la rica acumulación de datos de productos de toda la categoría de JD.com, el modelo grande puede comprender mejor las características del producto, ayudar a los comerciantes a generar automáticamente imágenes de productos, puntos de venta y otros materiales de marketing, y mejorar la eficiencia operativa de los comerciantes y la calidad del contenido de marketing.
En otras palabras, los comerciantes solo necesitan cargar una imagen del producto y pueden obtener rápidamente múltiples tipos de imágenes, como imágenes del producto principal, imágenes de carteles de marketing e imágenes de detalles comerciales necesarias para las operaciones de comercio electrónico, satisfaciendo las necesidades de apertura rápida de tiendas, listado de productos y marketing. Estas capacidades pueden ahorrar a los comerciantes el 90 % del costo del dibujo y acortar el ciclo de producción de 7 días a medio día.
Usando más capacidades de modelos a gran escala, los comerciantes ni siquiera necesitan vender sus propios productos, solo necesitan usar el humano digital multimodal de JD Cloud para entregar productos las 24 horas del día a bajo costo.
Además de estas aplicaciones, JD.com también demostró una plataforma de operación de marketing de IA en el campo financiero. A través de un diálogo simple, los usuarios pueden generar actividades de marketing en un solo paso, cubriendo la formulación de estrategias operativas, la programación de tareas de marketing, la creación de páginas de actividades, la generación por lotes de redacción y materiales de marketing, la entrega digital, etc. Según datos relevantes de JD.com, en el pasado este conjunto de procesos requería cinco tipos de personal funcional: producto, I+D, algoritmo, diseño y analista, pero ahora se ha reducido a una sola persona; en el pasado, el proceso requirió 2,000 interacciones humano-computadora, pero también se ha reducido a menos de 50. Con el apoyo de la gran capacidad del modelo, la eficiencia de producción del plan de marketing se ha mejorado significativamente.
** Se puede decir que el gran modelo industrial de JD.com se está convirtiendo en la base para aplicaciones industriales en varias industrias. En la actualidad, ha penetrado en el comercio minorista, la logística, la salud, la industria, la fabricación, las finanzas, el marketing y otras industrias, y se ha dirigido a la industria y la aplicación práctica. **
Medio año después de que el gran modelo se volviera loco, los fabricantes se dieron cuenta de que la "gran escala" o los "altos parámetros" no pueden resolver los problemas prácticos. Cuando termine el período de la burbuja, los modelos grandes deben volver a la industria, volver a escenarios reales y resolver problemas prácticos después de todo. Este es el destino final de la tecnología y el comienzo del desarrollo benigno de modelos grandes. Aquellas empresas con datos industriales sólidos y práctica de escenarios comenzaron a subir al escenario.
Obviamente, el modelo grande de Jingdong Yanxi ha zarpado hacia el otro extremo del valor industrial.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
De la locura a la racionalidad, los modelos a gran escala marcaron el comienzo del "punto de inflexión" de la industria
Todo el mundo habla del modelo grande, que es un fiel retrato del mundo de la tecnología en la primera mitad de este año.
A juzgar por la emoción del mercado, los modelos a gran escala se han convertido en una pista para que varios fabricantes de tecnología se apresuren, ya sean gigantes de Internet, empresas de tecnología o incluso instituciones de investigación, todos se han unido a este tumulto de modelos a gran escala. -Los modelos a escala se han convertido en "campo de batalla".
Justo cuando el mercado nacional de modelos a gran escala está en pleno apogeo, ChatGPT, que ha impulsado la popularidad de los modelos a gran escala de un solo golpe, ha experimentado una disminución en las visitas. Según los últimos datos de SimilarWeb, una agencia de monitoreo de terceros, en mayo de este año, ChatGPT comenzó a mostrar una desaceleración en el crecimiento, con una tasa de crecimiento de solo 2.8% en ese mes, mientras que los primeros cuatro meses de 2023 fueron 131.6 %, 62,5%, 55,8%, 12,6%. Esta es la primera vez que ChatGPT experimenta un crecimiento de tráfico negativo desde su lanzamiento el 30 de noviembre de 2022.
Este fenómeno puede reflejar una tendencia importante de la industria: todas las partes están cambiando del entusiasmo técnico inicial por los modelos grandes a pensar tranquilamente en la comercialización. Y el aterrizaje de modelos a gran escala también es un tema que todas las empresas de modelos a gran escala deben considerar seriamente.
** "JD.com cree que el valor de un modelo grande = algoritmo × potencia informática × datos × cuadrado del grosor de la industria", dijo Xu Ran, director ejecutivo de JD.com. JD.com no solo persigue el avance de la tecnología, sino que también presta especial atención al espesor de la industria: valora cuántos escenarios industriales la tecnología se puede aplicar de manera práctica y puede crear varios valores para la sociedad. **
El 13 de julio, JD.com lanzó un modelo grande de Yanxi. Según JD.com, este es un modelo de nueva generación con parámetros que alcanzan los cientos de miles de millones de dólares, y será muy utilizado en el comercio minorista, las finanzas, la logística, la salud, la industria y otros escenarios industriales en el futuro.
Cuando la eficiencia industrial y la expansión de los límites industriales mejoren cualitativamente, el modelo grande tendrá un valor práctico y un significado más importantes. En el ajetreo y el bullicio de los modelos grandes, debemos volver a la racionalidad y considerar seriamente el verdadero valor de los modelos grandes. ¿Qué tipo de gran modelo necesita la industria? ¿Cómo se debe poner en uso comercial el modelo grande para reducir costos y aumentar la eficiencia de la industria?
Compitiendo por el gran modelo: el consenso de general a la industria
De la noche a la mañana, los modelos domésticos a gran escala "surgieron" uno tras otro.
Según el "Informe de investigación de mapas modelo a gran escala de inteligencia artificial de China" publicado por el Instituto de Información Científica y Tecnológica de China del Ministerio de Ciencia y Tecnología, al 28 de mayo, al menos 79 modelos básicos a gran escala con una escala de Se han publicado más de mil millones de parámetros en China. El número de modelos grandes desarrollados en mi país ocupa el segundo lugar en el mundo.
Sin embargo, detrás del creciente número de I+D, vale la pena explorar cómo obtener el valor comercial de los modelos grandes.
En la actualidad, están saliendo más modelos grandes de propósito general.Este tipo de modelo a gran escala tiene una poderosa comprensión del lenguaje natural, generación de lenguaje y capacidades de reconocimiento de voz, y funciona bien en escenarios con fuertes atributos generales, como chat y entretenimiento. , estos escenarios son aún difíciles de lograr la comercialización a gran escala.
En escenarios industriales subdivididos, la precisión de la respuesta del modelo grande general es baja. Esto se debe a que la industria en sí tiene un tamaño de muestra pequeño, una distribución de datos desigual y escenarios de aplicación cambiantes, lo que hace que el modelo grande no pueda optimizarse ni mejorarse a sí mismo. La precisión, naturalmente, no es alta.
Desde la perspectiva de la comercialización, es posible que las empresas no necesiten un modelo a gran escala de uso general "completo", sino un modelo industrial a gran escala que apunte a escenarios de campo subdivididos y resuelva problemas prácticos.
Wu Hequan, académico de la Academia de Ingeniería de China, señaló una vez que "los modelos grandes similares a chats han desencadenado una nueva ronda de aumento, pero el diálogo, la escritura de poesía y la pintura no son todos de modelos grandes. Necesitamos Piense profundamente en la dirección de aplicación de modelos grandes, y realmente debemos poner modelos grandes en En los campos del desarrollo urbano, la tecnología financiera, la biomedicina, la fabricación industrial y la investigación científica, también se necesitan empresas y organizaciones profesionales para acelerar su implementación en el industria real, aportando valor real a las necesidades inmediatas de la industria y realmente sirviendo a la sociedad a gran escala".
Hoy en día, se está formando un consenso en el mercado de modelos a gran escala de que los modelos a gran escala que no se pueden poner en uso comercial son solo "herramientas de entretenimiento", y solo los modelos a gran escala que profundizan en la industria y resuelven problemas prácticos tienen valor. Pensando profundamente en el valor de los modelos grandes, una fórmula propuesta por JD.com está más en línea con la tendencia del mercado de modelos grandes, a saber: el valor de los modelos grandes = algoritmo × potencia informática × datos × cuadrado del grosor de la industria.
** A partir de la fórmula de valor del modelo grande, podemos ver que el modelo grande industrial y el modelo grande general no están en oposición. El modelo grande industrial se basa en el modelo grande general y está entrenado. El contenido está más en línea con las necesidades de los escenarios verticales industriales y más específicos. **
En términos de la ruta de evolución del modelo grande, no sorprende que JD.com tenga visión de futuro. Desde su establecimiento, Jingdong se ha arraigado en la industria y, naturalmente, presta más atención al valor de los modelos grandes en la industria.
"Jingdong considera los modelos grandes y otras innovaciones tecnológicas. Además de perseguir la naturaleza avanzada de la tecnología, también presta especial atención al grosor de la industria: en cuántos escenarios industriales se puede aplicar la tecnología en la práctica para crear valor real para la sociedad. ", dijo Xu Ran, CEO de Jingdong.
**De hecho, el desarrollo de modelos grandes en esta etapa está pasando de "universal" a "industrial". **
El último informe de investigación publicado por Minsheng Securities mencionó que después del período intensivo de lanzamiento de modelos grandes de febrero a marzo, el período de desarrollo de productos de abril a mayo y la dirección de la política se aclararon gradualmente, los productos y aplicaciones de modelos grandes comenzarán en junio. Se espera que marque el comienzo de un lanzamiento centralizado. La nueva ola de lanzamientos se basa en productos de aplicaciones modelo a gran escala, y las actualizaciones a gran escala han comenzado a estar en línea, preparándose para ingresar a miles de hogares.
Recientemente, la mayoría de los últimos modelos a gran escala lanzados por empresas de tecnología nacionales están destinados a industrias verticales. En el extranjero, varias empresas han lanzado sucesivamente modelos de industria a gran escala de diferentes escalas, con el propósito de aplicarlos al campo industrial.
A partir de las tendencias reales de los principales fabricantes nacionales y extranjeros, no es difícil ver que el modelo industrial podrá ayudar más a los socios industriales a completar la transformación digital, reducir costos y aumentar la eficiencia, y crear un mayor valor para la industria y la sociedad. .
Gran modelo industrial, es difícil sentar una base sólida para la industria
La dificultad de construir modelos industriales a gran escala es mucho mayor que la de los modelos a gran escala de propósito general.
Si el modelo general a gran escala prueba el poder de cómputo y la acumulación de algoritmos de la empresa, entonces el modelo industrial a gran escala prueba el acceso de la empresa y la comprensión de los escenarios comerciales, así como la acumulación y aplicación de datos industriales.
Un consenso de la industria es que en el entrenamiento de grandes modelos industriales, lo más difícil de obtener son los datos industriales. Los datos industriales a menudo están en manos de las empresas. Debido a la seguridad de los datos y otras consideraciones, pocas empresas están dispuestas a divulgar datos privados. Sin embargo, estos datos industriales a menudo afectan directa o indirectamente la velocidad de iteración técnica, la precisión del modelo y la profesionalidad comercial del modelo industrial grande.
"Los datos industriales también se pueden dividir en datos estáticos y datos dinámicos. Los datos estáticos son relativamente estables, no cambiarán de inmediato y la ruta de adquisición es relativamente clara. Los datos dinámicos son los datos generados en cada momento en diferentes escenarios industriales. Esta parte del Los datos son datos de escenas 'vivas'. No es fácil de obtener, pero es uno de los elementos necesarios del modelo industrial", enfatizó He Xiaodong, presidente del Instituto de Investigación JD y presidente del Departamento de Productos y Servicios Inteligentes de JD Technology.
Sin embargo, el entrenamiento de grandes modelos industriales no solo puede usar datos industriales, sino que aún necesita usar una gran cantidad de datos generales para proporcionar conocimiento de sentido común. Las razones son las siguientes: en primer lugar, la generalización de los datos industriales es insuficiente y el modelo grande debe volver a entrenarse cada vez que se cambia la escena, lo cual es costoso; Atascado en un estado atascado.
He Xiaodong comparó la capacitación de un gran modelo industrial con la capacitación de una persona: "Si una persona sale a trabajar directamente después de graduarse de la escuela secundaria, parece estar bien, pero el profesionalismo será menos profesional. Si puede terminar un programa de cuatro años Licenciatura antes de salir a trabajar, tienes tanto conocimiento general Habilidad como conocimiento profesional suficiente son las capacidades que debe poseer un gran modelo industrial.”
Por esta razón, los datos del modelo grande de JD Yanxi se componen de un 70 % de datos generales y un 30 % de datos sin procesar del crecimiento de la escena de la cadena de suministro.
Cabe mencionar que estos datos industriales provienen del propio JD.com. JD.com en sí es una empresa basada en la cadena de suministro. Tiene sus raíces en una amplia gama de industrias. No solo tiene datos prácticos en comercio minorista, logística, finanzas, salud, industria y otras industrias, sino que también tiene datos sobre ciudades, asuntos gubernamentales, finanzas, manufactura, industria, aviación, transporte, etc. Los datos insensibilizados de industrias como parques industriales, parques industriales y energía, y los datos de alta calidad generados cada año alcanzan los 10 mil millones de piezas.
Además del suministro continuo de datos industriales de alta calidad, el modelo industrial grande también necesita comprender el know-how de la industria, es decir, tener un conocimiento único sobre la industria y tener mayores requisitos de comprensión. Por ejemplo, la industria minorista presta más atención al efecto del marketing y la recomendación, y la industria financiera presta más atención al efecto del control de riesgos, la confiabilidad y la seguridad.
Para esta demanda, la cadena de suministro de inteligencia digital a largo plazo de JD.com ha jugado un papel clave y se ha convertido en el foco de los esfuerzos de JD.com en la aplicación de modelos grandes. El modelo grande también puede basarse en la inteligencia digital de la cadena de suministro y profundizar en la industria física.
Se informa que la cadena de suministro de inteligencia digital de JD.com ha cubierto más de 10 millones de SKU de productos autooperados de JD.com, sirviendo a más de 8 millones de clientes corporativos activos, incluido más del 90% de las 500 empresas más importantes del mundo en China, y casi el 70% de las nuevas PYMES especiales especializadas del país. Al mismo tiempo, la cadena de suministro de inteligencia digital de JD.com todavía está en el país y tiene una cooperación profunda con más de 2000 cinturones industriales.
Este tipo de cadena de suministro de inteligencia digital con vínculos más largos, escenarios más complejos y datos más ricos es un excelente "campo de entrenamiento" para modelos grandes. Desde el punto de vista de JD Cloud, el valor del modelo grande solo se puede obtener comprendiendo a fondo la cadena de suministro y permitiendo que el modelo grande "se ejecute" en la cadena de suministro.
Además de la acumulación en el lado industrial, no se debe subestimar la fortaleza de JD.com en algoritmos básicos y poder de cómputo.
En 2021, JD Discovery Research Institute lanzó el primer clúster de computación a gran escala del país basado en la arquitectura DGX SuperPOD en Chongqing-Tianqin α, que aumentó la velocidad de razonamiento en 6,2 veces y redujo el costo del razonamiento en un 90 %. Esto proporciona a JD.com la garantía más básica para la formación de modelos a gran escala.
En el mismo año, JD.com lanzó el modelo K-PLUG de mil millones de niveles. La copia del producto generada por K-PLUG ha cubierto más de 3000 categorías en JD.com, generando un total de 3 mil millones de palabras, y la tasa de aprobación de revisión manual supera el 95%. Para 2022, el modelo grande de JD.com se actualizará a un modelo Vega de decenas de miles de millones, que se puede usar ampliamente en varias tareas de procesamiento de lenguaje natural posteriores, como análisis de sentimientos, coincidencia semántica, corrección de errores gramaticales, respuesta inteligente a preguntas y sentido común. razonamiento.
Gracias a la acumulación anterior, JD.com logró otro avance tecnológico este año y lanzó una nueva generación del modelo a gran escala de JD.com con cientos de miles de millones de parámetros, centrándose en varias tareas importantes, como la generación de contenido, el diálogo hombre-máquina, comprensión de la intención del usuario, extracción de información y clasificación de emociones. , realizó el ajuste fino del modelo base + modelo de dominio vertical, y aplicó escenarios verticales en profundidad como comercio minorista, logística, finanzas, salud y asuntos gubernamentales.
En la actualidad, el modelo industrial grande representado por JD.com está entrenando el modelo grande a través de sus datos y conocimientos industrializados y basados en escenarios acumulados, y corrigiendo el modelo grande en función de su conocimiento industrial acumulado, para mejorar el rendimiento de los modelos grandes. en industrias específicas y escenarios de aplicación, y para mejorar la capacidad de control. Esto es equivalente a completar una "educación general" para la IA.
**El gran modelo de Jingdong se está adentrando gradualmente en varias industrias para mejorar el nivel de inteligencia de la cadena de suministro. Por el contrario, la actualización de la inteligencia digital de la cadena de suministro también está promoviendo la transformación industrial, lo que a su vez proporciona un suelo de datos más rico para modelos grandes, formando un ciclo positivo. **
"Cortar en el modelo a gran escala desde el lado industrial es como escalar el Monte Everest técnico desde la ladera norte: aunque el camino es más difícil, hay paisajes más magníficos. Jingdong insiste en hacer 'cosas difíciles pero correctas', insistiendo en hacer práctico, valioso y es un asunto a largo plazo. En el campo técnico y en el modelo grande, este es nuestro compromiso constante ", dijo Xu Ran.
** Las "cosas difíciles y correctas" necesitan acumulación a largo plazo. Sin embargo, en cuanto a la construcción del modelo industrial, JD.com claramente ha sentado las bases. **
Jingdong, nacido en la industria, crea valor industrial con modelos grandes
"En la era del gran modelo, vale la pena volver a hacer cualquier cosa con el gran modelo".
Bajo la ola de modelos grandes, la industria alcanzó rápidamente el consenso anterior. Sin embargo, mientras que otros fabricantes importantes están buscando modelos comerciales a través de diversas estrategias, la dirección de la industria de aterrizaje de Jingdong nunca ha cambiado.
"Los atributos industriales son las características distintivas de la tecnología de JD.com. Cada tecnología desarrollada por JD.com surge de necesidades industriales, experiencias en escenarios industriales y crea valor industrial", dijo Xu Ran.
En la actualidad, el modelo a gran escala de JD Yanxi avanza de acuerdo con la estrategia de "tres pasos": en la actualidad, JD Cloud ha creado un modelo a gran escala de propósito general basado en prácticas internas; para fines de este año, JD. Servicios industriales sólidos; se espera que a principios de 2024, las capacidades del modelo a gran escala se abran a escenarios comerciales serios externos.
Desde un punto de vista práctico, el modelo grande de JD.com ha alcanzado el segundo paso. JD.com está utilizando las capacidades del modelo grande para los escenarios más familiares, como comercio minorista, finanzas, logística y salud, y ha penetrado en varios Enlaces.
Por ejemplo, Jingdong está mejorando la capacidad del servicio al cliente inteligente a través de modelos grandes. El campo del servicio al cliente es diferente de los chats y conversaciones diarias, es una escena de diálogo basada en tareas serias que necesita resolver varios problemas complejos entre compradores y vendedores en el mundo real.
"Cuando un usuario habla con ChatGPT, no importa si la respuesta es incorrecta, y no afectará ninguna toma de decisiones. Pero si en un escenario comercial serio, el servicio de atención al cliente inteligente responde mal, las consecuencias serán inimaginables". Por lo tanto, la precisión de la respuesta es muy importante ", dijo el Comité Técnico del Grupo Jingdong, Cao Peng, presidente y presidente de la división JD Cloud.
Para escenarios de servicio al cliente inteligente, JD.com no solo creó un modelo grande con comprensión semántica básica y lógica de preguntas y respuestas, sino que también perfeccionó un modelo pequeño para escenarios específicos. Si el problema del cliente involucra devoluciones y cambios comunes, etc., el servicio al cliente inteligente llamará a un modelo grande más general. Y una vez que la pregunta involucre la política de garantía y las reglas de protección de precios de productos específicos, el servicio de atención al cliente inteligente llamará a un modelo pequeño más específico para dar la respuesta. Diferentes modelos pueden asumir diferentes responsabilidades.
Ahora, el servicio de atención al cliente inteligente está funcionando dentro de JD.com, ayudando a más de 20 000 empleados de atención al cliente propios a reducir costos y aumentar la eficiencia, y optimizar continuamente la experiencia de atención al cliente. JD.com también ha abierto sus capacidades de servicio al cliente inteligente al mundo exterior para ayudar a más agencias gubernamentales y empresas a llevar a cabo la transformación y actualización digital e inteligente.
En términos de servicios externos para modelos grandes, JD.com todavía mantiene su propio ritmo "lento" y no tiene prisa por "vender" modelos grandes a empresas. La razón es que la inteligencia artificial es un cambio tecnológico muy serio: si se usa bien, puede transformar la industria, pero si se usa incorrectamente, también puede tener graves consecuencias. Bajo tales circunstancias, Jingdong se adhiere a la mentalidad a largo plazo y es una excelente opción.
"JD.com no servirá platos que no hayan logrado 'color, sabor y sabor completos'. Una vez que el modelo a gran escala haya completado la experiencia y la práctica en escenas internas clave, se abrirá a los socios para ayudar a toda la industria a reducir costos. y aumentar la eficiencia." Xu Ran express.
En el plan de JD.com, el modelo grande de Yanxi se convertirá en el soporte técnico de más bajo nivel. Según sus capacidades, el campo producirá una serie de productos, y los productos en el mismo campo se agregarán a una plataforma y, finalmente, generarán valor para la industria.
Por ejemplo, en el campo de la generación de contenido, JD.com ha creado la plataforma de marketing de contenido JD Cloud AIGC. Basado en la rica acumulación de datos de productos de toda la categoría de JD.com, el modelo grande puede comprender mejor las características del producto, ayudar a los comerciantes a generar automáticamente imágenes de productos, puntos de venta y otros materiales de marketing, y mejorar la eficiencia operativa de los comerciantes y la calidad del contenido de marketing.
En otras palabras, los comerciantes solo necesitan cargar una imagen del producto y pueden obtener rápidamente múltiples tipos de imágenes, como imágenes del producto principal, imágenes de carteles de marketing e imágenes de detalles comerciales necesarias para las operaciones de comercio electrónico, satisfaciendo las necesidades de apertura rápida de tiendas, listado de productos y marketing. Estas capacidades pueden ahorrar a los comerciantes el 90 % del costo del dibujo y acortar el ciclo de producción de 7 días a medio día.
Usando más capacidades de modelos a gran escala, los comerciantes ni siquiera necesitan vender sus propios productos, solo necesitan usar el humano digital multimodal de JD Cloud para entregar productos las 24 horas del día a bajo costo.
Además de estas aplicaciones, JD.com también demostró una plataforma de operación de marketing de IA en el campo financiero. A través de un diálogo simple, los usuarios pueden generar actividades de marketing en un solo paso, cubriendo la formulación de estrategias operativas, la programación de tareas de marketing, la creación de páginas de actividades, la generación por lotes de redacción y materiales de marketing, la entrega digital, etc. Según datos relevantes de JD.com, en el pasado este conjunto de procesos requería cinco tipos de personal funcional: producto, I+D, algoritmo, diseño y analista, pero ahora se ha reducido a una sola persona; en el pasado, el proceso requirió 2,000 interacciones humano-computadora, pero también se ha reducido a menos de 50. Con el apoyo de la gran capacidad del modelo, la eficiencia de producción del plan de marketing se ha mejorado significativamente.
** Se puede decir que el gran modelo industrial de JD.com se está convirtiendo en la base para aplicaciones industriales en varias industrias. En la actualidad, ha penetrado en el comercio minorista, la logística, la salud, la industria, la fabricación, las finanzas, el marketing y otras industrias, y se ha dirigido a la industria y la aplicación práctica. **
Medio año después de que el gran modelo se volviera loco, los fabricantes se dieron cuenta de que la "gran escala" o los "altos parámetros" no pueden resolver los problemas prácticos. Cuando termine el período de la burbuja, los modelos grandes deben volver a la industria, volver a escenarios reales y resolver problemas prácticos después de todo. Este es el destino final de la tecnología y el comienzo del desarrollo benigno de modelos grandes. Aquellas empresas con datos industriales sólidos y práctica de escenarios comenzaron a subir al escenario.
Obviamente, el modelo grande de Jingdong Yanxi ha zarpado hacia el otro extremo del valor industrial.