Todo mundo fala sobre o modelo grande, que é um verdadeiro retrato do mundo da tecnologia no primeiro semestre deste ano.
A julgar pela empolgação do mercado, os modelos em grande escala se tornaram um caminho para vários fabricantes de tecnologia se apressarem. Sejam gigantes da Internet, empresas de tecnologia ou até mesmo instituições de pesquisa, todos eles se juntaram a esse corpo a corpo de modelos em grande escala. modelos em escala tornaram-se "Battleground".
Justamente quando o mercado doméstico de modelos em grande escala está em pleno andamento, o ChatGPT, que impulsionou a popularidade dos modelos em grande escala de uma só vez, experimentou um declínio nas visitas. De acordo com os últimos dados da SimilarWeb, agência terceirizada de monitoramento, em maio deste ano, o ChatGPT começou a apresentar uma desaceleração no crescimento, com uma taxa de crescimento de apenas 2,8% naquele mês, enquanto os primeiros quatro meses de 2023 foram de 131,6 %, 62,5%, 55,8%, 12,6%. Esta é a primeira vez que o ChatGPT apresenta crescimento negativo no tráfego desde seu lançamento em 30 de novembro de 2022.
Esse fenômeno pode refletir uma tendência importante da indústria.Todas as partes estão mudando do entusiasmo técnico inicial por modelos grandes para o pensamento calmo sobre a comercialização. E o desembarque de modelos em grande escala também é um tópico que todas as empresas de modelos em grande escala precisam considerar seriamente.
** "A JD.com acredita que o valor de um modelo grande = algoritmo × poder de computação × dados × quadrado da espessura da indústria." disse Xu Ran, CEO da JD.com. A JD.com não apenas busca o avanço da tecnologia, mas também presta atenção especial à espessura da indústria - valoriza em quantos cenários industriais a tecnologia pode ser aplicada na prática e pode criar vários valores para a sociedade. **
Em 13 de julho, JD.com lançou um grande modelo de Yanxi. Segundo o JD.com, trata-se de um modelo de nova geração com parâmetros que chegam a centenas de bilhões de dólares e será amplamente utilizado no varejo, finanças, logística, saúde, indústria e outros cenários industriais no futuro.
Quando a eficiência industrial e a expansão das fronteiras industriais forem qualitativamente melhoradas, o modelo grande terá valor prático e significado mais importantes. Na agitação dos grandes modelos, devemos voltar à racionalidade e considerar seriamente o verdadeiro valor dos grandes modelos. De que tipo de grande modelo a indústria precisa? Como o modelo grande deve ser colocado em uso comercial para reduzir custos e aumentar a eficiência da indústria?
Competindo pelo grande modelo: o consenso do geral para a indústria
Da noite para o dia, modelos domésticos em grande escala "emergiram" um após o outro.
De acordo com o "Relatório de Pesquisa de Mapas de Modelos em Grande Escala de Inteligência Artificial da China", divulgado pelo Instituto Chinês de Informação de Ciência e Tecnologia do Ministério de Ciência e Tecnologia, em 28 de maio, pelo menos 79 modelos básicos de grande escala com uma escala de mais de 1 bilhão de parâmetros na China foram liberados. O número de grandes modelos desenvolvidos em meu país ficou em segundo lugar no mundo.
No entanto, por trás do crescente número de P&D, vale a pena explorar como realizar o valor comercial de modelos grandes.
No momento, mais modelos grandes de uso geral estão sendo lançados. Esse tipo de modelo em grande escala possui recursos poderosos de compreensão de linguagem natural, geração de linguagem e reconhecimento de fala, além de funcionar bem em cenários com fortes atributos gerais, como bate-papo e entretenimento. , esses cenários ainda são difíceis de alcançar a comercialização em larga escala.
Em cenários industriais subdivididos, a precisão da resposta do modelo grande geral é baixa, porque a própria indústria tem um tamanho de amostra pequeno, distribuição de dados desigual e cenários de aplicação variáveis, o que torna o modelo grande incapaz de se auto-otimizar e melhorar. A precisão não é naturalmente alta.
Do ponto de vista da comercialização, as empresas podem não precisar de um modelo de grande escala de uso geral "completo", mas precisam mais de um modelo industrial de grande escala que vise cenários de campo subdivididos e resolva problemas práticos.
Wu Hequan, um acadêmico da Academia Chinesa de Engenharia, uma vez apontou que "grandes modelos parecidos com bate-papo desencadearam uma nova onda de ascensão, mas diálogo, escrita de poesia e pintura não são de forma alguma todos os modelos grandes. Precisamos pense profundamente sobre a direção da aplicação de grandes modelos, e devemos realmente colocar grandes modelos em Nos campos de desenvolvimento urbano, tecnologia financeira, biomedicina, manufatura industrial e pesquisa científica, empresas e organizações profissionais também são necessárias para acelerar sua implementação no indústria real, agregando valor real às necessidades imediatas da indústria e servindo verdadeiramente a sociedade em larga escala."
Atualmente, está se formando um consenso no mercado de modelos grandes de que modelos grandes que não podem ser colocados em uso comercial são apenas "ferramentas de entretenimento", e apenas modelos grandes que se aprofundam na indústria e resolvem problemas práticos têm valor. Pensando profundamente no valor dos modelos grandes, uma fórmula proposta pelo JD.com está mais alinhada com a tendência do mercado de modelos grandes, a saber: o valor dos modelos grandes = algoritmo × poder de computação × dados × quadrado da espessura da indústria.
** A partir da fórmula de valor do modelo grande, podemos ver que o modelo grande industrial e o modelo grande geral não estão em uma relação oposta. O modelo grande industrial é baseado no modelo grande geral e é treinado. O conteúdo é mais em linha com as necessidades de cenários industriais verticais e mais direcionados. **
Em termos de rota de evolução do modelo grande, não é de estranhar que o JD.com esteja voltado para o futuro. Desde a sua criação, a Jingdong está enraizada na indústria e, naturalmente, presta mais atenção ao valor dos modelos grandes da indústria.
"Jingdong considera grandes modelos e outras inovações tecnológicas. Além de buscar a natureza avançada da tecnologia, também presta atenção especial à espessura da indústria - quantos cenários industriais a tecnologia pode ser aplicada na prática para realmente criar valor para a sociedade. " disse Xu Ran, CEO da Jingdong.
**Na verdade, o desenvolvimento de grandes modelos nesta fase está passando de "universal" para "industrial". **
O último relatório de pesquisa divulgado pela Minsheng Securities mencionou que após o período intensivo de lançamento de grandes modelos de fevereiro a março, o período de desenvolvimento de produtos de abril a maio e a direção da política foram gradualmente esclarecidos, os produtos e aplicações de grandes modelos começarão em junho Espera-se que dê início a uma versão centralizada. A nova onda de lançamentos é baseada em produtos de aplicação de modelo em larga escala, e atualizações em larga escala começaram a ficar online, preparando-se para entrar em milhares de residências.
Recentemente, a maioria dos últimos modelos em grande escala lançados por empresas nacionais de tecnologia é voltada para indústrias verticais. No exterior, diversas empresas têm lançado sucessivamente modelos industriais de grande porte e de diferentes escalas, com o objetivo de aplicá-los ao meio industrial.
A partir das tendências reais dos principais fabricantes nacionais e internacionais, não é difícil ver que o modelo industrial será mais capaz de ajudar os parceiros industriais a concluir a transformação digital, reduzir custos e aumentar a eficiência e criar maior valor para a indústria e a sociedade .
Grande modelo industrial, é difícil estabelecer uma base sólida para a indústria
A dificuldade de construir modelos industriais em grande escala é muito maior do que a dos modelos em larga escala de uso geral.
Se o modelo geral de grande escala testa o poder de computação e o acúmulo de algoritmos da empresa, o modelo industrial de grande escala testa o acesso da empresa e a compreensão dos cenários de negócios, bem como o acúmulo e a aplicação de dados industriais.
Um consenso da indústria é que, no treinamento de grandes modelos industriais, a coisa mais difícil de obter são os dados industriais. Os dados industriais geralmente estão nas mãos das empresas. Devido à segurança dos dados e outras considerações, poucas empresas estão dispostas a divulgar dados privados. No entanto, esses dados industriais geralmente afetam direta ou indiretamente a velocidade da iteração técnica, a precisão do modelo e o profissionalismo comercial do grande modelo industrial.
"Os dados industriais também podem ser divididos em dados estáticos e dados dinâmicos. Os dados estáticos são relativamente estáveis, não mudam imediatamente e o caminho de aquisição é relativamente claro. Os dados dinâmicos são os dados gerados a cada momento em diferentes cenários industriais. Esta parte do dados são dados de cena 'viva'. Não é fácil de obter, mas é um dos elementos necessários do modelo industrial." He Xiaodong, presidente do JD Research Institute e presidente do JD Technology Intelligent Service and Product Department, enfatizou.
No entanto, o treinamento de grandes modelos industriais não pode apenas usar dados industriais, mas ainda precisa usar uma grande quantidade de dados gerais para fornecer conhecimento de senso comum. Os motivos são os seguintes: Primeiro, a generalização dos dados industriais é insuficiente e o modelo grande precisa ser treinado novamente toda vez que a cena é alterada, o que é caro; Preso em um estado parado.
He Xiaodong comparou o treinamento de um grande modelo industrial ao treinamento de uma pessoa: "Se uma pessoa sai para trabalhar logo após se formar no ensino médio, parece bom, mas o profissionalismo será menos profissional. Se você puder terminar um curso de quatro anos grau de graduação antes de sair para o trabalho, você tem conhecimento geral Habilidade e conhecimento profissional suficiente são as capacidades que um grande modelo industrial deve ter.”
Por esse motivo, os dados do grande modelo de JD Yanxi são compostos por 70% de dados gerais e 30% de dados brutos do crescimento do cenário da cadeia de suprimentos.
Vale ressaltar que esses dados industriais vêm do próprio JD.com. JD.com em si é uma empresa baseada na cadeia de suprimentos. Está enraizada em uma ampla gama de setores. Não só possui dados práticos em varejo, logística, finanças, saúde, indústria e outros setores, mas também possui dados em cidades, assuntos governamentais, finanças, manufatura, indústria, aviação, transporte, etc. Os dados dessensibilizados de setores como parques industriais, parques industriais e energia, e os dados de alta qualidade gerados a cada ano atingem 10 bilhões de peças.
Além do fornecimento contínuo de dados industriais de alta qualidade, o grande modelo industrial também precisa entender o Know-How do setor, ou seja, ter conhecimento exclusivo sobre o setor e ter requisitos mais elevados de compreensão. Por exemplo, o setor de varejo presta mais atenção ao efeito do marketing e da recomendação, e o setor financeiro presta mais atenção ao efeito do controle de risco, confiabilidade e segurança.
Para essa demanda, a cadeia de suprimentos de inteligência digital de longo prazo da JD.com desempenhou um papel fundamental e se tornou o foco dos esforços da JD.com na aplicação de grandes modelos. O modelo grande também pode se basear na inteligência digital da cadeia de suprimentos e ir fundo na indústria física.
É relatado que a cadeia de suprimentos de inteligência digital da JD.com cobriu mais de 10 milhões de SKUs de produtos auto-operados da JD.com, atendendo a mais de 8 milhões de clientes corporativos ativos, incluindo mais de 90% das 500 maiores empresas do mundo na China e quase 70% das novas PME especializadas especiais do país. Ao mesmo tempo, a cadeia de suprimentos de inteligência digital da JD.com ainda está no país e tem uma cooperação profunda com mais de 2.000 cinturões industriais.
Esse tipo de cadeia de suprimentos de inteligência digital com links mais longos, cenários mais complexos e dados mais ricos é um excelente "campo de treinamento" para grandes modelos. Na visão de JD Cloud, o valor do modelo grande só pode ser percebido por meio da compreensão completa da cadeia de suprimentos e permitindo que o modelo grande "execute" na cadeia de suprimentos.
Além do acúmulo no lado industrial, a força do JD.com em algoritmos básicos e poder de computação não deve ser subestimada.
Em 2021, o JD Discovery Research Institute lançou o primeiro cluster de computação de grande escala do país baseado na arquitetura DGX SuperPOD em Chongqing-Tianqin α, que aumentou a velocidade do raciocínio em 6,2 vezes e reduziu o custo do raciocínio em 90%. Isso fornece ao JD.com a garantia mais básica para treinamento de modelo em grande escala.
No mesmo ano, JD.com lançou o modelo de nível bilhão K-PLUG. A cópia do produto gerada pelo K-PLUG cobriu mais de 3.000 categorias em JD.com, gerando um total de 3 bilhões de palavras, e o passe de revisão manual taxa superior a 95%. Até 2022, o grande modelo do JD.com será atualizado para um modelo Vega de dezenas de bilhões, que pode ser amplamente usado em várias tarefas de processamento de linguagem natural, como análise de sentimento, correspondência semântica, correção de erros gramaticais, resposta inteligente a perguntas e bom senso raciocínio.
Graças ao acúmulo anterior, o JD.com fez outro avanço tecnológico este ano e lançou uma nova geração do modelo de grande escala do JD.com com centenas de bilhões de parâmetros, concentrando-se em várias tarefas importantes, como geração de conteúdo, diálogo homem-máquina, compreensão da intenção do usuário, extração de informações e classificação de emoções. , realizou o ajuste fino do modelo básico + modelo de domínio vertical e aplicou cenários verticais detalhados, como varejo, logística, finanças, saúde e assuntos governamentais.
Atualmente, o grande modelo industrial representado por JD.com está treinando o grande modelo por meio de seus dados e conhecimentos industrializados e baseados em cenários acumulados e corrigindo o grande modelo com base em seu know-how acumulado da indústria, para melhorar o desempenho de grandes modelos em indústrias específicas e cenários de aplicação, e para melhorar a controlabilidade. Isso equivale a concluir uma "educação geral" para IA.
**O grande modelo de Jingdong está gradualmente se aprofundando em vários setores para melhorar o nível de inteligência da cadeia de suprimentos. Por outro lado, a atualização da inteligência digital da cadeia de suprimentos também está promovendo a transformação industrial, que por sua vez fornece um solo de dados mais rico para grandes modelos, formando um ciclo positivo. **
"Cortar o modelo grande pelo lado industrial é como escalar o Monte Everest técnico pela encosta norte: embora a estrada seja mais difícil, há paisagens mais magníficas. Jingdong insiste em fazer 'coisas difíceis, mas corretas', insistindo em fazer práticas , valioso e É uma questão de longo prazo. No campo técnico e no modelo grande, este é o nosso compromisso constante." Xu Ran disse.
** "Coisas difíceis e corretas" precisam de acumulação de longo prazo. No entanto, em termos de construção do modelo industrial, JD.com lançou claramente as bases. **
Jingdong, nascido na indústria, cria valor industrial com grandes modelos
"Na era da grande modelo, vale a pena fazer tudo de novo com a grande modelo."
Sob a onda de grandes modelos, a indústria rapidamente alcançou o consenso acima. No entanto, enquanto outros grandes fabricantes estão procurando modelos de negócios por meio de várias estratégias, a direção da indústria de pouso de Jingdong nunca mudou.
"Os atributos industriais são as características distintivas da tecnologia da JD. Cada tecnologia desenvolvida pela JD.com origina-se de necessidades industriais, experiências em cenários industriais e cria valor industrial", disse Xu Ran.
Atualmente, o modelo de grande escala de JD Yanxi está avançando de acordo com a estratégia de “três etapas”: atualmente, JD Cloud construiu um grande modelo de uso geral com base em práticas internas; até o final deste ano, JD. Serviços industriais sólidos; espera-se que no início de 2024, os recursos do modelo em grande escala sejam abertos a cenários de negócios sérios externos.
Do ponto de vista prático, o modelo grande da JD.com atingiu a segunda etapa. A JD.com está aplicando os recursos do modelo grande aos cenários mais familiares, como varejo, finanças, logística e saúde, e penetrou em vários links.
Por exemplo, Jingdong está melhorando a capacidade de atendimento ao cliente inteligente por meio de modelos grandes. O campo de atendimento ao cliente é diferente dos bate-papos e conversas diárias. É uma cena de diálogo baseada em tarefas sérias que precisa resolver vários problemas complexos entre compradores e vendedores no mundo real.
"Quando um usuário fala com o ChatGPT, não importa se a resposta está errada, e isso não afetará nenhuma tomada de decisão. Mas se em um cenário de negócios sério, o atendimento inteligente responder errado, as consequências serão inimagináveis . Portanto, a precisão da resposta é muito importante." Comitê Técnico do Grupo Jingdong Cao Peng, presidente da JD Cloud Division, disse.
Para cenários inteligentes de atendimento ao cliente, a JD.com não apenas construiu um modelo grande com compreensão semântica básica e lógica de perguntas e respostas, mas também aperfeiçoou um modelo pequeno para cenários específicos. Se o problema do cliente envolver devoluções e trocas comuns, etc., o atendimento ao cliente inteligente chamará um modelo grande mais geral. E uma vez que a questão envolve a política de garantia e as regras de proteção de preços de produtos específicos, o atendimento inteligente chamará um modelo pequeno mais direcionado para dar a resposta. Diferentes modelos podem assumir diferentes responsabilidades.
Agora, o atendimento ao cliente inteligente está funcionando dentro do JD.com, ajudando mais de 20.000 funcionários autônomos de atendimento ao cliente a reduzir custos e aumentar a eficiência, além de otimizar continuamente a experiência de atendimento ao cliente. A JD.com também abriu seus recursos inteligentes de atendimento ao cliente para o mundo exterior para ajudar mais agências governamentais e empresas a realizar transformação e atualização digital e inteligente.
Em termos de serviços externos para modelos grandes, o JD.com ainda mantém seu próprio ritmo "lento" e não tem pressa em "vender" modelos grandes para empresas. A razão é que a inteligência artificial é uma mudança tecnológica muito séria: se bem usada, pode transformar a indústria, mas se usada incorretamente, também pode trazer sérias consequências. Sob tais circunstâncias, Jingdong adere à mentalidade de longo prazo e é uma excelente escolha.
"O JD.com não servirá pratos que não atingiram 'cor total, sabor e sabor'. Após o modelo em grande escala ter completado experiência e prática em cenas internas importantes, ele será aberto a parceiros para ajudar toda a indústria a reduzir custos e aumentar a eficiência." Xu Ran express.
No plano da JD.com, o modelo grande de Yanxi se tornará o suporte técnico de nível mais baixo. Com base em suas capacidades, o campo produzirá uma série de produtos e os produtos no mesmo campo serão agregados em uma plataforma e, finalmente, gerarão valor para a indústria.
Por exemplo, no campo da geração de conteúdo, a JD.com construiu a plataforma de marketing de conteúdo JD Cloud AIGC. Com base no rico acúmulo de dados de produtos de toda a categoria do JD.com, o modelo grande pode entender melhor as características do produto, ajudar os comerciantes a gerar automaticamente imagens de produtos, pontos de venda e outros materiais de marketing e melhorar a eficiência operacional dos comerciantes e a qualidade do conteúdo de marketing.
Em outras palavras, os comerciantes precisam apenas fazer upload de uma foto do produto e podem obter rapidamente vários tipos de fotos, como fotos principais do produto, fotos de pôsteres de marketing e fotos de detalhes comerciais necessárias para operações de comércio eletrônico, atendendo às necessidades de abertura rápida da loja, lista de produtos e marketing. Esses recursos podem economizar 90% do custo de desenho para os comerciantes e reduzir o ciclo de produção de 7 dias para meio dia.
Usando mais recursos de modelo em grande escala, os comerciantes nem precisam vender seus próprios produtos, mas apenas usar o humano digital multimodal do JD Cloud para entregar mercadorias 24 horas por dia a baixo custo.
Além desses aplicativos, o JD.com também demonstrou uma plataforma de operação de marketing de IA no campo financeiro. Por meio de um diálogo simples, os usuários podem gerar atividades de marketing em uma parada, abrangendo formulação de estratégia operacional, agendamento de tarefas de marketing, construção de páginas de atividades, geração em lote de direitos autorais e materiais de marketing, entrega digital, etc. De acordo com dados relevantes do JD.com, no passado esse conjunto de processos exigia cinco tipos de pessoal funcional: produto, P&D, algoritmo, design e analista, mas agora foi reduzido a uma pessoa; no passado, o processo exigiu 2.000 interações homem-computador, mas também foi reduzido para menos de 50. Com o suporte da capacidade do modelo grande, a eficiência da produção do plano de marketing foi significativamente melhorada.
** Pode-se dizer que o grande modelo industrial da JD.com está se tornando a base para aplicações industriais em vários setores. Atualmente, penetrou no varejo, logística, saúde, indústria, manufatura, finanças, marketing e outras indústrias, e foi para a indústria e aplicação prática. **
Meio ano depois que o grande modelo correu solto, os fabricantes perceberam que "grande escala" ou "altos parâmetros" não podem resolver problemas práticos. Terminado o período da bolha, os grandes modelos devem retornar à indústria, retornar aos cenários reais e resolver problemas práticos, afinal, esse é o destino final da tecnologia e o início do desenvolvimento benigno dos grandes modelos. As empresas com sólidos dados industriais e prática de cenários começaram a subir ao palco.
Obviamente, o grande modelo Jingdong Yanxi partiu para o outro lado do valor industrial.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
Da mania à racionalidade, as maquetes em grande escala inauguram a "virada" da indústria
Todo mundo fala sobre o modelo grande, que é um verdadeiro retrato do mundo da tecnologia no primeiro semestre deste ano.
A julgar pela empolgação do mercado, os modelos em grande escala se tornaram um caminho para vários fabricantes de tecnologia se apressarem. Sejam gigantes da Internet, empresas de tecnologia ou até mesmo instituições de pesquisa, todos eles se juntaram a esse corpo a corpo de modelos em grande escala. modelos em escala tornaram-se "Battleground".
Justamente quando o mercado doméstico de modelos em grande escala está em pleno andamento, o ChatGPT, que impulsionou a popularidade dos modelos em grande escala de uma só vez, experimentou um declínio nas visitas. De acordo com os últimos dados da SimilarWeb, agência terceirizada de monitoramento, em maio deste ano, o ChatGPT começou a apresentar uma desaceleração no crescimento, com uma taxa de crescimento de apenas 2,8% naquele mês, enquanto os primeiros quatro meses de 2023 foram de 131,6 %, 62,5%, 55,8%, 12,6%. Esta é a primeira vez que o ChatGPT apresenta crescimento negativo no tráfego desde seu lançamento em 30 de novembro de 2022.
Esse fenômeno pode refletir uma tendência importante da indústria.Todas as partes estão mudando do entusiasmo técnico inicial por modelos grandes para o pensamento calmo sobre a comercialização. E o desembarque de modelos em grande escala também é um tópico que todas as empresas de modelos em grande escala precisam considerar seriamente.
** "A JD.com acredita que o valor de um modelo grande = algoritmo × poder de computação × dados × quadrado da espessura da indústria." disse Xu Ran, CEO da JD.com. A JD.com não apenas busca o avanço da tecnologia, mas também presta atenção especial à espessura da indústria - valoriza em quantos cenários industriais a tecnologia pode ser aplicada na prática e pode criar vários valores para a sociedade. **
Em 13 de julho, JD.com lançou um grande modelo de Yanxi. Segundo o JD.com, trata-se de um modelo de nova geração com parâmetros que chegam a centenas de bilhões de dólares e será amplamente utilizado no varejo, finanças, logística, saúde, indústria e outros cenários industriais no futuro.
Quando a eficiência industrial e a expansão das fronteiras industriais forem qualitativamente melhoradas, o modelo grande terá valor prático e significado mais importantes. Na agitação dos grandes modelos, devemos voltar à racionalidade e considerar seriamente o verdadeiro valor dos grandes modelos. De que tipo de grande modelo a indústria precisa? Como o modelo grande deve ser colocado em uso comercial para reduzir custos e aumentar a eficiência da indústria?
Competindo pelo grande modelo: o consenso do geral para a indústria
Da noite para o dia, modelos domésticos em grande escala "emergiram" um após o outro.
De acordo com o "Relatório de Pesquisa de Mapas de Modelos em Grande Escala de Inteligência Artificial da China", divulgado pelo Instituto Chinês de Informação de Ciência e Tecnologia do Ministério de Ciência e Tecnologia, em 28 de maio, pelo menos 79 modelos básicos de grande escala com uma escala de mais de 1 bilhão de parâmetros na China foram liberados. O número de grandes modelos desenvolvidos em meu país ficou em segundo lugar no mundo.
No entanto, por trás do crescente número de P&D, vale a pena explorar como realizar o valor comercial de modelos grandes.
No momento, mais modelos grandes de uso geral estão sendo lançados. Esse tipo de modelo em grande escala possui recursos poderosos de compreensão de linguagem natural, geração de linguagem e reconhecimento de fala, além de funcionar bem em cenários com fortes atributos gerais, como bate-papo e entretenimento. , esses cenários ainda são difíceis de alcançar a comercialização em larga escala.
Em cenários industriais subdivididos, a precisão da resposta do modelo grande geral é baixa, porque a própria indústria tem um tamanho de amostra pequeno, distribuição de dados desigual e cenários de aplicação variáveis, o que torna o modelo grande incapaz de se auto-otimizar e melhorar. A precisão não é naturalmente alta.
Do ponto de vista da comercialização, as empresas podem não precisar de um modelo de grande escala de uso geral "completo", mas precisam mais de um modelo industrial de grande escala que vise cenários de campo subdivididos e resolva problemas práticos.
Wu Hequan, um acadêmico da Academia Chinesa de Engenharia, uma vez apontou que "grandes modelos parecidos com bate-papo desencadearam uma nova onda de ascensão, mas diálogo, escrita de poesia e pintura não são de forma alguma todos os modelos grandes. Precisamos pense profundamente sobre a direção da aplicação de grandes modelos, e devemos realmente colocar grandes modelos em Nos campos de desenvolvimento urbano, tecnologia financeira, biomedicina, manufatura industrial e pesquisa científica, empresas e organizações profissionais também são necessárias para acelerar sua implementação no indústria real, agregando valor real às necessidades imediatas da indústria e servindo verdadeiramente a sociedade em larga escala."
Atualmente, está se formando um consenso no mercado de modelos grandes de que modelos grandes que não podem ser colocados em uso comercial são apenas "ferramentas de entretenimento", e apenas modelos grandes que se aprofundam na indústria e resolvem problemas práticos têm valor. Pensando profundamente no valor dos modelos grandes, uma fórmula proposta pelo JD.com está mais alinhada com a tendência do mercado de modelos grandes, a saber: o valor dos modelos grandes = algoritmo × poder de computação × dados × quadrado da espessura da indústria.
** A partir da fórmula de valor do modelo grande, podemos ver que o modelo grande industrial e o modelo grande geral não estão em uma relação oposta. O modelo grande industrial é baseado no modelo grande geral e é treinado. O conteúdo é mais em linha com as necessidades de cenários industriais verticais e mais direcionados. **
Em termos de rota de evolução do modelo grande, não é de estranhar que o JD.com esteja voltado para o futuro. Desde a sua criação, a Jingdong está enraizada na indústria e, naturalmente, presta mais atenção ao valor dos modelos grandes da indústria.
"Jingdong considera grandes modelos e outras inovações tecnológicas. Além de buscar a natureza avançada da tecnologia, também presta atenção especial à espessura da indústria - quantos cenários industriais a tecnologia pode ser aplicada na prática para realmente criar valor para a sociedade. " disse Xu Ran, CEO da Jingdong.
**Na verdade, o desenvolvimento de grandes modelos nesta fase está passando de "universal" para "industrial". **
O último relatório de pesquisa divulgado pela Minsheng Securities mencionou que após o período intensivo de lançamento de grandes modelos de fevereiro a março, o período de desenvolvimento de produtos de abril a maio e a direção da política foram gradualmente esclarecidos, os produtos e aplicações de grandes modelos começarão em junho Espera-se que dê início a uma versão centralizada. A nova onda de lançamentos é baseada em produtos de aplicação de modelo em larga escala, e atualizações em larga escala começaram a ficar online, preparando-se para entrar em milhares de residências.
Recentemente, a maioria dos últimos modelos em grande escala lançados por empresas nacionais de tecnologia é voltada para indústrias verticais. No exterior, diversas empresas têm lançado sucessivamente modelos industriais de grande porte e de diferentes escalas, com o objetivo de aplicá-los ao meio industrial.
A partir das tendências reais dos principais fabricantes nacionais e internacionais, não é difícil ver que o modelo industrial será mais capaz de ajudar os parceiros industriais a concluir a transformação digital, reduzir custos e aumentar a eficiência e criar maior valor para a indústria e a sociedade .
Grande modelo industrial, é difícil estabelecer uma base sólida para a indústria
A dificuldade de construir modelos industriais em grande escala é muito maior do que a dos modelos em larga escala de uso geral.
Se o modelo geral de grande escala testa o poder de computação e o acúmulo de algoritmos da empresa, o modelo industrial de grande escala testa o acesso da empresa e a compreensão dos cenários de negócios, bem como o acúmulo e a aplicação de dados industriais.
Um consenso da indústria é que, no treinamento de grandes modelos industriais, a coisa mais difícil de obter são os dados industriais. Os dados industriais geralmente estão nas mãos das empresas. Devido à segurança dos dados e outras considerações, poucas empresas estão dispostas a divulgar dados privados. No entanto, esses dados industriais geralmente afetam direta ou indiretamente a velocidade da iteração técnica, a precisão do modelo e o profissionalismo comercial do grande modelo industrial.
"Os dados industriais também podem ser divididos em dados estáticos e dados dinâmicos. Os dados estáticos são relativamente estáveis, não mudam imediatamente e o caminho de aquisição é relativamente claro. Os dados dinâmicos são os dados gerados a cada momento em diferentes cenários industriais. Esta parte do dados são dados de cena 'viva'. Não é fácil de obter, mas é um dos elementos necessários do modelo industrial." He Xiaodong, presidente do JD Research Institute e presidente do JD Technology Intelligent Service and Product Department, enfatizou.
No entanto, o treinamento de grandes modelos industriais não pode apenas usar dados industriais, mas ainda precisa usar uma grande quantidade de dados gerais para fornecer conhecimento de senso comum. Os motivos são os seguintes: Primeiro, a generalização dos dados industriais é insuficiente e o modelo grande precisa ser treinado novamente toda vez que a cena é alterada, o que é caro; Preso em um estado parado.
He Xiaodong comparou o treinamento de um grande modelo industrial ao treinamento de uma pessoa: "Se uma pessoa sai para trabalhar logo após se formar no ensino médio, parece bom, mas o profissionalismo será menos profissional. Se você puder terminar um curso de quatro anos grau de graduação antes de sair para o trabalho, você tem conhecimento geral Habilidade e conhecimento profissional suficiente são as capacidades que um grande modelo industrial deve ter.”
Por esse motivo, os dados do grande modelo de JD Yanxi são compostos por 70% de dados gerais e 30% de dados brutos do crescimento do cenário da cadeia de suprimentos.
Vale ressaltar que esses dados industriais vêm do próprio JD.com. JD.com em si é uma empresa baseada na cadeia de suprimentos. Está enraizada em uma ampla gama de setores. Não só possui dados práticos em varejo, logística, finanças, saúde, indústria e outros setores, mas também possui dados em cidades, assuntos governamentais, finanças, manufatura, indústria, aviação, transporte, etc. Os dados dessensibilizados de setores como parques industriais, parques industriais e energia, e os dados de alta qualidade gerados a cada ano atingem 10 bilhões de peças.
Além do fornecimento contínuo de dados industriais de alta qualidade, o grande modelo industrial também precisa entender o Know-How do setor, ou seja, ter conhecimento exclusivo sobre o setor e ter requisitos mais elevados de compreensão. Por exemplo, o setor de varejo presta mais atenção ao efeito do marketing e da recomendação, e o setor financeiro presta mais atenção ao efeito do controle de risco, confiabilidade e segurança.
Para essa demanda, a cadeia de suprimentos de inteligência digital de longo prazo da JD.com desempenhou um papel fundamental e se tornou o foco dos esforços da JD.com na aplicação de grandes modelos. O modelo grande também pode se basear na inteligência digital da cadeia de suprimentos e ir fundo na indústria física.
É relatado que a cadeia de suprimentos de inteligência digital da JD.com cobriu mais de 10 milhões de SKUs de produtos auto-operados da JD.com, atendendo a mais de 8 milhões de clientes corporativos ativos, incluindo mais de 90% das 500 maiores empresas do mundo na China e quase 70% das novas PME especializadas especiais do país. Ao mesmo tempo, a cadeia de suprimentos de inteligência digital da JD.com ainda está no país e tem uma cooperação profunda com mais de 2.000 cinturões industriais.
Esse tipo de cadeia de suprimentos de inteligência digital com links mais longos, cenários mais complexos e dados mais ricos é um excelente "campo de treinamento" para grandes modelos. Na visão de JD Cloud, o valor do modelo grande só pode ser percebido por meio da compreensão completa da cadeia de suprimentos e permitindo que o modelo grande "execute" na cadeia de suprimentos.
Além do acúmulo no lado industrial, a força do JD.com em algoritmos básicos e poder de computação não deve ser subestimada.
Em 2021, o JD Discovery Research Institute lançou o primeiro cluster de computação de grande escala do país baseado na arquitetura DGX SuperPOD em Chongqing-Tianqin α, que aumentou a velocidade do raciocínio em 6,2 vezes e reduziu o custo do raciocínio em 90%. Isso fornece ao JD.com a garantia mais básica para treinamento de modelo em grande escala.
No mesmo ano, JD.com lançou o modelo de nível bilhão K-PLUG. A cópia do produto gerada pelo K-PLUG cobriu mais de 3.000 categorias em JD.com, gerando um total de 3 bilhões de palavras, e o passe de revisão manual taxa superior a 95%. Até 2022, o grande modelo do JD.com será atualizado para um modelo Vega de dezenas de bilhões, que pode ser amplamente usado em várias tarefas de processamento de linguagem natural, como análise de sentimento, correspondência semântica, correção de erros gramaticais, resposta inteligente a perguntas e bom senso raciocínio.
Graças ao acúmulo anterior, o JD.com fez outro avanço tecnológico este ano e lançou uma nova geração do modelo de grande escala do JD.com com centenas de bilhões de parâmetros, concentrando-se em várias tarefas importantes, como geração de conteúdo, diálogo homem-máquina, compreensão da intenção do usuário, extração de informações e classificação de emoções. , realizou o ajuste fino do modelo básico + modelo de domínio vertical e aplicou cenários verticais detalhados, como varejo, logística, finanças, saúde e assuntos governamentais.
Atualmente, o grande modelo industrial representado por JD.com está treinando o grande modelo por meio de seus dados e conhecimentos industrializados e baseados em cenários acumulados e corrigindo o grande modelo com base em seu know-how acumulado da indústria, para melhorar o desempenho de grandes modelos em indústrias específicas e cenários de aplicação, e para melhorar a controlabilidade. Isso equivale a concluir uma "educação geral" para IA.
**O grande modelo de Jingdong está gradualmente se aprofundando em vários setores para melhorar o nível de inteligência da cadeia de suprimentos. Por outro lado, a atualização da inteligência digital da cadeia de suprimentos também está promovendo a transformação industrial, que por sua vez fornece um solo de dados mais rico para grandes modelos, formando um ciclo positivo. **
"Cortar o modelo grande pelo lado industrial é como escalar o Monte Everest técnico pela encosta norte: embora a estrada seja mais difícil, há paisagens mais magníficas. Jingdong insiste em fazer 'coisas difíceis, mas corretas', insistindo em fazer práticas , valioso e É uma questão de longo prazo. No campo técnico e no modelo grande, este é o nosso compromisso constante." Xu Ran disse.
** "Coisas difíceis e corretas" precisam de acumulação de longo prazo. No entanto, em termos de construção do modelo industrial, JD.com lançou claramente as bases. **
Jingdong, nascido na indústria, cria valor industrial com grandes modelos
"Na era da grande modelo, vale a pena fazer tudo de novo com a grande modelo."
Sob a onda de grandes modelos, a indústria rapidamente alcançou o consenso acima. No entanto, enquanto outros grandes fabricantes estão procurando modelos de negócios por meio de várias estratégias, a direção da indústria de pouso de Jingdong nunca mudou.
"Os atributos industriais são as características distintivas da tecnologia da JD. Cada tecnologia desenvolvida pela JD.com origina-se de necessidades industriais, experiências em cenários industriais e cria valor industrial", disse Xu Ran.
Atualmente, o modelo de grande escala de JD Yanxi está avançando de acordo com a estratégia de “três etapas”: atualmente, JD Cloud construiu um grande modelo de uso geral com base em práticas internas; até o final deste ano, JD. Serviços industriais sólidos; espera-se que no início de 2024, os recursos do modelo em grande escala sejam abertos a cenários de negócios sérios externos.
Do ponto de vista prático, o modelo grande da JD.com atingiu a segunda etapa. A JD.com está aplicando os recursos do modelo grande aos cenários mais familiares, como varejo, finanças, logística e saúde, e penetrou em vários links.
Por exemplo, Jingdong está melhorando a capacidade de atendimento ao cliente inteligente por meio de modelos grandes. O campo de atendimento ao cliente é diferente dos bate-papos e conversas diárias. É uma cena de diálogo baseada em tarefas sérias que precisa resolver vários problemas complexos entre compradores e vendedores no mundo real.
"Quando um usuário fala com o ChatGPT, não importa se a resposta está errada, e isso não afetará nenhuma tomada de decisão. Mas se em um cenário de negócios sério, o atendimento inteligente responder errado, as consequências serão inimagináveis . Portanto, a precisão da resposta é muito importante." Comitê Técnico do Grupo Jingdong Cao Peng, presidente da JD Cloud Division, disse.
Para cenários inteligentes de atendimento ao cliente, a JD.com não apenas construiu um modelo grande com compreensão semântica básica e lógica de perguntas e respostas, mas também aperfeiçoou um modelo pequeno para cenários específicos. Se o problema do cliente envolver devoluções e trocas comuns, etc., o atendimento ao cliente inteligente chamará um modelo grande mais geral. E uma vez que a questão envolve a política de garantia e as regras de proteção de preços de produtos específicos, o atendimento inteligente chamará um modelo pequeno mais direcionado para dar a resposta. Diferentes modelos podem assumir diferentes responsabilidades.
Agora, o atendimento ao cliente inteligente está funcionando dentro do JD.com, ajudando mais de 20.000 funcionários autônomos de atendimento ao cliente a reduzir custos e aumentar a eficiência, além de otimizar continuamente a experiência de atendimento ao cliente. A JD.com também abriu seus recursos inteligentes de atendimento ao cliente para o mundo exterior para ajudar mais agências governamentais e empresas a realizar transformação e atualização digital e inteligente.
Em termos de serviços externos para modelos grandes, o JD.com ainda mantém seu próprio ritmo "lento" e não tem pressa em "vender" modelos grandes para empresas. A razão é que a inteligência artificial é uma mudança tecnológica muito séria: se bem usada, pode transformar a indústria, mas se usada incorretamente, também pode trazer sérias consequências. Sob tais circunstâncias, Jingdong adere à mentalidade de longo prazo e é uma excelente escolha.
"O JD.com não servirá pratos que não atingiram 'cor total, sabor e sabor'. Após o modelo em grande escala ter completado experiência e prática em cenas internas importantes, ele será aberto a parceiros para ajudar toda a indústria a reduzir custos e aumentar a eficiência." Xu Ran express.
No plano da JD.com, o modelo grande de Yanxi se tornará o suporte técnico de nível mais baixo. Com base em suas capacidades, o campo produzirá uma série de produtos e os produtos no mesmo campo serão agregados em uma plataforma e, finalmente, gerarão valor para a indústria.
Por exemplo, no campo da geração de conteúdo, a JD.com construiu a plataforma de marketing de conteúdo JD Cloud AIGC. Com base no rico acúmulo de dados de produtos de toda a categoria do JD.com, o modelo grande pode entender melhor as características do produto, ajudar os comerciantes a gerar automaticamente imagens de produtos, pontos de venda e outros materiais de marketing e melhorar a eficiência operacional dos comerciantes e a qualidade do conteúdo de marketing.
Em outras palavras, os comerciantes precisam apenas fazer upload de uma foto do produto e podem obter rapidamente vários tipos de fotos, como fotos principais do produto, fotos de pôsteres de marketing e fotos de detalhes comerciais necessárias para operações de comércio eletrônico, atendendo às necessidades de abertura rápida da loja, lista de produtos e marketing. Esses recursos podem economizar 90% do custo de desenho para os comerciantes e reduzir o ciclo de produção de 7 dias para meio dia.
Usando mais recursos de modelo em grande escala, os comerciantes nem precisam vender seus próprios produtos, mas apenas usar o humano digital multimodal do JD Cloud para entregar mercadorias 24 horas por dia a baixo custo.
Além desses aplicativos, o JD.com também demonstrou uma plataforma de operação de marketing de IA no campo financeiro. Por meio de um diálogo simples, os usuários podem gerar atividades de marketing em uma parada, abrangendo formulação de estratégia operacional, agendamento de tarefas de marketing, construção de páginas de atividades, geração em lote de direitos autorais e materiais de marketing, entrega digital, etc. De acordo com dados relevantes do JD.com, no passado esse conjunto de processos exigia cinco tipos de pessoal funcional: produto, P&D, algoritmo, design e analista, mas agora foi reduzido a uma pessoa; no passado, o processo exigiu 2.000 interações homem-computador, mas também foi reduzido para menos de 50. Com o suporte da capacidade do modelo grande, a eficiência da produção do plano de marketing foi significativamente melhorada.
** Pode-se dizer que o grande modelo industrial da JD.com está se tornando a base para aplicações industriais em vários setores. Atualmente, penetrou no varejo, logística, saúde, indústria, manufatura, finanças, marketing e outras indústrias, e foi para a indústria e aplicação prática. **
Meio ano depois que o grande modelo correu solto, os fabricantes perceberam que "grande escala" ou "altos parâmetros" não podem resolver problemas práticos. Terminado o período da bolha, os grandes modelos devem retornar à indústria, retornar aos cenários reais e resolver problemas práticos, afinal, esse é o destino final da tecnologia e o início do desenvolvimento benigno dos grandes modelos. As empresas com sólidos dados industriais e prática de cenários começaram a subir ao palco.
Obviamente, o grande modelo Jingdong Yanxi partiu para o outro lado do valor industrial.