Acesso no exterior: www.kdjingpai.com
Ctrl + D Marcar este site como favorito

Por trás da tempestade DeepSeek: Ng alerta que a competição de modelos abertos remodelará o cenário de valores de IA nos EUA e na China

2025-01-31 717

Caros amigos.

esta semana DeepSeek O burburinho gerado deixou claro para muitos várias tendências importantes: (i) a China está se aproximando dos EUA em IA generativa, o que está tendo um impacto significativo na cadeia de suprimentos de IA; (ii) os modelos de ponderação abertos estão comoditizando a camada do modelo básico, criando oportunidades para os desenvolvedores de aplicativos; e (iii) o aumento de escala não é a única maneira de a IA progredir. Apesar do grande foco e do hype do setor no poder aritmético, a inovação algorítmica está reduzindo rapidamente os custos de treinamento.

Há cerca de uma semana, a empresa chinesa DeepSeek lançou o DeepSeek-R1 ,这款在基准测试中表现可与 OpenAI o1 相媲美的模型以MIT许可协议开放权重。上周在达沃斯,许多非技术背景的商业领袖都向我询问此事。周一股市出现”DeepSeek抛售潮”:英伟达等多家美国科技公司股价暴跌(截至撰稿时已部分回升)。

Acho que o DeepSeek mostra os seguintes pontos:

A IA geradora chinesa está diminuindo a distância em relação aos EUA.. Quando o ChatGPT for lançado em novembro de 2022, os EUA estarão significativamente à frente da China em IA generativa. As percepções das pessoas demoram a mudar, então, recentemente, ainda há amigos na China e nos EUA que acham que a China está ficando para trás. Mas, na verdade, essa diferença vem diminuindo rapidamente nos últimos dois anos. via lit. dez mil perguntas sobre princípios gerais (expressão idiomática); fig. uma longa lista de perguntas e respostas (Minha equipe o utiliza há meses), Kimi Com modelos chineses como o InternVL e o DeepSeek, fica claro que a China está diminuindo a diferença e até mesmo teve uma liderança temporária em áreas como a geração de vídeos.

令我振奋的是,DeepSeek-R1以开放权重形式发布,并附有详细技术报告。相比之下,多家美国公司通过炒作”AI灭绝人类”等假设性风险来推动限制开源的政策。现在显而易见,开源/开放权重模型已成为AI供应链的关键部分:众多企业将采用这些模型。若美国继续阻碍开源,中国将主导该供应链环节,最终多数企业将使用更体现中国而非美国价值观的模型。

Os modelos de ponderação abertos estão comoditizando a camada do modelo básico. Como mencionei anteriormente, os preços dos tokens de modelos de linguagem grandes estão caindo rapidamente, e a ponderação aberta acelera essa tendência e oferece mais opções para os desenvolvedores. O openAI o1 cobra US$ 60 por milhão de tokens de saída.E o DeepSeek R1 custa apenas US$ 2,19A diferença de preço de quase 30 vezes levou a uma preocupação generalizada sobre a tendência de redução de preços. Essa diferença de quase 30 vezes levou a uma tendência de redução de preços que atraiu a atenção de todos.

DeepSeek风暴背后:吴恩达警示开放模型竞赛将重塑中美AI价值观版图-1

训练基础模型并出售API访问的业务充满挑战。该领域许多公司仍在寻求收回高昂训练成本的途径。文章”AI的6000亿美元难题”对此挑战阐述精辟(但需要明确,我认为基础模型公司的工作卓有成效且期待其成功)。相较而言,基于基础模型构建应用程序蕴含着大量商业机遇。既然他人已投入数十亿训练模型,你仅需数美元即可获取这些模型来开发客服聊天机器人、邮件摘要工具、AI医生、法律文档助手等应用。

Os avanços da IA não dependem apenas de escalonamento。扩大模型规模推动进步的论调甚嚣尘上。平心而论,我曾是规模论的早期倡导者。多家公司通过鼓吹”资本越多就能(i)扩大规模且(ii)稳定提升性能”的叙事筹集数十亿美元。这导致业界过度聚焦规模扩张,而忽视其他多种进步途径。受美国AI芯片禁令推动,DeepSeek团队不得不在性能较弱的H800 GPU上进行大量优化创新,最终使模型训练成本(不计研究投入)控制在600万美元以内。

Resta saber se isso realmente reduzirá a demanda aritmética. Às vezes, uma redução no preço unitário dos produtos leva a um aumento no gasto total. Acredito que, a longo prazo, quase não há limite superior para a demanda humana por inteligência e poder aritmético, portanto, mesmo que o custo diminua, os seres humanos continuarão consumindo mais recursos inteligentes.

A mídia social tem estado repleta de interpretações conflitantes do progresso do DeepSeek, mapeando diferentes posições como um teste de Rorschach. Acho que o impacto geopolítico do DeepSeek-R1 ainda não foi totalmente percebido, mas é uma vantagem para os desenvolvedores de aplicativos de IA. Minha equipe já começou a fazer um brainstorming de novas ideias que só podem ser realizadas com a ajuda de modelos de inferência abertos e avançados. Este ainda é o melhor momento para criar aplicativos de IA!

Recomendado

Não consegue encontrar ferramentas de IA? Tente aqui!

Basta digitar a palavra-chave Acessibilidade Bing SearchA seção Ferramentas de IA deste site é uma maneira rápida e fácil de encontrar todas as ferramentas de IA deste site.

caixa de entrada

Entre em contato conosco

voltar ao topo

pt_BRPortuguês do Brasil