图片-精准获客

DeepSeek革新了人工智能领域的竞争格局。

近两日,中美AI领域发生两件重大事件。

美国发布AI禁令后,特朗普宣布一项预算达5000亿美元的AGI计划——星际之门,旨在维持其在AI领域的领先地位。

而在中国,创业公司Deepseek仅用2048块显卡,就训练出能与顶级模型媲美的Deepseek – V3模型。

Deepseek最突出的不是技术指标,而是效率革命。它凭借少量硬件配置和几十名年轻博士生,打破美国AI资源限制,实现技术跨越式突破。

更重要的是,Deepseek选择完全开源路线,公开代码、模型权重和训练日志。开源力量不容小觑,定义智能手机的是iOS,但让手机行业繁荣并普及全球的是安卓。

正如Perplexity CEO Aravind Srinivas所说,历史表明,开源一旦追上或超越闭源软件,开发者将转向开源。

以此为转折点,DeepSeek改变了AI竞争规则,让中美AI路线走向不同方向:巨额投入与追求效率、封闭与开源。

01 DeepSeek突破的三层意义

DeepSeek引发广泛讨论,不仅因其技术指标,更因其对AI行业的重要意义。

其一,DeepSeek重新定义大模型竞争壁垒。过去两年,OpenAI每年投入超百亿美元维持其在AI领域的优势。

如今规则改变。“DeepSeek”证明,数千万美元投资也能取得显著成果。

不久前,UC伯克利博士生潘家怡等研究人员在CountDown游戏中复现DeepSeek R1 – Zero。实验表明,通过强化学习RL,3B基础语言模型可自我验证和搜索。

更惊人的是,实现成本不到30美金(约217元)。这意味着低成本构建有推理能力的模型成为可能,预训练模型无需巨额投入。

这引出一个深层次问题:当公司能在缺乏顶级芯片时,以极低的成本建立突破性AI模型,那投入数千亿美元资本,是否真的值得?这是OpenAI要回答的问题。

其二,与OpenAI闭源路线不同,DeepSeek选择完全开源,公开代码、模型权重和训练日志。

当开源模型性能媲美甚至超越市场上最强大的模型时,会吸引更多开发者。原因很简单,开源软件成本低,成本越低对开发者吸引力越大,因为可大幅降低构建应用程序的成本。

这类似苹果和安卓的故事。移动互联网时代,iOS定义了智能机从0到1,但让手机行业繁荣普及全球的是安卓。

Meta副总裁兼首席人工智能科学家杨立昆认为,DeepSeek的成功,与其说是“中国超越美国”,不如说是开源模型超越专有模型。

其三,Deepseek的技术突破是AI研发开放性的胜利,与美国AI封锁形成鲜明对比。

具体而言,在GPU短缺和芯片禁运的环境下,一家未被列入中国“AI六小龙”的量化基金公司,凭借少量硬件配置和几十名年轻博士生,实现了技术的跨越式突破。

作为后来者,Deepseek的突破离不开自身努力,但更重要的是开放的技术交流环境,包括论文、开源代码和人才交流,为创新突破创造了条件。

这揭示了AI行业的关键特性:模型研发具有强外部性。在蒸馏与合成数据等技术支持下,后来者追赶和学习效应显著,这也是模型能力提升、成本下降的原因。

英伟达科学家Jim Fan也提到开放性对AI发展的影响:不管是否喜欢,AI的未来不会被“安全委员会”掌控,每个互联网用户都能在普通笔记本上运行高阶模型,这是历史潮流,应顺势而为。

在美国强化AI技术封锁时,Deepseek的突破是对美国AI制裁的一种“反噬”。

02 找到中国大模型的商业化答案

此前,李开复一直认为,中国做AI的优势并非无预算上限地进行突破性研究,而是在好、快、便宜和可靠性间找到最优解。

长期以来,国内大模型处境尴尬,训练阶段受技术封锁,还易被海外开源降维打击。

如今,Deepseek的突破带来新可能——通过提升算力效率,实现更繁荣的LLM应用生态。

从长远看,AI应用生态能否成功,取决于各国成本结构、商业模式、经济模型和产品供给能力,这是复杂的商业问题。

中国虽买不到最新芯片,单位Flops推理成本高于海外,但这也促使中国infra出现“工程式创新”,探索更高效的算力优化方式。

目前,国内推理优化进展超预期。一旦算力优化成功,国内大模型在商业层面建立良性循环并非不可能。

也就是说,中美未来AI发展不同:美国注重模型能力提升,中国追求模型效率极限。

这类似互联网发展历程。过去十年,中美在互联网领域走向不同:美国硅谷加大企业软件投入,中国则聚焦消费者应用。

谷歌和Meta之后,美国科技业放弃消费互联网流量入口再造,全面拥抱SaaS。软件接力消费移动应用,成为主流投资趋势,诞生众多优秀公司。

而中国消费互联网活力十足,字节跳动将短视频业务拓展至全球,美团将本地生活做成千亿美元规模,拼多多成为电商新势力。

GPT出现后,美国SaaS公司率先受益,向客户提供AI功能,通过既有客户基础和产品场景获商业回报,提升了AI创新投入回报的确定性。而中国AI应用因缺乏场景和商业模式进展缓慢。

随着AI应用落地,模型效率将成为打通中国大模型商业化循环的“钥匙”。

© 版权声明
THE END
喜欢就支持一下吧
点赞6 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容