Andrew Ng:AI应用层商业机会无限
2025年2月1日
近期DeepSeek引发的热议让众多人士意识到几个长期存在却未受重视的趋势:
第一,中国在生成式AI领域正迅速缩小与美国的差距,这将重塑AI供应链格局;
第二,开放权重模型正推动基础模型层商品化,为应用开发者带来新机遇;
第三,尽管业界热衷于大规模算力投入,但算法创新正在迅速降低训练成本,证明规模并非AI进步的唯一路径。
中国企业DeepSeek发布了堪比OpenAI的o1水平的杰作——DeepSeek-R1模型,并以MIT许可证形式开放了模型权重。
在达沃斯论坛期间,众多非技术背景的商界领袖纷纷就此向我请教。
市场更出现了"DeepSeek抛售潮",导致英伟达等多家美国科技巨头股价大跌(截至撰文时已略有回升)。
我认为DeepSeek的出现让人们认清了以下现实:
**中国正快速追赶美国的生成式AI水平。**2022年11月ChatGPT问世时,美国在这一领域遥遥领先。
刻板印象往往难以改变,以至于近期仍有中美两国友人认为中国处于落后地位。然而事实上,这一差距在过去两年中迅速缩小。
从Qwen(我团队已使用数月)到Kimi、InternVL再到DeepSeek,中国模型的表现清晰印证了这一点。
在视频生成等细分领域,中国更是已现领先之势。
令人欣喜的是,DeepSeek-R1不仅开放了模型权重,还公布了详尽的技术报告。反观美国部分企业,却以人类灭绝等假想威胁为由,极力推动监管来限制开源发展。
显然,开源与开放权重模型已成为AI供应链中不可或缺的环节,众多企业都将采用这类模型。
如果美国持续打压开源,中国必将主导供应链的这一关键环节,更多企业最终将不得不使用那些更多体现中国价值观、而非美国价值观的模型。
**开放权重模型正加速基础模型层的商品化进程。**正如我此前所言,LLM代币价格持续下跌,开放权重更是加剧了这一趋势,赋予开发者更多选择空间。
OpenAI的o1每百万输出代币收费60美元,而DeepSeek R1仅需2.19美元。如此巨大的价差让更多人注意到了这一降价趋势。
**训练基础模型并提供API访问的商业模式充满挑战。**该领域许多企业仍在摸索如何收回天价训练成本。
《AI的6000亿美元之问》一文深入剖析了这一难题(但请注意,我认为基础模型公司表现出色,衷心希望他们能取得成功)。
**相比之下,基于基础模型开发应用则商机无限。**如今,当其他公司已投入数十亿美元训练模型后,开发者只需投入几美元就能调用这些模型,开发客服聊天机器人、邮件摘要生成工具、AI医生、法律文件助手等应用。
**提升规模并非推动AI进步的唯一途径。**当前业界过分推崇通过扩大规模来实现突破。坦白说,我也曾是规模扩张的早期倡导者。
部分公司借助"更多资金能带来更大规模和可预期进步"的说法获得了数十亿美元融资。
这导致人们过度关注规模扩张,忽视了推动进步的其他重要手段。
在美国AI芯片禁令的压力下,DeepSeek团队不得不在多个层面进行创新优化,最终仅用性能较弱的H800 GPU(而非H100)就完成了模型训练,算力成本不足600万美元(不含研发投入)。
这是否真能降低算力需求仍有待观察。
历史表明,单位成本的下降有时反而会推高总支出。就长远来看,我认为人类对智能和算力的需求几乎无上限,因此即便成本降低,市场对智能的需求仍将持续增长。
社交媒体上对DeepSeek进展的解读五花八门,恍如罗夏墨迹测试,每个人都能从中读出自己想要的寓意。
我认为DeepSeek-R1的地缘政治影响尚未完全显现。
对AI应用开发者而言,这无疑是个利好消息。
我的团队已在构思一些新项目,这些构想之所以成为可能,正是因为我们能便捷使用一个开放的高级推理模型。
对于创业者来说,这依然是一个充满机遇的时代!
继续学习,
Andrew
参考内容:
如果你想用AI优化企业/个人工作流,提升获客、内容生产效率。欢迎找我们聊聊(微信:a52947593)
公众号「匠程AI」