进化潜力的展望 :下一步可能的范式是让模型自己出题自己做,自己检查做的对不对。例如,模型出了 1 万亿道题,做出了其中 1 亿道,自己检查后发现只有 100 万道能验证是对的。那么解出这 100 万道题的思维链就成了新的训练数据。用这些数据训练后得到的 2.0 模型,能够解出更难的题,思维链更长。如此迭代实现自我进化,最终当思维链长到比人类顶尖科学家几十年每天苦思冥想的内心戏连到一起都要长的时候,也许 AI 就真超过人类了。至少对于数理化计算机这类任务,AI 要做的不是和人类对齐,而是和宇宙对齐。因为所有数据都是在宇宙这个计算机内部折腾,然后收集它给出的反馈。最终的结果,可能是一群 AI 就一个科学问题切磋得热火朝天,你能看到每个模型的所有思维链,可是几乎看不懂,因为 AI 为了高效传输信息用自己发明的黑话压缩了思维链。AI 不是新工具而是新物种,Agent 的下一步是 AI 社会。
五、模型训练与应用前景
SFT 的变革 :有人说 SFT 不存在了,但实际上不可能的,最多是人类标注的 SFT 不存在了。取而代之的是 AI 标注的 SFT。没错,模型 RL 得到的思维链做 SFT 训练新模型,大模型的思维链训练小模型。一年多前说人类数据是 AI 的药引子,没想到这么快就实现了。这表明 DeepSeek 在模型训练方法上进行了创新,使得模型能够通过自我学习和自我训练不断提升性能,减少了对人类标注数据的依赖,提高了模型的自主学习能力和适应性。
应用前景的拓展 :在 AI 编程领域,现在有实用价值的只有 Claude 和 R1,但 Claude 不是 Reasoner 模型。我们日常写的代码,说白了都是别人写过的东西缝合一下,经验还是很有用的。DeepSeek 的 R1 模型虽然在思维链方面还比较初级,经常陷入转圈圈到处碰壁的牛角尖,但已经展现出了在编程等领域的应用潜力。随着技术的不断发展和完善,DeepSeek 有望在更多领域得到应用,为人们的生活和工作带来更多的便利和创新。
六、行业竞争与未来展望
行业竞争格局 :传统 VC 的思路已经跟不上 AI 时代的格局了。还在说什么壁垒壁垒,你看 OpenAI 有壁垒吗?最多半年。那么 DeepSeek 有壁垒吗?人家开源了。传统商业是占山为王思维,高筑墙广积粮。AI 是大航海时代,地球是平的,人人有机会,个个没把握。看不懂就别投,你不投有的是人投。去口口的壁垒,去口口的 PMF,DeepSeek 有 PMF 吗?出圈了就有,没出圈就继续烧量化的钱。这表明在 AI 行业,竞争格局正在发生变化,传统的商业壁垒和思维模式已经不再适用。开源和共享成为了新的趋势,各个企业和研究机构都在积极探索和创新,以在激烈的竞争中脱颖而出。