Skip to content

DeepSeek-R1 最大的贡献是什么?

一、复现 OpenAI 成果与自我推理能力

  1. 成果复现 :DeepSeek 的 R1 模型基本复现了 OpenAI 半年前的成果,这一结论已得到多方验证,包括 OpenAI 官方人员也有所发声。这表明 DeepSeek 在技术层面具备了较强的复现能力,能够达到行业领先水平,为后续的创新和发展奠定了基础。
  2. 自我推理出思维链 :开源界的一系列实验表明,通过强化学习(rl),模型确实能够自我推理出思维链。此前 OpenAI 传言的草莓、Q* 等概念,实际上指的就是这种自我推理能力。DeepSeek 在这方面取得了实质性进展,使得模型不再仅仅是简单的文本生成工具,而是具备了一定的逻辑推理和思维能力,能够生成具有连贯性和逻辑性的思维链,为解决更复杂的问题提供了可能。

二、训练成本与精度趋势

  1. 训练成本待验证 :关于 DeepSeek 的训练成本,有说法是达到了 500 万美金,但这一数据还有待进一步验证。不过可以肯定的是,随着技术的发展,使用 FP8 甚至 FP4 的精度进行训练已成为大势所趋。预计到 2025 年,会有更多模型从 FP16 转向 FP8/FP4。这将有助于降低训练成本,提高训练效率,使得更大规模的模型训练成为可能,进一步推动人工智能技术的发展。
  2. 精度提升的意义 :从 FP16 到 FP8/FP4 的转变,并不仅仅是精度的降低,更是对模型训练和推理效率的优化。在保持模型性能的前提下,降低精度可以减少计算资源的消耗,加快训练和推理速度,使得模型能够更快地应用于实际场景中,为行业带来更高效、更经济的解决方案。

三、蒸馏数据与预训练创新

  1. 蒸馏数据的作用 :蒸馏数据在模型训练中是一个公开的秘密,但 DeepSeek 的一些表现并不能仅仅用蒸馏来解释。例如,V3 模型的中文能力表现出色,很多用词和表达方式非常接地气,甚至让人产生了一种 “文学不存在了” 的幻觉。这表明 DeepSeek 可能使用了新的语料或者合成方法进行预训练,这种方法比传统的蒸馏更重要,但目前重视的人似乎不多。通过创新的预训练方法,DeepSeek 能够更好地捕捉语言的细微差别和文化特色,提高模型在特定语言环境下的表现能力,为用户提供更高质量的文本生成服务。
  2. 预训练创新的价值 :在人工智能领域,预训练是模型性能提升的关键环节之一。DeepSeek 在预训练方面的创新,不仅提高了模型的语言理解能力,还为解决语言生成中的语义理解和文化适应性问题提供了新的思路。这种创新的预训练方法有望在其他语言和领域得到推广和应用,推动整个人工智能技术的发展。

四、模型思维链与进化潜力

  1. 思维链的初级阶段 :R1 模型只是 Reasoner 的初级阶段,但 Reasoner 模型与此前的模型有质的区别。之前的模型就像一个学渣每天填鸭式刷题,虽然能够凭借超强的记忆力解决一些问题,但对大部分问题只是半懂不懂,知其然而不知其所以然。而 R1 模型就像这个学渣偷看了隔壁学霸的答案,通过对着答案苦思,试图反推解题步骤,成功复现了部分题的思路,知其然更知其所以然,从此功力大涨。这说明 DeepSeek 在模型思维链的构建上取得了重要突破,使得模型能够更好地理解和解决问题,为实现更高级的人工智能功能奠定了基础。
  2. 进化潜力的展望 :下一步可能的范式是让模型自己出题自己做,自己检查做的对不对。例如,模型出了 1 万亿道题,做出了其中 1 亿道,自己检查后发现只有 100 万道能验证是对的。那么解出这 100 万道题的思维链就成了新的训练数据。用这些数据训练后得到的 2.0 模型,能够解出更难的题,思维链更长。如此迭代实现自我进化,最终当思维链长到比人类顶尖科学家几十年每天苦思冥想的内心戏连到一起都要长的时候,也许 AI 就真超过人类了。至少对于数理化计算机这类任务,AI 要做的不是和人类对齐,而是和宇宙对齐。因为所有数据都是在宇宙这个计算机内部折腾,然后收集它给出的反馈。最终的结果,可能是一群 AI 就一个科学问题切磋得热火朝天,你能看到每个模型的所有思维链,可是几乎看不懂,因为 AI 为了高效传输信息用自己发明的黑话压缩了思维链。AI 不是新工具而是新物种,Agent 的下一步是 AI 社会。

五、模型训练与应用前景

  1. SFT 的变革 :有人说 SFT 不存在了,但实际上不可能的,最多是人类标注的 SFT 不存在了。取而代之的是 AI 标注的 SFT。没错,模型 RL 得到的思维链做 SFT 训练新模型,大模型的思维链训练小模型。一年多前说人类数据是 AI 的药引子,没想到这么快就实现了。这表明 DeepSeek 在模型训练方法上进行了创新,使得模型能够通过自我学习和自我训练不断提升性能,减少了对人类标注数据的依赖,提高了模型的自主学习能力和适应性。
  2. 应用前景的拓展 :在 AI 编程领域,现在有实用价值的只有 Claude 和 R1,但 Claude 不是 Reasoner 模型。我们日常写的代码,说白了都是别人写过的东西缝合一下,经验还是很有用的。DeepSeek 的 R1 模型虽然在思维链方面还比较初级,经常陷入转圈圈到处碰壁的牛角尖,但已经展现出了在编程等领域的应用潜力。随着技术的不断发展和完善,DeepSeek 有望在更多领域得到应用,为人们的生活和工作带来更多的便利和创新。

六、行业竞争与未来展望

  1. 行业竞争格局 :传统 VC 的思路已经跟不上 AI 时代的格局了。还在说什么壁垒壁垒,你看 OpenAI 有壁垒吗?最多半年。那么 DeepSeek 有壁垒吗?人家开源了。传统商业是占山为王思维,高筑墙广积粮。AI 是大航海时代,地球是平的,人人有机会,个个没把握。看不懂就别投,你不投有的是人投。去口口的壁垒,去口口的 PMF,DeepSeek 有 PMF 吗?出圈了就有,没出圈就继续烧量化的钱。这表明在 AI 行业,竞争格局正在发生变化,传统的商业壁垒和思维模式已经不再适用。开源和共享成为了新的趋势,各个企业和研究机构都在积极探索和创新,以在激烈的竞争中脱颖而出。
  2. 未来展望与挑战 :我们到底赢了没有?赢了,但是赢的还不够多。基本上每个谈论 DeepSeek 的人,无论懂不懂行,都是一片欢呼,一片乐观。这叫小赢,不叫大赢。那么大赢是什么呢?等到人们疯狂地冲进 DeepSeek 的机房、疯狂地砸烂几十亿的服务器的时候,等到海对面的人也同样疯狂地冲击 OpenAI 的时候,就像从教科书上读到的,工业革命时期的英国工人砸烂蒸汽机那样,大的就来了。这说明虽然 DeepSeek 取得了一定的成绩,但要实现真正的突破和成功,还需要面对更多的挑战和困难。未来,AI 技术的发展将面临更多的机遇和挑战,需要各方共同努力,不断探索和创新,以推动 AI 技术的发展和应用。