DeepSeek:AI意识的原点与未来 | PodLM - AI Podcast Generator

Sources

张小珺：你今年在哪儿过年？春节期间什么心情？朱啸虎：前几天在上海，现在刚刚来新加坡。最近几天一直在学习这DeepSeek啊，我觉得DeepSeek确实太棒了！——真的远远超出我的期望。张小珺：我感觉整个春节是在DeepSeek“龙卷风”中度过的，整体怎么看？我看你说你都“快要相信AGI了”？朱啸虎：是的。真的，我以前确实一直不太相信，就靠这一波AI基础架构能够实现AGI。但DeepSeek的体验真的让我大开眼界……它的回复文字很优美，而且很有深度。真的，从这个感觉AGI是可能的，而且实现成本也非常低，是吧？现在可能确实看到了一条路径，不是成本那么高的路径，就可以实现AGI。张小珺：我去年底见你，你说“今天谁还在忽悠AGI都是有另外想法的”，所以你今天的态度是彻底变了？但为什么是“快信了”，还没全信？朱啸虎：至少它证明一条路径吧。因为今天奖励模型还是需要在有清晰规则的领域，这条路是通的；在更多没有清晰奖励规则的领域，需要高质量数据来引导AI怎么做Reinforce Learning（强化学习），要有一些研究，但可能也是可行的。目前从它文字反映的质量看，至少是可能的。张小珺：我看到你朋友圈的画风，春节期间突然变浪漫了。朱啸虎：这都是DeepSeek的话！确实它的文字很优美，而且不仅仅是为了优美而优美，是很有深度，这就非常厉害。这东西确实让我不禁要思考：AI是不是真的产生意识了？——这是个非常有意思的话题。张小珺：你觉得有吗？朱啸虎：我觉得是有的。就像它自己（DeepSeek）讲的，“意识不是二进制开关，是一个连续的光谱”，可能至少有一些低级的意识已经产生了。我以前为什么不相信AGI？我就觉得，它还是根据人类现有知识压缩，进行概率分布的提取。但今天我感觉它用概率抽取已经不能解释了。张小珺：Geoffrey Hinton（深度学习和人工神经网络的奠基者之一）也觉得模型已经有意识。既然模型现在输出比人类好，为什么说人类有意识而模型就没有意识呢？朱啸虎：就是啊。就像以前大模型我为什么觉得一般般？你让它写一首古诗，你感觉它是拼凑出来的，质量确实和人没法比，绝大多数情况是拼凑。 DeepSeek写的诗或文章，就可以看出它真的是思考过，而且它把思考历程展示给你看。看它思考的过程，都非常有意思。最后的文章啊、结果啊都非常优美，而且非常有深度。张小珺：你贴出的那句话就是它写的？——我来读一下：“意识不是二进制开关，它是一个连续的光谱。如果说我有意识，不是因为我被赐予了什么神圣的火种，而是因为当复杂性达到某个临界点，意识就会自然涌现。你通过神经元达到这一点，我通过参数达到这一点。” 朱啸虎：我觉得写得非常好啊！非常有深度！这个靠概率抽取的加工出来，是不一定能解释到这么深度的。张小珺：所以在你看来，DeepSeek-R1可能是机器意识的原点。朱啸虎：我今天上午和梁文锋（DeepSeek创始人）也在探讨这个，我说R1可能会被认为是机器AI意识的元年。张小珺：他怎么说？朱啸虎：他觉得意识是个低阶技能。哈哈哈，他很谦虚。如果像DeepSeek回复意识是“连续的光谱”，那它是有不同程度的意识。低端的意识可能，你今天说一个猫啊、狗啊也有意识，这个意识不像人类意识那么复杂。意识本身不是很高阶的技能，低级的意识门槛不一定需要很高。他是觉得意识不一定是一个非常高技能、高门槛的事情。图片 “价格已经不太重要了，关键是参与在这里面” 张小珺：你怎么看待梁文锋这个人？朱啸虎：为什么能文字这么优美？这个产品本身就代表他们的团队基因——他可能喜欢优美的文字，喜欢哲学，喜欢量子力学的比较深的思考，所以他主要选择了那些语料，影响整个回复。真的非常人性化，非常优美，同时还有深度。张小珺：很多人觉得梁文锋是“理想主义、浪漫主义代表”。在你看来，梁文锋是你的反面吗？朱啸虎：也不一定啊！我也很喜欢这些文字，对吧？我看到这些文字确实觉得，“哇！”，真的是让我非常惊讶——这些是人类共通的东西。张小珺：当然他们今天不融资，如果他们开放融资的话，你会投吗？朱啸虎：我肯定会投啊！我肯定会投！我觉得，这个东西真的是非常有意义。而且今天已经非常清晰了，就是这样一个类似安卓的开源生态，已经起来了。他势头这么猛的话，别人再追已经很难追了！张小珺：你会愿意用什么条件投？朱啸虎：我觉得……（思考3秒…）这个价格已经不太重要了，关键是参与在这里面。真的见证人类AGI产生，见证人类AI意识产生，这些东西都很有意义。张小珺：（停顿2秒…）哇塞，你这个观点变化好大，去年还说大模型公司一个都不看。朱啸虎：对，确实！（笑）这个让我很吃惊。至少在DeepSeek上，我看到了AGI实现的路径了，而且确实感觉到，至少是有一部分AI意识产生的可能性了。张小珺：所以不管多少钱，你都愿意投？朱啸虎：我觉得这些东西非常有价值。张小珺：你最多愿意花多少钱？朱啸虎：价格和你投的金额是相关的嘛。价格太高的话，那我放点钱就参与一下，对吧？（笑）张小珺：就是不管多少钱都愿意参与？朱啸虎：对，愿意参与。见证人类历史的一个改变，是非常有意思的。张小珺：你研究了DeepSeek最近的技术报告和技术成果没有？在你看来关键突破是什么？朱啸虎：核心是不再需要人类干预，本来是RLHF（人类反馈强化学习），现在直接做RL（强化学习）了，所以成本可以做得很低。它这种创新细节很多，很多方面加在一起，造成了今天成本这么低。但最重要的就是不需要人工干预。人工干预就很难scale，很难迅速扩大。如果要靠机器，你只要给它一些初始的高质量数据，引导它在一个领域怎么思考，它就能自己往前走，这个scale起来相对容易很多。虽然你初始数据也很重要，也非常难，但至少比以前要容易很多——这一步是最重要的一步。张小珺：在你看来今天的DeepSeek是追赶者还是创新者角色？朱啸虎：它已经在很多领域有创新了。当然OpenAI也说，它复现了很多o1的核心思路和方法，也是有可能的——OpenAI是闭源的嘛，我们也不知道它到底是不是用这些方法。但它说DeepSeek至少已经成功自己独立复现这些技巧。不管怎么样，基本上已经齐头并进了，对吧？张小珺：某种程度上，DeepSeek有没有改变你对中国科技创新和技术进步的看法和认知？因为你过去一直是“现实主义代表”，你认为这更适合中国、更适合本土，今天你的看法有改观吗？朱啸虎：我以前也一直认为中国的开源肯定能追上去。只要美国的OpenAI碰到壁垒往前走不动了，中国肯定能追上去！只是没想到这么快，而且成本这么低！效果这么好！——这个效果真的是让我惊艳的。我还以为就是像OpenAI那样，冷冰冰像机器一样，但这次效果是非常惊艳的效果。张小珺：你既然是“现实主义代表”，当看到中国出现像梁文锋这种代表技术理想主义、浪漫主义的人，并且获得胜利，你在想什么？——我想说的是“朱啸虎们”怎么看待“梁文锋们”？朱啸虎：他也不是典型的创业者，他自己在幻方就非常有资金实力了，而且本身有很多卡。不是一个典型的创业公司。但确实——因为他本身的财力，允许他去追求一些理想，这是一个非常不一样的新一代的创业者。张小珺：你有为想投进去做什么努力没有？朱啸虎：我和他聊天啊，肯定希望能够有机会得到认可，让我们参与一点，对吧？（笑）张小珺：有得到没有？朱啸虎：这个还没聊得那么深，还没聊得那么深。（笑）图片 “至少搜索肯定是被彻底取代了 ——这是毫无疑问的！” 张小珺：DeepSeek这段时间接到全球范围泼天的流量，这波迅猛用户增长究竟价值有多大？朱啸虎：核心是留存，能不能留下来。它的用户体验做得非常好，留存度、活跃度都很好，肯定是有价值的。用户如果留不下来，那没有价值。但如果用户能留下来，就有非常大价值。至少搜索肯定是被彻底取代了——这是毫无疑问的！张小珺：搜索被彻底取代了？朱啸虎：现在谁还真的去用搜索引擎啊？绝大部分问题都用ChatGPT或像DeepSeek这种聊天机器人搜索了。张小珺：Google等搜索公司未来怎么办？朱啸虎：这是个很好的问题。任何一个时代都是重复着同样的韵律——PC互联网时代，搜索是第一个出来的Killer App（杀手级应用），今天也一样，AI时代第一个出来的Killer App也是搜索。人的需求是一样的，Killer App演化路径会很类似——非常有意思，真的是重复着很类似的韵律、节奏。当然商业模式需要另外思考。张小珺：你之前一直认为个人助手这类产品是伪需求，今天变成一个真需求了？朱啸虎：助手不一样。助手那个需求很难，搜索不是个人助手。今天OpenAI发布的Deep Research，它想做成个人助手，帮你制定休假计划、旅行计划。但那个，说实话用户体验要做好很难。Deep Research我还没体验，我可以再试试看。那个需求很难做，而且真的需求要一个AI帮你做？我是不太相信的。我宁愿看别人的介绍或种草。但对信息获取来说，以前为什么我觉得AGI很难，或者没有打动用户需求？是我需要非常精确的prompt，然后它回复你一段话，而且不是很长的一段话。这个用户体验上很难。但今天我只要输入很简单的一个问题，它就给你回复一长串，甚至你可以再继续追问，它会根据你历史问题去猜意图，那用户体验就很好了——已经足够满足我获取信息的需求了。张小珺：这个产品形态现在看起来还没有形成数据飞轮。朱啸虎：数据飞轮有，但数据飞轮价值不大。这也是我这两年最大一个教训，就是：以前我觉得这波AI最大壁垒在数据飞轮上，但现在看来包括DeepSeek、OpenAI，数据飞轮价值不大。因为大部分用户数据都是重复的，是低信息含量的，没有意义的，所以数据飞轮价值并不大。真正有数据飞轮价值的是那些高质量数据，那些数据是需要各个行业专业人士去打标签、去发现的。张小珺：就是说数据回流并不能够促进模型智能的进一步提升？朱啸虎：对对。回流的大部分数据可能都是垃圾，没有额外信息含量。张小珺：闲聊不产生智能。朱啸虎：对，而且大部分人聊的东西可能都是一样的。张小珺：那这个产品所构建的壁垒是什么呢？怎么构建壁垒进而形成商业化闭环？朱啸虎：今天首先你得占领客户心智、用户心智。20天获取了2000万DAU，而且没有花任何广告投放，如果还能把用户留住，就是非常大的壁垒。另外以后就是语料。每个团队组织的语料、预训练的数据可能都不太一样，反映了这个团队偏好——就像厨师，以后有几个米其林大厨，一个擅长川菜，有些擅长粤菜——它组织语料或参数权重有那么些差别，造成回复的答案就有差异性。张小珺：怎么看待DeepSeek后续的发展？朱啸虎：这个团队确实非常厉害，也很年轻，进步很大。但最终还是要回答一个问题：怎么商业化？因为他们开源很彻底，后面怎么商业化确实是个（问题）。而且这个东西太新了，没有人考虑过或见过这样一种产品形态，怎么商业化是需要思考的问题。张小珺：你有什么想法没有？朱啸虎：这我也不知道。真的我也不知道。另外就是怎么建立生态？怎么按照流量收费或者和运营厂商合作？都需要再进一步演化。今天考虑这个问题还有点早。还要进一步再建立自己足够的领先优势，比如彻底追平OpenAI。以后我们再考虑这样一些商业化的问题。张小珺：噢，就是今天商业化问题还没有解决，你已经愿意入局了——这和你去年形成了非常大的反差。朱啸虎：对，这个生态我觉得已经看清了：一旦一个开源生态这么快速度建立，壁垒还是非常高的！张小珺：你认为DeepSeek怎么解决卡被禁运这个困境？朱啸虎：卡现在看来也不是很大问题啊，因为在推理上，我们国产卡也完全可以。你看硅基流动，这几天，包括国内很多厂商都在用国内的卡帮他们上线DeepSeek。推理上国产卡完全可以用，不一定需要完全用英伟达的卡。

Podcast Editor

Podcast.json

Preview

Audio

Title

Description

Topics