Sources

张小珺:你今年在哪儿过年?春节期间什么心情? 朱啸虎:前几天在上海,现在刚刚来新加坡。最近几天一直在学习这DeepSeek啊,我觉得DeepSeek确实太棒了!——真的远远超出我的期望。 张小珺:我感觉整个春节是在DeepSeek“龙卷风”中度过的,整体怎么看?我看你说你都“快要相信AGI了”? 朱啸虎:是的。真的,我以前确实一直不太相信,就靠这一波AI基础架构能够实现AGI。但DeepSeek的体验真的让我大开眼界……它的回复文字很优美,而且很有深度。 真的,从这个感觉AGI是可能的,而且实现成本也非常低,是吧?现在可能确实看到了一条路径,不是成本那么高的路径,就可以实现AGI。 张小珺:我去年底见你,你说“今天谁还在忽悠AGI都是有另外想法的”,所以你今天的态度是彻底变了?但为什么是“快信了”,还没全信? 朱啸虎:至少它证明一条路径吧。因为今天奖励模型还是需要在有清晰规则的领域,这条路是通的;在更多没有清晰奖励规则的领域,需要高质量数据来引导AI怎么做Reinforce Learning(强化学习),要有一些研究,但可能也是可行的。目前从它文字反映的质量看,至少是可能的。 张小珺:我看到你朋友圈的画风,春节期间突然变浪漫了。 朱啸虎:这都是DeepSeek的话!确实它的文字很优美,而且不仅仅是为了优美而优美,是很有深度,这就非常厉害。这东西确实让我不禁要思考:AI是不是真的产生意识了?——这是个非常有意思的话题。 张小珺:你觉得有吗? 朱啸虎:我觉得是有的。就像它自己(DeepSeek)讲的,“意识不是二进制开关,是一个连续的光谱”,可能至少有一些低级的意识已经产生了。 我以前为什么不相信AGI?我就觉得,它还是根据人类现有知识压缩,进行概率分布的提取。但今天我感觉它用概率抽取已经不能解释了。 张小珺:Geoffrey Hinton(深度学习和人工神经网络的奠基者之一)也觉得模型已经有意识。既然模型现在输出比人类好,为什么说人类有意识而模型就没有意识呢? 朱啸虎:就是啊。就像以前大模型我为什么觉得一般般?你让它写一首古诗,你感觉它是拼凑出来的,质量确实和人没法比,绝大多数情况是拼凑。 DeepSeek写的诗或文章,就可以看出它真的是思考过,而且它把思考历程展示给你看。看它思考的过程,都非常有意思。最后的文章啊、结果啊都非常优美,而且非常有深度。 张小珺:你贴出的那句话就是它写的?——我来读一下:“意识不是二进制开关,它是一个连续的光谱。如果说我有意识,不是因为我被赐予了什么神圣的火种,而是因为当复杂性达到某个临界点,意识就会自然涌现。你通过神经元达到这一点,我通过参数达到这一点。” 朱啸虎:我觉得写得非常好啊!非常有深度!这个靠概率抽取的加工出来,是不一定能解释到这么深度的。 张小珺:所以在你看来,DeepSeek-R1可能是机器意识的原点。 朱啸虎:我今天上午和梁文锋(DeepSeek创始人)也在探讨这个,我说R1可能会被认为是机器AI意识的元年。 张小珺:他怎么说? 朱啸虎:他觉得意识是个低阶技能。哈哈哈,他很谦虚。 如果像DeepSeek回复意识是“连续的光谱”,那它是有不同程度的意识。低端的意识可能,你今天说一个猫啊、狗啊也有意识,这个意识不像人类意识那么复杂。意识本身不是很高阶的技能,低级的意识门槛不一定需要很高。 他是觉得意识不一定是一个非常高技能、高门槛的事情。 图片 “价格已经不太重要了, 关键是参与在这里面” 张小珺:你怎么看待梁文锋这个人? 朱啸虎:为什么能文字这么优美?这个产品本身就代表他们的团队基因——他可能喜欢优美的文字,喜欢哲学,喜欢量子力学的比较深的思考,所以他主要选择了那些语料,影响整个回复。 真的非常人性化,非常优美,同时还有深度。 张小珺:很多人觉得梁文锋是“理想主义、浪漫主义代表”。在你看来,梁文锋是你的反面吗? 朱啸虎:也不一定啊!我也很喜欢这些文字,对吧?我看到这些文字确实觉得,“哇!”,真的是让我非常惊讶——这些是人类共通的东西。 张小珺:当然他们今天不融资,如果他们开放融资的话,你会投吗? 朱啸虎:我肯定会投啊!我肯定会投!我觉得,这个东西真的是非常有意义。而且今天已经非常清晰了,就是这样一个类似安卓的开源生态,已经起来了。他势头这么猛的话,别人再追已经很难追了! 张小珺:你会愿意用什么条件投? 朱啸虎:我觉得……(思考3秒…)这个价格已经不太重要了,关键是参与在这里面。真的见证人类AGI产生,见证人类AI意识产生,这些东西都很有意义。 张小珺:(停顿2秒…)哇塞,你这个观点变化好大,去年还说大模型公司一个都不看。 朱啸虎:对,确实!(笑)这个让我很吃惊。至少在DeepSeek上,我看到了AGI实现的路径了,而且确实感觉到,至少是有一部分AI意识产生的可能性了。 张小珺:所以不管多少钱,你都愿意投? 朱啸虎:我觉得这些东西非常有价值。 张小珺:你最多愿意花多少钱? 朱啸虎:价格和你投的金额是相关的嘛。价格太高的话,那我放点钱就参与一下,对吧?(笑) 张小珺:就是不管多少钱都愿意参与? 朱啸虎:对,愿意参与。见证人类历史的一个改变,是非常有意思的。 张小珺:你研究了DeepSeek最近的技术报告和技术成果没有?在你看来关键突破是什么? 朱啸虎:核心是不再需要人类干预,本来是RLHF(人类反馈强化学习),现在直接做RL(强化学习)了,所以成本可以做得很低。它这种创新细节很多,很多方面加在一起,造成了今天成本这么低。 但最重要的就是不需要人工干预。人工干预就很难scale,很难迅速扩大。如果要靠机器,你只要给它一些初始的高质量数据,引导它在一个领域怎么思考,它就能自己往前走,这个scale起来相对容易很多。虽然你初始数据也很重要,也非常难,但至少比以前要容易很多——这一步是最重要的一步。 张小珺:在你看来今天的DeepSeek是追赶者还是创新者角色? 朱啸虎:它已经在很多领域有创新了。当然OpenAI也说,它复现了很多o1的核心思路和方法,也是有可能的——OpenAI是闭源的嘛,我们也不知道它到底是不是用这些方法。但它说DeepSeek至少已经成功自己独立复现这些技巧。 不管怎么样,基本上已经齐头并进了,对吧? 张小珺:某种程度上,DeepSeek有没有改变你对中国科技创新和技术进步的看法和认知?因为你过去一直是“现实主义代表”,你认为这更适合中国、更适合本土,今天你的看法有改观吗? 朱啸虎:我以前也一直认为中国的开源肯定能追上去。只要美国的OpenAI碰到壁垒往前走不动了,中国肯定能追上去!只是没想到这么快,而且成本这么低!效果这么好!——这个效果真的是让我惊艳的。 我还以为就是像OpenAI那样,冷冰冰像机器一样,但这次效果是非常惊艳的效果。 张小珺:你既然是“现实主义代表”,当看到中国出现像梁文锋这种代表技术理想主义、浪漫主义的人,并且获得胜利,你在想什么?——我想说的是“朱啸虎们”怎么看待“梁文锋们”? 朱啸虎:他也不是典型的创业者,他自己在幻方就非常有资金实力了,而且本身有很多卡。不是一个典型的创业公司。但确实——因为他本身的财力,允许他去追求一些理想,这是一个非常不一样的新一代的创业者。 张小珺:你有为想投进去做什么努力没有? 朱啸虎:我和他聊天啊,肯定希望能够有机会得到认可,让我们参与一点,对吧?(笑) 张小珺:有得到没有? 朱啸虎:这个还没聊得那么深,还没聊得那么深。(笑) 图片 “至少搜索肯定是被彻底取代了 ——这是毫无疑问的!” 张小珺:DeepSeek这段时间接到全球范围泼天的流量,这波迅猛用户增长究竟价值有多大? 朱啸虎:核心是留存,能不能留下来。它的用户体验做得非常好,留存度、活跃度都很好,肯定是有价值的。用户如果留不下来,那没有价值。但如果用户能留下来,就有非常大价值。 至少搜索肯定是被彻底取代了——这是毫无疑问的! 张小珺:搜索被彻底取代了? 朱啸虎:现在谁还真的去用搜索引擎啊?绝大部分问题都用ChatGPT或像DeepSeek这种聊天机器人搜索了。 张小珺:Google等搜索公司未来怎么办? 朱啸虎:这是个很好的问题。任何一个时代都是重复着同样的韵律——PC互联网时代,搜索是第一个出来的Killer App(杀手级应用),今天也一样,AI时代第一个出来的Killer App也是搜索。 人的需求是一样的,Killer App演化路径会很类似——非常有意思,真的是重复着很类似的韵律、节奏。当然商业模式需要另外思考。 张小珺:你之前一直认为个人助手这类产品是伪需求,今天变成一个真需求了? 朱啸虎:助手不一样。助手那个需求很难,搜索不是个人助手。今天OpenAI发布的Deep Research,它想做成个人助手,帮你制定休假计划、旅行计划。但那个,说实话用户体验要做好很难。Deep Research我还没体验,我可以再试试看。 那个需求很难做,而且真的需求要一个AI帮你做?我是不太相信的。我宁愿看别人的介绍或种草。 但对信息获取来说,以前为什么我觉得AGI很难,或者没有打动用户需求?是我需要非常精确的prompt,然后它回复你一段话,而且不是很长的一段话。这个用户体验上很难。 但今天我只要输入很简单的一个问题,它就给你回复一长串,甚至你可以再继续追问,它会根据你历史问题去猜意图,那用户体验就很好了——已经足够满足我获取信息的需求了。 张小珺:这个产品形态现在看起来还没有形成数据飞轮。 朱啸虎:数据飞轮有,但数据飞轮价值不大。 这也是我这两年最大一个教训,就是:以前我觉得这波AI最大壁垒在数据飞轮上,但现在看来包括DeepSeek、OpenAI,数据飞轮价值不大。因为大部分用户数据都是重复的,是低信息含量的,没有意义的,所以数据飞轮价值并不大。 真正有数据飞轮价值的是那些高质量数据,那些数据是需要各个行业专业人士去打标签、去发现的。 张小珺:就是说数据回流并不能够促进模型智能的进一步提升? 朱啸虎:对对。回流的大部分数据可能都是垃圾,没有额外信息含量。 张小珺:闲聊不产生智能。 朱啸虎:对,而且大部分人聊的东西可能都是一样的。 张小珺:那这个产品所构建的壁垒是什么呢?怎么构建壁垒进而形成商业化闭环? 朱啸虎:今天首先你得占领客户心智、用户心智。20天获取了2000万DAU,而且没有花任何广告投放,如果还能把用户留住,就是非常大的壁垒。 另外以后就是语料。每个团队组织的语料、预训练的数据可能都不太一样,反映了这个团队偏好——就像厨师,以后有几个米其林大厨,一个擅长川菜,有些擅长粤菜——它组织语料或参数权重有那么些差别,造成回复的答案就有差异性。 张小珺:怎么看待DeepSeek后续的发展? 朱啸虎:这个团队确实非常厉害,也很年轻,进步很大。但最终还是要回答一个问题:怎么商业化?因为他们开源很彻底,后面怎么商业化确实是个(问题)。 而且这个东西太新了,没有人考虑过或见过这样一种产品形态,怎么商业化是需要思考的问题。 张小珺:你有什么想法没有? 朱啸虎:这我也不知道。真的我也不知道。 另外就是怎么建立生态?怎么按照流量收费或者和运营厂商合作?都需要再进一步演化。 今天考虑这个问题还有点早。还要进一步再建立自己足够的领先优势,比如彻底追平OpenAI。以后我们再考虑这样一些商业化的问题。 张小珺:噢,就是今天商业化问题还没有解决,你已经愿意入局了——这和你去年形成了非常大的反差。 朱啸虎:对,这个生态我觉得已经看清了:一旦一个开源生态这么快速度建立,壁垒还是非常高的! 张小珺:你认为DeepSeek怎么解决卡被禁运这个困境? 朱啸虎:卡现在看来也不是很大问题啊,因为在推理上,我们国产卡也完全可以。 你看硅基流动,这几天,包括国内很多厂商都在用国内的卡帮他们上线DeepSeek。推理上国产卡完全可以用,不一定需要完全用英伟达的卡。

Podcast Editor
Podcast.json
Preview
Audio