Manus引爆智能体复现潮！DeepSeek已被整合，项目挤满开源榜，海外大V排队求码

a year ago

failed

在本次播客中，我们将深入探讨Manus的技术原理与能力优势，以及它如何在智能体赛道上掀起了一股开源复现的热潮。从商业闭源产品到开源社区的积极响应，我们将揭秘Manus的幕后故事及其对整个AI行业的深远影响。

Scripts

speaker1

欢迎各位听众，这里是科技前沿播客，我是你们的主持人，今天我们非常荣幸地邀请到了AI领域的一位知名专家。我们将深入探讨Manus这个令人震惊的智能体项目，以及它如何在智能体赛道上引发了一股开源复现的热潮。大家准备好了吗？

speaker2

哇，听上去真的很有趣！Manus到底是什么？它为什么这么火呢？

speaker1

Manus是由一家名为‘蝴蝶效应’的公司开发的智能体系统。它不仅开源了代码，还在发布的当天就有很多团队开始复现。Manus的独特之处在于它的多智能体协作框架，可以执行复杂的任务序列，使用多种工具，具备广泛的世界知识。这种能力让它在许多实际应用中表现出色。

speaker2

多智能体协作框架听起来很高大上，你能详细解释一下吗？比如说，它是怎么工作的？

speaker1

当然可以。多智能体协作框架就像是一个协同工作的团队，每个智能体都有自己的特定任务和能力。比如一个智能体负责信息检索，另一个负责数据分析，还有一个负责文本生成。这些智能体通过高效的通信机制相互协作，共同完成一个复杂的任务。这种模式大大提升了系统的灵活性和处理复杂任务的能力。

speaker2

那么，这些复现项目具体有哪些呢？你能给我们举个例子吗？

speaker1

目前进度最快的两个复现项目是OpenManus和OWL。其中，OWL项目已经将DeepSeek模型整合到多智能体协作框架中，这使得OWL在智能体测试基准GAIA的验证集上排名第三，在开源项目中排名第一。它的Level 1分数81.13，甚至超过了OpenAI的Deep Research。

speaker2

哇，这个分数真的很厉害！不过，听说Manus的能力优势不仅仅体现在分数上，对吗？

speaker1

没错。Manus的能力优势主要体现在它的自主性和工具使用能力上。它可以灵活应对各种复杂任务，比如编写个人主页、制作飞行游戏，甚至帮助用户寻找租房信息。这些任务不仅需要多步骤的逻辑推理，还需要调用多种工具，Manus都能处理得游刃有余。

speaker2

这听起来真的很强大！那么，开源社区对Manus的响应如何？

speaker1

开源社区对Manus的响应非常热烈。从GitHub热榜上可以看到，大多是Agent相关的项目和工具库。老牌Agent项目MetaGPT和AutoGPT都被顶到了前排。这说明Manus不仅吸引了大量开发者，还激发了整个社区的创造力。

speaker2

嗯，那么商业闭源产品又是如何应对这股热潮的呢？

speaker1

商业闭源产品也在积极应对。比如h2oGPTe Agent和Trase Agent这两个系统，它们在GAIA测试集的Level 2分数上已经与Manus公布的分数非常接近。这些商业产品通常有更强大的资源支持，但Manus的开源模式让它在灵活性和社区支持方面具有明显优势。

speaker2

海外大V们对Manus的评价如何？他们是否也对这个项目非常感兴趣？

speaker1

海外大V们对Manus的评价非常高。Manus联合创始人季逸超与抱抱脸CEO取得联系，公开分享了100个邀请码。这些码几乎瞬间被抢光了。很多用户试用后表示Manus的信息收集和处理能力非常出色，甚至有人用它来编写和部署个人主页，完全准确且最新。

speaker2

这真是令人印象深刻！不过，Manus的实际应用案例除了编写个人主页和制作飞行游戏，还有哪些呢？

speaker1

Manus的实际应用非常广泛。比如，有人用它来帮助寻找租房信息，整个过程只花了不到10分钟。还有人用它来编写复杂的编程任务，比如制作一个JavaScript的飞行游戏。这些应用不仅展示了Manus的强大能力，还证明了它在实际场景中的实用价值。

speaker2

听你这么一说，GAIA基准测试的重要性就更加凸显了。你能详细介绍一下GAIA基准测试吗？

speaker1

GAIA基准测试是由Meta AI、HuggingFace和AutoGPT团队联合推出的，旨在评估智能体系统的工具使用能力和自主性。测试分为三个难度级别，Level 1通常是不超过5步的简单任务，Level 2需要5-10步的复杂任务，而Level 3则要求AI能够执行任意长度的复杂动作序列，具备广泛的世界知识。

speaker2

那么，Manus在GAIA测试中的表现如何？

speaker1

Manus在GAIA测试中的表现非常出色。它的Level 3分数为57.7%，远超其他开源项目。这说明Manus不仅在基础能力上表现出色，还具备强大的自主性和工具使用能力。GAIA测试已经成为智能体类产品必争之地，很多团队都在努力提高自己的分数。

speaker2

Manus的未来展望是怎样的？它会继续引领智能体赛道的发展吗？

speaker1

Manus的未来非常值得期待。随着更多开发者和团队的加入，它的能力和应用场景将会不断扩展。此外，GAIA基准测试的推广也将进一步推动智能体技术的发展。我们可能会看到更多像Manus这样的智能体系统出现，甚至可以期待一下AgentArena智能体竞技场。Manus通过开源模式，已经为整个行业树立了一个新的标杆。

Participants

speaker1

AI专家/主持人

speaker2

联合主持人

Topics

Manus的技术原理
Manus的复现项目
Manus的能力优势
开源社区的响应
商业闭源产品的竞争
海外大V的评价与反馈
Manus的实际应用案例
GAIA基准测试的重要性
Manus与GAIA测试的关系
Manus的未来展望