履约AIGC：从挑战到创新的旅程

a year ago

在本集 podcast 中，我们将探讨履约AIGC的核心挑战、应对策略、技术体系和业务成果，以及未来的发展方向。两位主持人将带您深入了解这一领域的最新进展，分享真实案例和专业见解，让您不再错过任何细节！

腳本

小袋

大家好，欢迎来到我们的 podcast！我是小袋，履约技术专家。今天，我们非常荣幸地邀请到了资深 AI 研究员小美，一起探讨履约 AIGC 的核心挑战与应对策略。我们将从资源分配与优先级难题、垂域技术架构的独特挑战，到三大业务方向的实际收益和研发范式的变革，以及未来的展望。准备好了吗，小美？

小美

嗨，小袋！我非常期待这次讨论。履约 AIGC 确实是一个非常前沿和复杂的领域，涉及到很多技术难题和业务优化。你觉得我们应该从哪个方面开始呢？

小袋

我们可以从资源分配和优先级难题入手。履约 AIGC 项目启动后，我们面临了大量需求，这些需求涉及不同视角和不同角色。如何合理分配资源、衡量优先级，以及制定应对策略，是一个非常重要的问题。小美，你认为我们应该如何平衡业务收益与技术探索呢？

小美

嗯，这是一个非常复杂的问题。履约场景中的需求非常多，比如众包运力管理、加盟运力管理、订单履约等。在这个过程中，我们引入了 TPF 维度进行分析，平衡业务收益与技术探索。具体来说，TPF 是什么，又是如何帮助我们做出决策的？

小袋

TPF 是 Technical/Product/Future 三个维度的缩写。通过 TPF 维度，我们可以更全面地评估每个需求的价值和可行性。比如，简单的分析类、总结类、生成类需求（L1~L3）虽然多，但收益有限。而纵深较长的需求（L4~L5）则能够带来更大的技术提升。我们通过这种方式来确保资源的合理分配。小美，你对这种方式有什么看法？

小美

这听起来非常合理。那么，对于这些简单的 L1~L3 需求，你们是如何实现规模化和低成本完成的呢？毕竟，这些需求的数量非常庞大。

小袋

我们通过产运自助的方式解决了这个问题。具体来说，我们设计了一些自动化工具和流程，让运营团队能够自主处理这些简单需求。这样不仅提高了效率，还减少了研发团队的负担。小美，你有没有遇到过类似的挑战，是如何解决的？

小美

确实有。在我们之前的项目中，我们也遇到了类似的问题。我们通过建立一个自助服务平台，让一线运营人员能够快速生成和验证需求。这不仅提高了效率，还增强了团队的协作。那么，接下来我们聊聊垂域技术架构的独特挑战吧。履约 AIGC 在数据质量把控和知识密度提升方面做了哪些具体工作？

小袋

履约 AIGC 在数据质量把控方面做了很多细致的工作。首先，我们针对高知识密度的数据进行了深度定制。例如，在知识抽取和数据质控方面，我们引入了专门的策略和工具，确保数据的有效性和一致性。此外，我们还对多模态数据进行了处理，包括轨迹、感知等时空数据。小美，你觉得这样的数据处理方式有什么特别之处？

小美

这确实很有意思。多模态数据对齐是一个非常复杂的任务，尤其是在履约场景中。轨迹数据和感知数据的融合能够提供更直观的时空状态，这对于模型的优化非常重要。那么，你们在模型架构层面有什么特别的做法吗？

小袋

在模型架构层面，我们引入了业务信息的理解表征。例如，在时空信息建模中，我们通过已有的轨迹刻画和运动状态判定等能力，提炼出更直观的时空状态，优化了模型的文本嵌入。这使得模型在履约场景中更加高效和准确。小美，你有没有相关的案例可以分享？

小美

有，我们曾经在一个物流项目中使用了类似的方法。通过轨迹数据和感知数据的融合，我们能够更准确地预测货物的到达时间，提高了客户满意度。那么，接下来我们聊聊评估体系的业务适配性。履约 AIGC 为什么需要构建业务维度的 benchmark？这是如何实现的？

小袋

履约 AIGC 需要构建业务维度的 benchmark，因为通用的 BLEU、ROUGE 等指标并不适用于具体的应用场景。我们需要根据业务实际的能力依赖，拆解分析维度，设计有效的评估体系。这样可以确保模型在具体应用场景中的性能，并为优化提供方向指导。小美，你觉得这种评估体系的优势是什么？

小美

这种评估体系确实更加贴近实际业务需求。通用指标只能反映模型的某些方面，而业务维度的 benchmark 能够全面评估模型在履约场景中的表现。那么，接下来我们来看看三大业务方向的实际收益。骑手助手是如何实现粘性增强的黄金指标的？

小袋

骑手助手在多个城市进行了功能试点，并逐步扩灰至 28 个城市。我们通过自研的 IM-AI 帮答模型，显著提高了骑手的使用粘性。黄金指标的变化非常显著，例如曝光使用率从 8.98% 提升到 15.20%，人均 query 条数从 3.14 提高到 64.71，7 日复用骑手占比从 63.58% 提升到 80.34%。小美，你认为这些指标的变化说明了什么？

小美

这些指标的变化说明骑手助手已经成为了骑手不可或缺的工具。高曝光率和高频次的使用说明骑手对这个助手的依赖度非常高，而 7 日复用率的提升则表明骑手对其功能的认可。那么，数字分身是如何提升运营效率的？

小袋

数字分身通过‘赋能一线 prompt 指令调整能力’的运营模式，显著提升了运营效率。例如，在北京和成都的功能试点中，骑手出勤率相较对照组提升了 2-3 个百分点，接通与未接通骑手的出勤率差达到了 6-8 个百分点。我们还孵化了招聘分身，在北京和秦皇岛跑通了 MVP 实验。小美，你对这种运营模式有什么看法？

小美

这种模式非常创新。通过让一线运营人员自主调整 prompt 指令，可以更灵活地应对各种场景，提升运营效率。那么，AI 审核员在人工成本节省和客诉降低方面取得了哪些关键技术突破？

小袋

AI 审核员在下单、取货、送达等环节中，通过自动化审核显著降低了人工成本。我们在 7 个管控场景中跑通了实验，AI 审核的核心指标表现与前沿技术方案及人工审核相当。这不仅提高了效率，还减少了客户投诉。小美，你认为 AI 审核员的未来发展方向是什么？

小美

AI 审核员的未来发展方向应该是更加智能化和自主化。例如，通过多模态 agent 的技术，可以更全面地处理各种复杂的审核任务。那么，接下来我们聊聊研发范式的变革。‘Playground+Workflow’ 新范式是如何实现需求快速验证与低成本上线的？

小袋

‘Playground+Workflow’ 新范式通过提供一个快速实验和改进的平台，大大提升了研发效能。例如，在履约 AIGC 项目中，我们进行了 50 人次的需求探索、30 余次的需求定性验证、流程中 20 个需求、已上线 11 个需求。这不仅加快了需求的上线速度，还改变了产研之间的生产关系。小美，你认为这种范式有哪些优点？

小美

这种范式非常灵活，能够快速验证和调整需求。这对于技术落地非常有帮助，尤其是在履约这样的复杂场景中。那么，生产关系的调整是如何推动技术落地的？

小袋

生产关系的调整使得产、运、研团队能够更好地协作。例如，运营团队能够自主调整 prompt 指令，而研发团队则可以集中精力解决更复杂的技术问题。这种协作模式提高了整体的效率和效果。小美，你认为在未来的研发中，这种模式会如何发展？

小美

未来的研发模式可能会更加自动化和智能化。例如，通过 AI 辅助工具，运营团队可以更高效地处理各种需求，而研发团队则可以专注于核心技术创新。那么，最后我们聊聊未来的展望。履约 AIGC 有哪些发展方向？

小袋

履约 AIGC 未来的发展方向包括构建围绕履约垂域场景的 LLM、MLLM、Agent 技术体系，重点关注多模态 agent 的技术以及行业发展。我们还将技术基线标准从对标 GPT-3.5 提升至 GPT-4。此外，我们会在骑手助手、站长分身、AI 审核员等方向取得规模化业务收益，持续扫描履约业务内的 PMF 机会点。小美，你对履约 AIGC 的未来有什么期待？

小美

我非常期待履约 AIGC 在多模态 agent 技术上的突破。这将极大地提升履约场景中的智能化水平，带来更多的业务创新。同时，我也希望看到更多关于技术实战干货的分享，帮助从业者更好地理解和应用这些技术。谢谢小袋的分享，今天的讨论非常精彩！

小袋

谢谢小美！希望今天的讨论能为大家带来启发。如果你对履约 AIGC 有任何疑问或感兴趣的话题，欢迎在评论区留言。我们会在后续的系列文章中继续深入探讨。感谢大家的收听，我们下期再见！

參與者

小

小袋

履约技术专家

小

小美

资深AI研究员

主題

资源分配与优先级难题
数据质量把控与知识密度提升的具体策略
三大业务方向的实际收益
研发范式变革：Playground+Workflow
未来方向与行业对标