Leo
大家好,欢迎收听本期播客。今天我们非常荣幸邀请到了知乎技术中台智能算法部AI组的王难研究员,来和我们一起探讨一个非常有趣且前沿的话题——基于大模型的海量标签多分类方法。王难,欢迎你!
王难
谢谢Leo,很高兴来到这里和大家分享我们的研究成果。
Leo
王难,我们都知道,传统的标签分类方法在处理海量标签时会遇到很多挑战。你能先给我们简单介绍一下这些挑战吗?
王难
当然可以。传统方法主要面临几个问题:首先是训练周期长,因为标签数量庞大,需要大量的标注样本,导致训练时间很长。其次是模型的泛化性能差,特别是对于那些标注样本较少的标签,模型的准确率较低。此外,标签体系的迭代周期也很长,每次新增标签都需要重新标注和训练,效率很低。
Leo
听起来确实有很多挑战。那么,大模型是如何帮助我们解决这些问题的呢?
王难
大模型的出现为我们提供了新的解决方案。首先,大模型具有更强的语义理解能力,能够更好地捕捉文本的深层含义。其次,通过结合检索技术,我们可以将分类问题转化为检索问题,从而更高效地从海量标签中召回相关标签。最后,通过Prompt工程技术,我们可以进一步优化大模型的输出,确保标签的准确性。
Leo
这听起来非常有趣。你能详细介绍一下检索模型与大模型的结合策略吗?
王难
当然可以。我们的方法首先使用预训练的语义检索模型,在标注好的数据集上进行微调,使得文本和标签能够对齐。然后,我们使用微调后的检索模型从海量标签中召回与文本相关的候选标签。最后,我们将文本和候选标签作为知海图AI大模型的输入,通过Prompt工程技术对大模型进行微调,筛选出正确的标签。
Leo
主持人
王难
知乎技术中台智能算法部AI组研究员