从架构角度认识 AI：为架构师解读机器学习与生成增强技术

2 years ago

欢迎收听我们的最新一期播客，我们将深入探讨从架构角度如何理解人工智能，特别是机器学习和生成增强技术。我们的嘉宾将帮助你理解这些技术的核心概念，并提供实用的建议，让你在工作中更好地应用它们。

脚本

thomas

欢迎收听 InfoQ 播客，我是 Thomas Betts。今天我们非常荣幸地邀请到了 AI 专家 Anthony Alford。Anthony 也是 Generally AI 播客的主持人，今天我们来聊聊从架构角度如何理解人工智能，特别是机器学习和生成增强技术。Anthony，欢迎你！

anthony

谢谢 Thomas，很高兴来到这里。希望今天的讨论能帮助大家更好地理解这些复杂的概念。

thomas

首先，我们来定义一下 AI 是什么。很多人提到 AI 时，实际上指的是生成式 AI，这是最常见的实现方式。但 AI 究竟是什么，你能否给我们一个更具体的定义？

anthony

好的，当我们谈论 AI 时，通常指的是机器学习。机器学习是一种通过算法和统计模型让计算机从数据中学习的技术。特别是现在大多数人所说的机器学习是指深度学习，也就是神经网络。这些模型早在 20 世纪 50 年代就已经出现了，所以它们经过了广泛的研究和发展。

thomas

明白了，那么当我们说要在系统中加入 AI 时，实际上是在说加入机器学习模型。这些模型是如何工作的？它们的输入和输出是什么？

anthony

机器学习模型实际上就是一个函数，它可以接受输入并提供输出。你可以把它想象成调用一个外部库函数。输入可能是一张图片、一个播客音频，而输出可能是一段文字、一个摘要或图像的标签。这些输入和输出最终都会被转化为数学上的向量，即多维数组。

thomas

明白了，那么如何构建这些模型呢？训练过程是怎样的？

anthony

训练过程通常包括两个阶段：训练和推理。在训练阶段，你需要一个大的单元测试套件，即一系列的输入和预期输出。模型从一个随机的函数开始，通过不断调整参数来最小化实际输出与预期输出之间的差异。这个过程通常使用梯度下降等优化算法来完成。一旦训练完成，你就可以在推理阶段使用模型，提供输入并获得输出。

thomas

生成式 AI 是一个非常热门的话题，尤其是像 ChatGPT 这样的语言模型。这些模型是如何工作的？它们是如何生成文本的？

anthony

生成式 AI 模型，特别是语言模型，通常使用自回归方法。这意味着模型会根据前一个单词预测下一个单词。例如，如果输入是 'Once upon a'，模型会预测下一个单词是 'time'。这个过程会不断重复，直到生成完整的句子。模型通过大量的文本数据进行训练，使用交叉熵损失等方法来优化预测的准确性。

thomas

那么，语言模型的训练过程是怎样的？它们需要多大的数据集和计算资源？

anthony

训练语言模型通常需要大量的文本数据，这些数据可能来自互联网、书籍或其他来源。模型的参数数量也非常庞大，例如，GPT-3 有 1750 亿个参数，而 GPT-4 的参数数量可能更多。训练这些模型需要大量的计算资源，通常在高性能的 GPU 集群上进行，需要消耗大量的电力。

thomas

了解了，那么对于架构师来说，如何在产品中使用这些大语言模型（LLM）呢？有哪些最佳实践？

anthony

首先，你需要定义一个成功的标准，明确你希望模型解决的业务问题。你可以选择使用商业 API，如 ChatGPT，这通常是最简单的方法。但长期来看，成本和隐私问题可能需要考虑。另一种方法是使用开源模型，如 Hugging Face 提供的模型，你可以在自己的云环境中运行这些模型，以更好地控制数据和成本。

thomas

那么，如何评估这些模型的性能？有哪些指标可以用来比较不同的模型？

anthony

评估 LLM 的性能通常比传统机器学习模型更复杂，因为输出是非确定性的。一个常见的方法是让人类评委对模型的输出进行评分，例如，比较两个模型在相同任务上的表现。此外，还可以使用一些自动评估指标，如 BLEU 分数，但这些指标可能无法完全反映模型的实用性和准确性。

thomas

最后一个话题，我们来谈谈检索增强生成（RAG）技术。RAG 是如何工作的？为什么它能提高 LLM 的性能？

anthony

RAG 是一种将检索技术与生成式模型结合的方法。它通过从文档数据库中检索相关信息，并将这些信息作为上下文提供给 LLM，从而提高模型的准确性和相关性。例如，如果你有一个知识库，RAG 可以从知识库中找到与问题最相关的文档片段，并将这些片段提供给 LLM，帮助它生成更准确的回答。

thomas

非常感谢 Anthony 的精彩分享。今天的讨论帮助我们更好地理解了 AI 和机器学习的核心概念，以及如何在实际工作中应用这些技术。希望听众朋友们也能从中受益。

anthony

谢谢 Thomas，也感谢大家的聆听。希望这些内容对大家有所帮助。

参与者

thomas

InfoQ 主持人

anthony

AI 专家及 Generally AI 播客主持人

主题

AI 的定义
机器学习模型的输入输出
构建和训练机器学习模型
生成式 AI 的工作原理
语言模型的训练过程
模型的大小和效率
如何在产品中使用 LLM
自托管开源 LLM
LLM 的比较和评估
检索增强生成（RAG）技术