大模型的商业化落地挑战
大约 3 分钟
大模型的商业化落地挑战
- 现阶段快速实现商业化落地的方案:RAG
- 大模型的商业化落地挑战
- 生成与检索
- 场景:智能客服系统的实现思路
1. 现阶段快速实现商业化落地的方案:RAG
- RAG(Retrieval-Augmented Generation, 检索增强生成)
- RAG是现阶段快速实现商业化落地的方案
- 因为可以将原先的业务数据快速迁移到大模型领域
2. 大模型的商业化落地挑战
2.1. 效果
- B端和C端的要求不太一样
- B端:企业落地需要很高的要求
- C端:要求低一点,有高的容错性,用户可以买单
2.2. 可控生成(Controllable Generation)
- 大模型通过生成来实现,有一定自由度,那生成的内容就不可能完全是我们想要的
- 给大模型一些限制,让它按照预期的情况生成内容
2.3. 隐私
- 通过刻意引导,大模型如gpt4也可能把用户的一些隐私信息给套出来
2.4. 幻觉,"hallucination", /həˈluː.sɪ.neɪt/
- 一本正经的胡说八道
- 编造听起来合理但实际上不正确的内容
- 产生虚构信息,比如无效URL或不存在的数字
- 如何减少幻觉
- 要求模型首先从文本中找到任何相关的引用,然后使用这些引用来回答问题,并可以追溯答案到原文档,这种方式通常可以减少幻觉
- 问题:如果只根据给定的上下文来回复,是否能彻底解决模型的幻觉问题
- 不可能彻底解决,但可以大大地降低幻觉
- 不能彻底解决地原因
- 检索准确率
- LLM理解能力
- 问题复杂度
3. 生成与检索
3.1. 生成
- 优点:内容的多样性、创造性
- 缺点:
- 存在不可控性
- 不了解在训练数据之外的知识(eg.最近发生的事件;专有的信息内容)
3.2. 检索
- 优点:
- 可控
- 补充更多专有或最近最新的知识内容
- 缺点:内容的边界具有局限性
3.3. 生成与检索的结合:RAG
- RAG,其名称就是“检索增强生成”,通过检索来增强生成的能力
- 将生成和检索两者的优点结合在了一起
4. 场景:智能客服系统的实现思路
4.1. 基于检索的思路
- 1.构造常见问答对集<Q,A>(FAQ,Frequently Asked Question)
- 2.根据用户问题Query,检索相关的Question
- 3.给出相关Question的Answer作为结果
特点:
- 需要构造问答对集
- Answer是确定可靠的
4.2. 基于生成的思路
- 1.构造问答对集<Q,A>
- 2.用问答对集进行模型训练
- 3.用户提出问题Query,由Model生成结果
特点:
- 需要构造问答对集
- 结果是模型生成的,不太可靠和可控
4.3. 基于检索与生成的思路
- 1.搭建知识库(不用组织成问答对形式)
- 2.用户提出问题Query
- 3.先从知识库中检索相关内容信息作为候选Candidate
- 4.将Query作为Input,将Candidate作为Context,还有历史消息History,由Prompt组织到一起
- 5.将Prompt传给LLM,由LLM给出结果
特点:
- 不需要将数据组织成问答对形式
- LLM生成的内容参考了知识库中检索出的相关信息,更可靠