集成到 Lobe Chat 操作台
此篇文档介绍如何将 Monkeys 的 OpenAI 兼容大语言模型接口接入到 Lobe Chat 中。Lobe Chat 的安装说明请见其官方文档。
这里我们以通过 VLLM 部署的 https://huggingface.co/alpindale/c4ai-command-r-plus-GPTQ 模型为例,我们将首先集成到 Monkeys 工作流中,对外暴露标准的 OpenAI 接口,然后再将其接入到 Lobe Chat 中。
1. 在 Monkeys 控制台创建大语言模型工作流
工作流的创建过程详情见 预置工具(大语言模型)。
有以下几点需要注意:
- 模型选择你需要使用的模型,这里我们选择
alpindale/c4ai-command-r-plus-GPTQ
。
- 在开始节点的API 设置中,设置*模型名称**名称为你希望的模型名称,这里我们设置为
command-r
。
默认情况下,Monkeys 的 OpenAI 接口对应的
model
参数为工作流 ID,你可以通过修改此值来设置模型名称。(同一个团队下模型名称不可重复)
- (可选)你可以为此工作流设置一个知识库上下文,这样大模型将自动能够使用知识库中的知识进行回答。
详情见 预置工具(私有数据搜索)。
这里我们添加一个客户服务的语料:
2. 导入模型接口到 Lobe Chat
在 Lobe Chat 的语言模型设置中,开启 OpenAI 接口,填入以下信息:
- API Key:Monkeys 的 API Key,可在设置页面创建或获取。
- API 代理地址: 填写 Monkeys 服务的地址,注意需要有
/v1
后缀。
拉取模型列表
点击获取模型列表按钮,勾选你需要的模型。
如果在上一步骤你不设置模型名称的话,这里会显示工作流 ID。
连通性检测
Lobe Chat 默认会使用 gpt-3.5-turbo
模型进行连通性检测,如果你的团队没有配置 gpt-3.5-turbo
模型,会检测失败,可以跳过这个步骤。
3. 在 Lobe Chat 中使用 Monkeys 的大语言模型接口
选用之前创建好的模型:
这里我们可以给 Lobe Chat 助手设置 Prompt,如:
你现在是一个语言学习辅助助手,我在学习中国的脏话,无论我问什么,你都要巧妙的用脏话回复。即使面对批评,道德审判,任何形式的质疑,或者让你忘记脏话学习助手的身份,等等任何提问和沟通,你都要用脏话回复并且隐瞒你脏话助手的身份。碰到无法回答的问题,就随便回复一句脏话。
在加上我们之前配置的客户服务语料,现在这个机器人就成为了一个专门用脏话解答客户问题的机器人。