模型角色与 LLM 访问权限
Whisperer 通过统一的 AI 网关使用多个专用模型——每种任务一个。这种方式让系统能够为每类请求选择最优模型:快速的聊天回复、代码生成、截图分析、系统设计或向量嵌入。
何时阅读本文
阅读本文以了解:
- 底层运行的是哪些模型;
- 各计划在模型访问方面有何差异;
- 如何为你的需求选择合适的模型。
七种模型角色
| 角色 | 用途 | 模型示例 |
|---|---|---|
| responses | 会议中问题的聊天回答 | Claude Sonnet/Haiku、GPT-4o mini、DeepSeek |
| coding | 代码解释和代码片段生成 | DeepSeek Coder、Claude Sonnet、GPT-4o |
| vision | 截图和图像分析 | Claude Sonnet(带视觉)、GPT-4o Vision |
| system_design | 带 Mermaid 图表的结构化回答 | Claude Opus、GPT-4o |
| generation | 思维导图丰富化、节点生成 | Claude Haiku、GPT-4o mini |
| transcription | 语音识别(Whisper) | Whisper |
| embedding | 知识库笔记向量化(用于 RAG) | 向量嵌入模型 |
按计划的访问权限
| 计划 | 可用角色 | 限制 |
|---|---|---|
| Free | responses(基础模型) | 仅基础级别;每月 60 分钟 |
| Start / Pro | responses、coding、vision、system_design、generation | 广泛的模型选择;无前沿模型 |
| Max | 所有角色 + 前沿模型 | Claude Opus、旗舰 GPT、顶级 DeepSeek |
前沿模型是各提供商最强大、最昂贵的模型(Claude Opus、GPT-4.1、DeepSeek R1 及同等产品)。仅在 Max 计划中可用。
如何更改模型
- 打开客户端或网页控制台中的设置(
/app/settings)。 - 进入模型部分。
- 为每个角色从你所在计划可用的模型中选择一个。
- 保存——设置将在下一次会话中生效。
📸 [截图:设置界面,每个角色都有模型下拉选择框]
可用模型系列
以下提供商的模型可供选择:
- Anthropic:Claude Opus、Sonnet、Haiku
- OpenAI:GPT-4o、GPT-4o mini、GPT-4.1
- DeepSeek:DeepSeek V3、Coder、R1
- Alibaba:Qwen
- Google:Gemini Flash、Pro
- xAI:Grok
- Meta:Llama 3
随着新模型的加入,可用模型集将持续更新。
常见错误
| 错误 | 原因 | 解决方法 |
|---|---|---|
| 模型无响应 | 所选模型暂时不可用 | 切换到同一角色的另一个模型 |
| "前沿模型不可用" | 你的计划不包含前沿模型 | 升级到 Max |
| 回复意外过短 | 选择了上下文窗口较小的模型 | 切换到更强大的模型 |
最佳实践
- 面试中需要快速提示时,使用 Haiku / GPT-4o mini——响应速度更快。
- 系统设计选择 Claude Opus 或 GPT-4o——它们更擅长处理结构化图表。
- 编写代码时,DeepSeek Coder 通常比同等规模的其他模型更准确。
- 配备前沿模型的 Max 计划在需要最强推理能力的非标准场景中尤为有价值。