模型角色与 LLM 访问权限

Whisperer 通过统一的 AI 网关使用多个专用模型——每种任务一个。这种方式让系统能够为每类请求选择最优模型:快速的聊天回复、代码生成、截图分析、系统设计或向量嵌入。

何时阅读本文

阅读本文以了解:

  • 底层运行的是哪些模型;
  • 各计划在模型访问方面有何差异;
  • 如何为你的需求选择合适的模型。

七种模型角色

角色 用途 模型示例
responses 会议中问题的聊天回答 Claude Sonnet/Haiku、GPT-4o mini、DeepSeek
coding 代码解释和代码片段生成 DeepSeek Coder、Claude Sonnet、GPT-4o
vision 截图和图像分析 Claude Sonnet(带视觉)、GPT-4o Vision
system_design 带 Mermaid 图表的结构化回答 Claude Opus、GPT-4o
generation 思维导图丰富化、节点生成 Claude Haiku、GPT-4o mini
transcription 语音识别(Whisper) Whisper
embedding 知识库笔记向量化(用于 RAG) 向量嵌入模型

按计划的访问权限

计划 可用角色 限制
Free responses(基础模型) 仅基础级别;每月 60 分钟
Start / Pro responses、coding、vision、system_design、generation 广泛的模型选择;无前沿模型
Max 所有角色 + 前沿模型 Claude Opus、旗舰 GPT、顶级 DeepSeek

前沿模型是各提供商最强大、最昂贵的模型(Claude Opus、GPT-4.1、DeepSeek R1 及同等产品)。仅在 Max 计划中可用

如何更改模型

  1. 打开客户端或网页控制台中的设置/app/settings)。
  2. 进入模型部分。
  3. 为每个角色从你所在计划可用的模型中选择一个。
  4. 保存——设置将在下一次会话中生效。

📸 [截图:设置界面,每个角色都有模型下拉选择框]

可用模型系列

以下提供商的模型可供选择:

  • Anthropic:Claude Opus、Sonnet、Haiku
  • OpenAI:GPT-4o、GPT-4o mini、GPT-4.1
  • DeepSeek:DeepSeek V3、Coder、R1
  • Alibaba:Qwen
  • Google:Gemini Flash、Pro
  • xAI:Grok
  • Meta:Llama 3

随着新模型的加入,可用模型集将持续更新。

常见错误

错误 原因 解决方法
模型无响应 所选模型暂时不可用 切换到同一角色的另一个模型
"前沿模型不可用" 你的计划不包含前沿模型 升级到 Max
回复意外过短 选择了上下文窗口较小的模型 切换到更强大的模型

最佳实践

  • 面试中需要快速提示时,使用 Haiku / GPT-4o mini——响应速度更快。
  • 系统设计选择 Claude Opus 或 GPT-4o——它们更擅长处理结构化图表。
  • 编写代码时,DeepSeek Coder 通常比同等规模的其他模型更准确。
  • 配备前沿模型的 Max 计划在需要最强推理能力的非标准场景中尤为有价值。

相关文章