Роли моделей и доступ к LLM

Whisperer использует несколько специализированных моделей через единый AI-шлюз — по одной на каждую задачу. Такой подход позволяет выбирать оптимальную модель для каждого типа запроса: быстрый чат-ответ, генерация кода, разбор скриншота, System Design или векторизация.

Когда использовать

Читайте эту статью, чтобы понять:

  • какие модели работают «под капотом»;
  • чем отличаются тарифы с точки зрения доступа к моделям;
  • как выбрать модель под свои задачи.

Семь ролей моделей

Роль Назначение Модели (примеры)
responses Чат-ответы на вопросы во время встречи Claude Sonnet/Haiku, GPT-4o mini, DeepSeek
coding Объяснение кода, генерация сниппетов DeepSeek Coder, Claude Sonnet, GPT-4o
vision Разбор скриншотов и изображений Claude Sonnet с vision, GPT-4o Vision
system_design Структурированный ответ с диаграммами Mermaid Claude Opus, GPT-4o
generation Обогащение mind-map, генерация узлов Claude Haiku, GPT-4o mini
transcription Распознавание речи (Whisper) Whisper
embedding Векторизация заметок базы знаний для RAG модель эмбеддингов

Доступ по тарифам

Тариф Доступные роли Ограничения
Free responses (базовые модели) Только базовый уровень; 60 мин/мес
Start / Pro responses, coding, vision, system_design, generation Широкий набор моделей; без frontier
Max Все роли + frontier-модели Claude Opus, флагманский GPT, топовый DeepSeek

Frontier-модели — самые мощные и дорогие модели каждого провайдера (Claude Opus, GPT-4.1, DeepSeek R1 и аналоги). Доступны исключительно на тарифах Max.

Как сменить модель

  1. Откройте Настройки в клиенте или веб-кабинете (/app/settings).
  2. Перейдите в раздел Модели.
  3. Для каждой роли выберите модель из доступного вам набора.
  4. Сохраните — настройки применяются к следующей сессии.

📸 [Скриншот: экран настроек с выпадающими списками моделей по ролям]

Доступные семейства моделей

Доступны модели следующих провайдеров:

  • Anthropic: Claude Opus, Sonnet, Haiku
  • OpenAI: GPT-4o, GPT-4o mini, GPT-4.1
  • DeepSeek: DeepSeek V3, Coder, R1
  • Alibaba: Qwen
  • Google: Gemini Flash, Pro
  • xAI: Grok
  • Meta: Llama 3

Набор доступных моделей обновляется по мере добавления новинок.

Частые ошибки

Ошибка Причина Решение
Модель не отвечает Выбранная модель временно недоступна Переключите на другую модель той же роли
«Frontier модель недоступна» Ваш тариф не включает frontier Перейдите на Max
Ответ неожиданно короткий Выбрана модель с малым context window Переключите на более мощную модель

Лучшие практики

  • Для быстрых подсказок на собеседовании используйте Haiku/GPT-4o mini — ответ приходит быстрее.
  • Для System Design выбирайте Claude Opus или GPT-4o — они лучше работают со структурированными схемами.
  • Для кода DeepSeek Coder часто точнее других моделей сравнимого размера.
  • Max-тариф с frontier особенно ценен для нестандартных ситуаций, требующих максимального рассуждения.

Связанные статьи