Не слышно собеседника или микрофон
Короткое описание
Whisperer слушает созвон из двух источников: ваш голос — через микрофон, голос собеседника — через системный звук. В стенограмме они помечаются как [Я] и [Собеседник]. На macOS системный звук идёт через разрешение «Запись экрана»; на Windows — через системный звук с устройства вывода по умолчанию (разрешение не нужно — см. Разрешения на Windows). Если одна из ролей пропадает или транскрипция «молчит», проблема почти всегда в разрешениях, выборе источника/устройства или настройках сессии.
Эта статья — пошаговый чеклист диагностики: от самого частого случая (нет собеседника = нет «Записи экрана») до настроек шумоподавления и языка транскрипции.
Когда использовать
- В стенограмме есть только
[Я]— собеседника не слышно. - В стенограмме есть только
[Собеседник]— не пишется ваш голос. - Транскрипция пустая или «обрывочная», хотя звук в созвоне идёт.
- Текст распознаётся не на том языке (искажённые слова).
Пошаговая инструкция (чеклист диагностики)
- Нет собеседника? На macOS это причина №1 — проверьте «Запись экрана»: System Settings → Privacy & Security → Screen Recording → тумблер напротив Whisperer включён, затем перезапустите приложение (без записи экрана системный звук недоступен). На Windows разрешение для этого не нужно — проверьте, что устройством вывода по умолчанию выбрано то, через которое реально звучит созвон: захват системного звука работает только с устройства по умолчанию. Подробнее — Разрешения на Windows.
- Нет вашего голоса? Проверьте «Микрофон». System Settings → Privacy & Security → Microphone → тумблер напротив Whisperer включён.
- Посмотрите на waveform-индикатор. В CommandBar оверлея есть индикатор громкости/waveform. Говорите — он должен реагировать на ваш голос; когда говорит собеседник, движение тоже должно быть. Нет реакции на одну из сторон — значит, не идёт соответствующий источник (см. шаги 1–2).
- Проверьте, что сессия запущена и не на паузе. В CommandBar кнопка play/pause должна быть в режиме записи. На паузе аудио не захватывается.
- Проверьте устройство ввода. Если у вас несколько микрофонов (встроенный, гарнитура, веб-камера), убедитесь, что в системе и в созвоне выбран рабочий микрофон. Сильно зашумлённый или выключенный микрофон даст пустую дорожку
[Я]. - Проверьте шумоподавление. В настройках оверлея есть шумоподавление. Если речь тихая и «съедается», попробуйте его ослабить/выключить; если фон сильно шумит — наоборот, включить.
- Проверьте язык транскрипции. Язык задаётся для сессии (по умолчанию
ru). Если созвон на другом языке, а распознаётся как русский — слова будут искажены. Задайте правильный язык транскрипции (Whisper мультиязычный) и начните сессию заново. - Перезапустите сессию/приложение. Если что-то «подвисло» после смены разрешений или устройства — завершите сессию, перезапустите Whisperer и начните заново.
Скриншоты
📸 [Скриншот: стенограмма только с
[Я]без[Собеседник]— типичный признак отсутствия «Записи экрана»]
📸 [Скриншот: waveform-индикатор в CommandBar при активной речи]
📸 [Скриншот: настройки оверлея — шумоподавление и язык транскрипции]
Частые ошибки
- Собеседника не слышно (macOS) → не выдана «Запись экрана». Микрофон даёт только ваш голос; голос собеседника — это системный звук, доступный лишь через запись экрана.
- Собеседника не слышно (Windows) → не то устройство вывода по умолчанию. Захват системного звука работает только с устройства вывода по умолчанию. Назначьте по умолчанию то устройство, через которое звучит созвон (см. Разрешения на Windows).
- Разрешение есть, но звука нет → не перезапустили приложение. macOS применяет «Запись экрана» только после перезапуска.
- Текст «бредовый» → не тот язык. Несовпадение языка сессии с реальным языком созвона ломает распознавание. Язык задаётся per-session.
- Пустой
[Я]→ не тот/выключенный микрофон. Проверьте выбранное устройство ввода и что микрофон не приглушён в созвоне. - Ожидание загрузки записи. Whisperer транскрибирует только в реальном времени; загрузить готовый аудиофайл нельзя — звук должен идти во время сессии.
Лучшие практики
- Перед важным созвоном сделайте 30-секундную пробную сессию и убедитесь, что в стенограмме есть обе роли —
[Я]и[Собеседник]. - Запомните мнемонику:
[Я]= Микрофон,[Собеседник]= Запись экрана. Это сразу указывает, какое разрешение чинить. - Заранее выставляйте язык транскрипции под язык встречи.
- Используйте стабильный микрофон (гарнитуру) и не меняйте устройство ввода в середине сессии.