Не слышно собеседника или микрофон

Короткое описание

Whisperer слушает созвон из двух источников: ваш голос — через микрофон, голос собеседника — через системный звук. В стенограмме они помечаются как [Я] и [Собеседник]. На macOS системный звук идёт через разрешение «Запись экрана»; на Windows — через системный звук с устройства вывода по умолчанию (разрешение не нужно — см. Разрешения на Windows). Если одна из ролей пропадает или транскрипция «молчит», проблема почти всегда в разрешениях, выборе источника/устройства или настройках сессии.

Эта статья — пошаговый чеклист диагностики: от самого частого случая (нет собеседника = нет «Записи экрана») до настроек шумоподавления и языка транскрипции.

Когда использовать

  • В стенограмме есть только [Я] — собеседника не слышно.
  • В стенограмме есть только [Собеседник] — не пишется ваш голос.
  • Транскрипция пустая или «обрывочная», хотя звук в созвоне идёт.
  • Текст распознаётся не на том языке (искажённые слова).

Пошаговая инструкция (чеклист диагностики)

  1. Нет собеседника? На macOS это причина №1 — проверьте «Запись экрана»: System Settings → Privacy & Security → Screen Recording → тумблер напротив Whisperer включён, затем перезапустите приложение (без записи экрана системный звук недоступен). На Windows разрешение для этого не нужно — проверьте, что устройством вывода по умолчанию выбрано то, через которое реально звучит созвон: захват системного звука работает только с устройства по умолчанию. Подробнее — Разрешения на Windows.
  2. Нет вашего голоса? Проверьте «Микрофон». System Settings → Privacy & Security → Microphone → тумблер напротив Whisperer включён.
  3. Посмотрите на waveform-индикатор. В CommandBar оверлея есть индикатор громкости/waveform. Говорите — он должен реагировать на ваш голос; когда говорит собеседник, движение тоже должно быть. Нет реакции на одну из сторон — значит, не идёт соответствующий источник (см. шаги 1–2).
  4. Проверьте, что сессия запущена и не на паузе. В CommandBar кнопка play/pause должна быть в режиме записи. На паузе аудио не захватывается.
  5. Проверьте устройство ввода. Если у вас несколько микрофонов (встроенный, гарнитура, веб-камера), убедитесь, что в системе и в созвоне выбран рабочий микрофон. Сильно зашумлённый или выключенный микрофон даст пустую дорожку [Я].
  6. Проверьте шумоподавление. В настройках оверлея есть шумоподавление. Если речь тихая и «съедается», попробуйте его ослабить/выключить; если фон сильно шумит — наоборот, включить.
  7. Проверьте язык транскрипции. Язык задаётся для сессии (по умолчанию ru). Если созвон на другом языке, а распознаётся как русский — слова будут искажены. Задайте правильный язык транскрипции (Whisper мультиязычный) и начните сессию заново.
  8. Перезапустите сессию/приложение. Если что-то «подвисло» после смены разрешений или устройства — завершите сессию, перезапустите Whisperer и начните заново.

Скриншоты

📸 [Скриншот: стенограмма только с [Я] без [Собеседник] — типичный признак отсутствия «Записи экрана»]

📸 [Скриншот: waveform-индикатор в CommandBar при активной речи]

📸 [Скриншот: настройки оверлея — шумоподавление и язык транскрипции]

Частые ошибки

  • Собеседника не слышно (macOS) → не выдана «Запись экрана». Микрофон даёт только ваш голос; голос собеседника — это системный звук, доступный лишь через запись экрана.
  • Собеседника не слышно (Windows) → не то устройство вывода по умолчанию. Захват системного звука работает только с устройства вывода по умолчанию. Назначьте по умолчанию то устройство, через которое звучит созвон (см. Разрешения на Windows).
  • Разрешение есть, но звука нет → не перезапустили приложение. macOS применяет «Запись экрана» только после перезапуска.
  • Текст «бредовый» → не тот язык. Несовпадение языка сессии с реальным языком созвона ломает распознавание. Язык задаётся per-session.
  • Пустой [Я] → не тот/выключенный микрофон. Проверьте выбранное устройство ввода и что микрофон не приглушён в созвоне.
  • Ожидание загрузки записи. Whisperer транскрибирует только в реальном времени; загрузить готовый аудиофайл нельзя — звук должен идти во время сессии.

Лучшие практики

  • Перед важным созвоном сделайте 30-секундную пробную сессию и убедитесь, что в стенограмме есть обе роли — [Я] и [Собеседник].
  • Запомните мнемонику: [Я] = Микрофон, [Собеседник] = Запись экрана. Это сразу указывает, какое разрешение чинить.
  • Заранее выставляйте язык транскрипции под язык встречи.
  • Используйте стабильный микрофон (гарнитуру) и не меняйте устройство ввода в середине сессии.

Связанные статьи