相手の声やマイクが聞こえない

概要

Whisperer は通話を 2 つのソースから聞き取ります。あなたの声は マイク を通じて、相手の声は システムオーディオ を通じて取得します。文字起こしでは、それぞれ [Me][Other] として記録されます。macOS では、システムオーディオは「画面収録」権限を通じて取得されます。Windows では、システムオーディオは権限なしでデフォルトの出力デバイスからキャプチャされます — Windows の権限 を参照してください。いずれかの役割が消える、または文字起こしが「無音」になる場合、問題はほぼ常に権限、ソース/デバイスの選択、またはセッション設定にあります。

この記事は、最もよくあるケース(相手の声がない = 「画面収録」がない)からノイズ抑制や文字起こし言語まで、ステップごとの診断チェックリストです。

こんなときに

  • 文字起こしに [Me] しか表示されない — 相手の声が聞こえない。
  • 文字起こしに [Other] しか表示されない — 自分の声が録音されない。
  • 通話では音声が流れているのに、文字起こしが空、または「途切れがち」。
  • テキストが間違った言語で認識される(単語が文字化けしている)。

ステップごとの手順(診断チェックリスト)

  1. 相手の声がない? macOS ではこれが原因 No.1 です — 「画面収録」を確認:システム設定 → プライバシーとセキュリティ → 画面収録Whisperer の横のトグルがオンになっていることを確認し、その後 アプリを再起動 してください(画面収録がないとシステムオーディオは利用できません)。Windows ではこれに権限は不要です — 通話が実際に再生される デフォルト の出力デバイスが正しいことを確認してください:システムオーディオのキャプチャはデフォルトデバイスのみを拾います。詳細は Windows の権限 を参照してください。
  2. 自分の声がない? 「マイク」を確認。 システム設定 → プライバシーとセキュリティ → マイクWhisperer の横のトグルがオンになっていること。
  3. 波形インジケーターを見る。 オーバーレイの CommandBar には音量/波形インジケーターがあります。あなたが話すとあなたの声に反応し、相手が話すときにも動きがあるはずです。片側で反応がない場合、対応するソースが流れていません(ステップ 1〜2 を参照)。
  4. セッションが実行中で一時停止していないことを確認。 CommandBar の再生/一時停止ボタンが録音モードになっているはずです。一時停止中は音声がキャプチャされません。
  5. 入力デバイスを確認。 複数のマイク(内蔵、ヘッドセット、ウェブカメラ)がある場合、システムと通話で動作するマイクが選択されていることを確認してください。ノイズが多い、またはミュートされたマイクは空の [Me] トラックになります。
  6. ノイズ抑制を確認。 オーバーレイ設定にはノイズ抑制があります。発話が小さく「食われて」しまう場合は、弱める/オフにしてみてください。背景ノイズが多い場合は逆にオンにしてください。
  7. 文字起こし言語を確認。 言語はセッションごとに設定されます(デフォルトは ru)。通話が別の言語なのにロシア語として認識されると、単語が文字化けします。正しい文字起こし言語を設定し(Whisper は多言語対応)、セッションを再度開始してください。
  8. セッション/アプリを再起動。 権限やデバイスの変更後に何かが「固まった」場合は、セッションを終了し、Whisperer を再起動して、最初からやり直してください。

スクリーンショット

📸 [スクリーンショット:[Me] だけで [Other] がない文字起こし — 「画面収録」が欠けている典型的なサイン]

📸 [スクリーンショット:発話中の CommandBar の波形インジケーター]

📸 [スクリーンショット:オーバーレイ設定 — ノイズ抑制と文字起こし言語]

よくある間違い

  • 相手の声が聞こえない(macOS)→ 「画面収録」が許可されていない。 マイクはあなたの声だけを取得します。相手の声はシステムオーディオで、画面収録を通じてのみ利用できます。
  • 相手の声が聞こえない(Windows)→ デフォルト出力デバイスが間違っている。 システムオーディオのキャプチャはデフォルト出力デバイスからのみ音声を取得します。通話が再生されるデバイスをデフォルトに設定してください(Windows の権限 を参照)。
  • 権限を付与したのに音声がない → アプリを再起動していない。 macOS は「画面収録」を再起動後にのみ適用します。
  • テキストが「意味不明」→ 言語が間違っている。 セッション言語と通話の実際の言語が一致しないと認識が崩れます。言語はセッションごとに設定されます。
  • 空の [Me] → マイクが間違っている/ミュートされている。 選択された入力デバイスと、通話でマイクがミュートされていないことを確認してください。
  • 録音のアップロードを待っている。 Whisperer はリアルタイムでのみ文字起こしします。完成した音声ファイルをアップロードすることはできません — 音声はセッション中に流れている必要があります。

ベストプラクティス

  • 重要な通話の前に、30 秒のお試しセッションを行い、文字起こしに両方の役割 — [Me][Other] — が表示されることを確認してください。
  • 覚え方を思い出しましょう:[Me] = マイク、[Other] = 画面収録。これでどの権限を修正すべきかが一目で分かります。
  • 会議の言語に合わせて文字起こし言語を事前に設定しておきましょう。
  • 安定したマイク(ヘッドセット)を使用し、セッションの途中で入力デバイスを変更しないでください。

関連記事