Não consigo ouvir a outra pessoa ou o microfone

Em resumo

O Whisperer escuta uma chamada a partir de duas fontes: a sua voz — pelo microfone, e a voz da outra pessoa — pelo áudio do sistema. Na transcrição, elas são marcadas como [Me] e [Other]. No macOS, o áudio do sistema vem através da permissão de "Gravação de tela"; no Windows, o áudio do sistema é capturado do dispositivo de saída padrão sem necessidade de nenhuma permissão — veja Permissões no Windows. Se uma das funções desaparece ou a transcrição fica "muda", o problema quase sempre está nas permissões, na escolha da fonte/dispositivo ou nas configurações da sessão.

Este artigo é uma lista de verificação de diagnóstico passo a passo: do caso mais comum (sem a outra pessoa = sem "Gravação de tela") à supressão de ruído e ao idioma da transcrição.

Quando usar isto

  • A transcrição mostra apenas [Me] — você não consegue ouvir a outra pessoa.
  • A transcrição mostra apenas [Other] — sua voz não está sendo gravada.
  • A transcrição está vazia ou "irregular", mesmo que o áudio esteja fluindo na chamada.
  • O texto é reconhecido no idioma errado (palavras embaralhadas).

Passo a passo (lista de verificação de diagnóstico)

  1. Sem a outra pessoa? No macOS este é o motivo nº 1 — verifique a "Gravação de tela": Ajustes do Sistema → Privacidade e Segurança → Gravação de tela → o botão ao lado do Whisperer está ativado, depois reinicie o app (sem a gravação de tela, o áudio do sistema não fica disponível). No Windows não é necessária nenhuma permissão para isso — certifique-se de que o dispositivo de saída padrão é aquele pelo qual a chamada realmente está tocando: a captura de áudio do sistema só pega o dispositivo padrão. Para detalhes, veja Permissões no Windows.
  2. Sem voz da sua parte? Verifique o "Microfone". Ajustes do Sistema → Privacidade e Segurança → Microfone → o botão ao lado do Whisperer está ativado.
  3. Observe o indicador de forma de onda. A CommandBar da sobreposição tem um indicador de volume/forma de onda. Enquanto você fala, ele deve reagir à sua voz; quando a outra pessoa fala, também deve haver movimento. A falta de reação em um dos lados significa que a fonte correspondente não está fluindo (veja os passos 1–2).
  4. Certifique-se de que a sessão está em andamento e não está pausada. Na CommandBar, o botão de reproduzir/pausar deve estar no modo de gravação. Enquanto pausado, o áudio não é capturado.
  5. Verifique o dispositivo de entrada. Se você tem vários microfones (embutido, headset, webcam), certifique-se de que o microfone em funcionamento está selecionado no sistema e na chamada. Um microfone muito ruidoso ou mudo gera uma faixa [Me] vazia.
  6. Verifique a supressão de ruído. As configurações da sobreposição têm a supressão de ruído. Se a fala estiver baixa e for "engolida", tente reduzi-la/desativá-la; se houver muito ruído de fundo, faça o contrário e ative-a.
  7. Verifique o idioma da transcrição. O idioma é definido por sessão (padrão ru). Se a chamada for em outro idioma, mas for reconhecida como russo, as palavras ficarão embaralhadas. Defina o idioma de transcrição correto (o Whisper é multilíngue) e inicie a sessão novamente.
  8. Reinicie a sessão/o app. Se algo "travou" após alterar as permissões ou o dispositivo, encerre a sessão, reinicie o Whisperer e comece de novo.

Capturas de tela

📸 [Captura de tela: uma transcrição apenas com [Me] e sem [Other] — o sinal típico de que falta a "Gravação de tela"]

📸 [Captura de tela: o indicador de forma de onda na CommandBar durante a fala ativa]

📸 [Captura de tela: as configurações da sobreposição — supressão de ruído e idioma da transcrição]

Erros comuns

  • Não consigo ouvir a outra pessoa (macOS) → "Gravação de tela" não concedida. O microfone fornece apenas a sua voz; a voz da outra pessoa é o áudio do sistema, disponível somente através da gravação de tela.
  • Não consigo ouvir a outra pessoa (Windows) → dispositivo de saída padrão errado. A captura de áudio do sistema só pega o áudio do dispositivo de saída padrão. Defina como padrão o dispositivo pelo qual a chamada está tocando (veja Permissões no Windows).
  • Permissão concedida, mas sem áudio → o app não foi reiniciado. O macOS aplica a "Gravação de tela" somente após uma reinicialização.
  • O texto está "sem sentido" → idioma errado. Uma incompatibilidade entre o idioma da sessão e o idioma real da chamada quebra o reconhecimento. O idioma é definido por sessão.
  • [Me] vazio → microfone errado/mudo. Verifique o dispositivo de entrada selecionado e se o microfone não está mudo na chamada.
  • Esperar para enviar uma gravação. O Whisperer transcreve apenas em tempo real; você não pode enviar um arquivo de áudio pronto — o áudio precisa fluir durante a sessão.

Boas práticas

  • Antes de uma chamada importante, faça uma sessão de teste de 30 segundos e certifique-se de que ambas as funções — [Me] e [Other] — aparecem na transcrição.
  • Lembre-se do mnemônico: [Me] = Microfone, [Other] = Gravação de tela. Isso aponta diretamente qual permissão corrigir.
  • Defina com antecedência o idioma da transcrição para corresponder ao idioma da reunião.
  • Use um microfone estável (um headset) e não troque o dispositivo de entrada no meio de uma sessão.

Artigos relacionados