Não consigo ouvir a outra pessoa ou o microfone
Em resumo
O Whisperer escuta uma chamada a partir de duas fontes: a sua voz — pelo microfone, e a voz da outra pessoa — pelo áudio do sistema. Na transcrição, elas são marcadas como [Me] e [Other]. No macOS, o áudio do sistema vem através da permissão de "Gravação de tela"; no Windows, o áudio do sistema é capturado do dispositivo de saída padrão sem necessidade de nenhuma permissão — veja Permissões no Windows. Se uma das funções desaparece ou a transcrição fica "muda", o problema quase sempre está nas permissões, na escolha da fonte/dispositivo ou nas configurações da sessão.
Este artigo é uma lista de verificação de diagnóstico passo a passo: do caso mais comum (sem a outra pessoa = sem "Gravação de tela") à supressão de ruído e ao idioma da transcrição.
Quando usar isto
- A transcrição mostra apenas
[Me]— você não consegue ouvir a outra pessoa. - A transcrição mostra apenas
[Other]— sua voz não está sendo gravada. - A transcrição está vazia ou "irregular", mesmo que o áudio esteja fluindo na chamada.
- O texto é reconhecido no idioma errado (palavras embaralhadas).
Passo a passo (lista de verificação de diagnóstico)
- Sem a outra pessoa? No macOS este é o motivo nº 1 — verifique a "Gravação de tela": Ajustes do Sistema → Privacidade e Segurança → Gravação de tela → o botão ao lado do Whisperer está ativado, depois reinicie o app (sem a gravação de tela, o áudio do sistema não fica disponível). No Windows não é necessária nenhuma permissão para isso — certifique-se de que o dispositivo de saída padrão é aquele pelo qual a chamada realmente está tocando: a captura de áudio do sistema só pega o dispositivo padrão. Para detalhes, veja Permissões no Windows.
- Sem voz da sua parte? Verifique o "Microfone". Ajustes do Sistema → Privacidade e Segurança → Microfone → o botão ao lado do Whisperer está ativado.
- Observe o indicador de forma de onda. A CommandBar da sobreposição tem um indicador de volume/forma de onda. Enquanto você fala, ele deve reagir à sua voz; quando a outra pessoa fala, também deve haver movimento. A falta de reação em um dos lados significa que a fonte correspondente não está fluindo (veja os passos 1–2).
- Certifique-se de que a sessão está em andamento e não está pausada. Na CommandBar, o botão de reproduzir/pausar deve estar no modo de gravação. Enquanto pausado, o áudio não é capturado.
- Verifique o dispositivo de entrada. Se você tem vários microfones (embutido, headset, webcam), certifique-se de que o microfone em funcionamento está selecionado no sistema e na chamada. Um microfone muito ruidoso ou mudo gera uma faixa
[Me]vazia. - Verifique a supressão de ruído. As configurações da sobreposição têm a supressão de ruído. Se a fala estiver baixa e for "engolida", tente reduzi-la/desativá-la; se houver muito ruído de fundo, faça o contrário e ative-a.
- Verifique o idioma da transcrição. O idioma é definido por sessão (padrão
ru). Se a chamada for em outro idioma, mas for reconhecida como russo, as palavras ficarão embaralhadas. Defina o idioma de transcrição correto (o Whisper é multilíngue) e inicie a sessão novamente. - Reinicie a sessão/o app. Se algo "travou" após alterar as permissões ou o dispositivo, encerre a sessão, reinicie o Whisperer e comece de novo.
Capturas de tela
📸 [Captura de tela: uma transcrição apenas com
[Me]e sem[Other]— o sinal típico de que falta a "Gravação de tela"]
📸 [Captura de tela: o indicador de forma de onda na CommandBar durante a fala ativa]
📸 [Captura de tela: as configurações da sobreposição — supressão de ruído e idioma da transcrição]
Erros comuns
- Não consigo ouvir a outra pessoa (macOS) → "Gravação de tela" não concedida. O microfone fornece apenas a sua voz; a voz da outra pessoa é o áudio do sistema, disponível somente através da gravação de tela.
- Não consigo ouvir a outra pessoa (Windows) → dispositivo de saída padrão errado. A captura de áudio do sistema só pega o áudio do dispositivo de saída padrão. Defina como padrão o dispositivo pelo qual a chamada está tocando (veja Permissões no Windows).
- Permissão concedida, mas sem áudio → o app não foi reiniciado. O macOS aplica a "Gravação de tela" somente após uma reinicialização.
- O texto está "sem sentido" → idioma errado. Uma incompatibilidade entre o idioma da sessão e o idioma real da chamada quebra o reconhecimento. O idioma é definido por sessão.
[Me]vazio → microfone errado/mudo. Verifique o dispositivo de entrada selecionado e se o microfone não está mudo na chamada.- Esperar para enviar uma gravação. O Whisperer transcreve apenas em tempo real; você não pode enviar um arquivo de áudio pronto — o áudio precisa fluir durante a sessão.
Boas práticas
- Antes de uma chamada importante, faça uma sessão de teste de 30 segundos e certifique-se de que ambas as funções —
[Me]e[Other]— aparecem na transcrição. - Lembre-se do mnemônico:
[Me]= Microfone,[Other]= Gravação de tela. Isso aponta diretamente qual permissão corrigir. - Defina com antecedência o idioma da transcrição para corresponder ao idioma da reunião.
- Use um microfone estável (um headset) e não troque o dispositivo de entrada no meio de uma sessão.