Transcrição ao vivo

Visão geral

A transcrição ao vivo é uma transcrição em tempo real da sua chamada. O Whisperer escuta o áudio em dois fluxos independentes — seu microfone (sua voz) e o áudio do sistema (a voz da outra pessoa) — reconhece a fala e marca instantaneamente as falas por interlocutor: [Me] e [Other]. O texto rola na sobreposição (LiveTranscriptStrip) e serve de contexto para as sugestões da IA.

O reconhecimento é feito pelo modelo Whisper em tempo real. A transcrição é somente em streaming (tempo real): o áudio é enviado para reconhecimento em pequenos trechos à medida que é gravado. Não há upload de um arquivo de áudio finalizado para transcrição em lote — o Whisperer foi feito para chamadas ao vivo, não para o pós-processamento de gravações.

Quando usar

  • Qualquer videochamada. O Whisperer funciona como uma sobreposição sobre Zoom, Google Meet, Microsoft Teams, Telegram, Discord e qualquer outro serviço — sem necessidade de integração separada.
  • Entrevistas (comportamentais e de System Design), nas quais você não pode se dar ao luxo de perder como uma pergunta foi formulada.
  • Aulas, sessões de tutoria, vendas — quando você precisa de uma transcrição precisa das falas de ambos os lados.
  • Chamadas multilíngues — o Whisper entende dezenas de idiomas; o idioma de reconhecimento é definido por sessão.

Passo a passo

  1. Conceda as permissões. No macOS, os dois fluxos exigem duas permissões: "Microfone" (sua voz) e "Gravação de Tela" (o áudio do sistema da outra pessoa); sem "Gravação de Tela" a outra pessoa não será ouvida. Consulte permissões do macOS. No Windows, o áudio do sistema é capturado sem nenhuma permissão adicional — você só precisa do acesso ao microfone; consulte permissões do Windows.
  2. Escolha o idioma da transcrição. Nas configurações da sessão, defina o idioma falado. O padrão é ru. O Whisper é multilíngue, então para uma entrevista em inglês defina en, e para uma chamada mista use o idioma principal da chamada.
  3. Abra a sobreposição e pressione play. Um indicador de volume (forma de onda) aparece na CommandBar — ele confirma que o áudio está chegando.
  4. Fale e escute. Suas falas são marcadas como [Me], as falas do áudio do sistema são marcadas como [Other]. A transcrição é atualizada na LiveTranscriptStrip em tempo real.
  5. (Opcional) Ative a tradução. Se a tradução estiver ativada nas configurações da sobreposição, uma linha de tradução (TranslationStrip) aparece abaixo da transcrição.
  6. Encerre a sessão. Quando terminar, a transcrição é salva no histórico (exceto no modo sem registros — consulte Limites e cotas).

Por que a permissão de "Gravação de Tela" é necessária (macOS)

No macOS, o áudio de outros aplicativos (a voz da outra pessoa no Zoom/Meet) é capturado por meio do mecanismo de gravação de tela — o mesmo recurso do sistema usado para captura de tela. Por isso, o Whisperer solicita a permissão de "Gravação de Tela" não para observar sua tela, mas para obter tecnicamente o fluxo de áudio do sistema (e para tirar capturas de tela para as sugestões de visão). Sem essa permissão, apenas o microfone é gravado — você é ouvido, a outra pessoa não.

No Windows é mais simples: o áudio do sistema da outra pessoa é capturado sem nenhuma permissão adicional — basta o acesso ao microfone. Os detalhes estão em permissões do Windows.

Capturas de tela

📸 [Captura de tela: sobreposição com uma transcrição rolando e marcação [Me]/[Other]]

📸 [Captura de tela: escolhendo o idioma da transcrição nas configurações da sessão]

📸 [Captura de tela: indicador de volume (forma de onda) na CommandBar]

Erros comuns

  • A outra pessoa não é ouvida, a transcrição mostra apenas [Me]. A permissão de "Gravação de Tela" não foi concedida. Abra Configurações do Sistema → Privacidade e Segurança → Gravação de Tela, ative o Whisperer e reinicie o cliente.
  • A transcrição está no idioma errado / muitos erros de reconhecimento. O idioma da transcrição foi definido incorretamente. Altere o idioma da sessão para o idioma real da conversa antes de começar.
  • Sem indicador de volume. Nenhum dispositivo de entrada está selecionado ou o acesso ao microfone não foi concedido — verifique "Microfone" nas suas configurações de privacidade.
  • Aguardando o upload de uma gravação. Não há transcrição em lote de um arquivo finalizado — a transcrição funciona apenas ao vivo durante uma sessão.

Boas práticas

  • Antes de uma reunião importante, faça uma chamada de teste com um colega e confirme que a outra pessoa aparece na transcrição como [Other].
  • Ative a supressão de ruído nas configurações da sobreposição em um ambiente barulhento — isso melhora a precisão do Whisper.
  • Para chamadas com mistura de idiomas, escolha o idioma falado na maior parte do tempo; o Whisper lida com as trocas, mas é melhor definir o idioma base explicitamente.
  • Se o conteúdo for sensível, use o modo sem registros — a transcrição não será salva no banco de dados (os minutos, no entanto, continuam sendo consumidos).
  • Mantenha uma dicção clara e evite falar por cima um do outro — falas separadas são marcadas por interlocutor com mais precisão.

Artigos relacionados