Transcrição ao vivo
Visão geral
A transcrição ao vivo é uma transcrição em tempo real da sua chamada. O Whisperer escuta o áudio em dois fluxos independentes — seu microfone (sua voz) e o áudio do sistema (a voz da outra pessoa) — reconhece a fala e marca instantaneamente as falas por interlocutor: [Me] e [Other]. O texto rola na sobreposição (LiveTranscriptStrip) e serve de contexto para as sugestões da IA.
O reconhecimento é feito pelo modelo Whisper em tempo real. A transcrição é somente em streaming (tempo real): o áudio é enviado para reconhecimento em pequenos trechos à medida que é gravado. Não há upload de um arquivo de áudio finalizado para transcrição em lote — o Whisperer foi feito para chamadas ao vivo, não para o pós-processamento de gravações.
Quando usar
- Qualquer videochamada. O Whisperer funciona como uma sobreposição sobre Zoom, Google Meet, Microsoft Teams, Telegram, Discord e qualquer outro serviço — sem necessidade de integração separada.
- Entrevistas (comportamentais e de System Design), nas quais você não pode se dar ao luxo de perder como uma pergunta foi formulada.
- Aulas, sessões de tutoria, vendas — quando você precisa de uma transcrição precisa das falas de ambos os lados.
- Chamadas multilíngues — o Whisper entende dezenas de idiomas; o idioma de reconhecimento é definido por sessão.
Passo a passo
- Conceda as permissões. No macOS, os dois fluxos exigem duas permissões: "Microfone" (sua voz) e "Gravação de Tela" (o áudio do sistema da outra pessoa); sem "Gravação de Tela" a outra pessoa não será ouvida. Consulte permissões do macOS. No Windows, o áudio do sistema é capturado sem nenhuma permissão adicional — você só precisa do acesso ao microfone; consulte permissões do Windows.
- Escolha o idioma da transcrição. Nas configurações da sessão, defina o idioma falado. O padrão é
ru. O Whisper é multilíngue, então para uma entrevista em inglês definaen, e para uma chamada mista use o idioma principal da chamada. - Abra a sobreposição e pressione play. Um indicador de volume (forma de onda) aparece na CommandBar — ele confirma que o áudio está chegando.
- Fale e escute. Suas falas são marcadas como
[Me], as falas do áudio do sistema são marcadas como[Other]. A transcrição é atualizada na LiveTranscriptStrip em tempo real. - (Opcional) Ative a tradução. Se a tradução estiver ativada nas configurações da sobreposição, uma linha de tradução (TranslationStrip) aparece abaixo da transcrição.
- Encerre a sessão. Quando terminar, a transcrição é salva no histórico (exceto no modo sem registros — consulte Limites e cotas).
Por que a permissão de "Gravação de Tela" é necessária (macOS)
No macOS, o áudio de outros aplicativos (a voz da outra pessoa no Zoom/Meet) é capturado por meio do mecanismo de gravação de tela — o mesmo recurso do sistema usado para captura de tela. Por isso, o Whisperer solicita a permissão de "Gravação de Tela" não para observar sua tela, mas para obter tecnicamente o fluxo de áudio do sistema (e para tirar capturas de tela para as sugestões de visão). Sem essa permissão, apenas o microfone é gravado — você é ouvido, a outra pessoa não.
No Windows é mais simples: o áudio do sistema da outra pessoa é capturado sem nenhuma permissão adicional — basta o acesso ao microfone. Os detalhes estão em permissões do Windows.
Capturas de tela
📸 [Captura de tela: sobreposição com uma transcrição rolando e marcação [Me]/[Other]]
📸 [Captura de tela: escolhendo o idioma da transcrição nas configurações da sessão]
📸 [Captura de tela: indicador de volume (forma de onda) na CommandBar]
Erros comuns
- A outra pessoa não é ouvida, a transcrição mostra apenas
[Me]. A permissão de "Gravação de Tela" não foi concedida. Abra Configurações do Sistema → Privacidade e Segurança → Gravação de Tela, ative o Whisperer e reinicie o cliente. - A transcrição está no idioma errado / muitos erros de reconhecimento. O idioma da transcrição foi definido incorretamente. Altere o idioma da sessão para o idioma real da conversa antes de começar.
- Sem indicador de volume. Nenhum dispositivo de entrada está selecionado ou o acesso ao microfone não foi concedido — verifique "Microfone" nas suas configurações de privacidade.
- Aguardando o upload de uma gravação. Não há transcrição em lote de um arquivo finalizado — a transcrição funciona apenas ao vivo durante uma sessão.
Boas práticas
- Antes de uma reunião importante, faça uma chamada de teste com um colega e confirme que a outra pessoa aparece na transcrição como
[Other]. - Ative a supressão de ruído nas configurações da sobreposição em um ambiente barulhento — isso melhora a precisão do Whisper.
- Para chamadas com mistura de idiomas, escolha o idioma falado na maior parte do tempo; o Whisper lida com as trocas, mas é melhor definir o idioma base explicitamente.
- Se o conteúdo for sensível, use o modo sem registros — a transcrição não será salva no banco de dados (os minutos, no entanto, continuam sendo consumidos).
- Mantenha uma dicção clara e evite falar por cima um do outro — falas separadas são marcadas por interlocutor com mais precisão.