No se escucha a la otra persona ni el micrófono
En resumen
Whisperer escucha una llamada desde dos fuentes: tu voz — a través del micrófono, la voz de la otra persona — a través del audio del sistema. En la transcripción se marcan como [Me] y [Other]. En macOS, el audio del sistema llega a través del permiso de "Grabación de pantalla"; en Windows, el audio del sistema se captura del dispositivo de salida predeterminado sin necesidad de ningún permiso — ver Permisos en Windows. Si uno de los roles desaparece o la transcripción se queda "en silencio", el problema casi siempre está en los permisos, la elección de la fuente/dispositivo o la configuración de la sesión.
Este artículo es una lista de verificación de diagnóstico paso a paso: desde el caso más común (no se escucha la otra persona = sin "Grabación de pantalla") hasta la supresión de ruido y el idioma de transcripción.
Cuándo usar esto
- La transcripción solo muestra
[Me]— no se escucha a la otra persona. - La transcripción solo muestra
[Other]— tu voz no se está grabando. - La transcripción está vacía o es "irregular", aunque el audio fluye en la llamada.
- El texto se reconoce en el idioma incorrecto (palabras confusas).
Paso a paso (lista de verificación de diagnóstico)
- ¿No se escucha a la otra persona? En macOS esta es la razón #1 — comprueba "Grabación de pantalla": Configuración del Sistema → Privacidad y Seguridad → Grabación de pantalla → el interruptor junto a Whisperer está activado, luego reinicia la aplicación (sin grabación de pantalla, el audio del sistema no está disponible). En Windows no se necesita ningún permiso para esto — asegúrate de que el dispositivo de salida predeterminado es el que realmente reproduce la llamada: la captura de audio del sistema solo recoge el dispositivo predeterminado. Para más detalles, ver Permisos en Windows.
- ¿No se escucha tu voz? Comprueba el "Micrófono". Configuración del Sistema → Privacidad y Seguridad → Micrófono → el interruptor junto a Whisperer está activado.
- Mira el indicador de forma de onda. La CommandBar de la superposición tiene un indicador de volumen/forma de onda. Cuando hablas, debería reaccionar a tu voz; cuando habla la otra persona, también debería haber movimiento. Sin reacción en un lado significa que la fuente correspondiente no está fluyendo (ver pasos 1–2).
- Asegúrate de que la sesión está en marcha y no en pausa. En la CommandBar, el botón de reproducción/pausa debe estar en modo de grabación. Mientras está en pausa, el audio no se captura.
- Comprueba el dispositivo de entrada. Si tienes varios micrófonos (integrado, auriculares, cámara web), asegúrate de que el micrófono que funciona está seleccionado en el sistema y en la llamada. Un micrófono con mucho ruido o silenciado da una pista
[Me]vacía. - Comprueba la supresión de ruido. La configuración de la superposición tiene supresión de ruido. Si el habla es suave y se "traga", intenta reducirla/desactivarla; si hay mucho ruido de fondo, haz lo contrario y actívala.
- Comprueba el idioma de transcripción. El idioma se establece por sesión (por defecto
ru). Si la llamada es en otro idioma pero se reconoce como ruso, las palabras estarán confusas. Establece el idioma de transcripción correcto (Whisper es multilingüe) y vuelve a iniciar la sesión. - Reinicia la sesión/aplicación. Si algo "se colgó" después de cambiar los permisos o el dispositivo, finaliza la sesión, reinicia Whisperer y vuelve a empezar.
Capturas de pantalla
📸 [Captura de pantalla: transcripción con solo
[Me]y sin[Other]— señal típica de que falta "Grabación de pantalla"]
📸 [Captura de pantalla: el indicador de forma de onda en la CommandBar durante el habla activa]
📸 [Captura de pantalla: configuración de la superposición — supresión de ruido e idioma de transcripción]
Errores comunes
- No se escucha la otra persona (macOS) → "Grabación de pantalla" no concedida. El micrófono solo da tu voz; la voz de la otra persona es audio del sistema, disponible solo a través de la grabación de pantalla.
- No se escucha la otra persona (Windows) → dispositivo de salida predeterminado incorrecto. La captura de audio del sistema solo toma audio del dispositivo de salida predeterminado. Establece el dispositivo por el que reproduce la llamada como predeterminado (ver Permisos en Windows).
- Permiso concedido, pero sin audio → la aplicación no fue reiniciada. macOS aplica "Grabación de pantalla" solo después de reiniciar.
- El texto es "incomprensible" → idioma incorrecto. Una discrepancia entre el idioma de la sesión y el idioma real de la llamada rompe el reconocimiento. El idioma se establece por sesión.
[Me]vacío → micrófono incorrecto/silenciado. Comprueba el dispositivo de entrada seleccionado y que el micrófono no esté silenciado en la llamada.- Esperar subir una grabación. Whisperer transcribe solo en tiempo real; no puedes subir un archivo de audio terminado — el audio debe fluir durante la sesión.
Buenas prácticas
- Antes de una llamada importante, haz una sesión de prueba de 30 segundos y asegúrate de que ambos roles —
[Me]y[Other]— aparecen en la transcripción. - Recuerda el truco mnemotécnico:
[Me]= Micrófono,[Other]= Grabación de pantalla. Esto apunta directamente a qué permiso corregir. - Establece el idioma de transcripción para que coincida con el idioma de la reunión con antelación.
- Usa un micrófono estable (unos auriculares) y no cambies el dispositivo de entrada en mitad de una sesión.