Tu primera sesión: paso a paso
Descripción general
Una sesión es una ejecución de escucha de una llamada: Whisperer escucha el audio, mantiene una transcripción y responde tus preguntas. Esta página muestra cómo iniciar tu primera reunión en el overlay, cómo se ve la transcripción en vivo, cómo hacer preguntas de tres maneras distintas y dónde encontrar el historial después.
Whisperer escucha dos fuentes de audio: tu micrófono (tu voz) y el audio del sistema (la voz del interlocutor). En macOS, el audio del sistema se captura a través del permiso de "Grabación de pantalla" — sin él, el interlocutor no se escuchará (consulta Permisos en macOS). En Windows, el audio del sistema se captura sin ningún permiso adicional — solo necesitas el acceso al micrófono (consulta Permisos en Windows).
Cuándo utilizarlo
Inicia una sesión al comienzo de cualquier llamada en la que necesites transcripción, sugerencias o traducción. Antes de tu primer inicio, asegúrate de que el dispositivo está vinculado a tu cuenta y todos los permisos están concedidos — consulta Inicio rápido.
Paso a paso
- Abre la aplicación. Aparece un panel overlay (GhostPanel) con una barra de comandos (CommandBar) sobre tu pantalla.
- Pulsa reproducir. Whisperer empieza a grabar: el indicador de volumen (waveform) muestra que el audio está llegando.
- Observa la transcripción. En la franja en vivo (LiveTranscriptStrip), las intervenciones se etiquetan por interlocutor:
[Yo]para tu voz y[Otro]para el audio del sistema. - Haz una pregunta — de una de estas tres formas:
- Por texto — escribe tu pregunta en el campo de entrada y envíala.
- A partir de lo escuchado — pulsa Enter con el campo de entrada vacío: Whisperer construye una pregunta a partir del fragmento de conversación escuchado recientemente.
- Desde una captura de pantalla — toma una captura para que el modelo analice la imagen (vision).
- Lee la respuesta. Las respuestas aparecen en el área de respuesta (AnswerArea) en Markdown, con paginación
1/Ny la opción de expandir el razonamiento del modelo. - Finaliza la sesión. Pulsa pausa/detener para terminar — la transcripción y las respuestas se guardan en el historial (excepto en el modo no-logs).
- Abre el historial en el panel web. Allí encontrarás la transcripción completa, las respuestas, el mapa mental de la reunión (temas, decisiones, tareas) y la búsqueda.
Capturas de pantalla
📸 [Captura de pantalla: barra de comandos del overlay con el botón de reproducción y el indicador de volumen]
📸 [Captura de pantalla: transcripción en vivo con las etiquetas [Yo] y [Otro]]
📸 [Captura de pantalla: área de respuesta con paginación 1/N y razonamiento expandido]
Errores frecuentes
- El interlocutor no aparece en la transcripción (
[Otro]). En macOS la causa más común es que el permiso de "Grabación de pantalla" no está concedido — es el que captura el audio del sistema (consulta Permisos en macOS). En Windows no se necesita ningún permiso para esto — comprueba que el dispositivo de salida predeterminado es el que reproduce la llamada (el loopback solo captura ese); consulta Permisos en Windows. - La pregunta "a partir de lo escuchado" no funcionó. Esta acción solo se activa con Enter cuando el campo de entrada está vacío; si hay texto en el campo, ese texto se envía en su lugar.
- La sesión no se guardó en el historial. Comprueba si el modo no-logs (efímero) está activado: en ese modo, la transcripción y las respuestas se eliminan al terminar la sesión, aunque los minutos se siguen contabilizando.
Buenas prácticas
- Antes de una reunión importante, realiza una llamada de prueba breve y confirma que ambas etiquetas —
[Yo]y[Otro]— aparecen en la transcripción. - Usa Enter con el campo vacío cuando necesites reaccionar rápidamente a lo que se acaba de decir, sin tener que formular una pregunta manualmente.
- Para analizar código, diagramas o errores en pantalla, toma una captura de pantalla — el modelo la tendrá en cuenta en su respuesta.