Tu primera sesión: paso a paso

Descripción general

Una sesión es una ejecución de escucha de una llamada: Whisperer escucha el audio, mantiene una transcripción y responde tus preguntas. Esta página muestra cómo iniciar tu primera reunión en el overlay, cómo se ve la transcripción en vivo, cómo hacer preguntas de tres maneras distintas y dónde encontrar el historial después.

Whisperer escucha dos fuentes de audio: tu micrófono (tu voz) y el audio del sistema (la voz del interlocutor). En macOS, el audio del sistema se captura a través del permiso de "Grabación de pantalla" — sin él, el interlocutor no se escuchará (consulta Permisos en macOS). En Windows, el audio del sistema se captura sin ningún permiso adicional — solo necesitas el acceso al micrófono (consulta Permisos en Windows).

Cuándo utilizarlo

Inicia una sesión al comienzo de cualquier llamada en la que necesites transcripción, sugerencias o traducción. Antes de tu primer inicio, asegúrate de que el dispositivo está vinculado a tu cuenta y todos los permisos están concedidos — consulta Inicio rápido.

Paso a paso

Abre la aplicación. Aparece un panel overlay (GhostPanel) con una barra de comandos (CommandBar) sobre tu pantalla.
Pulsa reproducir. Whisperer empieza a grabar: el indicador de volumen (waveform) muestra que el audio está llegando.
Observa la transcripción. En la franja en vivo (LiveTranscriptStrip), las intervenciones se etiquetan por interlocutor: [Yo] para tu voz y [Otro] para el audio del sistema.
Haz una pregunta — de una de estas tres formas:
- Por texto — escribe tu pregunta en el campo de entrada y envíala.
- A partir de lo escuchado — pulsa Enter con el campo de entrada vacío: Whisperer construye una pregunta a partir del fragmento de conversación escuchado recientemente.
- Desde una captura de pantalla — toma una captura para que el modelo analice la imagen (vision).
Lee la respuesta. Las respuestas aparecen en el área de respuesta (AnswerArea) en Markdown, con paginación 1/N y la opción de expandir el razonamiento del modelo.
Finaliza la sesión. Pulsa pausa/detener para terminar — la transcripción y las respuestas se guardan en el historial (excepto en el modo no-logs).
Abre el historial en el panel web. Allí encontrarás la transcripción completa, las respuestas, el mapa mental de la reunión (temas, decisiones, tareas) y la búsqueda.

Capturas de pantalla

📸 [Captura de pantalla: barra de comandos del overlay con el botón de reproducción y el indicador de volumen]

📸 [Captura de pantalla: transcripción en vivo con las etiquetas [Yo] y [Otro]]

📸 [Captura de pantalla: área de respuesta con paginación 1/N y razonamiento expandido]

Errores frecuentes

El interlocutor no aparece en la transcripción ([Otro]). En macOS la causa más común es que el permiso de "Grabación de pantalla" no está concedido — es el que captura el audio del sistema (consulta Permisos en macOS). En Windows no se necesita ningún permiso para esto — comprueba que el dispositivo de salida predeterminado es el que reproduce la llamada (el loopback solo captura ese); consulta Permisos en Windows.
La pregunta "a partir de lo escuchado" no funcionó. Esta acción solo se activa con Enter cuando el campo de entrada está vacío; si hay texto en el campo, ese texto se envía en su lugar.
La sesión no se guardó en el historial. Comprueba si el modo no-logs (efímero) está activado: en ese modo, la transcripción y las respuestas se eliminan al terminar la sesión, aunque los minutos se siguen contabilizando.

Buenas prácticas

Antes de una reunión importante, realiza una llamada de prueba breve y confirma que ambas etiquetas — [Yo] y [Otro] — aparecen en la transcripción.
Usa Enter con el campo vacío cuando necesites reaccionar rápidamente a lo que se acaba de decir, sin tener que formular una pregunta manualmente.
Para analizar código, diagramas o errores en pantalla, toma una captura de pantalla — el modelo la tendrá en cuenta en su respuesta.