Sugerencias de AI en tiempo real
Descripción general
Las sugerencias de AI son respuestas que Whisperer genera durante una llamada, basándose en la transcripción en vivo, tus preguntas y tu base de conocimientos. La respuesta llega como un flujo al AnswerArea del overlay: el texto aparece a medida que se genera, admite Markdown, revelación del razonamiento y paginación (1/N). Las sugerencias funcionan en varios modos — desde una respuesta simple hasta el análisis de una captura de pantalla y el diseño de System Design con diagramas.
Todas las solicitudes pasan por nuestro proveedor de AI con modelos de las familias Claude, GPT, DeepSeek, Qwen, Gemini, Grok y Llama. Qué modelos están disponibles depende de tu plan (tier gating): los mejores modelos de frontera están incluidos solo en Max.
Cuándo usar esto
- Entrevista: formula rápidamente una respuesta a una pregunta de comportamiento o esboza una solución de System Design.
- Ventas y negociaciones: encuentra un argumento, responde a una objeción, verifica un dato.
- Entrevista técnica / programación en pareja: obtén código en el modo de codificación.
- Comprender lo que hay en pantalla: envía una captura de pantalla de una pizarra, diagrama o código en el modo de visión.
Paso a paso
- Haz una pregunta como texto. Escribe la pregunta en el campo de entrada de la CommandBar y pulsa Enter — la respuesta comienza a fluir al AnswerArea.
- O pregunta "por lo escuchado". Pulsa Enter en un campo vacío — Whisperer toma el último fragmento de transcripción (la pregunta de la otra persona) y lo responde. Práctico cuando la pregunta acaba de ser formulada en voz alta.
- O adjunta una captura de pantalla. Toma una captura de pantalla (con el atajo captureScreenshot) — el fotograma va al modo de visión y el modelo analiza la imagen.
- Lee la respuesta en streaming. El texto aparece a medida que se genera. Puedes expandir el razonamiento del modelo si está presente.
- Paginación. Las respuestas largas y una serie de solicitudes se dividen en páginas — cambia con la paginación 1/N en el AnswerArea.
Modos de respuesta
- Respuesta simple (rol
responses) — una respuesta de texto a una pregunta, teniendo en cuenta el contexto y la base de conocimientos. - Codificación (rol
coding) — generación y explicación de código, un modelo optimizado para programación. - Visión / multi-captura (rol
vision) — análisis de una sola imagen o varios fotogramas acumulados (el array de capturas va al endpoint de visión). Útil para tareas largas que no caben en una pantalla. - System Design (rol
system_design) — una respuesta estructurada con diagramas Mermaid (componentes, flujos de datos, diagrama de arquitectura).
Cómo se ensambla el prompt (en resumen)
El prompt del sistema se ensambla por prioridad, de arriba a abajo:
- Prompt de rol — tu plantilla personal del Prompt Studio.
- Contexto de usuario — los datos que configuraste sobre ti mismo y tu rol.
- Bloque RAG — fragmentos relevantes de la base de conocimientos, seleccionados dinámicamente para cada solicitud.
Los diferentes roles de modelo manejan diferentes tareas: responses (chat), coding (código), vision (imágenes), system_design (diagramas), generation (mapa mental), transcription (Whisper), embedding (vectorización para RAG).
Restricciones de modelos por nivel (tier gating)
En Free, están disponibles modelos básicos; en planes de pago, un conjunto más amplio. Los modelos de frontera (los mejores: Claude Opus, GPT de primera línea, etc.) están disponibles solo en planes Max. Más en Planes y qué incluyen.
Capturas de pantalla
📸 [Captura de pantalla: AnswerArea con una respuesta en streaming y paginación 1/N]
📸 [Captura de pantalla: una solicitud "por lo escuchado" mediante Enter vacío]
📸 [Captura de pantalla: una respuesta de System Design con un diagrama Mermaid]
📸 [Captura de pantalla: modo de visión con una captura de pantalla adjunta]
Errores comunes
- Enter no envió nada. Si el campo está vacío, Whisperer toma la pregunta de la transcripción — asegúrate de que la otra persona sea escuchada (se requiere el permiso "Grabación de pantalla") o escribe la pregunta como texto.
- Un modelo de frontera no está disponible. Los mejores modelos están habilitados solo en Max — en Free/Start/Pro se selecciona el más cercano disponible.
- El contexto "no funcionó". El contexto de usuario es información de referencia sobre ti, no una instrucción; haz la pregunta real en el campo de entrada.
- La captura de pantalla no fue analizada. La multi-captura y la visión no están disponibles en todos los planes — comprueba las capacidades en Planes.
Buenas prácticas
- Haz preguntas cortas y específicas — el streaming comienza más rápido y la respuesta es más precisa.
- Para una tarea larga en pantalla, acumula varios fotogramas y envíalos como multi-captura en lugar de uno a la vez.
- Construye tu base de conocimientos — RAG mezcla tus datos en la respuesta y reduce las "alucinaciones".
- Configura un prompt de rol personal adaptado a tu tarea (entrevistas / ventas / enseñanza).
- Para preguntas arquitectónicas, usa el modo System Design — obtienes un diagrama Mermaid listo en lugar de una descripción solo de texto.