Sugerencias de AI en tiempo real

Descripción general

Las sugerencias de AI son respuestas que Whisperer genera durante una llamada, basándose en la transcripción en vivo, tus preguntas y tu base de conocimientos. La respuesta llega como un flujo al AnswerArea del overlay: el texto aparece a medida que se genera, admite Markdown, revelación del razonamiento y paginación (1/N). Las sugerencias funcionan en varios modos — desde una respuesta simple hasta el análisis de una captura de pantalla y el diseño de System Design con diagramas.

Todas las solicitudes pasan por nuestro proveedor de AI con modelos de las familias Claude, GPT, DeepSeek, Qwen, Gemini, Grok y Llama. Qué modelos están disponibles depende de tu plan (tier gating): los mejores modelos de frontera están incluidos solo en Max.

Cuándo usar esto

Entrevista: formula rápidamente una respuesta a una pregunta de comportamiento o esboza una solución de System Design.
Ventas y negociaciones: encuentra un argumento, responde a una objeción, verifica un dato.
Entrevista técnica / programación en pareja: obtén código en el modo de codificación.
Comprender lo que hay en pantalla: envía una captura de pantalla de una pizarra, diagrama o código en el modo de visión.

Paso a paso

Haz una pregunta como texto. Escribe la pregunta en el campo de entrada de la CommandBar y pulsa Enter — la respuesta comienza a fluir al AnswerArea.
O pregunta "por lo escuchado". Pulsa Enter en un campo vacío — Whisperer toma el último fragmento de transcripción (la pregunta de la otra persona) y lo responde. Práctico cuando la pregunta acaba de ser formulada en voz alta.
O adjunta una captura de pantalla. Toma una captura de pantalla (con el atajo captureScreenshot) — el fotograma va al modo de visión y el modelo analiza la imagen.
Lee la respuesta en streaming. El texto aparece a medida que se genera. Puedes expandir el razonamiento del modelo si está presente.
Paginación. Las respuestas largas y una serie de solicitudes se dividen en páginas — cambia con la paginación 1/N en el AnswerArea.

Modos de respuesta

Respuesta simple (rol responses) — una respuesta de texto a una pregunta, teniendo en cuenta el contexto y la base de conocimientos.
Codificación (rol coding) — generación y explicación de código, un modelo optimizado para programación.
Visión / multi-captura (rol vision) — análisis de una sola imagen o varios fotogramas acumulados (el array de capturas va al endpoint de visión). Útil para tareas largas que no caben en una pantalla.
System Design (rol system_design) — una respuesta estructurada con diagramas Mermaid (componentes, flujos de datos, diagrama de arquitectura).

Cómo se ensambla el prompt (en resumen)

El prompt del sistema se ensambla por prioridad, de arriba a abajo:

Prompt de rol — tu plantilla personal del Prompt Studio.
Contexto de usuario — los datos que configuraste sobre ti mismo y tu rol.
Bloque RAG — fragmentos relevantes de la base de conocimientos, seleccionados dinámicamente para cada solicitud.

Los diferentes roles de modelo manejan diferentes tareas: responses (chat), coding (código), vision (imágenes), system_design (diagramas), generation (mapa mental), transcription (Whisper), embedding (vectorización para RAG).

Restricciones de modelos por nivel (tier gating)

En Free, están disponibles modelos básicos; en planes de pago, un conjunto más amplio. Los modelos de frontera (los mejores: Claude Opus, GPT de primera línea, etc.) están disponibles solo en planes Max. Más en Planes y qué incluyen.

Capturas de pantalla

📸 [Captura de pantalla: AnswerArea con una respuesta en streaming y paginación 1/N]

📸 [Captura de pantalla: una solicitud "por lo escuchado" mediante Enter vacío]

📸 [Captura de pantalla: una respuesta de System Design con un diagrama Mermaid]

📸 [Captura de pantalla: modo de visión con una captura de pantalla adjunta]

Errores comunes

Enter no envió nada. Si el campo está vacío, Whisperer toma la pregunta de la transcripción — asegúrate de que la otra persona sea escuchada (se requiere el permiso "Grabación de pantalla") o escribe la pregunta como texto.
Un modelo de frontera no está disponible. Los mejores modelos están habilitados solo en Max — en Free/Start/Pro se selecciona el más cercano disponible.
El contexto "no funcionó". El contexto de usuario es información de referencia sobre ti, no una instrucción; haz la pregunta real en el campo de entrada.
La captura de pantalla no fue analizada. La multi-captura y la visión no están disponibles en todos los planes — comprueba las capacidades en Planes.

Buenas prácticas

Haz preguntas cortas y específicas — el streaming comienza más rápido y la respuesta es más precisa.
Para una tarea larga en pantalla, acumula varios fotogramas y envíalos como multi-captura en lugar de uno a la vez.
Construye tu base de conocimientos — RAG mezcla tus datos en la respuesta y reduce las "alucinaciones".
Configura un prompt de rol personal adaptado a tu tarea (entrevistas / ventas / enseñanza).
Para preguntas arquitectónicas, usa el modo System Design — obtienes un diagrama Mermaid listo en lugar de una descripción solo de texto.