Glosario de entidades clave

Descripción general

Este glosario reúne las definiciones de los conceptos centrales de Whisperer — desde la sesión de llamada hasta la base de conocimiento y los planes. Existe para que el resto de la documentación se pueda leer sin ambigüedades: cuando encuentres un término en cualquier artículo, aquí encontrarás su significado exacto.

Esta es una página de referencia. En lugar de un procedimiento paso a paso, incluye una sección "Cómo se relacionan las entidades" — que muestra cómo los conceptos se articulan en un único flujo de trabajo del producto.

Cuándo usarlo

  • Estás leyendo la documentación por primera vez y quieres verificar los términos.
  • Otro artículo usó un término desconocido (por ejemplo, "no-logs" o "rol de modelo").
  • Estás configurando prompts, la base de conocimiento o una suscripción y quieres entender los límites de los conceptos.

Términos

Sesión — una sola sesión de asistente en una llamada. Tiene un ciclo de vida: inicio (session.start) → grabación de audio → preguntas y respuestas → finalización con guardado de datos. A una sesión se le adjuntan una transcripción, las preguntas formuladas y las respuestas del modelo. La sesión es la unidad de contabilidad de minutos y la base del historial en el panel.

Segmento de transcripción (Segment) — un fragmento de voz reconocida que Whisperer forma al instante a partir del audio en streaming. Cada segmento está etiquetado con un hablante y una marca de tiempo. Los segmentos componen la transcripción completa de la sesión, que se muestra como un ticker en el cliente y se guarda en el historial (excepto en el modo no-logs).

Hablante ([Me] / [Other]) — la etiqueta de hablante en la transcripción. [Me] es tu voz del micrófono, [Other] es la voz del audio del sistema (lo que suena en tus auriculares/altavoces). Esta etiquetado es posible porque el cliente captura dos fuentes de audio independientes y etiqueta cada fragmento de audio con una etiqueta de hablante.

Mapa mental (nodo: topic / action_item / decision) — el mapa de la reunión que Whisperer extrae tras una sesión. Los nodos (MeetingMapNode) son de tres tipos: topic (un tema tratado), action_item (una tarea pendiente), decision (una decisión tomada). En el panel, el mapa se puede visualizar y ampliar posteriormente (enrich-mindmap).

Plantilla de prompt (role prompt) — un borrador de instrucción de sistema para el modelo adaptado a un rol específico. La estableces tú en Prompt Studio y se incrusta en el prompt del sistema antes del contexto de usuario y el bloque de base de conocimiento.

Rol de modelo — el propósito para el que se selecciona un modelo. Whisperer tiene siete roles: responses (respuestas de chat habituales), coding (código), vision (capturas de pantalla e imágenes), system_design (respuesta estructurada con diagramas Mermaid), generation (generación y enriquecimiento del mapa mental), transcription (reconocimiento de voz, Whisper), embedding (vectorización de texto para RAG). Puedes configurar un modelo distinto para cada rol.

Base de conocimiento / Nota (Note) — tu almacén personal de conocimiento en el panel. Una nota contiene un título, texto en Markdown y etiquetas. Los wiki-links de la forma [[...]] conectan notas en un grafo (vecinos, camino más corto, centralidad). La base de conocimiento se conserva hasta que la elimines.

RAG (Retrieval-Augmented Generation) — el mecanismo por el que la respuesta del modelo se enriquece con hechos de tu base de conocimiento. Las notas se dividen en fragmentos (~512 tokens, solapamiento de 64), se convierten en embeddings y se almacenan en una base de datos vectorial; para cada consulta el sistema usa búsqueda coseno para encontrar los fragmentos más relevantes y los inserta en el prompt. De este modo, las sugerencias se basan en tus materiales, no solo en el conocimiento general del modelo.

Contexto de usuario — datos arbitrarios que proporcionas al asistente con antelación (por ejemplo, una descripción de tu rol, producto o currículum). Se configura en tu perfil e influye en el tono y la profundidad de las respuestas en todas las sesiones.

Suscripción / Plan (Plan) — tu nivel de acceso al producto: Free, Start, Pro, Max. El plan determina el límite de minutos, el acceso a la base de conocimiento, las capturas múltiples, el modo System Design y los modelos frontier. El núcleo del producto (sesiones, base de conocimiento) requiere una suscripción de pago activa.

Cuota de minutos — el límite de tiempo de reconocimiento dentro de un plan. En Free son 60 minutos al mes; en planes de pago los minutos son ilimitados. Los minutos de una sesión cuentan hacia la cuota, incluso en modo no-logs (un contador separado, no_logs_minutes_used). La cuota es flexible: la sesión en curso terminará, pero no podrás iniciar una nueva hasta que se renueve.

Modo no-logs (efímero) — un modo de sesión privada en el que la transcripción y las respuestas no se escriben en la base de datos y se eliminan al terminar la sesión. Útil para conversaciones sensibles. Importante: los minutos se siguen consumiendo de la cuota.

Modelos frontier — los LLM de vanguardia más potentes (por ejemplo, Claude Opus, GPT de primera línea y equivalentes). En Whisperer solo están disponibles en los planes Max.

Referido — un usuario que has invitado. Por cada compra elegible de un referido (plan Pro o Max) recibes una recompensa de 500 ₽; una recompensa por invitado.

Código promocional — un código de descuento. Dos tipos: percent (descuento porcentual sobre el precio) y bonus_days (días de suscripción adicionales). El recargo por conversión de moneda no se aplica a los descuentos y bonificaciones.

Cómo se relacionan las entidades

Los conceptos de Whisperer forman un único flujo — de la conversación al conocimiento:

  1. Inicias una sesión. El cliente captura dos fuentes de audio y las etiqueta con hablantes [Me] / [Other].
  2. El reconocimiento (el rol de modelo transcription) convierte el audio en segmentos de transcripción.
  3. Cuando haces una pregunta, se ensambla el prompt del sistema: la plantilla de prompt del rol de modelo elegido → contexto de usuario → el bloque RAG de tu base de conocimiento.
  4. El modelo responde; en modo no-logs ni la transcripción ni las respuestas se guardan, pero los minutos se siguen descontando de la cuota establecida por el plan.
  5. Tras la sesión, Whisperer extrae un mapa mental (topic / action_item / decision) para el resumen de la reunión.
  6. El nivel de acceso a todo esto lo fija la suscripción; los códigos promocionales y los referidos ayudan a ampliarla o abaratarla, y los modelos frontier se habilitan en Max.

Capturas de pantalla

📸 [Captura de pantalla: transcripción en vivo con etiquetas [Me] y [Other]]

📸 [Captura de pantalla: mapa mental de la reunión con nodos topic/action_item/decision]

📸 [Captura de pantalla: grafo de la base de conocimiento construido a partir de wiki-links]

Errores comunes

  • Confundir una sesión con una transcripción. Una sesión es el conjunto completo, con contabilidad de minutos; la transcripción (un conjunto de segmentos) es solo una parte de ella.
  • Considerar el modo no-logs como "gratuito". Los minutos en no-logs se consumen con normalidad; lo que no se guarda son los datos.
  • Esperar modelos frontier en Pro. Frontier solo está disponible en Max.
  • Intentar dar instrucciones a través del contexto de usuario. El contexto aporta hechos sobre ti; usa una plantilla de Prompt Studio para controlar cómo responde el asistente.

Buenas prácticas

  • Consulta el glosario antes de configurar prompts y roles de modelo — ahorra tiempo de depuración.
  • Rellena tu contexto de usuario y tu base de conocimiento con antelación: RAG incorpora tus datos en cada respuesta.
  • Usa wiki-links entre notas para que el grafo de conocimiento ayude en la búsqueda y la navegación.
  • Para llamadas sensibles, activa el modo no-logs, teniendo en cuenta que los minutos se siguen consumiendo.

Artículos relacionados