Glosario de entidades clave
Descripción general
Este glosario reúne las definiciones de los conceptos centrales de Whisperer — desde la sesión de llamada hasta la base de conocimiento y los planes. Existe para que el resto de la documentación se pueda leer sin ambigüedades: cuando encuentres un término en cualquier artículo, aquí encontrarás su significado exacto.
Esta es una página de referencia. En lugar de un procedimiento paso a paso, incluye una sección "Cómo se relacionan las entidades" — que muestra cómo los conceptos se articulan en un único flujo de trabajo del producto.
Cuándo usarlo
- Estás leyendo la documentación por primera vez y quieres verificar los términos.
- Otro artículo usó un término desconocido (por ejemplo, "no-logs" o "rol de modelo").
- Estás configurando prompts, la base de conocimiento o una suscripción y quieres entender los límites de los conceptos.
Términos
Sesión — una sola sesión de asistente en una llamada. Tiene un ciclo de vida: inicio (session.start) → grabación de audio → preguntas y respuestas → finalización con guardado de datos. A una sesión se le adjuntan una transcripción, las preguntas formuladas y las respuestas del modelo. La sesión es la unidad de contabilidad de minutos y la base del historial en el panel.
Segmento de transcripción (Segment) — un fragmento de voz reconocida que Whisperer forma al instante a partir del audio en streaming. Cada segmento está etiquetado con un hablante y una marca de tiempo. Los segmentos componen la transcripción completa de la sesión, que se muestra como un ticker en el cliente y se guarda en el historial (excepto en el modo no-logs).
Hablante ([Me] / [Other]) — la etiqueta de hablante en la transcripción. [Me] es tu voz del micrófono, [Other] es la voz del audio del sistema (lo que suena en tus auriculares/altavoces). Esta etiquetado es posible porque el cliente captura dos fuentes de audio independientes y etiqueta cada fragmento de audio con una etiqueta de hablante.
Mapa mental (nodo: topic / action_item / decision) — el mapa de la reunión que Whisperer extrae tras una sesión. Los nodos (MeetingMapNode) son de tres tipos: topic (un tema tratado), action_item (una tarea pendiente), decision (una decisión tomada). En el panel, el mapa se puede visualizar y ampliar posteriormente (enrich-mindmap).
Plantilla de prompt (role prompt) — un borrador de instrucción de sistema para el modelo adaptado a un rol específico. La estableces tú en Prompt Studio y se incrusta en el prompt del sistema antes del contexto de usuario y el bloque de base de conocimiento.
Rol de modelo — el propósito para el que se selecciona un modelo. Whisperer tiene siete roles: responses (respuestas de chat habituales), coding (código), vision (capturas de pantalla e imágenes), system_design (respuesta estructurada con diagramas Mermaid), generation (generación y enriquecimiento del mapa mental), transcription (reconocimiento de voz, Whisper), embedding (vectorización de texto para RAG). Puedes configurar un modelo distinto para cada rol.
Base de conocimiento / Nota (Note) — tu almacén personal de conocimiento en el panel. Una nota contiene un título, texto en Markdown y etiquetas. Los wiki-links de la forma [[...]] conectan notas en un grafo (vecinos, camino más corto, centralidad). La base de conocimiento se conserva hasta que la elimines.
RAG (Retrieval-Augmented Generation) — el mecanismo por el que la respuesta del modelo se enriquece con hechos de tu base de conocimiento. Las notas se dividen en fragmentos (~512 tokens, solapamiento de 64), se convierten en embeddings y se almacenan en una base de datos vectorial; para cada consulta el sistema usa búsqueda coseno para encontrar los fragmentos más relevantes y los inserta en el prompt. De este modo, las sugerencias se basan en tus materiales, no solo en el conocimiento general del modelo.
Contexto de usuario — datos arbitrarios que proporcionas al asistente con antelación (por ejemplo, una descripción de tu rol, producto o currículum). Se configura en tu perfil e influye en el tono y la profundidad de las respuestas en todas las sesiones.
Suscripción / Plan (Plan) — tu nivel de acceso al producto: Free, Start, Pro, Max. El plan determina el límite de minutos, el acceso a la base de conocimiento, las capturas múltiples, el modo System Design y los modelos frontier. El núcleo del producto (sesiones, base de conocimiento) requiere una suscripción de pago activa.
Cuota de minutos — el límite de tiempo de reconocimiento dentro de un plan. En Free son 60 minutos al mes; en planes de pago los minutos son ilimitados. Los minutos de una sesión cuentan hacia la cuota, incluso en modo no-logs (un contador separado, no_logs_minutes_used). La cuota es flexible: la sesión en curso terminará, pero no podrás iniciar una nueva hasta que se renueve.
Modo no-logs (efímero) — un modo de sesión privada en el que la transcripción y las respuestas no se escriben en la base de datos y se eliminan al terminar la sesión. Útil para conversaciones sensibles. Importante: los minutos se siguen consumiendo de la cuota.
Modelos frontier — los LLM de vanguardia más potentes (por ejemplo, Claude Opus, GPT de primera línea y equivalentes). En Whisperer solo están disponibles en los planes Max.
Referido — un usuario que has invitado. Por cada compra elegible de un referido (plan Pro o Max) recibes una recompensa de 500 ₽; una recompensa por invitado.
Código promocional — un código de descuento. Dos tipos: percent (descuento porcentual sobre el precio) y bonus_days (días de suscripción adicionales). El recargo por conversión de moneda no se aplica a los descuentos y bonificaciones.
Cómo se relacionan las entidades
Los conceptos de Whisperer forman un único flujo — de la conversación al conocimiento:
- Inicias una sesión. El cliente captura dos fuentes de audio y las etiqueta con hablantes
[Me]/[Other]. - El reconocimiento (el rol de modelo
transcription) convierte el audio en segmentos de transcripción. - Cuando haces una pregunta, se ensambla el prompt del sistema: la plantilla de prompt del rol de modelo elegido → contexto de usuario → el bloque RAG de tu base de conocimiento.
- El modelo responde; en modo no-logs ni la transcripción ni las respuestas se guardan, pero los minutos se siguen descontando de la cuota establecida por el plan.
- Tras la sesión, Whisperer extrae un mapa mental (topic / action_item / decision) para el resumen de la reunión.
- El nivel de acceso a todo esto lo fija la suscripción; los códigos promocionales y los referidos ayudan a ampliarla o abaratarla, y los modelos frontier se habilitan en Max.
Capturas de pantalla
📸 [Captura de pantalla: transcripción en vivo con etiquetas [Me] y [Other]]
📸 [Captura de pantalla: mapa mental de la reunión con nodos topic/action_item/decision]
📸 [Captura de pantalla: grafo de la base de conocimiento construido a partir de wiki-links]
Errores comunes
- Confundir una sesión con una transcripción. Una sesión es el conjunto completo, con contabilidad de minutos; la transcripción (un conjunto de segmentos) es solo una parte de ella.
- Considerar el modo no-logs como "gratuito". Los minutos en no-logs se consumen con normalidad; lo que no se guarda son los datos.
- Esperar modelos frontier en Pro. Frontier solo está disponible en Max.
- Intentar dar instrucciones a través del contexto de usuario. El contexto aporta hechos sobre ti; usa una plantilla de Prompt Studio para controlar cómo responde el asistente.
Buenas prácticas
- Consulta el glosario antes de configurar prompts y roles de modelo — ahorra tiempo de depuración.
- Rellena tu contexto de usuario y tu base de conocimiento con antelación: RAG incorpora tus datos en cada respuesta.
- Usa wiki-links entre notas para que el grafo de conocimiento ayude en la búsqueda y la navegación.
- Para llamadas sensibles, activa el modo no-logs, teniendo en cuenta que los minutos se siguen consumiendo.