Glossaire des entités clés

Vue d'ensemble

Ce glossaire rassemble les définitions des concepts fondamentaux de Whisperer — de la session d'appel à la base de connaissances en passant par les plans. Il existe pour que le reste de la documentation se lise sans ambiguïté : lorsque vous rencontrez un terme dans un article, vous en trouverez ici la signification exacte.

Il s'agit d'une page de référence. Plutôt qu'une procédure pas à pas, elle comprend une section « Comment les entités s'articulent » — elle montre comment les concepts s'assemblent en un flux produit cohérent.

Quand l'utiliser

Vous lisez la documentation pour la première fois et souhaitez vérifier les termes.
Un autre article a utilisé un terme inconnu (par exemple, « no-logs » ou « rôle de modèle »).
Vous configurez des prompts, la base de connaissances ou un abonnement et voulez comprendre les limites des concepts.

Termes

Session — une session d'assistant sur un appel. Elle a un cycle de vie : démarrage (session.start) → enregistrement audio → questions et réponses → fin avec sauvegarde des données. Une session possède une transcription, les questions posées et les réponses du modèle. La session est l'unité de comptabilisation des minutes et la base de l'historique dans le tableau de bord.

Segment de transcription (Segment) — un fragment de parole reconnue que Whisperer forme à la volée à partir de l'audio en streaming. Chaque segment est étiqueté avec un locuteur et un horodatage. Les segments s'accumulent pour constituer la transcription complète de la session, affichée sous forme de défilement dans le client et sauvegardée dans l'historique (sauf en mode no-logs).

Locuteur ([Me] / [Other]) — l'étiquette de locuteur dans la transcription. [Me] correspond à votre voix depuis le microphone, [Other] à la voix provenant de l'audio système (ce qui se joue dans vos écouteurs/haut-parleurs). Cet étiquetage est possible parce que le client capture deux sources audio indépendantes et associe une étiquette de locuteur à chaque bloc audio.

Mind-map (nœud : topic / action_item / decision) — la carte de réunion que Whisperer extrait après une session. Les nœuds (MeetingMapNode) sont de trois types : topic (un sujet discuté), action_item (une tâche à accomplir), decision (une décision prise). Dans le tableau de bord, la carte peut être visualisée et enrichie davantage (enrich-mindmap).

Modèle de prompt (role prompt) — une instruction système préliminaire pour le modèle, adaptée à un rôle spécifique. Définie par vous dans Prompt Studio et intégrée dans le prompt système avant le contexte utilisateur et le bloc de base de connaissances.

Rôle de modèle — la finalité pour laquelle un modèle est sélectionné. Whisperer dispose de sept rôles : responses (réponses de chat ordinaires), coding (code), vision (captures d'écran et images), system_design (réponse structurée avec des diagrammes Mermaid), generation (génération et enrichissement de la mind-map), transcription (reconnaissance vocale, Whisper), embedding (vectorisation de texte pour le RAG). Vous pouvez définir un modèle distinct pour chaque rôle.

Base de connaissances / Note (Note) — votre espace de stockage de connaissances personnelles dans le tableau de bord. Une note contient un titre, du texte Markdown et des tags. Les wiki-links de la forme [[...]] connectent les notes en un graphe (voisins, chemin le plus court, centralité). La base de connaissances est conservée jusqu'à ce que vous la supprimiez.

RAG (Retrieval-Augmented Generation) — le mécanisme par lequel la réponse du modèle est enrichie de faits issus de votre base de connaissances. Les notes sont découpées en morceaux (~512 tokens, chevauchement de 64), converties en embeddings et stockées dans une base de données vectorielle ; pour chaque requête, le système utilise une recherche cosinus pour trouver les fragments les plus pertinents (top-k) et les insère dans le prompt. Ainsi, les suggestions s'appuient sur vos matériaux, et pas seulement sur les connaissances générales du modèle.

Contexte utilisateur — des données arbitraires que vous fournissez à l'assistant à l'avance (par exemple, une description de votre rôle, de votre produit ou de votre CV). Défini dans votre profil, il influence le ton et la profondeur des réponses dans toutes les sessions.

Abonnement / Plan (Plan) — votre niveau d'accès au produit : Free, Start, Pro, Max. Le plan détermine la limite de minutes, l'accès à la base de connaissances, la multi-capture d'écran, le mode System Design et les modèles frontier. Le cœur du produit (sessions, base de connaissances) nécessite un abonnement payant actif.

Quota de minutes — la limite de temps de reconnaissance dans un plan. Avec Free, c'est 60 minutes par mois ; avec les plans payants, les minutes sont illimitées. Les minutes d'une session sont comptabilisées dans le quota, y compris en mode no-logs (compteur séparé, no_logs_minutes_used). Le quota est souple : la session en cours se terminera, mais vous ne pourrez pas en démarrer une nouvelle tant qu'il n'est pas reconstitué.

Mode no-logs (éphémère) — un mode de session privée dans lequel la transcription et les réponses ne sont pas écrites dans la base de données et sont supprimées à la fin de la session. Utile pour les conversations sensibles. Important : les minutes sont quand même débitées du quota.

Modèles frontier — les LLM phares et les plus puissants (par exemple, Claude Opus, GPT-4 haut de gamme et équivalents). Dans Whisperer, ils sont débloqués uniquement sur les plans Max.

Parrainage — un utilisateur que vous avez invité. Pour chaque achat qualifiant d'un filleul (plan Pro ou Max), vous recevez une récompense de 500 ₽ ; une récompense par invité.

Code promo — un code de réduction. Deux types : percent (une réduction en pourcentage sur le prix) et bonus_days (des jours d'abonnement bonus). La majoration de conversion de devise ne s'applique pas aux remises et aux bonus.

Comment les entités s'articulent

Les concepts de Whisperer forment un flux unique — de la conversation à la connaissance :

Vous démarrez une session. Le client capture deux sources audio et les étiquette avec les locuteurs [Me] / [Other].
La reconnaissance (le rôle de modèle transcription) convertit l'audio en segments de transcription.
Lorsque vous posez une question, le prompt système est assemblé : le modèle de prompt du rôle de modèle choisi → le contexte utilisateur → le bloc RAG issu de votre base de connaissances.
Le modèle répond ; en mode no-logs, ni la transcription ni les réponses ne sont sauvegardées, mais les minutes sont quand même déduites du quota défini par le plan.
Après la session, Whisperer extrait une mind-map (topic / action_item / decision) pour le résumé de la réunion.
Le niveau d'accès à tout ceci est défini par l'abonnement ; les codes promo et les parrainages aident à l'étendre ou à le rendre moins coûteux, et les modèles frontier sont activés sur Max.

Captures d'écran

📸 [Capture d'écran : transcription en direct avec les étiquettes [Me] et [Other]]

📸 [Capture d'écran : mind-map de réunion avec les nœuds topic/action_item/decision]

📸 [Capture d'écran : graphe de la base de connaissances construit à partir des wiki-links]

Erreurs courantes

Confondre une session avec une transcription. Une session est l'ensemble de la séance, avec la comptabilisation des minutes ; la transcription (un ensemble de segments) n'en est qu'une partie.
Considérer le mode no-logs comme « gratuit ». Les minutes en no-logs sont consommées normalement ; seules les données ne sont pas sauvegardées.
Attendre des modèles frontier sur Pro. Frontier n'est disponible que sur Max.
Essayer de donner des instructions via le contexte utilisateur. Le contexte fournit des faits vous concernant ; utilisez un modèle de Prompt Studio pour contrôler la façon dont l'assistant répond.

Bonnes pratiques

Consultez le glossaire avant de configurer des prompts et des rôles de modèle — cela vous fait gagner du temps de débogage.
Remplissez votre contexte utilisateur et votre base de connaissances à l'avance : le RAG intègre vos informations dans chaque réponse.
Utilisez les wiki-links entre les notes pour que le graphe de connaissances facilite la recherche et la navigation.
Pour les appels sensibles, activez le mode no-logs, en gardant à l'esprit que les minutes sont quand même consommées.