主要エンティティの用語集

概要

この用語集は、通話セッションからナレッジベース、プランに至るまで、Whisperer の中核となる概念の定義をまとめたものです。これにより、残りのドキュメントを推測せずに読めるようになります。どの記事で用語に出会っても、その正確な意味をここで確認できます。

これはリファレンスページです。手順を追ったプロシージャの代わりに、「エンティティの関連性」というセクションを設けています。これは、各概念がどのように一つの製品ワークフローへとまとまるかを示すものです。

利用する場面

  • ドキュメントを初めて読んでいて、用語を確認したいとき。
  • 別の記事で見慣れない用語(たとえば「no-logs」や「モデルロール」)が使われていたとき。
  • プロンプト、ナレッジベース、またはサブスクリプションを設定していて、各概念の境界を理解したいとき。

用語

セッション (Session) — 通話中のアシスタントの一回のセッション。ライフサイクルを持ちます:開始 (session.start) → 音声録音 → 質問と回答 → データ保存して終了。セッションには文字起こし、行われた質問、モデルの回答が紐づきます。セッションは分数計上の単位であり、ダッシュボードの履歴の基礎となります。

文字起こしセグメント (Segment) — Whisperer がストリーミング音声からその場で生成する、認識された発話の断片。各セグメントには話者とタイムスタンプがタグ付けされます。セグメントが積み重なってセッション全体の文字起こしを構成し、クライアントではティッカーとして表示され、履歴に保存されます(no-logs モードを除く)。

話者 ([Me] / [Other]) — 文字起こし中の話者ラベル。[Me] はマイクからのあなたの声、[Other] はシステム音声からの声(ヘッドホン/スピーカーで再生されているもの)です。このラベル付けは、クライアントが2つの独立した音声ソースをキャプチャし、各音声チャンクに話者ラベルをタグ付けすることで可能になっています。

マインドマップ (ノード: topic / action_item / decision) — セッション後に Whisperer が抽出する会議マップ。ノード (MeetingMapNode) には3つのタイプがあります:topic(議論されたトピック)、action_item(実行すべきタスク)、decision(下された決定)。ダッシュボードではマップを可視化し、さらに充実させること(enrich-mindmap)ができます。

プロンプトテンプレート (ロールプロンプト) — 特定のロールに合わせて調整されたモデル向けのシステム指示の下書き。Prompt Studio であなたが設定し、ユーザーコンテキストとナレッジベースブロックの前にシステムプロンプトへ組み込まれます。

モデルロール (Model role) — モデルが選択される目的。Whisperer には7つのロールがあります:responses(通常のチャット回答)、coding(コード)、vision(スクリーンショットや画像)、system_design(Mermaid 図を含む構造化された回答)、generation(マインドマップの生成と充実)、transcription(音声認識、Whisper)、embedding(RAG 向けのテキストのベクトル化)。各ロールに対して個別のモデルを設定できます。

ナレッジベース / ノート (Note) — ダッシュボード内のあなた個人のナレッジストア。ノートにはタイトル、Markdown テキスト、タグが含まれます。[[...]] 形式の Wiki リンクがノートをグラフ(隣接、最短経路、中心性)へとつなぎます。ナレッジベースは削除するまで保持されます。

RAG (Retrieval-Augmented Generation) — モデルの回答があなたのナレッジベースの事実で補強される仕組み。ノートはチャンク(約512トークン、オーバーラップ64)に分割され、埋め込みに変換されてベクトルデータベースに保存されます。クエリごとに、システムはコサイン検索で関連性の高い上位 k 個の断片を見つけ、プロンプトに挿入します。これにより、提案はモデルの一般知識だけでなく、あなたの資料に基づいたものになります。

ユーザーコンテキスト — あなたが事前にアシスタントに提供する任意のデータ(たとえば、あなたのロール、製品、または履歴書の説明)。プロフィールで設定すると、すべてのセッションにわたって回答のトーンや深さに影響します。

サブスクリプション / プラン (Plan) — 製品へのアクセスレベル:Free、Start、Pro、Max。プランによって、分数制限、ナレッジベースへのアクセス、マルチスクリーンショット、System Design モード、フロンティアモデルが決まります。製品の中核機能(セッション、ナレッジベース)には有効な有料サブスクリプションが必要です。

分数クォータ — プラン内の認識時間の制限。Free では月60分、有料プランでは分数は無制限です。セッションの分数はクォータに計上され、no-logs モードでも同様です(別カウンター no_logs_minutes_used)。クォータはソフトです:現在のセッションは終了できますが、補充されるまで新しいセッションを開始することはできません。

No-logs(エフェメラル)モード — 文字起こしと回答がデータベースに書き込まれず、セッション終了後に削除されるプライベートセッションモード。機密性の高い会話に役立ちます。重要:分数はクォータから引き続き消費されます。

フロンティアモデル (Frontier models) — 旗艦級で最も強力な LLM(たとえば Claude Opus、最上位の GPT、およびそれらに相当するもの)。Whisperer ではMax プランでのみ解放されます。

リファラル (Referral) — あなたが招待したユーザー。リファラルによる対象購入(Pro または Max プラン)ごとに500₽の報酬が得られます。招待者1人につき報酬は1回です。

プロモコード (Promo code) — 割引コード。2種類あります:percent(価格に対するパーセンテージ割引)と bonus_days(ボーナスのサブスクリプション日数)。通貨換算の上乗せは、割引やボーナスには適用されません。

エンティティの関連性

Whisperer の概念は、会話からナレッジへと至る一つの流れを形成します:

  1. セッションを開始します。クライアントは2つの音声ソースをキャプチャし、話者 [Me] / [Other] をタグ付けします。
  2. 認識(transcription モデルロール)が音声を文字起こしセグメントに変換します。
  3. 質問をすると、システムプロンプトが組み立てられます:選択したモデルロールプロンプトテンプレートユーザーコンテキスト → あなたのナレッジベースからの RAG ブロック。
  4. モデルが回答します。no-logs モードでは文字起こしも回答も保存されませんが、プランで設定されたクォータから分数は引き続き差し引かれます。
  5. セッション後、Whisperer は会議サマリー用にマインドマップ(topic / action_item / decision)を抽出します。
  6. これらすべてへのアクセスレベルはサブスクリプションで設定されます。プロモコードリファラルはそれを延長または安価にするのに役立ち、フロンティアモデルは Max で有効になります。

スクリーンショット

📸 [スクリーンショット:[Me] と [Other] ラベル付きのライブ文字起こし]

📸 [スクリーンショット:topic/action_item/decision ノードを持つ会議マインドマップ]

📸 [スクリーンショット:Wiki リンクから構築されたナレッジベースグラフ]

よくある間違い

  • セッションと文字起こしを混同する。 セッションはセッション全体であり、分数計上を伴います。文字起こし(セグメントの集合)はその一部にすぎません。
  • no-logs を「無料」だと考える。 no-logs でも分数は通常どおり消費されます。保存されないのはデータだけです。
  • Pro でフロンティアモデルを期待する。 フロンティアは Max でのみ利用できます。
  • ユーザーコンテキストを通じてコマンドを発行しようとする。 コンテキストはあなたに関する事実を提供するものです。アシスタントの応答方法を制御するには Prompt Studio のテンプレートを使ってください。

ベストプラクティス

  • プロンプトとモデルロールを設定する前に用語集を確認しましょう — デバッグ時間の節約になります。
  • ユーザーコンテキストナレッジベースを事前に記入しましょう:RAG はあなたの事実をすべての回答に取り込みます。
  • ノート間で Wiki リンクを使い、ナレッジグラフが検索やナビゲーションに役立つようにしましょう。
  • 機密性の高い通話では no-logs を有効にしましょう。ただし分数は引き続き消費される点を念頭に置いてください。

関連記事