よくある質問(FAQ)
概要
ここでは、Whisperer に関する最もよくある質問への簡潔な回答をまとめています。通話中のプライバシーから請求、モデルの選び方まで幅広く扱います。回答は短く(1〜3文)、さらに詳しく知りたい場合は詳細記事へのリンクを掲載しています。
質問はトピックごとに分類されています。製品の一般情報、インストールと権限、音声・ビデオサービス、プランと請求、AI とモデル、ナレッジベース、プライバシーと no-logs、アカウントです。
こんなときに
- 短く具体的な質問があり、すばやく答えが欲しいとき。
- 製品を知り始めたばかりで、よくある疑問を解消したいとき。
- あるトピックの詳細についてどの記事を確認すればよいか探しているとき。
ステップバイステップ
答えを見つけるには、1)質問のトピックを特定する、2)下記の該当セクションへ移動する、3)必要に応じて回答内のリンクから関連記事を開く、という手順で進めます。
一般 / 製品
Whisperer とは何ですか? 個人向けの AI 通話アシスタントです。あらゆるビデオサービスの上に重なるオーバーレイとして動作し、音声を聞き取り、文字起こしを行い、LLM を通じて回答を提案します。詳しくは Whisperer とは をご覧ください。
どのビデオサービスで使えますか? Zoom、Google Meet、Microsoft Teams、Telegram、Discord など、どれでも使えます。サービスへの統合はありません。Whisperer はアプリの上に重なるオーバーレイとして動作します。
通話に「ボット」を招待する必要がありますか? いいえ。Whisperer は通話に参加者として加わることはなく、招待リンクも必要ありません。Mac 上でローカルに動作します。
相手に提案や文字起こしは見えますか? いいえ。オーバーレイは配信や画面共有では見えません。あなただけが見ることができます。
Whisperer は誰のためのものですか? 求職者(System Design 面接を含む)、教師やチューター、営業・マネージャー、そして頻繁に通話をするすべての人のためのものです。
System Design モードとは何ですか? モデルが図(Mermaid)付きの構造化された回答を生成するモードです。有料プランで利用できます。
Whisperer は会話を翻訳しますか? はい、オーバーレイ設定で翻訳を有効にできます。別の行(TranslationStrip)として表示されます。
インストールと権限
クライアントはどこでダウンロードできますか? 配布物は Web ダッシュボード(ダウンロードセクション)からダウンロードできます。バージョンとサイズを含むビルドの一覧は builds サービスから提供されます。
Whisperer はどの OS で動作しますか? macOS(Intel および Apple Silicon)と Windows(10 のバージョン 1809+ または 11)向けのネイティブクライアントがあります。Web ダッシュボード(履歴、ナレッジベース、請求)はどのブラウザからでもアクセスできます。macOS へのインストール と Windows へのインストール をご覧ください。
Windows 版はありますか? はい。macOS に近い機能(ライブ文字起こし、オーバーレイ、スクリーンショット、翻訳、ホットキー)を備えた本格的なネイティブアプリです。Windows 10 1809+ または 11、および WebView2 Runtime(自動でインストールされます)が必要です。Windows へのクライアントのインストール と Windows での権限 をご覧ください。
macOS ではどの権限が必要ですか? マイク(あなたの声)、画面収録(相手のシステム音声とスクリーンショット)、アクセシビリティ(グローバルホットキー)です。
Windows ではどうですか? マイクのみです。相手のシステム音声は自動的に取得され、スクリーンショットとホットキーは個別の権限なしで動作します。Windows での権限 をご覧ください。
ビデオを録画しないのに、なぜ「画面収録」権限が必要なのですか? macOS はこれを利用して システム音声(相手の声)とスクリーンショットを提供します。これがないと、アシスタントは相手の声を聞き取れません。
権限が付与されていない場合はどうすればよいですか? 初回起動時に権限ウィザード(PermissionWizard)が起動し、システム設定 → プライバシーとセキュリティへ案内します。
ホットキーはどう設定しますか? 5 つのアクション(pushToTalk、toggleOverlay、searchKB、captureScreenshot、textInput)は、クライアントおよび Web ダッシュボードで設定します。
音声・ビデオサービス
Whisperer は誰が話しているかをどう判別しますか? マイク([Me])とシステム音声([Other])の 2 つのソースを取得し、各フラグメントに話者のタグを付けます。
アシスタントが相手の声を聞き取れません。なぜですか? おそらく「画面収録」権限が付与されていません。これこそがシステム音声へのアクセスを提供するものです。システム設定で付与してください。
認識のために録音済みの音声ファイルをアップロードできますか? いいえ。文字起こしはストリーミング(リアルタイム)のみで、バッチでのファイルアップロードはありません。
文字起こしは何語で行われますか? 言語はセッションごとに設定されます(デフォルトはロシア語)。認識は多言語対応です(Whisper、標準的な言語コード)。
文字起こしの言語を変更するにはどうすればよいですか? 言語はセッション開始時(hello パラメータ)に選択します。デフォルトは ru で、サポートされている他の言語を指定できます。
ノイズ抑制はありますか? はい、ノイズ抑制はオーバーレイ設定で幅、不透明度、フォントサイズとともに有効にできます。
スクリーンショットから作業できますか? はい。vision モードで画像を解析するための単一スクリーンショットとマルチスクリーンショット(フレームを蓄積)があります。マルチスクリーンショットは有料プランで利用できます。
プランと請求
Free と有料プランの違いは何ですか? Free は月 60 分と基本的な提案を提供しますが、コア機能はありません。履歴付きのセッション、ナレッジベース、マルチスクリーンショット、System Design、フロンティアモデルは使えません。詳しくは サブスクリプション、プラン、クォータ をご覧ください。
どのようなプランがありますか? Free、Start、Pro、Max です。機能の違いは サブスクリプションに関する記事 に、価格と期間は プランページ にあります。
Max は Pro に加えて何が含まれますか? フロンティアモデル(フラッグシップの Claude Opus、最上位の GPT、およびそれらに相当するもの)へのアクセスです。それ以外のコア機能は Pro と同じです。
フロンティアモデルとは何ですか? 最も強力な LLM です。Whisperer では Max プランでのみアンロックされます。
Free では何分使えますか? 月 60 分です。有料プランでは分数は無制限です。
分数を使い切るとどうなりますか? 制限はソフトです。現在のセッションは終了まで続けられますが、クォータが回復するか有料プランに切り替えるまで新しいセッションは開始できません。
どの通貨で支払いますか? 通貨は国によって決まります。ロシアはルーブル、ヨーロッパは EUR、それ以外の地域は USD です。詳しくは プランページ をご覧ください。
EUR や USD ではどう支払いますか? EUR/USD の支払いは moneta.ru(PayAnyWay、Visa/Mastercard/Maestro)を通じて行われます。ルーブルの支払いは TBank(MIR カード)を通じて行われます。
なぜ外貨価格はルーブルからの単純換算より高いのですか? ルーブルの基本価格に 1.30 の係数が適用され、中央銀行レートで割って切り捨てられます。この上乗せは割引やボーナスには適用されません。
返金はどうすれば受けられますか? 返金はサポートを通じて処理されます。ダッシュボードでのセルフサービスでのキャンセルはありません。サポートにご連絡ください。
プロモコードとは何ですか? 割引コードです。percent(割引率)または bonus_days(ボーナスのサブスクリプション日数)のタイプがあります。
紹介プログラムはどう機能しますか? 招待した人が対象となる購入(Pro または Max)をするごとに 500 ₽ がもらえます。報酬は招待者 1 人につき 1 回です。
AI とモデル
音声を認識するモデルはどれですか? Whisper です。リアルタイムのみです。
提案に利用できる LLM は何ですか? モデルファミリー:Claude(Opus/Sonnet/Haiku)、GPT、DeepSeek、Qwen、Gemini、Grok、Llama。利用できるセットはプランによって異なります。
「モデルロール」とは何ですか? モデルの用途です。responses(回答)、coding(コード)、vision(スクリーンショット)、system_design(図)、generation(マインドマップ)、transcription(音声)、embedding(RAG)。各ロールに個別のモデルを設定できます。
モデルを切り替えるにはどうすればよいですか? 設定で各ロールにモデルを割り当てられます。利用できるセットはプランによって制限されます(フロンティアは Max のみ)。
モデルの回答は何で構成されていますか? システムプロンプト:ロールプロンプト → ユーザーコンテキスト → ナレッジベースブロック(RAG)です。
ミーティングのマインドマップとは何ですか? topic / action_item / decision ノードからなるミーティングマップで、Whisperer がセッション後に抽出します。ダッシュボードでさらに充実させることができます。
ナレッジベース
ナレッジベースとは何ですか? あなたのメモ(Markdown + タグ)を保存するもので、その事実は RAG を通じてモデルの回答に組み込まれます。有料プランで利用できます。
メモはどのように回答に反映されますか? メモはチャンクに分割され、埋め込みに変換されてベクトルデータベースに保存されます。各クエリに対してコサイン検索が関連するフラグメントを見つけ、プロンプトに挿入します。
ウィキリンク [[...]] は何をしますか? メモをグラフ(隣接、最短経路、中心性)でつなげます。ナビゲーションや検索に便利です。
私のメモは誰が見られますか? あなただけです。アクセスは fail-closed の原則で閉じられています。
編集後に検索を更新するにはどうすればよいですか? 再インデックス(ボタン/reindex から)を実行してください。バックグラウンドで埋め込みを再構築します。
プライバシー / No-logs
no-logs モードとは何ですか? 文字起こしと回答が保存されず、セッション終了後に削除されるセッションモードです。詳しくは セキュリティとプライバシー をご覧ください。
no-logs は分数を消費しますか? はい。分数は通常どおり消費されます。節約されるのはデータの保存だけです。
通常のセッション後には何が保存されますか? 文字起こしと回答(履歴と検索用)です。ただし no-logs セッションは除きます。ナレッジベースは、あなたが削除するまで保存されます。
ファイルはどこに保存されますか? あなたのデバイス上にローカルに保存されます。外部のオブジェクトストレージ(S3)はありません。
私のデータへのアクセスはどう保護されていますか? データはアカウントごとに分離され、トークンはシステムのセキュアストレージに保存されます。詳しくは セキュリティとプライバシー をご覧ください。
データを削除するにはどうすればよいですか? セッションとメモはダッシュボードで削除します。アカウントの完全削除はサポートを通じて行います。
アカウント
登録には何が必要ですか? 名前、メールアドレス、パスワード(8 文字以上)、そしてキャプチャの通過です。詳しくは 登録とメール確認 をご覧ください。
確認コードが届きませんでした。どうすればよいですか? 「迷惑メール」を確認し、約 60 秒待ってから「再送信」をクリックしてください。コードは 5 分間有効で、最大 3 回まで試せます。
コードの有効期限が切れた、または試行回数を使い切りました。 新しいコードをリクエストしてください(クールダウン約 60 秒)。新しいコードも再び 5 分間有効で 3 回試せます。
メールを確認する前にサインインできますか? いいえ、アドレスが確認されるまでサインインはブロックされます。
パスワードはどうリセットしますか? サインインページでリンクをリクエストしてください。24 時間有効で、1 回だけ使えます。パスワードを変更すると、すべてのデバイスからログアウトされます。
macOS クライアントをアカウントと連携するには(デバイスコード)どうすればよいですか? Web で接続セクションを開くと、クライアントが一度きりのコード(30 分間有効)を受け取り、それをトークンと交換します。アプリへのリダイレクトは whisperer:// スキームを通じて行われます。
インターフェースの言語を変更するにはどうすればよいですか? Whisperer は 16 言語をサポートしています。選択した言語はプロフィールに保存されます。初回ログイン時には、ブラウザとジオ情報から言語が検出されます。
アカウントにはどのようなステータスがありますか? active(アクティブ)、frozen(凍結)、banned(禁止)です。
スクリーンショット
📸 [スクリーンショット:ビデオ通話ウィンドウの上に表示された Whisperer オーバーレイ]
📸 [スクリーンショット:メール確認コードの入力画面]
📸 [スクリーンショット:ダッシュボードでのプランと通貨の選択]
よくある間違い
- 通話でボットを待つこと。 Whisperer はオーバーレイとしてローカルで動作し、通話には参加しません。
- 「画面収録」を付与しないこと。 これがないと相手の声が聞こえず、スクリーンショットも動作しません。
- no-logs を分数の点で無料だと考えること。 分数は常に消費されます。
- 音声ファイルのアップロードを探すこと。 文字起こしはストリーミングのみです。
ベストプラクティス
- 最初の通話の前に、権限ウィザードを最後まで進めておきましょう。
- ナレッジベースとユーザーコンテキストを事前に入力しておくと、回答がより正確になります。
- 機密性の高い会話では no-logs を有効にしましょう。
- Free の 60 分に常に達してしまう場合は、無制限の分数とコア機能のために有料プランに切り替えましょう。