第一次会话:分步指南

概览

会话是一次通话的完整监听过程:Whisperer 监听音频、保留转录记录并回答你的问题。本页说明如何在悬浮窗中开始第一次会议、实时转录的样子、三种提问方式,以及事后在哪里查看历史记录。

Whisperer 监听两路音频源:麦克风(你的声音)和系统音频(对方的声音)。在 macOS 上,系统音频通过"屏幕录制"权限捕获——没有该权限将无法听到对方(详见 macOS 权限)。在 Windows 上,系统音频无需任何额外权限——只需麦克风权限(详见 Windows 权限)。

适用场景

在任何需要转录、建议或翻译的通话开始时启动会话。首次启动前,请确保设备已与账户配对,并已授予所有权限——参阅快速上手

使用步骤

  1. 打开应用。 悬浮面板(GhostPanel)及命令栏(CommandBar)出现在屏幕顶层。
  2. 按下播放键。 Whisperer 开始录制:音量指示器(波形图)显示音频正在输入。
  3. 查看转录。 在实时转录条(LiveTranscriptStrip)中,发言按说话人标注:[我] 表示你的声音,[对方] 表示系统音频。
  4. 提问——以下三种方式任选其一:
    • 文字输入 — 在输入框中输入问题并发送。
    • 基于已听到的内容 — 在空白输入框中按 Enter:Whisperer 根据最近听到的对话构建问题。
    • 基于截图 — 截取屏幕图像,让模型分析图片(视觉理解)。
  5. 阅读回答。 回答以 Markdown 格式显示在回答区域(AnswerArea),支持 1/N 分页,并可展开模型的推理过程。
  6. 结束会话。 按下暂停/停止键结束会话——转录和回答将保存到历史记录中(无痕模式除外)。
  7. 在网页控制台查看历史记录。 那里有完整转录、回答、会议思维导图(主题、决策、行动项)以及搜索功能。

截图

📸 [截图:悬浮窗命令栏,显示播放键和音量指示器]

📸 [截图:带有 [我] 和 [对方] 标签的实时转录]

📸 [截图:带有 1/N 分页和展开推理的回答区域]

常见误区

  • 对方没有出现在转录中([对方])。 macOS 上最常见的原因是未授予"屏幕录制"权限——该权限用于捕获系统音频(参阅 macOS 权限)。Windows 上无需该权限——检查默认输出设备是否是通话实际播放的那个(loopback 只捕获默认设备);参阅 Windows 权限
  • "基于已听到内容"的提问没有生效。 此操作只在输入框为空时按 Enter 才会触发;若输入框中有文字,则发送该文字。
  • 会话未保存到历史记录。 检查是否开启了无痕(ephemeral)模式:在该模式下,转录和回答在会话结束后会被删除,但分钟数仍会计入用量。

最佳实践

  • 在重要会议前,先进行一次短暂的测试通话,确认转录中出现了 [我][对方] 两个标签。
  • 需要对刚说过的话快速做出回应时,使用空白输入框按 Enter——无需手动输入问题。
  • 对于分析屏幕上的代码、图表或错误,可以截图——模型会将图像纳入回答。

相关文章