第一次会话:分步指南
概览
会话是一次通话的完整监听过程:Whisperer 监听音频、保留转录记录并回答你的问题。本页说明如何在悬浮窗中开始第一次会议、实时转录的样子、三种提问方式,以及事后在哪里查看历史记录。
Whisperer 监听两路音频源:麦克风(你的声音)和系统音频(对方的声音)。在 macOS 上,系统音频通过"屏幕录制"权限捕获——没有该权限将无法听到对方(详见 macOS 权限)。在 Windows 上,系统音频无需任何额外权限——只需麦克风权限(详见 Windows 权限)。
适用场景
在任何需要转录、建议或翻译的通话开始时启动会话。首次启动前,请确保设备已与账户配对,并已授予所有权限——参阅快速上手。
使用步骤
- 打开应用。 悬浮面板(GhostPanel)及命令栏(CommandBar)出现在屏幕顶层。
- 按下播放键。 Whisperer 开始录制:音量指示器(波形图)显示音频正在输入。
- 查看转录。 在实时转录条(LiveTranscriptStrip)中,发言按说话人标注:
[我]表示你的声音,[对方]表示系统音频。 - 提问——以下三种方式任选其一:
- 文字输入 — 在输入框中输入问题并发送。
- 基于已听到的内容 — 在空白输入框中按 Enter:Whisperer 根据最近听到的对话构建问题。
- 基于截图 — 截取屏幕图像,让模型分析图片(视觉理解)。
- 阅读回答。 回答以 Markdown 格式显示在回答区域(AnswerArea),支持
1/N分页,并可展开模型的推理过程。 - 结束会话。 按下暂停/停止键结束会话——转录和回答将保存到历史记录中(无痕模式除外)。
- 在网页控制台查看历史记录。 那里有完整转录、回答、会议思维导图(主题、决策、行动项)以及搜索功能。
截图
📸 [截图:悬浮窗命令栏,显示播放键和音量指示器]
📸 [截图:带有 [我] 和 [对方] 标签的实时转录]
📸 [截图:带有 1/N 分页和展开推理的回答区域]
常见误区
- 对方没有出现在转录中(
[对方])。 macOS 上最常见的原因是未授予"屏幕录制"权限——该权限用于捕获系统音频(参阅 macOS 权限)。Windows 上无需该权限——检查默认输出设备是否是通话实际播放的那个(loopback 只捕获默认设备);参阅 Windows 权限。 - "基于已听到内容"的提问没有生效。 此操作只在输入框为空时按 Enter 才会触发;若输入框中有文字,则发送该文字。
- 会话未保存到历史记录。 检查是否开启了无痕(ephemeral)模式:在该模式下,转录和回答在会话结束后会被删除,但分钟数仍会计入用量。
最佳实践
- 在重要会议前,先进行一次短暂的测试通话,确认转录中出现了
[我]和[对方]两个标签。 - 需要对刚说过的话快速做出回应时,使用空白输入框按 Enter——无需手动输入问题。
- 对于分析屏幕上的代码、图表或错误,可以截图——模型会将图像纳入回答。