첫 세션: 단계별 안내
개요
세션이란 통화 한 번을 듣는 단일 실행 단위입니다. Whisperer는 오디오를 듣고, 스크립트(전사)를 기록하며, 여러분의 질문에 답합니다. 이 페이지에서는 오버레이에서 첫 회의를 시작하는 방법, 실시간 스크립트가 어떻게 보이는지, 세 가지 방식으로 질문하는 법, 그리고 나중에 기록을 어디서 찾는지 설명합니다.
Whisperer는 두 가지 오디오 소스를 듣습니다. 여러분의 마이크(본인의 목소리)와 시스템 오디오(상대방의 목소리)입니다. macOS에서는 시스템 오디오가 "화면 기록" 권한을 통해 캡처됩니다 — 이 권한이 없으면 상대방의 목소리가 들리지 않습니다(macOS 권한 참고). Windows에서는 별도의 권한 없이 시스템 오디오를 가져옵니다 — 마이크 접근 권한만 있으면 됩니다(Windows 권한 참고).
사용 시점
스크립트, 답변 제안, 또는 번역이 필요한 모든 통화의 시작 시점에 세션을 시작하세요. 처음 실행하기 전에 기기가 계정과 페어링되어 있고 모든 권한이 부여되었는지 확인하세요 — 빠른 시작을 참고하세요.
단계별 안내
- 앱을 엽니다. 명령 바(CommandBar)가 있는 오버레이 패널(GhostPanel)이 화면 위에 나타납니다.
- 재생을 누릅니다. Whisperer가 녹음을 시작합니다. 음량 표시기(파형)가 오디오가 들어오고 있음을 보여줍니다.
- 스크립트를 지켜봅니다. 실시간 스트립(LiveTranscriptStrip)에서 발언은 화자별로 표시됩니다. 본인의 목소리는
[Me], 시스템 오디오는[Them]입니다. - 질문하기 — 세 가지 방식 중 하나로:
- 텍스트로 — 입력란에 질문을 입력하고 전송합니다.
- 들은 내용으로부터 — 빈 입력란에서 Enter를 누릅니다. Whisperer가 최근에 들은 대화로부터 질문을 구성합니다.
- 스크린샷으로부터 — 스크린샷을 찍어 모델이 이미지를 분석하도록 합니다(비전).
- 답변을 읽습니다. 답변은 답변 영역(AnswerArea)에 Markdown 형식으로 나타나며,
1/N페이지 매김과 모델의 추론 과정을 펼쳐 볼 수 있는 옵션이 제공됩니다. - 세션을 종료합니다. 일시정지/정지를 눌러 마칩니다 — 스크립트와 답변이 기록에 저장됩니다(no-logs 모드 제외).
- 웹 대시보드에서 기록을 엽니다. 그곳에서 전체 스크립트, 답변, 회의 마인드맵(주제, 결정 사항, 실행 항목), 그리고 검색 기능을 찾을 수 있습니다.
스크린샷
📸 [스크린샷: 재생 버튼과 음량 표시기가 있는 오버레이 명령 바]
📸 [스크린샷: [Me]와 [Them] 레이블이 있는 실시간 스크립트]
📸 [스크린샷: 1/N 페이지 매김과 펼쳐진 추론 과정이 있는 답변 영역]
흔한 실수
- 스크립트에 상대방이 나타나지 않음(
[Them]). macOS에서 가장 흔한 원인은 "화면 기록" 권한이 부여되지 않은 것입니다 — 시스템 오디오를 캡처하는 권한입니다(macOS 권한 참고). Windows에서는 이를 위한 권한이 필요 없습니다 — 통화가 재생되는 출력 장치가 기본 장치로 설정되어 있는지 확인하세요(루프백은 그 장치만 가져옵니다). Windows 권한을 참고하세요. - "들은 내용으로부터" 질문이 작동하지 않음. 이 동작은 입력란이 비어 있을 때만 Enter로 발동됩니다. 입력란에 텍스트가 있으면 그 텍스트가 대신 전송됩니다.
- 세션이 기록에 저장되지 않음. no-logs(임시) 모드가 켜져 있는지 확인하세요. 이 모드에서는 세션 종료 후 스크립트와 답변이 삭제되지만, 사용 시간(분)은 여전히 집계됩니다.
모범 사례
- 중요한 회의 전에 짧은 테스트 통화를 실행하여 두 레이블 —
[Me]와[Them]— 이 모두 스크립트에 나타나는지 확인하세요. - 방금 들은 내용에 빠르게 반응해야 하고 직접 질문을 작성할 여유가 없을 때는 빈 입력란에서 Enter를 사용하세요.
- 화면의 코드, 다이어그램, 또는 오류를 분석하려면 스크린샷을 찍으세요 — 모델이 이미지를 답변에 반영합니다.