Phiên đầu tiên của bạn: từng bước
Tổng quan
Một phiên là một lần lắng nghe duy nhất của cuộc gọi: Whisperer nghe âm thanh, ghi lại bản chép lời và trả lời các câu hỏi của bạn. Trang này hướng dẫn cách bắt đầu cuộc họp đầu tiên trong lớp phủ (overlay), bản chép lời trực tiếp trông như thế nào, cách đặt câu hỏi theo ba cách, và nơi tìm lại lịch sử sau đó.
Whisperer lắng nghe hai nguồn âm thanh: micro của bạn (giọng nói của bạn) và âm thanh hệ thống (giọng của người đối thoại). Trên macOS, âm thanh hệ thống được thu qua quyền "Screen Recording" (Ghi màn hình) — không có quyền này thì sẽ không nghe được người đối thoại (xem Quyền trên macOS). Trên Windows, âm thanh hệ thống được lấy mà không cần quyền bổ sung nào — bạn chỉ cần quyền truy cập micro (xem Quyền trên Windows).
Khi nào nên dùng
Hãy bắt đầu một phiên ngay đầu bất kỳ cuộc gọi nào mà bạn cần bản chép lời, gợi ý hoặc bản dịch. Trước lần khởi chạy đầu tiên, hãy đảm bảo thiết bị đã được ghép cặp với tài khoản của bạn và tất cả các quyền đã được cấp — xem Bắt đầu nhanh.
Từng bước
- Mở ứng dụng. Một bảng lớp phủ (GhostPanel) cùng thanh lệnh (CommandBar) xuất hiện trên đầu màn hình của bạn.
- Nhấn phát. Whisperer bắt đầu ghi: chỉ báo âm lượng (dạng sóng) cho thấy âm thanh đang được thu vào.
- Theo dõi bản chép lời. Trong dải trực tiếp (LiveTranscriptStrip), các câu nói được gắn nhãn theo người nói:
[Me]cho giọng của bạn và[Them]cho âm thanh hệ thống. - Đặt câu hỏi — theo một trong ba cách:
- Bằng văn bản — nhập câu hỏi của bạn vào ô nhập liệu rồi gửi đi.
- Từ nội dung đã nghe — nhấn Enter khi ô nhập liệu trống: Whisperer sẽ tạo câu hỏi từ phần hội thoại vừa nghe.
- Từ ảnh chụp màn hình — chụp màn hình để mô hình có thể phân tích hình ảnh (vision).
- Đọc câu trả lời. Các câu trả lời hiển thị trong vùng trả lời (AnswerArea) ở định dạng Markdown, có phân trang
1/Nvà tùy chọn mở rộng lập luận của mô hình. - Kết thúc phiên. Nhấn tạm dừng/dừng để kết thúc — bản chép lời và các câu trả lời được lưu vào lịch sử (trừ khi ở chế độ không lưu nhật ký).
- Mở lịch sử trong bảng điều khiển web. Tại đó bạn sẽ thấy toàn bộ bản chép lời, các câu trả lời, sơ đồ tư duy của cuộc họp (chủ đề, quyết định, mục hành động) và chức năng tìm kiếm.
Ảnh chụp màn hình
📸 [Ảnh chụp màn hình: thanh lệnh lớp phủ với nút phát và chỉ báo âm lượng]
📸 [Ảnh chụp màn hình: bản chép lời trực tiếp với nhãn [Me] và [Them]]
📸 [Ảnh chụp màn hình: vùng trả lời với phân trang 1/N và lập luận được mở rộng]
Các lỗi thường gặp
- Người đối thoại không xuất hiện trong bản chép lời (
[Them]). Trên macOS, nguyên nhân phổ biến nhất là chưa cấp quyền "Screen Recording" (Ghi màn hình) — đây chính là quyền thu âm thanh hệ thống (xem Quyền trên macOS). Trên Windows thì việc này không cần quyền nào — hãy kiểm tra rằng thiết bị đầu ra mặc định chính là thiết bị mà cuộc gọi đang phát qua (loopback chỉ lấy đúng thiết bị đó); xem Quyền trên Windows. - Câu hỏi "từ nội dung đã nghe" không hoạt động. Hành động này chỉ được kích hoạt khi nhấn Enter lúc ô nhập liệu trống; nếu trong ô đã có chữ thì chính đoạn chữ đó sẽ được gửi đi.
- Phiên không được lưu vào lịch sử. Hãy kiểm tra xem chế độ không lưu nhật ký (tạm thời) có đang bật không: ở chế độ này, bản chép lời và các câu trả lời sẽ bị xóa sau phiên, dù số phút vẫn được tính.
Thực hành tốt nhất
- Trước một cuộc họp quan trọng, hãy thực hiện một cuộc gọi thử ngắn và xác nhận rằng cả hai nhãn —
[Me]và[Them]— đều xuất hiện trong bản chép lời. - Dùng Enter khi ô trống khi bạn cần phản ứng nhanh với điều vừa được nói mà không phải tự soạn câu hỏi bằng tay.
- Để phân tích mã, sơ đồ hay lỗi trên màn hình, hãy chụp màn hình — mô hình sẽ đưa hình ảnh vào câu trả lời.