Vòng đời Phiên

Phiên (session) là đơn vị làm việc cốt lõi trong Whisperer: khoảng thời gian mà ứng dụng khách lắng nghe cuộc họp, chuyển lời nói thành văn bản và nhận phản hồi từ LLM. Hiểu rõ vòng đời giúp bạn sử dụng đúng các thao tác bắt đầu/tạm dừng, diễn giải các trạng thái trong bảng điều khiển và xử lý sự cố.

Khi nào nên đọc bài này

Hãy đọc bài viết này nếu bạn muốn hiểu:

  • điều gì xảy ra với dữ liệu của bạn ở từng giai đoạn của cuộc họp;
  • vì sao đôi khi phản hồi bị trễ và khi nào bản ghi lời nói được lưu;
  • cách kết nối giữa ứng dụng khách và máy chủ hoạt động.

Các giai đoạn của phiên

1. Bắt đầu

Nhấn nút "Bắt đầu" (hoặc phím tắt) sẽ chuyển ứng dụng khách sang chế độ hoạt động:

  1. Ứng dụng khách mở kết nối tới máy chủ và gửi mã định danh thiết bị cùng token.
  2. Máy chủ xác thực gói đăng ký và hạn mức số phút. Nếu kiểm tra hợp lệ, máy chủ xác nhận việc bắt đầu phiên và trả về mã định danh phiên.
  3. Ứng dụng khách kích hoạt thu âm và bắt đầu ghi.

2. Ghi âm (Streaming)

Âm thanh được truyền theo từng đoạn ngắn khoảng mỗi ~0,8 giây. Mỗi đoạn được gắn nhãn người nói: người dùng hoặc đối phương.

Máy chủ đệm (buffer) các đoạn âm thanh và gửi đi để nhận dạng. Bản ghi lời nói được trả về ứng dụng khách theo thời gian thực và hiển thị trong LiveTranscriptStrip.

3. Yêu cầu và phản hồi

Khi người dùng nhấn "Hỏi" (hoặc phím tắt), ứng dụng khách gửi một khung ask kèm theo ngữ cảnh bản ghi hiện tại.

Máy chủ lắp ghép câu lệnh hệ thống (lời nhắc vai trò → ngữ cảnh người dùng → RAG từ cơ sở tri thức) và truy vấn LLM. Phản hồi được truyền theo luồng: văn bản hiện ra ngay khi được tạo và hiển thị tức thì trong AnswerArea với hỗ trợ Markdown và phân trang (nếu có nhiều phản hồi).

4. Tạm dừng

Nhấn "Tạm dừng" sẽ ngừng thu âm, nhưng kết nối WebSocket vẫn được giữ mở. Bộ đếm thời gian phiên tạm dừng. Tiếp tục bằng cách nhấn "Tiếp tục".

5. Kết thúc

Nhấn "Dừng" hoặc đóng ứng dụng khách:

  1. Ứng dụng khách gửi khung session.end.
  2. Máy chủ ghi (flush) các bản ghi đã đệm và danh sách phản hồi đã hoàn tất vào cơ sở dữ liệu.
  3. WebSocket đóng lại.
  4. Trong bảng điều khiển web, phiên xuất hiện ở mục Lịch sử cùng toàn bộ bản ghi và phần phân tích.

📸 [Ảnh chụp màn hình: Bảng điều khiển Whisperer ở chế độ ghi — hiển thị LiveTranscriptStrip và các nút điều khiển]

Lưu trữ dữ liệu

Theo mặc định, bản ghi lời nói và phản hồi của LLM được lưu vào cơ sở dữ liệu và có thể truy cập trong bảng điều khiển. Nếu bật chế độ no-logs, dữ liệu sẽ bị xóa sau khi phiên kết thúc — nhưng số phút đã sử dụng vẫn được tính.

Lỗi thường gặp

Lỗi Nguyên nhân Cách khắc phục
Phiên không bắt đầu Email chưa được xác nhận hoặc không có gói đăng ký đang hoạt động Kiểm tra trạng thái tài khoản và hạn mức
"Không nghe được người kia" Chưa cấp quyền ghi màn hình (macOS) hoặc không thu được âm thanh hệ thống (Windows) Quyền trên macOS / Windows
Bản ghi không hiện ra Kết nối internet kém hoặc mất WebSocket Kiểm tra mạng; khởi động lại phiên
Phản hồi LLM mất quá nhiều thời gian Nhà cung cấp AI quá tải hoặc đang chọn mô hình chậm Đổi mô hình trong phần cài đặt

Thực hành tốt nhất

  • Dừng phiên một cách rõ ràng bằng nút "Dừng" — điều này đảm bảo dữ liệu được ghi vào lịch sử.
  • Tạm dừng trong những khoảng nghỉ dài của cuộc họp — bộ đếm thời gian dừng lại và số phút không bị lãng phí.
  • Dùng no-logs cho các cuộc họp bảo mật, nơi việc lưu bản ghi lời nói là không mong muốn.

Bài viết liên quan