Bảng thuật ngữ các thực thể chính
Tổng quan
Bảng thuật ngữ này tập hợp các định nghĩa về những khái niệm cốt lõi của Whisperer — từ phiên cuộc gọi đến cơ sở tri thức và các gói cước. Nó tồn tại để phần còn lại của tài liệu đọc lên mà không phải đoán mò: khi bạn gặp một thuật ngữ trong bất kỳ bài viết nào, bạn sẽ tìm thấy nghĩa chính xác của nó tại đây.
Đây là một trang tham khảo. Thay vì một quy trình từng bước, nó bao gồm phần "Các thực thể kết nối với nhau như thế nào" — phần này cho thấy các khái niệm hợp lại thành một luồng làm việc sản phẩm thống nhất ra sao.
Khi nào dùng
- Bạn đang đọc tài liệu lần đầu và muốn kiểm tra các thuật ngữ.
- Một bài viết khác đã dùng một thuật ngữ lạ (ví dụ, "no-logs" hoặc "vai trò mô hình").
- Bạn đang cấu hình prompt, cơ sở tri thức, hoặc một gói đăng ký và muốn hiểu ranh giới của các khái niệm.
Thuật ngữ
Phiên (Session) — một phiên trợ lý trong một cuộc gọi. Nó có một vòng đời: bắt đầu (session.start) → ghi âm → hỏi và đáp → kết thúc cùng với việc lưu dữ liệu. Một phiên có gắn kèm bản ghi lời thoại, các câu hỏi đã đặt, và các câu trả lời của mô hình. Phiên là đơn vị tính số phút và là cơ sở của lịch sử trong bảng điều khiển.
Đoạn bản ghi (Segment) — một mảnh lời nói được nhận diện mà Whisperer tạo ngay tức thì từ luồng âm thanh trực tuyến. Mỗi đoạn được gắn thẻ với một người nói và một dấu thời gian. Các đoạn cộng lại thành bản ghi lời thoại đầy đủ của phiên, hiển thị dưới dạng dải chạy trong ứng dụng khách và được lưu trong lịch sử (trừ khi ở chế độ no-logs).
Người nói ([Me] / [Other]) — nhãn người nói trong bản ghi lời thoại. [Me] là giọng của bạn từ micrô, [Other] là giọng từ âm thanh hệ thống (những gì phát ra trong tai nghe/loa của bạn). Việc gắn nhãn này khả thi vì ứng dụng khách thu hai nguồn âm thanh độc lập và gắn thẻ mỗi đoạn âm thanh bằng một nhãn người nói.
Sơ đồ tư duy (nút: topic / action_item / decision) — bản đồ cuộc họp mà Whisperer trích xuất sau một phiên. Các nút (MeetingMapNode) có ba loại: topic (một chủ đề đã thảo luận), action_item (một việc cần làm), decision (một quyết định đã đưa ra). Trong bảng điều khiển, bản đồ có thể được trực quan hóa và làm giàu thêm (enrich-mindmap).
Mẫu prompt (prompt theo vai trò) — một chỉ dẫn hệ thống nháp cho mô hình được điều chỉnh theo một vai trò cụ thể. Do bạn thiết lập trong Prompt Studio và được nhúng vào prompt hệ thống trước ngữ cảnh người dùng và khối cơ sở tri thức.
Vai trò mô hình — mục đích mà một mô hình được chọn để đảm nhiệm. Whisperer có bảy vai trò: responses (câu trả lời trò chuyện thông thường), coding (mã nguồn), vision (ảnh chụp màn hình và hình ảnh), system_design (câu trả lời có cấu trúc với sơ đồ Mermaid), generation (tạo và làm giàu sơ đồ tư duy), transcription (nhận diện giọng nói, Whisper), embedding (vector hóa văn bản cho RAG). Bạn có thể thiết lập một mô hình riêng cho mỗi vai trò.
Cơ sở tri thức / Ghi chú (Note) — kho tri thức cá nhân của bạn trong bảng điều khiển. Một ghi chú chứa tiêu đề, văn bản Markdown, và các thẻ. Các liên kết wiki dạng [[...]] kết nối các ghi chú thành một đồ thị (lân cận, đường đi ngắn nhất, độ trung tâm). Cơ sở tri thức được giữ cho đến khi bạn xóa nó.
RAG (Retrieval-Augmented Generation) — cơ chế mà nhờ đó câu trả lời của mô hình được bổ sung bằng các sự kiện từ cơ sở tri thức của bạn. Ghi chú được chia thành các khối (~512 token, chồng lấn 64), chuyển thành embedding, và lưu trong một cơ sở dữ liệu vector; với mỗi truy vấn, hệ thống dùng tìm kiếm cosine để tìm top-k mảnh liên quan và chèn chúng vào prompt. Bằng cách này, các gợi ý dựa trên tài liệu của bạn, không chỉ dựa trên kiến thức tổng quát của mô hình.
Ngữ cảnh người dùng — dữ liệu tùy ý mà bạn cung cấp cho trợ lý từ trước (ví dụ, mô tả về vai trò, sản phẩm, hoặc sơ yếu lý lịch của bạn). Được thiết lập trong hồ sơ của bạn, nó ảnh hưởng đến giọng điệu và độ sâu của các câu trả lời trong tất cả các phiên.
Đăng ký / Gói (Plan) — mức độ truy cập của bạn vào sản phẩm: Free, Start, Pro, Max. Gói quyết định giới hạn số phút, quyền truy cập vào cơ sở tri thức, đa ảnh chụp màn hình, chế độ System Design, và các mô hình tiên phong. Phần lõi của sản phẩm (phiên, cơ sở tri thức) đòi hỏi một gói đăng ký trả phí đang hoạt động.
Hạn mức phút — giới hạn thời gian nhận diện trong một gói. Ở Free là 60 phút mỗi tháng; ở các gói trả phí, số phút là không giới hạn. Số phút của một phiên được tính vào hạn mức, kể cả ở chế độ no-logs (một bộ đếm riêng, no_logs_minutes_used). Hạn mức là mềm: phiên hiện tại sẽ hoàn thành, nhưng bạn sẽ không thể bắt đầu phiên mới cho đến khi nó được bổ sung lại.
Chế độ no-logs (tạm thời) — một chế độ phiên riêng tư trong đó bản ghi lời thoại và các câu trả lời không được ghi vào cơ sở dữ liệu và bị xóa sau khi phiên kết thúc. Hữu ích cho các cuộc trò chuyện nhạy cảm. Quan trọng: số phút vẫn được trừ vào hạn mức.
Mô hình tiên phong — các LLM hàng đầu, mạnh mẽ nhất (ví dụ, Claude Opus, GPT cao cấp, và các mô hình tương đương). Trong Whisperer, chúng chỉ được mở khóa trên các gói Max.
Người được giới thiệu — một người dùng mà bạn đã mời. Với mỗi lần mua đủ điều kiện của một người được giới thiệu (gói Pro hoặc Max), bạn nhận được phần thưởng 500 ₽; mỗi người được mời chỉ một phần thưởng.
Mã khuyến mãi — một mã giảm giá. Có hai loại: percent (giảm giá theo phần trăm của giá) và bonus_days (số ngày đăng ký thưởng thêm). Khoản phụ thu chuyển đổi tiền tệ không áp dụng cho các khoản giảm giá và phần thưởng.
Các thực thể kết nối với nhau như thế nào
Các khái niệm của Whisperer tạo thành một luồng thống nhất — từ cuộc trò chuyện đến tri thức:
- Bạn bắt đầu một phiên. Ứng dụng khách thu hai nguồn âm thanh và gắn thẻ chúng bằng người nói
[Me]/[Other]. - Việc nhận diện (vai trò mô hình
transcription) biến âm thanh thành các đoạn bản ghi. - Khi bạn đặt câu hỏi, prompt hệ thống được lắp ráp: mẫu prompt của vai trò mô hình đã chọn → ngữ cảnh người dùng → khối RAG từ cơ sở tri thức của bạn.
- Mô hình trả lời; ở chế độ no-logs, cả bản ghi lời thoại lẫn các câu trả lời đều không được lưu, nhưng số phút vẫn bị trừ khỏi hạn mức do gói thiết lập.
- Sau phiên, Whisperer trích xuất một sơ đồ tư duy (topic / action_item / decision) cho bản tóm tắt cuộc họp.
- Mức độ truy cập vào tất cả những điều này được thiết lập bởi gói đăng ký; mã khuyến mãi và người được giới thiệu giúp gia hạn hoặc làm rẻ nó đi, còn mô hình tiên phong được bật trên Max.
Ảnh chụp màn hình
📸 [Ảnh chụp màn hình: bản ghi lời thoại trực tiếp với nhãn [Me] và [Other]]
📸 [Ảnh chụp màn hình: sơ đồ tư duy cuộc họp với các nút topic/action_item/decision]
📸 [Ảnh chụp màn hình: đồ thị cơ sở tri thức được xây từ các liên kết wiki]
Những lỗi thường gặp
- Nhầm lẫn phiên với bản ghi lời thoại. Phiên là toàn bộ buổi làm việc, có tính số phút; bản ghi lời thoại (một tập các đoạn) chỉ là một phần của nó.
- Coi no-logs là "miễn phí". Số phút trong no-logs vẫn bị tiêu hao như thường; chỉ có dữ liệu là không được lưu.
- Mong đợi mô hình tiên phong trên Pro. Mô hình tiên phong chỉ có trên Max.
- Cố ra lệnh qua ngữ cảnh người dùng. Ngữ cảnh cung cấp các sự kiện về bạn; hãy dùng một mẫu Prompt Studio để kiểm soát cách trợ lý trả lời.
Thực hành tốt nhất
- Kiểm tra bảng thuật ngữ trước khi cấu hình prompt và vai trò mô hình — nó tiết kiệm thời gian gỡ lỗi.
- Điền ngữ cảnh người dùng và cơ sở tri thức của bạn từ trước: RAG kéo các sự kiện của bạn vào mọi câu trả lời.
- Dùng liên kết wiki giữa các ghi chú để đồ thị tri thức hỗ trợ tìm kiếm và điều hướng.
- Với các cuộc gọi nhạy cảm, hãy bật no-logs, lưu ý rằng số phút vẫn bị tiêu hao.