Gợi ý AI theo thời gian thực

Tổng quan

Gợi ý AI là những câu trả lời mà Whisperer tạo ra ngay trong lúc gọi, dựa trên bản ghi trực tiếp, các câu hỏi của bạn và cơ sở tri thức của bạn. Câu trả lời được truyền theo luồng vào AnswerArea của lớp phủ: văn bản hiện ra khi đang được tạo, hỗ trợ Markdown, hiển thị quá trình suy luận và phân trang (1/N). Gợi ý hoạt động ở nhiều chế độ — từ một câu trả lời thuần túy đến phân tích ảnh chụp màn hình và thiết kế System Design với sơ đồ.

Tất cả yêu cầu đều đi qua nhà cung cấp AI của chúng tôi với các mô hình thuộc họ Claude, GPT, DeepSeek, Qwen, Gemini, Grok và Llama. Những mô hình nào khả dụng tùy thuộc vào gói của bạn (giới hạn theo bậc): các mô hình frontier hàng đầu chỉ được bao gồm trong gói Max.

Khi nào nên dùng

  • Phỏng vấn: nhanh chóng diễn đạt câu trả lời cho một câu hỏi hành vi hoặc phác thảo một giải pháp System Design.
  • Bán hàng và đàm phán: tìm một luận điểm, phản hồi một phản đối, kiểm chứng lại một sự thật.
  • Phỏng vấn kỹ thuật / lập trình theo cặp: nhận mã ở chế độ coding.
  • Hiểu rõ những gì hiển thị trên màn hình: gửi ảnh chụp màn hình của một bảng trắng, sơ đồ hoặc đoạn mã ở chế độ vision.

Hướng dẫn từng bước

  1. Đặt câu hỏi dưới dạng văn bản. Gõ câu hỏi vào ô nhập CommandBar và nhấn Enter — câu trả lời bắt đầu được truyền theo luồng vào AnswerArea.
  2. Hoặc hỏi "từ những gì đã nghe được". Nhấn Enter trên ô trống — Whisperer lấy đoạn bản ghi mới nhất (câu hỏi của người đối diện) và trả lời nó. Tiện lợi khi câu hỏi vừa được nói ra.
  3. Hoặc đính kèm ảnh chụp màn hình. Chụp một ảnh màn hình (bằng phím tắt captureScreenshot) — khung hình đi vào chế độ vision, và mô hình phân tích hình ảnh.
  4. Đọc câu trả lời được truyền theo luồng. Văn bản hiện ra khi đang được tạo. Bạn có thể mở rộng phần suy luận của mô hình nếu có.
  5. Lật qua các trang. Câu trả lời dài và một loạt yêu cầu được chia thành nhiều trang — chuyển đổi bằng phân trang 1/N trong AnswerArea.

Các chế độ trả lời

  • Trả lời thuần túy (vai trò responses) — một câu trả lời dạng văn bản cho câu hỏi, có tính đến ngữ cảnh và cơ sở tri thức.
  • Coding (vai trò coding) — tạo và giải thích mã, một mô hình được tối ưu hóa cho lập trình.
  • Vision / nhiều ảnh chụp màn hình (vai trò vision) — phân tích một hình ảnh duy nhất hoặc nhiều khung hình được tích lũy (mảng ảnh chụp màn hình đi đến endpoint vision). Hữu ích cho các tác vụ dài không vừa trên một màn hình.
  • System Design (vai trò system_design) — một câu trả lời có cấu trúc với sơ đồ Mermaid (thành phần, luồng dữ liệu, sơ đồ kiến trúc).

Prompt được lắp ráp như thế nào (tóm tắt)

System prompt được lắp ráp theo thứ tự ưu tiên, từ trên xuống dưới:

  1. Prompt vai trò — mẫu cá nhân của bạn từ Prompt Studio.
  2. Ngữ cảnh người dùng — dữ liệu bạn thiết lập về bản thân và vai trò của bạn.
  3. Khối RAG — các đoạn liên quan từ cơ sở tri thức, được chọn động cho mỗi yêu cầu.

Các vai trò mô hình khác nhau xử lý các tác vụ khác nhau: responses (trò chuyện), coding (mã), vision (hình ảnh), system_design (sơ đồ), generation (sơ đồ tư duy), transcription (Whisper), embedding (vector hóa cho RAG).

Giới hạn bậc mô hình

Ở gói Free, các mô hình cơ bản khả dụng; ở các gói trả phí, có một tập hợp rộng hơn. Mô hình frontier (những mô hình hàng đầu: Claude Opus, GPT đầu bảng, v.v.) chỉ khả dụng ở gói Max. Xem thêm tại Các gói và những gì được bao gồm.

Ảnh chụp màn hình

📸 [Ảnh chụp màn hình: AnswerArea với câu trả lời được truyền theo luồng và phân trang 1/N]

📸 [Ảnh chụp màn hình: một yêu cầu "từ những gì đã nghe được" qua việc nhấn Enter trên ô trống]

📸 [Ảnh chụp màn hình: một câu trả lời System Design với sơ đồ Mermaid]

📸 [Ảnh chụp màn hình: chế độ vision với ảnh chụp màn hình được đính kèm]

Những lỗi thường gặp

  • Nhấn Enter không gửi gì cả. Nếu ô trống, Whisperer lấy câu hỏi từ bản ghi — hãy đảm bảo người đối diện được nghe thấy (cần có quyền "Screen Recording") hoặc gõ câu hỏi dưới dạng văn bản.
  • Một mô hình frontier không khả dụng. Các mô hình hàng đầu chỉ được bật ở gói Max — trên Free/Start/Pro, mô hình khả dụng gần nhất sẽ được chọn.
  • Ngữ cảnh "không hoạt động". Ngữ cảnh người dùng là thông tin tham khảo về bạn, không phải là một lệnh; hãy đặt câu hỏi thực sự vào ô nhập.
  • Ảnh chụp màn hình không được phân tích. Chế độ nhiều ảnh chụp màn hình và vision không khả dụng ở tất cả các gói — kiểm tra các khả năng tại Các gói.

Thực hành tốt nhất

  • Đặt câu hỏi ngắn gọn, cụ thể — luồng bắt đầu nhanh hơn và câu trả lời chính xác hơn.
  • Đối với một tác vụ dài trên màn hình, hãy tích lũy nhiều khung hình và gửi chúng dưới dạng nhiều ảnh chụp màn hình thay vì từng cái một.
  • Xây dựng cơ sở tri thức của bạn — RAG trộn các sự thật của bạn vào câu trả lời và giảm "ảo giác".
  • Thiết lập một prompt vai trò cá nhân phù hợp với tác vụ của bạn (phỏng vấn / bán hàng / giảng dạy).
  • Đối với các câu hỏi về kiến trúc, hãy dùng chế độ System Design — bạn nhận được một sơ đồ Mermaid sẵn sàng thay vì chỉ một mô tả bằng văn bản.

Bài viết liên quan