คำแนะนำจาก AI แบบเรียลไทม์

ภาพรวม

คำแนะนำจาก AI คือคำตอบที่ Whisperer สร้างขึ้นทันทีในระหว่างการสนทนา โดยอ้างอิงจากสตูริปต์ถอดเสียงสด คำถามของคุณ และฐานความรู้ของคุณ คำตอบจะไหลเข้ามาเป็นสตรีมในส่วน AnswerArea ของโอเวอร์เลย์ ข้อความจะปรากฏขึ้นตามที่ถูกสร้าง รองรับ Markdown การเปิดเผยกระบวนการให้เหตุผล และการแบ่งหน้า (1/N) คำแนะนำทำงานได้หลายโหมด — ตั้งแต่คำตอบธรรมดาไปจนถึงการวิเคราะห์ภาพหน้าจอและการออกแบบ System Design พร้อมไดอะแกรม

คำขอทั้งหมดจะส่งผ่านผู้ให้บริการ AI ของเรา ด้วยโมเดลจากตระกูล Claude, GPT, DeepSeek, Qwen, Gemini, Grok และ Llama โมเดลที่ใช้ได้ขึ้นอยู่กับแพ็กเกจของคุณ (การกำหนดสิทธิ์ตามระดับ): โมเดลระดับแนวหน้าสูงสุดรวมอยู่ในแพ็กเกจ Max เท่านั้น

เมื่อใดควรใช้

  • การสัมภาษณ์งาน: เรียบเรียงคำตอบสำหรับคำถามเชิงพฤติกรรมได้อย่างรวดเร็ว หรือร่างแนวทางแก้ปัญหา System Design
  • การขายและการเจรจาต่อรอง: หาเหตุผลสนับสนุน ตอบโต้ข้อโต้แย้ง ตรวจสอบข้อเท็จจริงซ้ำ
  • การสัมภาษณ์ทางเทคนิค / pair programming: รับโค้ดในโหมด coding
  • ทำความเข้าใจสิ่งที่อยู่บนหน้าจอ: ส่งภาพหน้าจอของไวท์บอร์ด ไดอะแกรม หรือโค้ดในโหมด vision

ทีละขั้นตอน

  1. ถามคำถามเป็นข้อความ พิมพ์คำถามลงในช่องป้อนข้อมูล CommandBar แล้วกด Enter — คำตอบจะเริ่มไหลเข้ามาในส่วน AnswerArea
  2. หรือถาม "จากสิ่งที่ได้ยิน" กด Enter ในช่อง ว่างเปล่า — Whisperer จะนำส่วนล่าสุดของสตูริปต์ถอดเสียง (คำถามของอีกฝ่าย) มาตอบให้ สะดวกเมื่อคำถามเพิ่งถูกพูดออกมา
  3. หรือแนบภาพหน้าจอ จับภาพหน้าจอ (ด้วยปุ่มลัด captureScreenshot) — เฟรมจะเข้าสู่โหมด vision และโมเดลจะวิเคราะห์ภาพ
  4. อ่านคำตอบที่ไหลเข้ามา ข้อความจะปรากฏขึ้นตามที่ถูกสร้าง คุณสามารถขยายดูกระบวนการให้เหตุผลของโมเดลได้หากมี
  5. เลื่อนดูทีละหน้า คำตอบที่ยาวและชุดคำขอจะถูกแบ่งออกเป็นหน้า — สลับด้วยการแบ่งหน้า 1/N ในส่วน AnswerArea

โหมดของคำตอบ

  • คำตอบธรรมดา (บทบาท responses) — คำตอบแบบข้อความสำหรับคำถาม โดยคำนึงถึงบริบทและฐานความรู้
  • Coding (บทบาท coding) — การสร้างและอธิบายโค้ด ด้วยโมเดลที่ถูกปรับให้เหมาะกับการเขียนโปรแกรม
  • Vision / หลายภาพหน้าจอ (บทบาท vision) — การวิเคราะห์ภาพเดียวหรือหลายเฟรมที่สะสมไว้ (อาร์เรย์ของภาพหน้าจอจะถูกส่งไปยัง vision endpoint) มีประโยชน์สำหรับงานยาว ๆ ที่ไม่พอดีกับหน้าจอเดียว
  • System Design (บทบาท system_design) — คำตอบที่มีโครงสร้างพร้อมไดอะแกรม Mermaid (คอมโพเนนต์ การไหลของข้อมูล ไดอะแกรมสถาปัตยกรรม)

พรอมต์ถูกประกอบขึ้นอย่างไร (โดยสังเขป)

system prompt ถูกประกอบขึ้นตามลำดับความสำคัญ จากบนลงล่าง:

  1. พรอมต์ของบทบาท — เทมเพลตส่วนตัวของคุณจาก Prompt Studio
  2. บริบทผู้ใช้ — ข้อมูลที่คุณตั้งค่าเกี่ยวกับตัวคุณเองและบทบาทของคุณ
  3. บล็อก RAG — ส่วนที่เกี่ยวข้องจากฐานความรู้ ซึ่งถูกเลือกแบบไดนามิกสำหรับแต่ละคำขอ

บทบาทของโมเดลที่แตกต่างกันจัดการงานที่แตกต่างกัน: responses (แชต), coding (โค้ด), vision (ภาพ), system_design (ไดอะแกรม), generation (mind map), transcription (Whisper), embedding (การแปลงเป็นเวกเตอร์สำหรับ RAG)

การกำหนดสิทธิ์โมเดลตามระดับ

ในแพ็กเกจ Free จะใช้โมเดลพื้นฐานได้ ส่วนแพ็กเกจแบบเสียเงินจะมีชุดที่กว้างกว่า โมเดลระดับแนวหน้า (โมเดลสูงสุด: Claude Opus, GPT รุ่นเรือธง ฯลฯ) ใช้ได้ เฉพาะแพ็กเกจ Max เท่านั้น อ่านเพิ่มเติมในแพ็กเกจและสิ่งที่รวมอยู่

ภาพหน้าจอ

📸 [ภาพหน้าจอ: AnswerArea พร้อมคำตอบที่ไหลเข้ามาและการแบ่งหน้า 1/N]

📸 [ภาพหน้าจอ: คำขอแบบ "จากสิ่งที่ได้ยิน" ผ่านการกด Enter ในช่องว่าง]

📸 [ภาพหน้าจอ: คำตอบแบบ System Design พร้อมไดอะแกรม Mermaid]

📸 [ภาพหน้าจอ: โหมด vision พร้อมภาพหน้าจอที่แนบมา]

ข้อผิดพลาดที่พบบ่อย

  • กด Enter แล้วไม่มีอะไรถูกส่ง หากช่องว่างเปล่า Whisperer จะนำคำถามมาจากสตูริปต์ถอดเสียง — ตรวจสอบให้แน่ใจว่าได้ยินเสียงของอีกฝ่าย (ต้องการสิทธิ์ "Screen Recording") หรือพิมพ์คำถามเป็นข้อความ
  • โมเดลระดับแนวหน้าใช้ไม่ได้ โมเดลสูงสุดเปิดใช้งานเฉพาะแพ็กเกจ Max — ใน Free/Start/Pro จะมีการเลือกโมเดลที่ใช้ได้ใกล้เคียงที่สุด
  • บริบท "ไม่ทำงาน" บริบทผู้ใช้คือข้อมูลอ้างอิงเกี่ยวกับตัวคุณ ไม่ใช่คำสั่ง ให้ถามคำถามจริง ๆ ในช่องป้อนข้อมูล
  • ภาพหน้าจอไม่ถูกวิเคราะห์ หลายภาพหน้าจอและ vision ไม่ได้มีในทุกแพ็กเกจ — ตรวจสอบความสามารถในแพ็กเกจ

แนวทางปฏิบัติที่ดีที่สุด

  • ถามคำถามสั้น ๆ และเฉพาะเจาะจง — การสตรีมจะเริ่มเร็วขึ้นและคำตอบจะแม่นยำกว่า
  • สำหรับงานบนหน้าจอที่ยาว ให้สะสมหลายเฟรมแล้วส่งเป็นหลายภาพหน้าจอ แทนที่จะส่งทีละภาพ
  • สร้างฐานความรู้ของคุณขึ้นมา — RAG จะผสมข้อเท็จจริงของคุณเข้ากับคำตอบและลด "การหลอน" (hallucinations)
  • ตั้งค่าพรอมต์บทบาทส่วนตัวให้เหมาะกับงานของคุณ (สัมภาษณ์ / ขาย / สอน)
  • สำหรับคำถามเชิงสถาปัตยกรรม ให้ใช้โหมด System Design — คุณจะได้ไดอะแกรม Mermaid ที่พร้อมใช้งานแทนคำอธิบายแบบข้อความล้วน

บทความที่เกี่ยวข้อง