คำแนะนำจาก AI แบบเรียลไทม์
ภาพรวม
คำแนะนำจาก AI คือคำตอบที่ Whisperer สร้างขึ้นทันทีในระหว่างการสนทนา โดยอ้างอิงจากสตูริปต์ถอดเสียงสด คำถามของคุณ และฐานความรู้ของคุณ คำตอบจะไหลเข้ามาเป็นสตรีมในส่วน AnswerArea ของโอเวอร์เลย์ ข้อความจะปรากฏขึ้นตามที่ถูกสร้าง รองรับ Markdown การเปิดเผยกระบวนการให้เหตุผล และการแบ่งหน้า (1/N) คำแนะนำทำงานได้หลายโหมด — ตั้งแต่คำตอบธรรมดาไปจนถึงการวิเคราะห์ภาพหน้าจอและการออกแบบ System Design พร้อมไดอะแกรม
คำขอทั้งหมดจะส่งผ่านผู้ให้บริการ AI ของเรา ด้วยโมเดลจากตระกูล Claude, GPT, DeepSeek, Qwen, Gemini, Grok และ Llama โมเดลที่ใช้ได้ขึ้นอยู่กับแพ็กเกจของคุณ (การกำหนดสิทธิ์ตามระดับ): โมเดลระดับแนวหน้าสูงสุดรวมอยู่ในแพ็กเกจ Max เท่านั้น
เมื่อใดควรใช้
- การสัมภาษณ์งาน: เรียบเรียงคำตอบสำหรับคำถามเชิงพฤติกรรมได้อย่างรวดเร็ว หรือร่างแนวทางแก้ปัญหา System Design
- การขายและการเจรจาต่อรอง: หาเหตุผลสนับสนุน ตอบโต้ข้อโต้แย้ง ตรวจสอบข้อเท็จจริงซ้ำ
- การสัมภาษณ์ทางเทคนิค / pair programming: รับโค้ดในโหมด coding
- ทำความเข้าใจสิ่งที่อยู่บนหน้าจอ: ส่งภาพหน้าจอของไวท์บอร์ด ไดอะแกรม หรือโค้ดในโหมด vision
ทีละขั้นตอน
- ถามคำถามเป็นข้อความ พิมพ์คำถามลงในช่องป้อนข้อมูล CommandBar แล้วกด Enter — คำตอบจะเริ่มไหลเข้ามาในส่วน AnswerArea
- หรือถาม "จากสิ่งที่ได้ยิน" กด Enter ในช่อง ว่างเปล่า — Whisperer จะนำส่วนล่าสุดของสตูริปต์ถอดเสียง (คำถามของอีกฝ่าย) มาตอบให้ สะดวกเมื่อคำถามเพิ่งถูกพูดออกมา
- หรือแนบภาพหน้าจอ จับภาพหน้าจอ (ด้วยปุ่มลัด captureScreenshot) — เฟรมจะเข้าสู่โหมด vision และโมเดลจะวิเคราะห์ภาพ
- อ่านคำตอบที่ไหลเข้ามา ข้อความจะปรากฏขึ้นตามที่ถูกสร้าง คุณสามารถขยายดูกระบวนการให้เหตุผลของโมเดลได้หากมี
- เลื่อนดูทีละหน้า คำตอบที่ยาวและชุดคำขอจะถูกแบ่งออกเป็นหน้า — สลับด้วยการแบ่งหน้า 1/N ในส่วน AnswerArea
โหมดของคำตอบ
- คำตอบธรรมดา (บทบาท
responses) — คำตอบแบบข้อความสำหรับคำถาม โดยคำนึงถึงบริบทและฐานความรู้ - Coding (บทบาท
coding) — การสร้างและอธิบายโค้ด ด้วยโมเดลที่ถูกปรับให้เหมาะกับการเขียนโปรแกรม - Vision / หลายภาพหน้าจอ (บทบาท
vision) — การวิเคราะห์ภาพเดียวหรือหลายเฟรมที่สะสมไว้ (อาร์เรย์ของภาพหน้าจอจะถูกส่งไปยัง vision endpoint) มีประโยชน์สำหรับงานยาว ๆ ที่ไม่พอดีกับหน้าจอเดียว - System Design (บทบาท
system_design) — คำตอบที่มีโครงสร้างพร้อมไดอะแกรม Mermaid (คอมโพเนนต์ การไหลของข้อมูล ไดอะแกรมสถาปัตยกรรม)
พรอมต์ถูกประกอบขึ้นอย่างไร (โดยสังเขป)
system prompt ถูกประกอบขึ้นตามลำดับความสำคัญ จากบนลงล่าง:
- พรอมต์ของบทบาท — เทมเพลตส่วนตัวของคุณจาก Prompt Studio
- บริบทผู้ใช้ — ข้อมูลที่คุณตั้งค่าเกี่ยวกับตัวคุณเองและบทบาทของคุณ
- บล็อก RAG — ส่วนที่เกี่ยวข้องจากฐานความรู้ ซึ่งถูกเลือกแบบไดนามิกสำหรับแต่ละคำขอ
บทบาทของโมเดลที่แตกต่างกันจัดการงานที่แตกต่างกัน: responses (แชต), coding (โค้ด), vision (ภาพ), system_design (ไดอะแกรม), generation (mind map), transcription (Whisper), embedding (การแปลงเป็นเวกเตอร์สำหรับ RAG)
การกำหนดสิทธิ์โมเดลตามระดับ
ในแพ็กเกจ Free จะใช้โมเดลพื้นฐานได้ ส่วนแพ็กเกจแบบเสียเงินจะมีชุดที่กว้างกว่า โมเดลระดับแนวหน้า (โมเดลสูงสุด: Claude Opus, GPT รุ่นเรือธง ฯลฯ) ใช้ได้ เฉพาะแพ็กเกจ Max เท่านั้น อ่านเพิ่มเติมในแพ็กเกจและสิ่งที่รวมอยู่
ภาพหน้าจอ
📸 [ภาพหน้าจอ: AnswerArea พร้อมคำตอบที่ไหลเข้ามาและการแบ่งหน้า 1/N]
📸 [ภาพหน้าจอ: คำขอแบบ "จากสิ่งที่ได้ยิน" ผ่านการกด Enter ในช่องว่าง]
📸 [ภาพหน้าจอ: คำตอบแบบ System Design พร้อมไดอะแกรม Mermaid]
📸 [ภาพหน้าจอ: โหมด vision พร้อมภาพหน้าจอที่แนบมา]
ข้อผิดพลาดที่พบบ่อย
- กด Enter แล้วไม่มีอะไรถูกส่ง หากช่องว่างเปล่า Whisperer จะนำคำถามมาจากสตูริปต์ถอดเสียง — ตรวจสอบให้แน่ใจว่าได้ยินเสียงของอีกฝ่าย (ต้องการสิทธิ์ "Screen Recording") หรือพิมพ์คำถามเป็นข้อความ
- โมเดลระดับแนวหน้าใช้ไม่ได้ โมเดลสูงสุดเปิดใช้งานเฉพาะแพ็กเกจ Max — ใน Free/Start/Pro จะมีการเลือกโมเดลที่ใช้ได้ใกล้เคียงที่สุด
- บริบท "ไม่ทำงาน" บริบทผู้ใช้คือข้อมูลอ้างอิงเกี่ยวกับตัวคุณ ไม่ใช่คำสั่ง ให้ถามคำถามจริง ๆ ในช่องป้อนข้อมูล
- ภาพหน้าจอไม่ถูกวิเคราะห์ หลายภาพหน้าจอและ vision ไม่ได้มีในทุกแพ็กเกจ — ตรวจสอบความสามารถในแพ็กเกจ
แนวทางปฏิบัติที่ดีที่สุด
- ถามคำถามสั้น ๆ และเฉพาะเจาะจง — การสตรีมจะเริ่มเร็วขึ้นและคำตอบจะแม่นยำกว่า
- สำหรับงานบนหน้าจอที่ยาว ให้สะสมหลายเฟรมแล้วส่งเป็นหลายภาพหน้าจอ แทนที่จะส่งทีละภาพ
- สร้างฐานความรู้ของคุณขึ้นมา — RAG จะผสมข้อเท็จจริงของคุณเข้ากับคำตอบและลด "การหลอน" (hallucinations)
- ตั้งค่าพรอมต์บทบาทส่วนตัวให้เหมาะกับงานของคุณ (สัมภาษณ์ / ขาย / สอน)
- สำหรับคำถามเชิงสถาปัตยกรรม ให้ใช้โหมด System Design — คุณจะได้ไดอะแกรม Mermaid ที่พร้อมใช้งานแทนคำอธิบายแบบข้อความล้วน