คำศัพท์สำคัญของระบบ

ภาพรวม

คำศัพท์ชุดนี้รวบรวมคำนิยามของแนวคิดหลักใน Whisperer — ตั้งแต่เซสชันการสนทนาไปจนถึงฐานความรู้และแพ็กเกจการใช้งาน มีไว้เพื่อให้เอกสารส่วนที่เหลืออ่านได้โดยไม่ต้องเดา เมื่อคุณพบคำใดในบทความใดก็ตาม คุณจะพบความหมายที่แม่นยำของคำนั้นได้ที่นี่

หน้านี้เป็นหน้าอ้างอิง แทนที่จะเป็นขั้นตอนทีละขั้น จะมีหัวข้อ "เอนทิตีต่าง ๆ เชื่อมโยงกันอย่างไร" ซึ่งแสดงให้เห็นว่าแนวคิดเหล่านี้ประกอบรวมกันเป็นกระบวนการทำงานเดียวของผลิตภัณฑ์อย่างไร

ใช้เมื่อใด

  • คุณกำลังอ่านเอกสารเป็นครั้งแรกและต้องการตรวจสอบความหมายของคำต่าง ๆ
  • บทความอื่นใช้คำที่คุณไม่คุ้นเคย (ตัวอย่างเช่น "no-logs" หรือ "บทบาทของโมเดล")
  • คุณกำลังตั้งค่าพรอมต์ ฐานความรู้ หรือการสมัครสมาชิก และต้องการเข้าใจขอบเขตของแนวคิดเหล่านั้น

คำศัพท์

เซสชัน (Session) — เซสชันการทำงานของผู้ช่วยหนึ่งครั้งระหว่างการสนทนา มีวงจรชีวิตของตัวเอง: เริ่มต้น (session.start) → บันทึกเสียง → ถามและตอบ → จบพร้อมบันทึกข้อมูล เซสชันจะมีสตริงสคริปต์ คำถามที่ถูกถาม และคำตอบของโมเดลแนบอยู่ด้วย เซสชันเป็นหน่วยในการนับนาทีและเป็นพื้นฐานของประวัติในแดชบอร์ด

ส่วนของสตริงสคริปต์ (Segment) — ชิ้นส่วนของคำพูดที่ระบบรู้จัก ซึ่ง Whisperer สร้างขึ้นแบบเรียลไทม์จากสตรีมเสียง แต่ละ segment จะถูกกำกับด้วยผู้พูดและเวลาประทับ segment ต่าง ๆ รวมกันเป็นสตริงสคริปต์เต็มของเซสชัน แสดงเป็นแถบเลื่อนในไคลเอนต์และบันทึกไว้ในประวัติ (ยกเว้นในโหมด no-logs)

ผู้พูด ([Me] / [Other]) — ป้ายกำกับผู้พูดในสตริงสคริปต์ [Me] คือเสียงของคุณจากไมโครโฟน [Other] คือเสียงจากเสียงระบบ (สิ่งที่ดังในหูฟัง/ลำโพงของคุณ) การกำกับนี้ทำได้เพราะไคลเอนต์จับแหล่งเสียงสองแหล่งที่เป็นอิสระต่อกันและกำกับแต่ละชิ้นเสียงด้วยป้ายผู้พูด

Mind-map (โหนด: topic / action_item / decision) — แผนที่การประชุมที่ Whisperer สกัดออกมาหลังจบเซสชัน โหนด (MeetingMapNode) มีสามประเภท ได้แก่ topic (หัวข้อที่พูดคุย) action_item (งานที่ต้องทำ) decision (การตัดสินใจที่เกิดขึ้น) ในแดชบอร์ดสามารถแสดงผลแผนที่นี้เป็นภาพและเสริมข้อมูลเพิ่มเติมได้ (enrich-mindmap)

เทมเพลตพรอมต์ (role prompt) — คำสั่งระบบฉบับร่างสำหรับโมเดลที่ปรับให้เหมาะกับบทบาทเฉพาะ คุณกำหนดได้ใน Prompt Studio และจะถูกฝังเข้าไปในพรอมต์ระบบก่อนบริบทของผู้ใช้และบล็อกฐานความรู้

บทบาทของโมเดล (Model role) — วัตถุประสงค์ที่เลือกใช้โมเดล Whisperer มีบทบาททั้งหมดเจ็ดแบบ ได้แก่ responses (คำตอบแชตทั่วไป) coding (โค้ด) vision (ภาพหน้าจอและรูปภาพ) system_design (คำตอบที่มีโครงสร้างพร้อมไดอะแกรม Mermaid) generation (สร้างและเสริมข้อมูล mind-map) transcription (การรู้จำคำพูด, Whisper) embedding (การแปลงข้อความเป็นเวกเตอร์สำหรับ RAG) คุณสามารถกำหนดโมเดลแยกสำหรับแต่ละบทบาทได้

ฐานความรู้ / โน้ต (Note) — ที่จัดเก็บความรู้ส่วนตัวของคุณในแดชบอร์ด โน้ตหนึ่งประกอบด้วยหัวเรื่อง ข้อความ Markdown และแท็ก ลิงก์แบบวิกิในรูปแบบ [[...]] เชื่อมโยงโน้ตต่าง ๆ เข้าเป็นกราฟ (โหนดข้างเคียง เส้นทางสั้นที่สุด ความเป็นศูนย์กลาง) ฐานความรู้จะถูกเก็บไว้จนกว่าคุณจะลบ

RAG (Retrieval-Augmented Generation) — กลไกที่ทำให้คำตอบของโมเดลได้รับการเสริมด้วยข้อเท็จจริงจากฐานความรู้ของคุณ โน้ตจะถูกแบ่งเป็นชิ้น (~512 โทเค็น ซ้อนทับกัน 64) แปลงเป็น embedding และเก็บไว้ในฐานข้อมูลเวกเตอร์ สำหรับแต่ละคำค้น ระบบจะใช้การค้นแบบโคไซน์เพื่อหาชิ้นส่วนที่เกี่ยวข้องมากที่สุด top-k แล้วแทรกเข้าไปในพรอมต์ ด้วยวิธีนี้คำแนะนำจึงอ้างอิงจากเอกสารของคุณ ไม่ใช่เพียงความรู้ทั่วไปของโมเดลเท่านั้น

บริบทของผู้ใช้ (User context) — ข้อมูลใด ๆ ที่คุณให้กับผู้ช่วยไว้ล่วงหน้า (ตัวอย่างเช่น คำอธิบายบทบาทของคุณ ผลิตภัณฑ์ หรือเรซูเม) กำหนดในโปรไฟล์ของคุณ และมีอิทธิพลต่อน้ำเสียงและความลึกของคำตอบในทุกเซสชัน

การสมัครสมาชิก / แพ็กเกจ (Plan) — ระดับการเข้าถึงผลิตภัณฑ์ของคุณ ได้แก่ Free, Start, Pro, Max แพ็กเกจกำหนดจำนวนนาทีที่ใช้ได้ การเข้าถึงฐานความรู้ การจับภาพหน้าจอหลายภาพ โหมด System Design และโมเดล frontier แกนหลักของผลิตภัณฑ์ (เซสชัน ฐานความรู้) ต้องมีการสมัครสมาชิกแบบชำระเงินที่ใช้งานอยู่

โควตานาที (Minute quota) — ขีดจำกัดของเวลาการรู้จำเสียงภายในแพ็กเกจ ในแพ็กเกจ Free จะได้ 60 นาทีต่อเดือน ส่วนแพ็กเกจแบบชำระเงินจะใช้นาทีได้ไม่จำกัด นาทีของเซสชันจะถูกนับเข้าโควตา รวมถึงในโหมด no-logs ด้วย (มีตัวนับแยกต่างหาก คือ no_logs_minutes_used) โควตาเป็นแบบยืดหยุ่น: เซสชันปัจจุบันจะทำงานจนจบ แต่คุณจะเริ่มเซสชันใหม่ไม่ได้จนกว่าโควตาจะถูกเติม

โหมด No-logs (ชั่วคราว) — โหมดเซสชันแบบส่วนตัวที่สตริงสคริปต์และคำตอบ จะไม่ถูกเขียนลงฐานข้อมูล และจะถูกลบหลังจากเซสชันสิ้นสุด มีประโยชน์สำหรับการสนทนาที่ละเอียดอ่อน ข้อสำคัญ: นาทียังคงถูกหักจากโควตา

โมเดล Frontier — LLM ระดับเรือธงที่ทรงพลังที่สุด (ตัวอย่างเช่น Claude Opus, GPT ระดับสูงสุด และที่เทียบเท่า) ใน Whisperer จะปลดล็อก เฉพาะในแพ็กเกจ Max เท่านั้น

ผู้แนะนำ (Referral) — ผู้ใช้ที่คุณเชิญมา สำหรับการซื้อที่เข้าเงื่อนไขแต่ละครั้งของผู้ที่ถูกแนะนำ (แพ็กเกจ Pro หรือ Max) คุณจะได้รับรางวัล 500 ₽ หนึ่งรางวัลต่อผู้ถูกเชิญหนึ่งคน

โค้ดโปรโมชัน (Promo code) — รหัสส่วนลด มีสองประเภท ได้แก่ percent (ส่วนลดเป็นเปอร์เซ็นต์จากราคา) และ bonus_days (วันสมัครสมาชิกโบนัส) การบวกเพิ่มจากการแปลงสกุลเงินจะไม่นำมาใช้กับส่วนลดและโบนัส

เอนทิตีต่าง ๆ เชื่อมโยงกันอย่างไร

แนวคิดต่าง ๆ ของ Whisperer ประกอบกันเป็นกระบวนการเดียว — ตั้งแต่บทสนทนาไปจนถึงความรู้:

  1. คุณเริ่ม เซสชัน ไคลเอนต์จับแหล่งเสียงสองแหล่งและกำกับด้วย ผู้พูด [Me] / [Other]
  2. การรู้จำเสียง (บทบาทโมเดล transcription) แปลงเสียงเป็น ส่วนของสตริงสคริปต์
  3. เมื่อคุณถามคำถาม พรอมต์ระบบจะถูกประกอบขึ้น: เทมเพลตพรอมต์ ของ บทบาทโมเดล ที่เลือก → บริบทของผู้ใช้ → บล็อก RAG จาก ฐานความรู้ ของคุณ
  4. โมเดลตอบคำถาม ในโหมด no-logs ทั้งสตริงสคริปต์และคำตอบจะไม่ถูกบันทึก แต่ นาที ยังคงถูกหักจาก โควตา ที่กำหนดโดย แพ็กเกจ
  5. หลังจบเซสชัน Whisperer จะสกัด mind-map (topic / action_item / decision) เป็นสรุปการประชุม
  6. ระดับการเข้าถึงทั้งหมดนี้ถูกกำหนดโดย การสมัครสมาชิก โดย โค้ดโปรโมชัน และ ผู้แนะนำ ช่วยขยายหรือลดราคา และ โมเดล frontier จะเปิดใช้งานในแพ็กเกจ Max

ภาพหน้าจอ

📸 [ภาพหน้าจอ: สตริงสคริปต์สดพร้อมป้ายกำกับ [Me] และ [Other]]

📸 [ภาพหน้าจอ: mind-map การประชุมพร้อมโหนด topic/action_item/decision]

📸 [ภาพหน้าจอ: กราฟฐานความรู้ที่สร้างจากลิงก์แบบวิกิ]

ข้อผิดพลาดที่พบบ่อย

  • สับสนระหว่างเซสชันกับสตริงสคริปต์ เซสชันคือเซสชันทั้งหมดพร้อมการนับนาที ส่วนสตริงสคริปต์ (ชุดของ segment) เป็นเพียงส่วนหนึ่งเท่านั้น
  • เข้าใจว่า no-logs เป็น "ฟรี" นาทีในโหมด no-logs ถูกใช้ตามปกติ เพียงแต่ข้อมูลไม่ถูกบันทึกเท่านั้น
  • คาดหวังโมเดล frontier ในแพ็กเกจ Pro Frontier ใช้ได้เฉพาะในแพ็กเกจ Max เท่านั้น
  • พยายามออกคำสั่งผ่านบริบทของผู้ใช้ บริบทให้ข้อเท็จจริงเกี่ยวกับตัวคุณ ให้ใช้เทมเพลตใน Prompt Studio เพื่อควบคุมวิธีที่ผู้ช่วยตอบกลับ

แนวทางปฏิบัติที่ดี

  • ตรวจสอบคำศัพท์ก่อนตั้งค่าพรอมต์และบทบาทของโมเดล จะช่วยประหยัดเวลาในการแก้ปัญหา
  • กรอก บริบทของผู้ใช้ และ ฐานความรู้ ของคุณไว้ล่วงหน้า: RAG จะดึงข้อเท็จจริงของคุณเข้าไปในทุกคำตอบ
  • ใช้ ลิงก์แบบวิกิ ระหว่างโน้ต เพื่อให้กราฟความรู้ช่วยในการค้นหาและนำทาง
  • สำหรับการสนทนาที่ละเอียดอ่อน ให้เปิด no-logs โดยจำไว้ว่านาทียังคงถูกใช้

บทความที่เกี่ยวข้อง