सत्र जीवनचक्र
सत्र Whisperer में काम की मूल इकाई है: वह समय-अवधि जिसके दौरान क्लाइंट किसी मीटिंग को सुनता है, बोले गए शब्दों को लिखता है और LLM से उत्तर प्राप्त करता है। जीवनचक्र को समझने से आपको start/pause का सही उपयोग करने, डैशबोर्ड में स्थितियों की व्याख्या करने और समस्याओं का निवारण करने में मदद मिलती है।
इसे कब पढ़ें
इस लेख को तब पढ़ें जब आप समझना चाहते हों:
- मीटिंग के प्रत्येक चरण में आपके डेटा का क्या होता है;
- उत्तर कभी-कभी विलंबित क्यों होता है और स्टेनोग्राम (transcript) कब सहेजा जाता है;
- क्लाइंट और सर्वर के बीच कनेक्शन कैसे काम करता है।
सत्र के चरण
1. प्रारंभ (Start)
"Start" बटन (या कीबोर्ड शॉर्टकट) दबाने से क्लाइंट सक्रिय मोड में चला जाता है:
- क्लाइंट सर्वर से एक कनेक्शन खोलता है और डिवाइस पहचानकर्ता तथा टोकन भेजता है।
- सर्वर सब्सक्रिप्शन और मिनट कोटा को सत्यापित करता है। यदि जाँच पास हो जाती है, तो वह सत्र की शुरुआत की पुष्टि करता है और सत्र पहचानकर्ता लौटाता है।
- क्लाइंट ऑडियो कैप्चर को सक्रिय करता है और रिकॉर्डिंग शुरू करता है।
2. रिकॉर्डिंग (स्ट्रीमिंग)
ऑडियो प्रत्येक ~0.8 सेकंड में छोटे टुकड़ों में प्रसारित होता है। प्रत्येक टुकड़े को वक्ता के अनुसार लेबल किया जाता है: उपयोगकर्ता या प्रतिपक्ष।
सर्वर टुकड़ों को बफर करता है और उन्हें पहचान के लिए भेजता है। स्टेनोग्राम वास्तविक समय में क्लाइंट को लौटाया जाता है और LiveTranscriptStrip में प्रदर्शित होता है।
3. अनुरोध और उत्तर
जब उपयोगकर्ता "Ask" (या कीबोर्ड शॉर्टकट) दबाता है, तो क्लाइंट वर्तमान स्टेनोग्राम संदर्भ के साथ एक ask फ्रेम भेजता है।
सर्वर सिस्टम प्रॉम्प्ट इकट्ठा करता है (भूमिका प्रॉम्प्ट → उपयोगकर्ता संदर्भ → ज्ञान आधार से RAG) और LLM से क्वेरी करता है। उत्तर स्ट्रीम में आता है: टेक्स्ट जैसे-जैसे उत्पन्न होता है वैसे-वैसे प्रकट होता है और तुरंत AnswerArea में Markdown समर्थन और पेजिनेशन के साथ प्रदर्शित होता है (यदि कई उत्तर हों)।
4. विराम (Pause)
"Pause" दबाने से ऑडियो कैप्चर रुक जाता है, लेकिन WebSocket कनेक्शन खुला रहता है। सत्र टाइमर रुक जाता है। "Resume" दबाकर फिर से शुरू करें।
5. समाप्ति (End)
"Stop" दबाने या क्लाइंट बंद करने पर:
- क्लाइंट एक
session.endफ्रेम भेजता है। - सर्वर बफर किए गए स्टेनोग्राम और पूर्ण किए गए उत्तरों की सूची को डेटाबेस में फ्लश करता है।
- WebSocket बंद हो जाता है।
- वेब डैशबोर्ड में, सत्र पूर्ण स्टेनोग्राम और एनालिटिक्स के साथ History अनुभाग में दिखाई देता है।
📸 [स्क्रीनशॉट: रिकॉर्डिंग मोड में Whisperer पैनल — LiveTranscriptStrip और नियंत्रण बटन दिखाई दे रहे हैं]
डेटा भंडारण
डिफ़ॉल्ट रूप से, स्टेनोग्राम और LLM उत्तर डेटाबेस में सहेजे जाते हैं और डैशबोर्ड में उपलब्ध रहते हैं। यदि no-logs मोड सक्षम है, तो सत्र समाप्त होने के बाद डेटा हटा दिया जाता है — लेकिन खपत किए गए मिनट फिर भी गिने जाते हैं।
सामान्य त्रुटियाँ
| त्रुटि | कारण | समाधान |
|---|---|---|
| सत्र शुरू नहीं होता | ईमेल की पुष्टि नहीं हुई या कोई सक्रिय सब्सक्रिप्शन नहीं | खाता स्थिति और कोटा जाँचें |
| "दूसरे व्यक्ति को नहीं सुन सकते" | स्क्रीन रिकॉर्डिंग अनुमति नहीं दी गई (macOS) या सिस्टम ऑडियो कैप्चर अनुपलब्ध (Windows) | macOS अनुमतियाँ / Windows |
| स्टेनोग्राम दिखाई नहीं देता | खराब इंटरनेट कनेक्शन या WebSocket हानि | अपना नेटवर्क जाँचें; सत्र पुनः आरंभ करें |
| LLM उत्तर में बहुत अधिक समय लगता है | AI प्रदाता अतिभारित है या धीमा मॉडल चुना गया है | सेटिंग्स में मॉडल बदलें |
सर्वोत्तम अभ्यास
- सत्र को स्पष्ट रूप से रोकें "Stop" बटन से — यह सुनिश्चित करता है कि डेटा इतिहास में लिख दिया जाए।
- मीटिंग में लंबे ब्रेक के दौरान विराम (Pause) दें — टाइमर रुक जाता है और मिनट बर्बाद नहीं होते।
- गोपनीय मीटिंग के लिए no-logs का उपयोग करें जहाँ स्टेनोग्राम संग्रहीत करना अवांछनीय हो।