ट्रांसक्रिप्ट और वक्ता

Whisperer भाषण को रियल टाइम में Whisper — OpenAI के बहुभाषी मॉडल — का उपयोग करके ट्रांसक्राइब करता है। वक्ता डायराइज़ेशन एक साथ चलता है: उपयोगकर्ता के शब्द और वार्ताकार के शब्द अलग-अलग लेबल किए जाते हैं, जिससे ट्रांसक्रिप्ट पढ़ने में आसान हो जाता है और AI उत्तरों की सटीकता बढ़ती है।

इसे कब पढ़ें

यह लेख पढ़ें ताकि आप समझ सकें:

पहचान भाषा कैसे कॉन्फ़िगर करें;
कुछ कथन [Me] और अन्य [Other] के रूप में क्यों लेबल किए जाते हैं;
कौन-सी भाषाएँ समर्थित हैं और उनके बीच कैसे स्विच करें।

ट्रांसक्रिप्शन कैसे काम करता है

Whisperer दो ऑडियो स्ट्रीम कैप्चर करता है:

स्ट्रीम	स्रोत	लेबल
उपयोगकर्ता की आवाज़	माइक्रोफ़ोन	[Me]
वार्ताकार की आवाज़	सिस्टम ऑडियो (macOS पर Screen Recording अनुमति / Windows पर सिस्टम ऑडियो)	[Other]

प्रत्येक ऑडियो चंक (~0.8 सेकंड) वक्ता लेबल के साथ सर्वर को भेजा जाता है और स्वतंत्र रूप से पहचाना जाता है। परिणाम तुरंत LiveTranscriptStrip में दिखाई देता है — ओवरले के नीचे स्क्रॉल होने वाला टिकर।

ट्रांसक्रिप्शन भाषा

पहचान भाषा सत्र स्तर पर सेट की जाती है:

क्लाइंट में (गियर आइकन) या वेब डैशबोर्ड में Settings खोलें।
Transcription Language फ़ील्ड खोजें।
भाषा कोड की मानक सूची से इच्छित भाषा चुनें (जैसे, en, ru, zh, de)।
एक नया सत्र शुरू करें — भाषा उस पर लागू होगी।

Whisper 90 से अधिक भाषाओं का समर्थन करता है। यदि मीटिंग प्रतिभागी अलग-अलग भाषाएँ बोलते हैं, तो Whisper चयनित भाषा "हिंट" के भीतर प्रत्येक चंक का स्वतः पता लगा लेता है।

📸 [स्क्रीनशॉट: [Me] और [Other] कथनों के साथ LiveTranscriptStrip स्क्रॉलिंग टिकर]

डैशबोर्ड में पूर्ण ट्रांसक्रिप्ट

सत्र समाप्त होने के बाद, पूर्ण ट्रांसक्रिप्ट वेब डैशबोर्ड के History सेक्शन में उपलब्ध होता है। आप कर सकते हैं:

इसे वक्ता द्वारा फ़िल्टर करके पढ़ना;
इसे पूरी तरह या अंशों में कॉपी करना;
इसे एनालिटिक्स और माइंड मैप के आधार के रूप में उपयोग करना।

📸 [स्क्रीनशॉट: डैशबोर्ड में सत्र पृष्ठ — वक्ता लेबल के साथ ट्रांसक्रिप्ट ब्लॉक]

सामान्य त्रुटियाँ

त्रुटि	कारण	समाधान
वार्ताकार की आवाज़ ट्रांसक्राइब नहीं होती	Screen Recording अनुमति नहीं दी गई (macOS) या सिस्टम ऑडियो उपलब्ध नहीं (Windows)	macOS अनुमतियाँ / Windows
ट्रांसक्रिप्ट में गलत भाषा	गलत ट्रांसक्रिप्शन भाषा चयनित	सेटिंग्स में भाषा बदलें और सत्र पुनः शुरू करें
वक्ताओं के बीच टेक्स्ट मिल जाता है	माइक्रोफ़ोन दोनों ऑडियो स्ट्रीम कैप्चर करता है (इको)	हेडफ़ोन का उपयोग करें या स्पीकर का वॉल्यूम कम करें
कमज़ोर कनेक्शन पर कोई टेक्स्ट नहीं	Whisper प्रतिक्रिया आने से पहले WebSocket कट जाता है	अपना कनेक्शन सुधारें; Whisperer स्वतः पुनः कनेक्ट होता है

सर्वोत्तम अभ्यास

हेडफ़ोन का उपयोग करें — इससे ध्वनिक इको समाप्त होती है और वक्ता पृथक्करण बेहतर होता है।
सत्र से पहले सही भाषा चुनें — रिकॉर्डिंग के बीच में भाषा बदलने से एक नया सत्र बनता है।
द्विभाषी कॉल पर आप वार्ताकार की भाषा चुन सकते हैं: कॉन्टेक्स्ट हिंट के कारण Whisper फिर भी आपके भाषण को पहचान लेगा।