ट्रांसक्रिप्ट और वक्ता
Whisperer भाषण को रियल टाइम में Whisper — OpenAI के बहुभाषी मॉडल — का उपयोग करके ट्रांसक्राइब करता है। वक्ता डायराइज़ेशन एक साथ चलता है: उपयोगकर्ता के शब्द और वार्ताकार के शब्द अलग-अलग लेबल किए जाते हैं, जिससे ट्रांसक्रिप्ट पढ़ने में आसान हो जाता है और AI उत्तरों की सटीकता बढ़ती है।
इसे कब पढ़ें
यह लेख पढ़ें ताकि आप समझ सकें:
- पहचान भाषा कैसे कॉन्फ़िगर करें;
- कुछ कथन [Me] और अन्य [Other] के रूप में क्यों लेबल किए जाते हैं;
- कौन-सी भाषाएँ समर्थित हैं और उनके बीच कैसे स्विच करें।
ट्रांसक्रिप्शन कैसे काम करता है
Whisperer दो ऑडियो स्ट्रीम कैप्चर करता है:
| स्ट्रीम | स्रोत | लेबल |
|---|---|---|
| उपयोगकर्ता की आवाज़ | माइक्रोफ़ोन | [Me] |
| वार्ताकार की आवाज़ | सिस्टम ऑडियो (macOS पर Screen Recording अनुमति / Windows पर सिस्टम ऑडियो) | [Other] |
प्रत्येक ऑडियो चंक (~0.8 सेकंड) वक्ता लेबल के साथ सर्वर को भेजा जाता है और स्वतंत्र रूप से पहचाना जाता है। परिणाम तुरंत LiveTranscriptStrip में दिखाई देता है — ओवरले के नीचे स्क्रॉल होने वाला टिकर।
ट्रांसक्रिप्शन भाषा
पहचान भाषा सत्र स्तर पर सेट की जाती है:
- क्लाइंट में (गियर आइकन) या वेब डैशबोर्ड में Settings खोलें।
- Transcription Language फ़ील्ड खोजें।
- भाषा कोड की मानक सूची से इच्छित भाषा चुनें (जैसे,
en,ru,zh,de)। - एक नया सत्र शुरू करें — भाषा उस पर लागू होगी।
Whisper 90 से अधिक भाषाओं का समर्थन करता है। यदि मीटिंग प्रतिभागी अलग-अलग भाषाएँ बोलते हैं, तो Whisper चयनित भाषा "हिंट" के भीतर प्रत्येक चंक का स्वतः पता लगा लेता है।
📸 [स्क्रीनशॉट: [Me] और [Other] कथनों के साथ LiveTranscriptStrip स्क्रॉलिंग टिकर]
डैशबोर्ड में पूर्ण ट्रांसक्रिप्ट
सत्र समाप्त होने के बाद, पूर्ण ट्रांसक्रिप्ट वेब डैशबोर्ड के History सेक्शन में उपलब्ध होता है। आप कर सकते हैं:
- इसे वक्ता द्वारा फ़िल्टर करके पढ़ना;
- इसे पूरी तरह या अंशों में कॉपी करना;
- इसे एनालिटिक्स और माइंड मैप के आधार के रूप में उपयोग करना।
📸 [स्क्रीनशॉट: डैशबोर्ड में सत्र पृष्ठ — वक्ता लेबल के साथ ट्रांसक्रिप्ट ब्लॉक]
सामान्य त्रुटियाँ
| त्रुटि | कारण | समाधान |
|---|---|---|
| वार्ताकार की आवाज़ ट्रांसक्राइब नहीं होती | Screen Recording अनुमति नहीं दी गई (macOS) या सिस्टम ऑडियो उपलब्ध नहीं (Windows) | macOS अनुमतियाँ / Windows |
| ट्रांसक्रिप्ट में गलत भाषा | गलत ट्रांसक्रिप्शन भाषा चयनित | सेटिंग्स में भाषा बदलें और सत्र पुनः शुरू करें |
| वक्ताओं के बीच टेक्स्ट मिल जाता है | माइक्रोफ़ोन दोनों ऑडियो स्ट्रीम कैप्चर करता है (इको) | हेडफ़ोन का उपयोग करें या स्पीकर का वॉल्यूम कम करें |
| कमज़ोर कनेक्शन पर कोई टेक्स्ट नहीं | Whisper प्रतिक्रिया आने से पहले WebSocket कट जाता है | अपना कनेक्शन सुधारें; Whisperer स्वतः पुनः कनेक्ट होता है |
सर्वोत्तम अभ्यास
- हेडफ़ोन का उपयोग करें — इससे ध्वनिक इको समाप्त होती है और वक्ता पृथक्करण बेहतर होता है।
- सत्र से पहले सही भाषा चुनें — रिकॉर्डिंग के बीच में भाषा बदलने से एक नया सत्र बनता है।
- द्विभाषी कॉल पर आप वार्ताकार की भाषा चुन सकते हैं: कॉन्टेक्स्ट हिंट के कारण Whisper फिर भी आपके भाषण को पहचान लेगा।