النسخ المباشر (Live transcription)

نظرة عامة

النسخ المباشر هو تفريغ نصي فوري لمكالمتك. يستمع Whisperer إلى الصوت عبر مسارين مستقلين — الميكروفون الخاص بك (صوتك) وصوت النظام (صوت الطرف الآخر) — ويتعرّف على الكلام ويصنّف الجُمل فورًا بحسب المتحدث: [Me] و[Other]. يتمرّر النص في الطبقة العلوية (LiveTranscriptStrip) ويُستخدم كسياق لاقتراحات الذكاء الاصطناعي.

يجري التعرّف عبر نموذج Whisper في الوقت الفعلي. النسخ بالبث فقط (في الوقت الفعلي): يُرسَل الصوت للتعرّف على شكل مقاطع قصيرة أثناء تسجيله. لا يوجد رفع لملف صوتي مكتمل من أجل نسخ دفعي — فقد صُمِّم Whisperer للمكالمات المباشرة، لا لمعالجة التسجيلات بعد انتهائها.

متى تستخدمه

أي مكالمة فيديو. يعمل Whisperer كطبقة علوية فوق Zoom وGoogle Meet وMicrosoft Teams وTelegram وDiscord وأي خدمة أخرى — دون الحاجة إلى تكامل منفصل.
المقابلات (السلوكية وتصميم الأنظمة System Design)، حيث لا يمكنك تحمّل تفويت طريقة صياغة السؤال.
المحاضرات وجلسات التدريس والمبيعات — حين تحتاج إلى تفريغ دقيق لتعليقات الطرفين.
المكالمات متعددة اللغات — يفهم Whisper عشرات اللغات؛ تُضبط لغة التعرّف لكل جلسة على حدة.

خطوة بخطوة

امنح الأذونات. على macOS، يتطلب المساران أذنين: "الميكروفون" (صوتك) و"تسجيل الشاشة" (صوت نظام الطرف الآخر)؛ من دون "تسجيل الشاشة" لن يُسمع الطرف الآخر. راجع أذونات macOS. على Windows، يُلتقط صوت النظام دون أي إذن إضافي — تحتاج فقط إلى الوصول إلى الميكروفون؛ راجع أذونات Windows.
اختر لغة النسخ. في إعدادات الجلسة، اضبط اللغة المنطوقة. القيمة الافتراضية هي ru. إنّ Whisper متعدد اللغات، لذا اضبط en لمقابلة باللغة الإنجليزية، واستخدم اللغة الأساسية للمكالمة في المكالمات المختلطة.
افتح الطبقة العلوية واضغط تشغيل. يظهر مؤشر مستوى الصوت (الموجة الصوتية) في CommandBar — وهو يؤكد أن الصوت وارد.
تكلّم واستمع. تُصنَّف تعليقاتك بـ[Me]، وتُصنَّف التعليقات الواردة من صوت النظام بـ[Other]. يتحدّث التفريغ النصي في LiveTranscriptStrip في الوقت الفعلي.
(اختياري) فعّل الترجمة. إذا كانت الترجمة مفعّلة في إعدادات الطبقة العلوية، فسيظهر سطر ترجمة (TranslationStrip) أسفل التفريغ النصي.
أنهِ الجلسة. عند الانتهاء، يُحفظ التفريغ النصي في السجل (باستثناء وضع عدم التسجيل no-logs — راجع الحدود والحصص).

لماذا يلزم إذن "تسجيل الشاشة" (macOS)

على macOS، يُلتقط الصوت من التطبيقات الأخرى (صوت الطرف الآخر في Zoom/Meet) عبر آلية تسجيل الشاشة — وهي المرفق النظامي نفسه المستخدَم لالتقاط الشاشة. لذا يطلب Whisperer إذن "تسجيل الشاشة" ليس لمراقبة شاشتك، بل ليحصل تقنيًا على مسار صوت النظام (وكذلك لالتقاط لقطات الشاشة الخاصة باقتراحات الرؤية). من دون هذا الإذن، يُسجَّل الميكروفون فقط — فيُسمَع صوتك دون صوت الطرف الآخر.

على Windows يكون الأمر أبسط: يُلتقط صوت نظام الطرف الآخر دون أي إذن إضافي — يكفي الوصول إلى الميكروفون. التفاصيل في أذونات Windows.

لقطات الشاشة

📸 [لقطة شاشة: الطبقة العلوية مع تفريغ نصي متمرّر وتصنيف [Me]/[Other]]

📸 [لقطة شاشة: اختيار لغة النسخ في إعدادات الجلسة]

📸 [لقطة شاشة: مؤشر مستوى الصوت (الموجة الصوتية) في CommandBar]

أخطاء شائعة

لا يُسمع الطرف الآخر، ويُظهر التفريغ [Me] فقط. لم يُمنح إذن "تسجيل الشاشة". افتح إعدادات النظام ← الخصوصية والأمان ← تسجيل الشاشة، فعّل Whisperer، ثم أعد تشغيل العميل.
التفريغ بلغة خاطئة / الكثير من أخطاء التعرّف. لغة النسخ مضبوطة بشكل غير صحيح. غيّر لغة الجلسة إلى اللغة الفعلية للمحادثة قبل البدء.
لا يوجد مؤشر لمستوى الصوت. لم يُختَر أي جهاز إدخال أو لم يُمنح الوصول إلى الميكروفون — تحقّق من "الميكروفون" في إعدادات الخصوصية لديك.
انتظار رفع تسجيل. لا يوجد نسخ دفعي لملف مكتمل — يعمل النسخ مباشرةً فقط أثناء الجلسة.

أفضل الممارسات

قبل اجتماع مهم، أجرِ مكالمة تجريبية مع زميل وتأكّد من ظهور الطرف الآخر في التفريغ بوسم [Other].
فعّل خفض الضوضاء في إعدادات الطبقة العلوية في غرفة صاخبة — فهذا يحسّن دقة Whisper.
في المكالمات المختلطة اللغات، اختر اللغة الأكثر استخدامًا في الحديث؛ يتعامل Whisper مع التبديل بين اللغات، لكن من الأفضل ضبط اللغة الأساسية صراحةً.
إذا كان المحتوى حسّاسًا، استخدم وضع عدم التسجيل no-logs — فلن يُحفظ التفريغ في قاعدة البيانات (لكن تُستهلك الدقائق رغم ذلك).
حافظ على نطق واضح وتجنّب الحديث في الوقت نفسه — فالجُمل المنفصلة تُصنَّف بحسب المتحدث بدقة أكبر.