Canlı transkripsiyon
Genel bakış
Canlı transkripsiyon, görüşmenizin gerçek zamanlı bir dökümüdür. Whisperer sesi iki bağımsız akış üzerinden dinler — mikrofonunuz (sizin sesiniz) ve sistem sesi (karşı tarafın sesi) — konuşmayı tanır ve söylenenleri anında konuşmacıya göre etiketler: [Me] ve [Other]. Metin yer paylaşımı katmanında (LiveTranscriptStrip) kayarak akar ve yapay zekâ önerileri için bağlam görevi görür.
Tanıma, gerçek zamanlı olarak Whisper modeli üzerinden çalışır. Transkripsiyon yalnızca akış (streaming) modundadır (gerçek zamanlı): ses, kaydedildikçe kısa parçalar hâlinde tanımaya gönderilir. Tamamlanmış bir ses dosyasının toplu (batch) transkripsiyon için yüklenmesi söz konusu değildir — Whisperer canlı görüşmeler için tasarlanmıştır, kayıtların sonradan işlenmesi için değil.
Ne zaman kullanılır
- Herhangi bir görüntülü görüşme. Whisperer; Zoom, Google Meet, Microsoft Teams, Telegram, Discord ve diğer tüm hizmetlerin üzerinde bir yer paylaşımı katmanı olarak çalışır — ayrı bir entegrasyon gerekmez.
- Mülakatlar (davranışsal ve System Design), bir sorunun nasıl ifade edildiğini kaçırmanın göze alınamayacağı durumlar.
- Dersler, özel ders seansları, satış — her iki tarafın söylediklerinin doğru bir dökümüne ihtiyaç duyduğunuzda.
- Çok dilli görüşmeler — Whisper onlarca dili anlar; tanıma dili her oturum için ayrıca ayarlanır.
Adım adım
- İzinleri verin. macOS üzerinde iki akış iki izin gerektirir: "Mikrofon" (sizin sesiniz) ve "Ekran Kaydı" (karşı tarafın sistem sesi); "Ekran Kaydı" izni olmadan karşı taraf duyulmaz. Bkz. macOS izinleri. Windows üzerinde sistem sesi herhangi bir ek izin olmadan yakalanır — yalnızca mikrofon erişimi gerekir; bkz. Windows izinleri.
- Transkripsiyon dilini seçin. Oturum ayarlarında konuşulan dili belirleyin. Varsayılan
ru'dur. Whisper çok dillidir; bu nedenle İngilizce bir mülakat içinenayarlayın ve karma bir görüşme için görüşmenin ağırlıklı dilini kullanın. - Yer paylaşımı katmanını açın ve oynat'a basın. CommandBar içinde bir ses göstergesi (dalga formu) belirir — bu, sesin geldiğini doğrular.
- Konuşun ve dinleyin. Sizin söyledikleriniz
[Me], sistem sesinden gelenler[Other]olarak etiketlenir. Döküm, LiveTranscriptStrip içinde gerçek zamanlı olarak güncellenir. - (İsteğe bağlı) Çeviriyi etkinleştirin. Yer paylaşımı ayarlarında çeviri etkinleştirildiyse, dökümün altında bir çeviri satırı (TranslationStrip) belirir.
- Oturumu sonlandırın. İşiniz bittiğinde döküm geçmişe kaydedilir (no-logs modu hariç — bkz. Sınırlar ve kotalar).
"Ekran Kaydı" izni neden gereklidir (macOS)
macOS üzerinde diğer uygulamalardan gelen ses (Zoom/Meet'te karşı tarafın sesi) ekran kaydı mekanizması aracılığıyla yakalanır — ekran görüntüsü almakla aynı sistem olanağı. Bu nedenle Whisperer, "Ekran Kaydı" iznini ekranınızı izlemek için değil, teknik olarak sistem ses akışını elde etmek (ve görsel öneriler için ekran görüntüleri almak) için ister. Bu izin verilmezse yalnızca mikrofon kaydedilir — siz duyulursunuz, karşı taraf duyulmaz.
Windows üzerinde durum daha basittir: karşı tarafın sistem sesi herhangi bir ek izin olmadan yakalanır — mikrofon erişimi yeterlidir. Ayrıntılar Windows izinleri bölümündedir.
Ekran görüntüleri
📸 [Ekran görüntüsü: kayan döküm ve [Me]/[Other] etiketlemesiyle yer paylaşımı katmanı]
📸 [Ekran görüntüsü: oturum ayarlarında transkripsiyon dilinin seçilmesi]
📸 [Ekran görüntüsü: CommandBar içindeki ses göstergesi (dalga formu)]
Sık yapılan hatalar
- Karşı taraf duyulmuyor, döküm yalnızca
[Me]gösteriyor. "Ekran Kaydı" izni verilmemiş. Sistem Ayarları → Gizlilik ve Güvenlik → Ekran Kaydı yolunu açın, Whisperer'ı etkinleştirin, ardından istemciyi yeniden başlatın. - Döküm yanlış dilde / çok sayıda tanıma hatası var. Transkripsiyon dili yanlış ayarlanmış. Başlamadan önce oturum dilini konuşmanın gerçek diline değiştirin.
- Ses göstergesi yok. Bir giriş cihazı seçilmemiş ya da mikrofon erişimi verilmemiş — gizlilik ayarlarınızda "Mikrofon"u kontrol edin.
- Bir kaydın yüklenmesini bekleme. Tamamlanmış bir dosyanın toplu transkripsiyonu yoktur — transkripsiyon yalnızca bir oturum sırasında canlı olarak çalışır.
En iyi uygulamalar
- Önemli bir toplantıdan önce bir meslektaşınızla deneme görüşmesi yapın ve karşı tarafın dökümde
[Other]olarak göründüğünü doğrulayın. - Gürültülü bir ortamda yer paylaşımı ayarlarında gürültü bastırmayı etkinleştirin — bu, Whisper'ın doğruluğunu artırır.
- Diller karışık görüşmelerde çoğunlukla konuşulan dili seçin; Whisper geçişleri idare eder, ancak temel dili açıkça ayarlamak daha iyidir.
- İçerik hassassa no-logs modunu kullanın — döküm veritabanına kaydedilmez (yine de dakikalar tüketilir).
- Net bir diksiyon koruyun ve birbirinizin sözünü kesmeyin — ayrı söylemler, konuşmacıya göre daha doğru etiketlenir.