Transkript ve Konuşmacılar

Whisperer, konuşmayı gerçek zamanlı olarak OpenAI'nin çok dilli modeli Whisper ile metne dönüştürür. Konuşmacı ayrımı (diarization) aynı anda çalışır: kullanıcının söyledikleri ile karşı tarafın söyledikleri farklı şekilde etiketlenir; bu sayede transkript daha okunaklı hâle gelir ve AI yanıtlarının doğruluğu artar.

Bunu Ne Zaman Okumalısınız

Bu makaleyi şunları anlamak için okuyun:

  • tanıma dilini nasıl yapılandıracağınızı;
  • bazı ifadelerin neden [Me], bazılarının [Other] olarak etiketlendiğini;
  • hangi dillerin desteklendiğini ve aralarında nasıl geçiş yapılacağını.

Transkripsiyon Nasıl Çalışır

Whisperer iki ses akışını yakalar:

Akış Kaynak Etiket
Kullanıcının sesi Mikrofon [Me]
Karşı tarafın sesi Sistem sesi (macOS'ta Ekran Kaydı izni / Windows'ta sistem sesi) [Other]

Her ses parçası (~0,8 sn) bir konuşmacı etiketiyle birlikte sunucuya gönderilir ve bağımsız olarak tanınır. Sonuç anında LiveTranscriptStrip'te görünür — bu, kaplamanın (overlay) altındaki kayan akış şerididir.

Transkripsiyon Dili

Tanıma dili oturum düzeyinde ayarlanır:

  1. İstemcide (dişli simgesi) ya da web panosunda Ayarlar'ı açın.
  2. Transkripsiyon Dili alanını bulun.
  3. Standart dil kodu listesinden istediğiniz dili seçin (örneğin, en, ru, zh, de).
  4. Yeni bir oturum başlatın — dil bu oturuma uygulanacaktır.

Whisper 90'dan fazla dili destekler. Toplantı katılımcıları farklı diller konuşuyorsa, Whisper seçilen dil "ipucu" çerçevesinde her parçayı otomatik olarak algılar.

📸 [Ekran görüntüsü: [Me] ve [Other] ifadeleriyle kayan LiveTranscriptStrip şeridi]

Panodaki Tam Transkript

Oturum sona erdikten sonra tam transkript, web panosunun Geçmiş bölümünde kullanılabilir hâle gelir. Şunları yapabilirsiniz:

  • konuşmacıya göre filtreleyerek okuyabilir;
  • tamamını veya parçalarını kopyalayabilir;
  • analiz ve zihin haritaları için temel olarak kullanabilirsiniz.

📸 [Ekran görüntüsü: panodaki oturum sayfası — konuşmacı etiketli transkript blokları]

Sık Karşılaşılan Hatalar

Hata Neden Çözüm
Karşı tarafın sesi metne dönüştürülmüyor Ekran Kaydı izni verilmemiş (macOS) veya sistem sesi kullanılamıyor (Windows) macOS İzinleri / Windows
Transkriptte yanlış dil Yanlış transkripsiyon dili seçilmiş Dili ayarlardan değiştirin ve oturumu yeniden başlatın
Metin konuşmacılar arasında karışıyor Mikrofon her iki ses akışını da yakalıyor (yankı) Kulaklık kullanın veya hoparlör sesini kısın
Zayıf bağlantıda metin yok Whisper yanıtı gelmeden WebSocket kopuyor Bağlantınızı iyileştirin; Whisperer otomatik olarak yeniden bağlanır

En İyi Uygulamalar

  • Kulaklık kullanın — bu, akustik yankıyı ortadan kaldırır ve konuşmacı ayrımını iyileştirir.
  • Oturumdan önce doğru dili seçin — kayıt sırasında dili değiştirmek yeni bir oturum oluşturur.
  • İki dilli aramalarda karşı tarafın dilini seçebilirsiniz: bağlam ipucu sayesinde Whisper sizin konuşmanızı yine de tanır.

İlgili Makaleler