Transkript ve Konuşmacılar
Whisperer, konuşmayı gerçek zamanlı olarak OpenAI'nin çok dilli modeli Whisper ile metne dönüştürür. Konuşmacı ayrımı (diarization) aynı anda çalışır: kullanıcının söyledikleri ile karşı tarafın söyledikleri farklı şekilde etiketlenir; bu sayede transkript daha okunaklı hâle gelir ve AI yanıtlarının doğruluğu artar.
Bunu Ne Zaman Okumalısınız
Bu makaleyi şunları anlamak için okuyun:
- tanıma dilini nasıl yapılandıracağınızı;
- bazı ifadelerin neden [Me], bazılarının [Other] olarak etiketlendiğini;
- hangi dillerin desteklendiğini ve aralarında nasıl geçiş yapılacağını.
Transkripsiyon Nasıl Çalışır
Whisperer iki ses akışını yakalar:
| Akış | Kaynak | Etiket |
|---|---|---|
| Kullanıcının sesi | Mikrofon | [Me] |
| Karşı tarafın sesi | Sistem sesi (macOS'ta Ekran Kaydı izni / Windows'ta sistem sesi) | [Other] |
Her ses parçası (~0,8 sn) bir konuşmacı etiketiyle birlikte sunucuya gönderilir ve bağımsız olarak tanınır. Sonuç anında LiveTranscriptStrip'te görünür — bu, kaplamanın (overlay) altındaki kayan akış şerididir.
Transkripsiyon Dili
Tanıma dili oturum düzeyinde ayarlanır:
- İstemcide (dişli simgesi) ya da web panosunda Ayarlar'ı açın.
- Transkripsiyon Dili alanını bulun.
- Standart dil kodu listesinden istediğiniz dili seçin (örneğin,
en,ru,zh,de). - Yeni bir oturum başlatın — dil bu oturuma uygulanacaktır.
Whisper 90'dan fazla dili destekler. Toplantı katılımcıları farklı diller konuşuyorsa, Whisper seçilen dil "ipucu" çerçevesinde her parçayı otomatik olarak algılar.
📸 [Ekran görüntüsü: [Me] ve [Other] ifadeleriyle kayan LiveTranscriptStrip şeridi]
Panodaki Tam Transkript
Oturum sona erdikten sonra tam transkript, web panosunun Geçmiş bölümünde kullanılabilir hâle gelir. Şunları yapabilirsiniz:
- konuşmacıya göre filtreleyerek okuyabilir;
- tamamını veya parçalarını kopyalayabilir;
- analiz ve zihin haritaları için temel olarak kullanabilirsiniz.
📸 [Ekran görüntüsü: panodaki oturum sayfası — konuşmacı etiketli transkript blokları]
Sık Karşılaşılan Hatalar
| Hata | Neden | Çözüm |
|---|---|---|
| Karşı tarafın sesi metne dönüştürülmüyor | Ekran Kaydı izni verilmemiş (macOS) veya sistem sesi kullanılamıyor (Windows) | macOS İzinleri / Windows |
| Transkriptte yanlış dil | Yanlış transkripsiyon dili seçilmiş | Dili ayarlardan değiştirin ve oturumu yeniden başlatın |
| Metin konuşmacılar arasında karışıyor | Mikrofon her iki ses akışını da yakalıyor (yankı) | Kulaklık kullanın veya hoparlör sesini kısın |
| Zayıf bağlantıda metin yok | Whisper yanıtı gelmeden WebSocket kopuyor | Bağlantınızı iyileştirin; Whisperer otomatik olarak yeniden bağlanır |
En İyi Uygulamalar
- Kulaklık kullanın — bu, akustik yankıyı ortadan kaldırır ve konuşmacı ayrımını iyileştirir.
- Oturumdan önce doğru dili seçin — kayıt sırasında dili değiştirmek yeni bir oturum oluşturur.
- İki dilli aramalarda karşı tarafın dilini seçebilirsiniz: bağlam ipucu sayesinde Whisper sizin konuşmanızı yine de tanır.