Transkrip dan Pembicara

Whisperer mentranskripsi ucapan secara real-time menggunakan Whisper — model multibahasa dari OpenAI. Diarisasi pembicara berjalan bersamaan: kata-kata pengguna dan kata-kata lawan bicara diberi label yang berbeda, sehingga transkrip lebih mudah dibaca dan akurasi respons AI meningkat.

Kapan Membaca Ini

Baca artikel ini untuk memahami:

  • cara mengonfigurasi bahasa pengenalan;
  • mengapa sebagian ucapan diberi label [Me] dan sebagian lainnya [Other];
  • bahasa apa saja yang didukung dan cara beralih di antaranya.

Cara Kerja Transkripsi

Whisperer menangkap dua aliran audio:

Aliran Sumber Label
Suara pengguna Mikrofon [Me]
Suara lawan bicara Audio sistem (izin Screen Recording di macOS / audio sistem di Windows) [Other]

Setiap potongan audio (~0,8 dtk) dikirim ke server dengan label pembicara dan dikenali secara independen. Hasilnya muncul seketika di LiveTranscriptStrip — ticker bergulir di bagian bawah overlay.

Bahasa Transkripsi

Bahasa pengenalan diatur pada tingkat sesi:

  1. Buka Settings di klien (ikon roda gigi) atau di dasbor web.
  2. Temukan kolom Transcription Language.
  3. Pilih bahasa yang diinginkan dari daftar standar kode bahasa (mis. en, ru, zh, de).
  4. Mulai sesi baru — bahasa tersebut akan diterapkan padanya.

Whisper mendukung lebih dari 90 bahasa. Jika peserta rapat berbicara dalam bahasa yang berbeda, Whisper mendeteksi setiap potongan secara otomatis dalam "petunjuk" bahasa yang dipilih.

📸 [Tangkapan layar: ticker bergulir LiveTranscriptStrip dengan ucapan [Me] dan [Other]]

Transkrip Lengkap di Dasbor

Setelah sesi berakhir, transkrip lengkap tersedia di bagian History pada dasbor web. Anda dapat:

  • membacanya dengan filter berdasarkan pembicara;
  • menyalinnya secara keseluruhan atau sebagian;
  • menggunakannya sebagai dasar untuk analitik dan mind map.

📸 [Tangkapan layar: halaman sesi di dasbor — blok transkrip dengan label pembicara]

Kesalahan Umum

Kesalahan Penyebab Solusi
Suara lawan bicara tidak ditranskripsi Izin Screen Recording tidak diberikan (macOS) atau audio sistem tidak tersedia (Windows) Izin macOS / Windows
Bahasa yang salah pada transkrip Bahasa transkripsi yang dipilih tidak tepat Ubah bahasa di pengaturan dan mulai ulang sesi
Teks tercampur antar pembicara Mikrofon menangkap kedua aliran audio (gema) Gunakan headphone atau turunkan volume speaker
Tidak ada teks saat koneksi lemah WebSocket terputus sebelum respons Whisper tiba Perbaiki koneksi Anda; Whisperer menyambung ulang secara otomatis

Praktik Terbaik

  • Gunakan headphone — ini menghilangkan gema akustik dan meningkatkan pemisahan pembicara.
  • Pilih bahasa yang benar sebelum sesi — mengubah bahasa di tengah perekaman akan membuat sesi baru.
  • Pada panggilan dwibahasa Anda dapat memilih bahasa lawan bicara: Whisper tetap akan mengenali ucapan Anda berkat petunjuk konteks.

Artikel Terkait