Transkrip dan Pembicara
Whisperer mentranskripsi ucapan secara real-time menggunakan Whisper — model multibahasa dari OpenAI. Diarisasi pembicara berjalan bersamaan: kata-kata pengguna dan kata-kata lawan bicara diberi label yang berbeda, sehingga transkrip lebih mudah dibaca dan akurasi respons AI meningkat.
Kapan Membaca Ini
Baca artikel ini untuk memahami:
- cara mengonfigurasi bahasa pengenalan;
- mengapa sebagian ucapan diberi label [Me] dan sebagian lainnya [Other];
- bahasa apa saja yang didukung dan cara beralih di antaranya.
Cara Kerja Transkripsi
Whisperer menangkap dua aliran audio:
| Aliran | Sumber | Label |
|---|---|---|
| Suara pengguna | Mikrofon | [Me] |
| Suara lawan bicara | Audio sistem (izin Screen Recording di macOS / audio sistem di Windows) | [Other] |
Setiap potongan audio (~0,8 dtk) dikirim ke server dengan label pembicara dan dikenali secara independen. Hasilnya muncul seketika di LiveTranscriptStrip — ticker bergulir di bagian bawah overlay.
Bahasa Transkripsi
Bahasa pengenalan diatur pada tingkat sesi:
- Buka Settings di klien (ikon roda gigi) atau di dasbor web.
- Temukan kolom Transcription Language.
- Pilih bahasa yang diinginkan dari daftar standar kode bahasa (mis.
en,ru,zh,de). - Mulai sesi baru — bahasa tersebut akan diterapkan padanya.
Whisper mendukung lebih dari 90 bahasa. Jika peserta rapat berbicara dalam bahasa yang berbeda, Whisper mendeteksi setiap potongan secara otomatis dalam "petunjuk" bahasa yang dipilih.
📸 [Tangkapan layar: ticker bergulir LiveTranscriptStrip dengan ucapan [Me] dan [Other]]
Transkrip Lengkap di Dasbor
Setelah sesi berakhir, transkrip lengkap tersedia di bagian History pada dasbor web. Anda dapat:
- membacanya dengan filter berdasarkan pembicara;
- menyalinnya secara keseluruhan atau sebagian;
- menggunakannya sebagai dasar untuk analitik dan mind map.
📸 [Tangkapan layar: halaman sesi di dasbor — blok transkrip dengan label pembicara]
Kesalahan Umum
| Kesalahan | Penyebab | Solusi |
|---|---|---|
| Suara lawan bicara tidak ditranskripsi | Izin Screen Recording tidak diberikan (macOS) atau audio sistem tidak tersedia (Windows) | Izin macOS / Windows |
| Bahasa yang salah pada transkrip | Bahasa transkripsi yang dipilih tidak tepat | Ubah bahasa di pengaturan dan mulai ulang sesi |
| Teks tercampur antar pembicara | Mikrofon menangkap kedua aliran audio (gema) | Gunakan headphone atau turunkan volume speaker |
| Tidak ada teks saat koneksi lemah | WebSocket terputus sebelum respons Whisper tiba | Perbaiki koneksi Anda; Whisperer menyambung ulang secara otomatis |
Praktik Terbaik
- Gunakan headphone — ini menghilangkan gema akustik dan meningkatkan pemisahan pembicara.
- Pilih bahasa yang benar sebelum sesi — mengubah bahasa di tengah perekaman akan membuat sesi baru.
- Pada panggilan dwibahasa Anda dapat memilih bahasa lawan bicara: Whisper tetap akan mengenali ucapan Anda berkat petunjuk konteks.