Transkripsi langsung
Ikhtisar
Transkripsi langsung adalah transkrip real-time dari panggilan Anda. Whisperer mendengarkan audio melalui dua aliran independen — mikrofon Anda (suara Anda) dan audio sistem (suara lawan bicara) — mengenali ucapan dan langsung menandai setiap kalimat berdasarkan pembicara: [Me] dan [Other]. Teks bergulir di overlay (LiveTranscriptStrip) dan berfungsi sebagai konteks untuk saran AI.
Pengenalan berjalan melalui model Whisper secara real-time. Transkripsi bersifat streaming saja (real-time): audio dikirim untuk dikenali dalam potongan-potongan singkat saat sedang direkam. Tidak ada unggahan berkas audio jadi untuk transkripsi batch — Whisperer dibangun untuk panggilan langsung, bukan untuk pemrosesan rekaman setelahnya.
Kapan menggunakannya
- Panggilan video apa pun. Whisperer bekerja sebagai overlay di atas Zoom, Google Meet, Microsoft Teams, Telegram, Discord, dan layanan lainnya — tanpa perlu integrasi terpisah.
- Wawancara (behavioral dan System Design), di mana Anda tidak boleh melewatkan bagaimana sebuah pertanyaan dirumuskan.
- Kuliah, sesi les, penjualan — saat Anda membutuhkan transkrip akurat dari ucapan kedua belah pihak.
- Panggilan multibahasa — Whisper memahami puluhan bahasa; bahasa pengenalan diatur per sesi.
Langkah demi langkah
- Berikan izin. Di macOS, dua aliran tersebut membutuhkan dua izin: "Microphone" (suara Anda) dan "Screen Recording" (audio sistem dari lawan bicara); tanpa "Screen Recording" suara lawan bicara tidak akan terdengar. Lihat Izin macOS. Di Windows, audio sistem ditangkap tanpa izin tambahan apa pun — Anda hanya memerlukan akses mikrofon; lihat Izin Windows.
- Pilih bahasa transkripsi. Di pengaturan sesi, atur bahasa yang diucapkan. Default-nya adalah
ru. Whisper bersifat multibahasa, jadi untuk wawancara berbahasa Inggris atur keen, dan untuk panggilan campuran gunakan bahasa utama panggilan tersebut. - Buka overlay dan tekan putar. Indikator volume (gelombang suara) muncul di CommandBar — ini mengonfirmasi bahwa audio sedang masuk.
- Berbicara dan mendengarkan. Ucapan Anda ditandai
[Me], ucapan dari audio sistem ditandai[Other]. Transkrip diperbarui di LiveTranscriptStrip secara real-time. - (Opsional) Aktifkan terjemahan. Jika terjemahan diaktifkan di pengaturan overlay, baris terjemahan (TranslationStrip) muncul di bawah transkrip.
- Akhiri sesi. Setelah selesai, transkrip disimpan ke riwayat (kecuali dalam mode no-logs — lihat Batas dan kuota).
Mengapa izin "Screen Recording" diperlukan (macOS)
Di macOS, audio dari aplikasi lain (suara lawan bicara di Zoom/Meet) ditangkap melalui mekanisme perekaman layar — fasilitas sistem yang sama dengan tangkapan layar. Jadi Whisperer meminta izin "Screen Recording" bukan untuk melihat layar Anda, melainkan untuk secara teknis memperoleh aliran audio sistem (dan untuk mengambil tangkapan layar untuk saran berbasis vision). Tanpa izin ini, hanya mikrofon yang direkam — Anda terdengar, lawan bicara tidak.
Di Windows lebih sederhana: audio sistem dari lawan bicara ditangkap tanpa izin tambahan apa pun — akses mikrofon sudah cukup. Detailnya ada di Izin Windows.
Tangkapan layar
📸 [Tangkapan layar: overlay dengan transkrip yang bergulir dan penandaan [Me]/[Other]]
📸 [Tangkapan layar: memilih bahasa transkripsi di pengaturan sesi]
📸 [Tangkapan layar: indikator volume (gelombang suara) di CommandBar]
Kesalahan umum
- Lawan bicara tidak terdengar, transkrip hanya menampilkan
[Me]. Izin "Screen Recording" belum diberikan. Buka System Settings → Privacy & Security → Screen Recording, aktifkan Whisperer, lalu mulai ulang klien. - Transkrip dalam bahasa yang salah / banyak kesalahan pengenalan. Bahasa transkripsi diatur secara tidak benar. Ubah bahasa sesi ke bahasa percakapan yang sebenarnya sebelum memulai.
- Tidak ada indikator volume. Tidak ada perangkat input yang dipilih atau akses mikrofon belum diberikan — periksa "Microphone" di pengaturan privasi Anda.
- Menunggu rekaman terunggah. Tidak ada transkripsi batch dari berkas jadi — transkripsi hanya bekerja secara langsung selama sesi.
Praktik terbaik
- Sebelum rapat penting, lakukan panggilan uji coba dengan rekan kerja dan pastikan lawan bicara muncul di transkrip sebagai
[Other]. - Aktifkan penekanan kebisingan di pengaturan overlay saat berada di ruangan yang bising — ini meningkatkan akurasi Whisper.
- Untuk panggilan campuran bahasa, pilih bahasa yang paling sering diucapkan; Whisper menangani peralihan, tetapi lebih baik mengatur bahasa dasar secara eksplisit.
- Jika kontennya sensitif, gunakan mode no-logs — transkrip tidak akan disimpan ke basis data (namun menit tetap terpakai).
- Jaga artikulasi yang jelas dan hindari berbicara bersamaan — ucapan yang terpisah ditandai berdasarkan pembicara dengan lebih akurat.