Trascrizione e Interlocutori
Whisperer trascrive il parlato in tempo reale utilizzando Whisper — il modello multilingue di OpenAI. La diarizzazione degli interlocutori avviene contemporaneamente: le parole dell'utente e quelle dell'interlocutore vengono etichettate in modo diverso, rendendo la trascrizione più facile da leggere e migliorando l'accuratezza delle risposte dell'AI.
Quando Leggere Questo Articolo
Leggi questo articolo per capire:
- come configurare la lingua di riconoscimento;
- perché alcune frasi sono etichettate [Me] e altre [Other];
- quali lingue sono supportate e come passare dall'una all'altra.
Come Funziona la Trascrizione
Whisperer cattura due flussi audio:
| Flusso | Sorgente | Etichetta |
|---|---|---|
| Voce dell'utente | Microfono | [Me] |
| Voce dell'interlocutore | Audio di sistema (permesso di Registrazione schermo su macOS / audio di sistema su Windows) | [Other] |
Ogni segmento audio (~0,8 s) viene inviato al server con un'etichetta di interlocutore e viene riconosciuto in modo indipendente. Il risultato appare istantaneamente nella LiveTranscriptStrip — il ticker scorrevole nella parte inferiore dell'overlay.
Lingua di Trascrizione
La lingua di riconoscimento viene impostata a livello di sessione:
- Apri le Impostazioni nel client (icona dell'ingranaggio) o nel pannello web.
- Trova il campo Lingua di trascrizione.
- Seleziona la lingua desiderata dall'elenco standard dei codici lingua (ad es.
en,ru,zh,de). - Avvia una nuova sessione — la lingua verrà applicata ad essa.
Whisper supporta più di 90 lingue. Se i partecipanti alla riunione parlano lingue diverse, Whisper rileva automaticamente ogni segmento all'interno del "suggerimento" della lingua selezionata.
📸 [Screenshot: ticker scorrevole LiveTranscriptStrip con frasi [Me] e [Other]]
Trascrizione Completa nel Pannello
Al termine della sessione, la trascrizione completa è disponibile nella sezione Cronologia del pannello web. Puoi:
- leggerla filtrata per interlocutore;
- copiarla per intero o a frammenti;
- usarla come base per analisi e mappe mentali.
📸 [Screenshot: pagina della sessione nel pannello — blocchi di trascrizione con etichette degli interlocutori]
Errori Comuni
| Errore | Causa | Soluzione |
|---|---|---|
| La voce dell'interlocutore non viene trascritta | Permesso di Registrazione schermo non concesso (macOS) o audio di sistema non disponibile (Windows) | Permessi macOS / Windows |
| Lingua errata nella trascrizione | Lingua di trascrizione selezionata in modo errato | Cambia la lingua nelle impostazioni e riavvia la sessione |
| Il testo si mescola tra gli interlocutori | Il microfono cattura entrambi i flussi audio (eco) | Usa le cuffie o abbassa il volume degli altoparlanti |
| Nessun testo con una connessione debole | Il WebSocket cade prima che arrivi la risposta di Whisper | Migliora la connessione; Whisperer si riconnette automaticamente |
Buone Pratiche
- Usa le cuffie — questo elimina l'eco acustico e migliora la separazione degli interlocutori.
- Seleziona la lingua corretta prima della sessione — cambiare la lingua a registrazione in corso crea una nuova sessione.
- Nelle chiamate bilingue puoi selezionare la lingua dell'interlocutore: Whisper riconoscerà comunque il tuo parlato grazie al suggerimento di contesto.