Trascrizione e Interlocutori

Whisperer trascrive il parlato in tempo reale utilizzando Whisper — il modello multilingue di OpenAI. La diarizzazione degli interlocutori avviene contemporaneamente: le parole dell'utente e quelle dell'interlocutore vengono etichettate in modo diverso, rendendo la trascrizione più facile da leggere e migliorando l'accuratezza delle risposte dell'AI.

Quando Leggere Questo Articolo

Leggi questo articolo per capire:

come configurare la lingua di riconoscimento;
perché alcune frasi sono etichettate [Me] e altre [Other];
quali lingue sono supportate e come passare dall'una all'altra.

Come Funziona la Trascrizione

Whisperer cattura due flussi audio:

Flusso	Sorgente	Etichetta
Voce dell'utente	Microfono	[Me]
Voce dell'interlocutore	Audio di sistema (permesso di Registrazione schermo su macOS / audio di sistema su Windows)	[Other]

Ogni segmento audio (~0,8 s) viene inviato al server con un'etichetta di interlocutore e viene riconosciuto in modo indipendente. Il risultato appare istantaneamente nella LiveTranscriptStrip — il ticker scorrevole nella parte inferiore dell'overlay.

Lingua di Trascrizione

La lingua di riconoscimento viene impostata a livello di sessione:

Apri le Impostazioni nel client (icona dell'ingranaggio) o nel pannello web.
Trova il campo Lingua di trascrizione.
Seleziona la lingua desiderata dall'elenco standard dei codici lingua (ad es. en, ru, zh, de).
Avvia una nuova sessione — la lingua verrà applicata ad essa.

Whisper supporta più di 90 lingue. Se i partecipanti alla riunione parlano lingue diverse, Whisper rileva automaticamente ogni segmento all'interno del "suggerimento" della lingua selezionata.

📸 [Screenshot: ticker scorrevole LiveTranscriptStrip con frasi [Me] e [Other]]

Trascrizione Completa nel Pannello

Al termine della sessione, la trascrizione completa è disponibile nella sezione Cronologia del pannello web. Puoi:

leggerla filtrata per interlocutore;
copiarla per intero o a frammenti;
usarla come base per analisi e mappe mentali.

📸 [Screenshot: pagina della sessione nel pannello — blocchi di trascrizione con etichette degli interlocutori]

Errori Comuni

Errore	Causa	Soluzione
La voce dell'interlocutore non viene trascritta	Permesso di Registrazione schermo non concesso (macOS) o audio di sistema non disponibile (Windows)	Permessi macOS / Windows
Lingua errata nella trascrizione	Lingua di trascrizione selezionata in modo errato	Cambia la lingua nelle impostazioni e riavvia la sessione
Il testo si mescola tra gli interlocutori	Il microfono cattura entrambi i flussi audio (eco)	Usa le cuffie o abbassa il volume degli altoparlanti
Nessun testo con una connessione debole	Il WebSocket cade prima che arrivi la risposta di Whisper	Migliora la connessione; Whisperer si riconnette automaticamente

Buone Pratiche

Usa le cuffie — questo elimina l'eco acustico e migliora la separazione degli interlocutori.
Seleziona la lingua corretta prima della sessione — cambiare la lingua a registrazione in corso crea una nuova sessione.
Nelle chiamate bilingue puoi selezionare la lingua dell'interlocutore: Whisper riconoscerà comunque il tuo parlato grazie al suggerimento di contesto.