Trascrizione e Interlocutori

Whisperer trascrive il parlato in tempo reale utilizzando Whisper — il modello multilingue di OpenAI. La diarizzazione degli interlocutori avviene contemporaneamente: le parole dell'utente e quelle dell'interlocutore vengono etichettate in modo diverso, rendendo la trascrizione più facile da leggere e migliorando l'accuratezza delle risposte dell'AI.

Quando Leggere Questo Articolo

Leggi questo articolo per capire:

  • come configurare la lingua di riconoscimento;
  • perché alcune frasi sono etichettate [Me] e altre [Other];
  • quali lingue sono supportate e come passare dall'una all'altra.

Come Funziona la Trascrizione

Whisperer cattura due flussi audio:

Flusso Sorgente Etichetta
Voce dell'utente Microfono [Me]
Voce dell'interlocutore Audio di sistema (permesso di Registrazione schermo su macOS / audio di sistema su Windows) [Other]

Ogni segmento audio (~0,8 s) viene inviato al server con un'etichetta di interlocutore e viene riconosciuto in modo indipendente. Il risultato appare istantaneamente nella LiveTranscriptStrip — il ticker scorrevole nella parte inferiore dell'overlay.

Lingua di Trascrizione

La lingua di riconoscimento viene impostata a livello di sessione:

  1. Apri le Impostazioni nel client (icona dell'ingranaggio) o nel pannello web.
  2. Trova il campo Lingua di trascrizione.
  3. Seleziona la lingua desiderata dall'elenco standard dei codici lingua (ad es. en, ru, zh, de).
  4. Avvia una nuova sessione — la lingua verrà applicata ad essa.

Whisper supporta più di 90 lingue. Se i partecipanti alla riunione parlano lingue diverse, Whisper rileva automaticamente ogni segmento all'interno del "suggerimento" della lingua selezionata.

📸 [Screenshot: ticker scorrevole LiveTranscriptStrip con frasi [Me] e [Other]]

Trascrizione Completa nel Pannello

Al termine della sessione, la trascrizione completa è disponibile nella sezione Cronologia del pannello web. Puoi:

  • leggerla filtrata per interlocutore;
  • copiarla per intero o a frammenti;
  • usarla come base per analisi e mappe mentali.

📸 [Screenshot: pagina della sessione nel pannello — blocchi di trascrizione con etichette degli interlocutori]

Errori Comuni

Errore Causa Soluzione
La voce dell'interlocutore non viene trascritta Permesso di Registrazione schermo non concesso (macOS) o audio di sistema non disponibile (Windows) Permessi macOS / Windows
Lingua errata nella trascrizione Lingua di trascrizione selezionata in modo errato Cambia la lingua nelle impostazioni e riavvia la sessione
Il testo si mescola tra gli interlocutori Il microfono cattura entrambi i flussi audio (eco) Usa le cuffie o abbassa il volume degli altoparlanti
Nessun testo con una connessione debole Il WebSocket cade prima che arrivi la risposta di Whisper Migliora la connessione; Whisperer si riconnette automaticamente

Buone Pratiche

  • Usa le cuffie — questo elimina l'eco acustico e migliora la separazione degli interlocutori.
  • Seleziona la lingua corretta prima della sessione — cambiare la lingua a registrazione in corso crea una nuova sessione.
  • Nelle chiamate bilingue puoi selezionare la lingua dell'interlocutore: Whisper riconoscerà comunque il tuo parlato grazie al suggerimento di contesto.

Articoli Correlati