Sitzungslebenszyklus
Eine Sitzung ist die zentrale Arbeitseinheit in Whisperer: der Zeitraum, in dem der Client einem Meeting zuhört, Sprache transkribiert und LLM-Antworten empfängt. Das Verständnis des Lebenszyklus hilft Ihnen, Start/Pause korrekt zu nutzen, Status im Dashboard zu interpretieren und Probleme zu beheben.
Wann Sie diesen Artikel lesen sollten
Lesen Sie diesen Artikel, wenn Sie verstehen möchten:
- was in jeder Phase eines Meetings mit Ihren Daten passiert;
- warum eine Antwort manchmal verzögert ist und wann das Transkript gespeichert wird;
- wie die Verbindung zwischen Client und Server funktioniert.
Sitzungsphasen
1. Start
Das Drücken der Schaltfläche „Start" (oder des Tastaturkürzels) versetzt den Client in den aktiven Modus:
- Der Client öffnet eine Verbindung zum Server und sendet die Gerätekennung und das Token.
- Der Server prüft das Abonnement und das Minutenkontingent. Wenn die Prüfung erfolgreich ist, bestätigt er den Sitzungsstart und gibt die Sitzungskennung zurück.
- Der Client aktiviert die Audioaufnahme und beginnt mit der Aufzeichnung.
2. Aufzeichnung (Streaming)
Audio wird in kurzen Blöcken alle ~0,8 Sekunden übertragen. Jeder Block ist mit dem Sprecher gekennzeichnet: dem Benutzer oder dem Gesprächspartner.
Der Server puffert die Blöcke und sendet sie zur Erkennung. Das Transkript wird in Echtzeit an den Client zurückgegeben und im LiveTranscriptStrip angezeigt.
3. Anfrage und Antwort
Wenn der Benutzer „Fragen" drückt (oder das Tastaturkürzel), sendet der Client einen ask-Frame mit dem aktuellen Transkriptkontext.
Der Server stellt den System-Prompt zusammen (Rollen-Prompt → Benutzerkontext → RAG aus der Wissensdatenbank) und fragt den LLM ab. Die Antwort wird gestreamt: Text erscheint während der Generierung und wird sofort im AnswerArea mit Markdown-Unterstützung und Paginierung angezeigt (wenn mehrere Antworten vorhanden sind).
4. Pause
Das Drücken von „Pause" stoppt die Audioaufnahme, aber die WebSocket-Verbindung bleibt offen. Der Sitzungstimer pausiert. Fortsetzen durch Drücken von „Weiter".
5. Ende
Das Drücken von „Stop" oder Schließen des Clients:
- Der Client sendet einen
session.end-Frame. - Der Server schreibt gepufferte Transkripte und die Liste der abgeschlossenen Antworten in die Datenbank.
- Der WebSocket schließt sich.
- Im Web-Dashboard erscheint die Sitzung im Abschnitt Verlauf mit dem vollständigen Transkript und der Analyse.
📸 [Screenshot: Whisperer-Panel im Aufzeichnungsmodus — LiveTranscriptStrip und Steuerungsschaltflächen sichtbar]
Datenspeicherung
Standardmäßig werden das Transkript und die LLM-Antworten in der Datenbank gespeichert und sind im Dashboard zugänglich. Wenn der No-Logs-Modus aktiviert ist, werden die Daten nach dem Ende der Sitzung gelöscht — die verbrauchten Minuten werden jedoch weiterhin gezählt.
Häufige Fehler
| Fehler | Ursache | Lösung |
|---|---|---|
| Sitzung startet nicht | E-Mail nicht bestätigt oder kein aktives Abonnement | Kontostatus und Kontingent prüfen |
| „Gegenseite nicht zu hören" | Bildschirmaufnahme-Berechtigung nicht erteilt (macOS) oder Systemaudioaufnahme nicht verfügbar (Windows) | macOS-Berechtigungen / Windows |
| Transkript erscheint nicht | Schlechte Internetverbindung oder WebSocket-Verlust | Netzwerk prüfen; Sitzung neu starten |
| LLM-Antwort dauert zu lange | KI-Anbieter überlastet oder langsames Modell ausgewählt | Modell in den Einstellungen wechseln |
Empfehlungen
- Beenden Sie die Sitzung explizit mit der Schaltfläche „Stop" — damit wird sichergestellt, dass die Daten in den Verlauf geschrieben werden.
- Pausieren Sie bei langen Pausen im Meeting — der Timer stoppt und Minuten werden nicht verschwendet.
- Verwenden Sie No-Logs für vertrauliche Meetings, bei denen die Speicherung des Transkripts unerwünscht ist.