Echtzeit-KI-Vorschläge

Überblick

KI-Vorschläge sind Antworten, die Whisperer direkt während eines Gesprächs generiert – auf Basis des Live-Transkripts, Ihrer Fragen und Ihrer Wissensbasis. Die Antwort wird als Stream in die AnswerArea des Overlays geliefert: Der Text erscheint, während er generiert wird, unterstützt Markdown, die Offenlegung des Reasonings sowie die Seitennummerierung (1/N). Vorschläge funktionieren in mehreren Modi – von einer einfachen Antwort bis hin zur Analyse eines Screenshots und dem Entwurf eines System Designs mit Diagrammen.

Alle Anfragen laufen über unseren KI-Anbieter mit Modellen aus den Familien Claude, GPT, DeepSeek, Qwen, Gemini, Grok und Llama. Welche Modelle verfügbar sind, hängt von Ihrem Tarif ab (Tier-Gating): Die besten Frontier-Modelle sind nur im Max-Tarif enthalten.

Wann zu verwenden

Vorstellungsgespräch: schnell eine Antwort auf eine Verhaltensfrage formulieren oder eine System-Design-Lösung skizzieren.
Vertrieb und Verhandlungen: ein Argument finden, auf einen Einwand reagieren, einen Fakt überprüfen.
Technisches Interview / Pair Programming: im Coding-Modus Code erhalten.
Verstehen, was auf dem Bildschirm ist: einen Screenshot eines Whiteboards, Diagramms oder Codes im Vision-Modus senden.

Schritt für Schritt

Stellen Sie eine Frage als Text. Tippen Sie die Frage in das Eingabefeld der CommandBar und drücken Sie Enter – die Antwort beginnt in die AnswerArea zu streamen.
Oder fragen Sie „aus dem Gehörten“. Drücken Sie Enter bei einem leeren Feld – Whisperer nimmt das jüngste Transkript-Fragment (die Frage der anderen Person) und beantwortet es. Praktisch, wenn die Frage gerade laut ausgesprochen wurde.
Oder fügen Sie einen Screenshot an. Erstellen Sie einen Screenshot (mit der captureScreenshot-Tastenkombination) – das Bild geht in den Vision-Modus, und das Modell analysiert das Bild.
Lesen Sie die gestreamte Antwort. Der Text erscheint, während er generiert wird. Sie können das Reasoning des Modells aufklappen, sofern vorhanden.
Blättern Sie durch. Lange Antworten und eine Reihe von Anfragen werden auf Seiten aufgeteilt – wechseln Sie mit der Seitennummerierung 1/N in der AnswerArea.

Antwortmodi

Einfache Antwort (Rolle responses) – eine Textantwort auf eine Frage, unter Berücksichtigung des Kontexts und der Wissensbasis.
Coding (Rolle coding) – Code-Generierung und -Erklärung, ein für die Programmierung optimiertes Modell.
Vision / Multi-Screenshot (Rolle vision) – Analyse eines einzelnen Bildes oder mehrerer gesammelter Frames (das Array von Screenshots geht an den Vision-Endpunkt). Nützlich für lange Aufgaben, die nicht auf einen Bildschirm passen.
System Design (Rolle system_design) – eine strukturierte Antwort mit Mermaid-Diagrammen (Komponenten, Datenflüsse, Architekturdiagramm).

Wie der Prompt zusammengesetzt wird (in Kürze)

Der System-Prompt wird nach Priorität zusammengesetzt, von oben nach unten:

Rollen-Prompt – Ihre persönliche Vorlage aus dem Prompt Studio.
Benutzerkontext – die Daten, die Sie über sich selbst und Ihre Rolle festgelegt haben.
RAG-Block – relevante Fragmente aus der Wissensbasis, die für jede Anfrage dynamisch ausgewählt werden.

Verschiedene Modellrollen bearbeiten verschiedene Aufgaben: responses (Chat), coding (Code), vision (Bilder), system_design (Diagramme), generation (Mindmap), transcription (Whisper), embedding (Vektorisierung für RAG).

Modell-Tier-Gating

Im Free-Tarif sind grundlegende Modelle verfügbar; in den kostenpflichtigen Tarifen ein größerer Umfang. Frontier-Modelle (die besten: Claude Opus, das Flaggschiff-GPT usw.) sind nur in Max-Tarifen verfügbar. Mehr unter Tarife und was enthalten ist.

Screenshots

📸 [Screenshot: AnswerArea mit einer gestreamten Antwort und 1/N-Seitennummerierung]

📸 [Screenshot: eine Anfrage „aus dem Gehörten“ über ein leeres Enter]

📸 [Screenshot: eine System-Design-Antwort mit einem Mermaid-Diagramm]

📸 [Screenshot: Vision-Modus mit einem angehängten Screenshot]

Häufige Fehler

Enter hat nichts gesendet. Wenn das Feld leer ist, nimmt Whisperer die Frage aus dem Transkript – stellen Sie sicher, dass die andere Person hörbar ist (die Berechtigung „Bildschirmaufnahme“ ist erforderlich), oder tippen Sie die Frage als Text ein.
Ein Frontier-Modell ist nicht verfügbar. Die besten Modelle sind nur im Max-Tarif aktiviert – bei Free/Start/Pro wird das nächste verfügbare ausgewählt.
Der Kontext „hat nicht funktioniert“. Der Benutzerkontext ist Referenzinformation über Sie, kein Befehl; stellen Sie die eigentliche Frage im Eingabefeld.
Der Screenshot wurde nicht analysiert. Multi-Screenshot und Vision sind nicht in allen Tarifen verfügbar – prüfen Sie die Funktionen unter Tarife.

Bewährte Vorgehensweisen

Stellen Sie kurze, konkrete Fragen – das Streaming startet schneller und die Antwort ist genauer.
Sammeln Sie bei einer langen Aufgabe auf dem Bildschirm mehrere Frames und senden Sie sie als Multi-Screenshot, anstatt einzeln.
Bauen Sie Ihre Wissensbasis aus – RAG mischt Ihre Fakten in die Antwort und reduziert „Halluzinationen“.
Richten Sie einen persönlichen Rollen-Prompt ein, der auf Ihre Aufgabe zugeschnitten ist (Vorstellungsgespräche / Vertrieb / Lehre).
Verwenden Sie für Architekturfragen den System-Design-Modus – Sie erhalten ein fertiges Mermaid-Diagramm anstelle einer reinen Textbeschreibung.