Echtzeit-KI-Vorschläge
Überblick
KI-Vorschläge sind Antworten, die Whisperer direkt während eines Gesprächs generiert – auf Basis des Live-Transkripts, Ihrer Fragen und Ihrer Wissensbasis. Die Antwort wird als Stream in die AnswerArea des Overlays geliefert: Der Text erscheint, während er generiert wird, unterstützt Markdown, die Offenlegung des Reasonings sowie die Seitennummerierung (1/N). Vorschläge funktionieren in mehreren Modi – von einer einfachen Antwort bis hin zur Analyse eines Screenshots und dem Entwurf eines System Designs mit Diagrammen.
Alle Anfragen laufen über unseren KI-Anbieter mit Modellen aus den Familien Claude, GPT, DeepSeek, Qwen, Gemini, Grok und Llama. Welche Modelle verfügbar sind, hängt von Ihrem Tarif ab (Tier-Gating): Die besten Frontier-Modelle sind nur im Max-Tarif enthalten.
Wann zu verwenden
- Vorstellungsgespräch: schnell eine Antwort auf eine Verhaltensfrage formulieren oder eine System-Design-Lösung skizzieren.
- Vertrieb und Verhandlungen: ein Argument finden, auf einen Einwand reagieren, einen Fakt überprüfen.
- Technisches Interview / Pair Programming: im Coding-Modus Code erhalten.
- Verstehen, was auf dem Bildschirm ist: einen Screenshot eines Whiteboards, Diagramms oder Codes im Vision-Modus senden.
Schritt für Schritt
- Stellen Sie eine Frage als Text. Tippen Sie die Frage in das Eingabefeld der CommandBar und drücken Sie Enter – die Antwort beginnt in die AnswerArea zu streamen.
- Oder fragen Sie „aus dem Gehörten“. Drücken Sie Enter bei einem leeren Feld – Whisperer nimmt das jüngste Transkript-Fragment (die Frage der anderen Person) und beantwortet es. Praktisch, wenn die Frage gerade laut ausgesprochen wurde.
- Oder fügen Sie einen Screenshot an. Erstellen Sie einen Screenshot (mit der captureScreenshot-Tastenkombination) – das Bild geht in den Vision-Modus, und das Modell analysiert das Bild.
- Lesen Sie die gestreamte Antwort. Der Text erscheint, während er generiert wird. Sie können das Reasoning des Modells aufklappen, sofern vorhanden.
- Blättern Sie durch. Lange Antworten und eine Reihe von Anfragen werden auf Seiten aufgeteilt – wechseln Sie mit der Seitennummerierung 1/N in der AnswerArea.
Antwortmodi
- Einfache Antwort (Rolle
responses) – eine Textantwort auf eine Frage, unter Berücksichtigung des Kontexts und der Wissensbasis. - Coding (Rolle
coding) – Code-Generierung und -Erklärung, ein für die Programmierung optimiertes Modell. - Vision / Multi-Screenshot (Rolle
vision) – Analyse eines einzelnen Bildes oder mehrerer gesammelter Frames (das Array von Screenshots geht an den Vision-Endpunkt). Nützlich für lange Aufgaben, die nicht auf einen Bildschirm passen. - System Design (Rolle
system_design) – eine strukturierte Antwort mit Mermaid-Diagrammen (Komponenten, Datenflüsse, Architekturdiagramm).
Wie der Prompt zusammengesetzt wird (in Kürze)
Der System-Prompt wird nach Priorität zusammengesetzt, von oben nach unten:
- Rollen-Prompt – Ihre persönliche Vorlage aus dem Prompt Studio.
- Benutzerkontext – die Daten, die Sie über sich selbst und Ihre Rolle festgelegt haben.
- RAG-Block – relevante Fragmente aus der Wissensbasis, die für jede Anfrage dynamisch ausgewählt werden.
Verschiedene Modellrollen bearbeiten verschiedene Aufgaben: responses (Chat), coding (Code), vision (Bilder), system_design (Diagramme), generation (Mindmap), transcription (Whisper), embedding (Vektorisierung für RAG).
Modell-Tier-Gating
Im Free-Tarif sind grundlegende Modelle verfügbar; in den kostenpflichtigen Tarifen ein größerer Umfang. Frontier-Modelle (die besten: Claude Opus, das Flaggschiff-GPT usw.) sind nur in Max-Tarifen verfügbar. Mehr unter Tarife und was enthalten ist.
Screenshots
📸 [Screenshot: AnswerArea mit einer gestreamten Antwort und 1/N-Seitennummerierung]
📸 [Screenshot: eine Anfrage „aus dem Gehörten“ über ein leeres Enter]
📸 [Screenshot: eine System-Design-Antwort mit einem Mermaid-Diagramm]
📸 [Screenshot: Vision-Modus mit einem angehängten Screenshot]
Häufige Fehler
- Enter hat nichts gesendet. Wenn das Feld leer ist, nimmt Whisperer die Frage aus dem Transkript – stellen Sie sicher, dass die andere Person hörbar ist (die Berechtigung „Bildschirmaufnahme“ ist erforderlich), oder tippen Sie die Frage als Text ein.
- Ein Frontier-Modell ist nicht verfügbar. Die besten Modelle sind nur im Max-Tarif aktiviert – bei Free/Start/Pro wird das nächste verfügbare ausgewählt.
- Der Kontext „hat nicht funktioniert“. Der Benutzerkontext ist Referenzinformation über Sie, kein Befehl; stellen Sie die eigentliche Frage im Eingabefeld.
- Der Screenshot wurde nicht analysiert. Multi-Screenshot und Vision sind nicht in allen Tarifen verfügbar – prüfen Sie die Funktionen unter Tarife.
Bewährte Vorgehensweisen
- Stellen Sie kurze, konkrete Fragen – das Streaming startet schneller und die Antwort ist genauer.
- Sammeln Sie bei einer langen Aufgabe auf dem Bildschirm mehrere Frames und senden Sie sie als Multi-Screenshot, anstatt einzeln.
- Bauen Sie Ihre Wissensbasis aus – RAG mischt Ihre Fakten in die Antwort und reduziert „Halluzinationen“.
- Richten Sie einen persönlichen Rollen-Prompt ein, der auf Ihre Aufgabe zugeschnitten ist (Vorstellungsgespräche / Vertrieb / Lehre).
- Verwenden Sie für Architekturfragen den System-Design-Modus – Sie erhalten ein fertiges Mermaid-Diagramm anstelle einer reinen Textbeschreibung.