Die andere Person oder das Mikrofon ist nicht zu hören

Kurz gefasst

Whisperer hört einem Gespräch aus zwei Quellen zu: deine Stimme — über das Mikrofon, die Stimme der anderen Person — über den Systemton. Im Transkript sind sie als [Me] und [Other] gekennzeichnet. Unter macOS kommt der Systemton über die Berechtigung „Bildschirmaufnahme"; unter Windows wird der Systemton ohne jede Berechtigung vom Standard-Ausgabegerät erfasst — siehe Windows-Berechtigungen. Wenn eine der Rollen verschwindet oder die Transkription „verstummt", liegt das Problem fast immer an den Berechtigungen, an der Wahl der Quelle/des Geräts oder an den Sitzungseinstellungen.

Dieser Artikel ist eine Schritt-für-Schritt-Diagnose-Checkliste: vom häufigsten Fall (keine andere Person = keine „Bildschirmaufnahme") bis hin zur Rauschunterdrückung und zur Transkriptionssprache.

Wann das relevant ist

  • Im Transkript erscheint nur [Me] — du hörst die andere Person nicht.
  • Im Transkript erscheint nur [Other] — deine Stimme wird nicht aufgezeichnet.
  • Die Transkription ist leer oder „lückenhaft", obwohl im Gespräch Audio fließt.
  • Text wird in der falschen Sprache erkannt (verstümmelte Wörter).

Schritt für Schritt (Diagnose-Checkliste)

  1. Keine andere Person? Unter macOS ist das Grund Nr. 1 — prüfe die „Bildschirmaufnahme": Systemeinstellungen → Datenschutz & Sicherheit → Bildschirmaufnahme → der Schalter neben Whisperer ist aktiviert, danach starte die App neu (ohne Bildschirmaufnahme ist der Systemton nicht verfügbar). Unter Windows ist dafür keine Berechtigung nötig — stelle sicher, dass das Standard-Ausgabegerät auch tatsächlich dasjenige ist, über das das Gespräch abgespielt wird: die Systemton-Erfassung nimmt nur das Standardgerät auf. Details siehe Windows-Berechtigungen.
  2. Keine Stimme von dir? Prüfe das „Mikrofon". Systemeinstellungen → Datenschutz & Sicherheit → Mikrofon → der Schalter neben Whisperer ist aktiviert.
  3. Schau auf die Wellenform-Anzeige. Die CommandBar des Overlays hat eine Lautstärke-/Wellenform-Anzeige. Während du sprichst, sollte sie auf deine Stimme reagieren; wenn die andere Person spricht, sollte ebenfalls Bewegung erkennbar sein. Keine Reaktion auf einer Seite bedeutet, dass die entsprechende Quelle nicht fließt (siehe Schritte 1–2).
  4. Vergewissere dich, dass die Sitzung läuft und nicht pausiert ist. In der CommandBar sollte die Wiedergabe-/Pause-Schaltfläche im Aufnahmemodus sein. Während der Pause wird kein Audio erfasst.
  5. Prüfe das Eingabegerät. Wenn du mehrere Mikrofone hast (eingebaut, Headset, Webcam), stelle sicher, dass im System und im Gespräch das funktionierende Mikrofon ausgewählt ist. Ein stark verrauschtes oder stummgeschaltetes Mikrofon erzeugt eine leere [Me]-Spur.
  6. Prüfe die Rauschunterdrückung. Die Overlay-Einstellungen verfügen über eine Rauschunterdrückung. Wenn die Sprache leise ist und „verschluckt" wird, versuche, sie zu reduzieren/auszuschalten; bei viel Hintergrundgeräusch mach das Gegenteil und schalte sie ein.
  7. Prüfe die Transkriptionssprache. Die Sprache wird pro Sitzung eingestellt (Standard ru). Wenn das Gespräch in einer anderen Sprache stattfindet, aber als Russisch erkannt wird, werden die Wörter verstümmelt. Stelle die korrekte Transkriptionssprache ein (Whisper ist mehrsprachig) und starte die Sitzung erneut.
  8. Starte Sitzung/App neu. Wenn nach einer Änderung von Berechtigungen oder Gerät etwas „hängengeblieben" ist, beende die Sitzung, starte Whisperer neu und beginne von vorn.

Screenshots

📸 [Screenshot: ein Transkript mit nur [Me] und ohne [Other] — das typische Anzeichen dafür, dass die „Bildschirmaufnahme" fehlt]

📸 [Screenshot: die Wellenform-Anzeige in der CommandBar während aktiven Sprechens]

📸 [Screenshot: die Overlay-Einstellungen — Rauschunterdrückung und Transkriptionssprache]

Häufige Fehler

  • Andere Person nicht zu hören (macOS) → „Bildschirmaufnahme" nicht erteilt. Das Mikrofon liefert nur deine Stimme; die Stimme der anderen Person ist Systemton, der nur über die Bildschirmaufnahme verfügbar ist.
  • Andere Person nicht zu hören (Windows) → falsches Standard-Ausgabegerät. Die Systemton-Erfassung nimmt Audio nur vom Standard-Ausgabegerät auf. Lege das Gerät, über das das Gespräch abgespielt wird, als Standard fest (siehe Windows-Berechtigungen).
  • Berechtigung erteilt, aber kein Audio → die App wurde nicht neu gestartet. macOS wendet die „Bildschirmaufnahme" erst nach einem Neustart an.
  • Text ist „Kauderwelsch" → falsche Sprache. Eine Diskrepanz zwischen der Sitzungssprache und der tatsächlichen Sprache des Gesprächs zerstört die Erkennung. Die Sprache wird pro Sitzung eingestellt.
  • Leeres [Me] → falsches/stummgeschaltetes Mikrofon. Prüfe das ausgewählte Eingabegerät und ob das Mikrofon im Gespräch nicht stummgeschaltet ist.
  • Warten auf das Hochladen einer Aufnahme. Whisperer transkribiert nur in Echtzeit; du kannst keine fertige Audiodatei hochladen — das Audio muss während der Sitzung fließen.

Bewährte Vorgehensweisen

  • Führe vor einem wichtigen Gespräch eine 30-sekündige Probesitzung durch und stelle sicher, dass beide Rollen — [Me] und [Other] — im Transkript erscheinen.
  • Merke dir die Eselsbrücke: [Me] = Mikrofon, [Other] = Bildschirmaufnahme. Das weist direkt darauf hin, welche Berechtigung zu korrigieren ist.
  • Stelle die Transkriptionssprache im Voraus passend zur Sprache des Meetings ein.
  • Verwende ein stabiles Mikrofon (ein Headset) und wechsle das Eingabegerät nicht mitten in einer Sitzung.

Verwandte Artikel