실시간 AI 제안

개요

AI 제안은 Whisperer가 통화 중에 실시간 스크립트, 질문, 지식 베이스를 바탕으로 생성하는 답변입니다. 답변은 오버레이의 AnswerArea로 스트리밍되어 들어옵니다. 텍스트는 생성되는 대로 나타나며, Markdown, 추론 과정 표시, 페이지 페이지네이션(1/N)을 지원합니다. 제안은 단순 답변부터 스크린샷 분석, 다이어그램이 포함된 System Design 설계까지 여러 모드로 작동합니다.

모든 요청은 Claude, GPT, DeepSeek, Qwen, Gemini, Grok, Llama 계열의 모델을 갖춘 당사 AI 제공자를 거칩니다. 사용 가능한 모델은 요금제에 따라 달라집니다(요금제 게이팅): 최상위 프런티어 모델은 Max에서만 제공됩니다.

사용 시점

  • 면접: 행동 면접 질문에 대한 답변을 빠르게 정리하거나 System Design 솔루션을 스케치합니다.
  • 영업 및 협상: 논거를 찾고, 반론에 대응하고, 사실을 재확인합니다.
  • 기술 면접 / 페어 프로그래밍: coding 모드에서 코드를 받습니다.
  • 화면에 보이는 내용 파악: vision 모드에서 화이트보드, 다이어그램, 코드의 스크린샷을 전송합니다.

단계별 안내

  1. 텍스트로 질문하기. CommandBar 입력란에 질문을 입력하고 Enter를 누르면 — 답변이 AnswerArea로 스트리밍되기 시작합니다.
  2. 또는 "들은 내용으로부터" 질문하기. 입력란에서 Enter를 누르면 — Whisperer가 최신 스크립트 조각(상대방의 질문)을 가져와 답변합니다. 질문이 방금 소리 내어 말해졌을 때 유용합니다.
  3. 또는 스크린샷 첨부하기. 스크린샷을 찍으면(captureScreenshot 단축키로) — 해당 프레임이 vision 모드로 전달되고 모델이 이미지를 분석합니다.
  4. 스트리밍 답변 읽기. 텍스트는 생성되는 대로 나타납니다. 모델의 추론 과정이 있는 경우 펼쳐 볼 수 있습니다.
  5. 페이지 넘기기. 긴 답변과 연속된 요청은 페이지로 분할됩니다 — AnswerArea의 1/N 페이지네이션으로 전환합니다.

답변 모드

  • 단순 답변 (역할 responses) — 컨텍스트와 지식 베이스를 고려한 질문에 대한 텍스트 답변입니다.
  • 코딩 (역할 coding) — 프로그래밍에 최적화된 모델을 통한 코드 생성 및 설명입니다.
  • Vision / 멀티 스크린샷 (역할 vision) — 단일 이미지 또는 누적된 여러 프레임 분석(스크린샷 배열이 vision 엔드포인트로 전달됨). 한 화면에 들어가지 않는 긴 작업에 유용합니다.
  • System Design (역할 system_design) — Mermaid 다이어그램(컴포넌트, 데이터 흐름, 아키텍처 다이어그램)이 포함된 구조화된 답변입니다.

프롬프트 구성 방식 (요약)

시스템 프롬프트는 우선순위에 따라 위에서 아래로 구성됩니다:

  1. 역할 프롬프트 — Prompt Studio에서 설정한 개인 템플릿입니다.
  2. 사용자 컨텍스트 — 자신과 자신의 역할에 대해 설정한 데이터입니다.
  3. RAG 블록지식 베이스에서 가져온 관련 조각으로, 각 요청마다 동적으로 선택됩니다.

서로 다른 모델 역할은 서로 다른 작업을 처리합니다: responses(채팅), coding(코드), vision(이미지), system_design(다이어그램), generation(마인드맵), transcription(Whisper), embedding(RAG용 벡터화).

모델 요금제 게이팅

Free에서는 기본 모델을, 유료 요금제에서는 더 폭넓은 모델을 사용할 수 있습니다. 프런티어 모델(최상위 모델: Claude Opus, 최고급 GPT 등)은 Max 요금제에서만 사용할 수 있습니다. 자세한 내용은 요금제와 포함 내용을 참조하세요.

스크린샷

📸 [스크린샷: 스트리밍 답변과 1/N 페이지네이션이 있는 AnswerArea]

📸 [스크린샷: 빈 입력란에서 Enter를 통한 "들은 내용으로부터" 요청]

📸 [스크린샷: Mermaid 다이어그램이 포함된 System Design 답변]

📸 [스크린샷: 스크린샷이 첨부된 vision 모드]

흔한 실수

  • Enter를 눌렀는데 아무것도 전송되지 않음. 입력란이 비어 있으면 Whisperer는 스크립트에서 질문을 가져옵니다 — 상대방의 음성이 들리는지(​"화면 녹화" 권한 필요) 확인하거나 질문을 텍스트로 입력하세요.
  • 프런티어 모델을 사용할 수 없음. 최상위 모델은 Max에서만 활성화됩니다 — Free/Start/Pro에서는 가장 가까운 사용 가능 모델이 선택됩니다.
  • 컨텍스트가 "작동하지 않음". 사용자 컨텍스트는 당신에 대한 참고 정보이지 명령이 아닙니다. 실제 질문은 입력란에 입력하세요.
  • 스크린샷이 분석되지 않음. 멀티 스크린샷과 vision은 모든 요금제에서 사용할 수 있는 것은 아닙니다 — 요금제에서 기능을 확인하세요.

모범 사례

  • 짧고 구체적인 질문을 하세요 — 스트리밍이 더 빨리 시작되고 답변이 더 정확합니다.
  • 화면에 표시되는 긴 작업의 경우, 여러 프레임을 모아 한 번에 하나씩 보내는 대신 멀티 스크린샷으로 보내세요.
  • 지식 베이스를 구축하세요 — RAG는 당신의 사실 정보를 답변에 섞어 넣어 "환각"을 줄여줍니다.
  • 작업에 맞춘 개인 역할 프롬프트를 설정하세요(면접 / 영업 / 교육).
  • 아키텍처 관련 질문에는 System Design 모드를 사용하세요 — 텍스트만 있는 설명 대신 완성된 Mermaid 다이어그램을 받습니다.

관련 문서