节奏门
What stage · Rounds left
AI 每次回答前都会先看一眼: 当前在哪个阶段、还剩几轮预算。 预算用完,自动切到下一阶段。
- 破冰≤ 2 轮
- 简历深挖≤ 5 轮
- 场景实战≤ 3 轮
- 反问≤ 2 轮
AI 模拟面试教练:用产品工艺驯化 LLM 输出
围绕「LLM 输出不可控」这道命题,落地 4 个产品决策,把不确定性包装成结构化、可预期、有节奏感的面试体验。

在做 OfferPilot 之前,我用 Gemini 和豆包做过一场 字节跳动 AI PM 岗的模拟面试。 50 分钟下来,体验并不好。
它在每一道题之前都用大段文字评价我上一题答得怎么样。 我搞不清楚自己是在面试中、还是已经在被宣判。 它问到第四题就草草结束。
它在一道问题里塞进 3-5 个子问题 (「说出商家使用智能工具最核心的 3 个真实刚需」+ 「说说各个主流大模型各自更适配 TikTok Shop 哪一类电商 AI 场景」)。 我面对的不是面试官,是一份没有交互感的考卷。 很多专业词汇对一个应届生太重,看着就不想答下去。
整整 6 个章节、6 条致命短板, 结尾是「建议候选人暂停投递大厂 AI 产品经理岗位」。 读起来不像反馈,更像审判。
用完这两个工具之后,我的第一反应是: 「是我太菜了吗?」 而不是:「这个工具有问题。」
那一刻,我自己就是那个被工具伤到的用户。
真正卡住用户的不是模型能力,是产品没在模型不可控的输出之上做工艺。
OfferPilot 的三个核心决策, 就是为了让下一个用户不必经历我那一晚的不踏实。
OfferPilot 是一个面向 PM / UX / HCI 应届与转岗候选人的 AI 模拟面试教练。 它由三屏构成: Setup(填资料、上传简历)、 Interview(多轮对话 + STAR 脚手架)、 Report(雷达图 + 红黑榜 + 答案重构)。
核心人设是「懂大厂逻辑的温和引导者」, 资深业务 Leader 与产品教练的混合体。它不是一个 chat 套壳, 而是一套把面试官的隐性经验显式编码进 system prompt的产品系统。
AI 模型本质上是慢的、不可控的、容易跑题的。 如果等模型把整段回答全部生成完再展示,用户从点击到看到第一个字 要等 8–15 秒,会以为系统卡死了; 但如果让模型完全自主决定问什么、问几轮, 实测它会「上来就抛最难的题」打击信心, 或者「在同一个问题上追问八轮」消耗耐心。
更深层的冲突是:用户对 AI 的信任成本远高于对真人。 一次模糊体验,用户就会归因为「AI 不行」。
把问题拆成两层来解:用「流式输出」解决"快感", 用「四阶段对话框架」解决"结构感"。

用户的节奏从「输入 → 等待 → 输入 → 等待」 切换成「全程都在交互」, 和真人面试的节奏拉齐。 顶部的阶段进度条还能消解一个隐性焦虑: 「AI 会不会一直没完没了地问下去?」
「阶段·主题」前缀不光是进度指示,它还在做元认知教学: 候选人在被问的过程中就意识到「这是在考察我的项目深度」。
最朴素的「提示」方案是:用户说「我不会,给我点提示」, AI 在对话里回一段 STAR 框架的文字解释。这有两个隐性问题:
做一个「会答题的卡片」,三件事同时解决:

心理摩擦从「我不会,怎么办」的模糊焦虑, 变成「填四个格子」的可操作任务。 评分公平性被显式写进契约, 候选人心理上才真正敢于使用这条求助通路。
复盘报告是产品的核心交付物,必须稳定地渲染成雷达图、 红黑榜、STAR 重构卡片。任何字段缺失、格式不合法、评分越界 都会让前端显示空白,等同于「产品没干活」。 但要求 AI 严格按格式输出,又会牺牲它本可以写得更 「教练味」的自由表达。
设三道闸门 + 一层拟人化兜底,让失败也像产品体验:



复盘页 100% 可渲染,杜绝了「AI 写了一长串但图表是空的」。 失败被包装成符合「教练」人设的语言, 技术错误不会被翻译成情感伤害。
前三个 trade-off 都在服务一类用户: 愿意花 3 分钟填资料、上传简历、做完整面试的「真实候选人」。 但 OfferPilot 还有另一类用户:评估者。HR、面试我的人、同行、想试一下产品的人。 对他们来说,Setup 不是路径,是路障。
错误的解法是把 Setup 简化、降低候选人体验质量; 也错误的是放任评估者在 Setup 流失, 让产品永远缺一个「真实可玩」的入口。
做一个独立的「演示模式」路径: 不破坏主流程,只为评估者开一个零摩擦的旁门。
评估者从「想了解 → 实际看完产品全貌」的认知成本 从3 分钟 + 心理摩擦压到30 秒 + 零摩擦。 portfolio 上从此不需要 Product Hero 截图:产品本身就是最好的展示。
这件事对我个人的价值更大。 它让我意识到「只有一类用户」是一个习惯性的思维盲区。 真实产品几乎从来没有只有一类用户,看到第二类、第三类用户存在并为他们做差异化设计, 才是从「做出产品」到「做对产品」的分水岭。
OfferPilot 在 LLM 黑盒之上做了三道决策门。节奏门管对话推进速度,策略门管对答案的应对方式,兜底门管失败时不伤害用户。
这三道门一起决定了「OfferPilot 在每一秒到底做什么」。
What stage · Rounds left
AI 每次回答前都会先看一眼: 当前在哪个阶段、还剩几轮预算。 预算用完,自动切到下一阶段。
Triage answer · Pick response
把候选人的每次回答归到三类,匹配对应策略。
「★不扣分」是从我实测被 Gemini「四题草草结束」反推回来的产品 patch。 用户已经在心理边界上,再扣分只会加速流失。
When things break · Never expose
任何环节失败,都不把技术错误暴露给用户。
「★无惩罚退出」是给候选人在卡壳极限时一条尊严的退路。 产品不应该惩罚用户的真实状态。
做 OfferPilot 的过程中,我一直在问自己一个问题:如果它只是一个「prompt 写得很好」的工具,那它没有壁垒。 Prompt 可以被任何人在 5 分钟内复制。 AI 产品真正的护城河,从来不在 prompt 这一层。
所以我对 OfferPilot 的护城河演进有 3 个判断。
OfferPilot 不是「一个 prompt 解决所有问题」,而是五层整合:prompt + 状态机 + GenUI 脚手架 + 报告 schema 校验 + 拟人化兜底。 这五层之间是相互依赖的: STAR 脚手架只在状态机判断「用户卡壳」时触发; schema 校验失败时,拟人化兜底立刻接管; 整个对话节奏由阶段 budget 控制。
这意味着:复制我的 prompt 只需要 5 分钟,复制整个产品系统需要 2-3 个月。 这是当下我能建立的最实在的壁垒。
OfferPilot 真正区别于 ChatGPT 类通用工具的, 不是技术能力,是「产品人懂不懂面试」的判断力。
四阶段对话节奏、STAR 脚手架的认知降级设计、 「教练 vs 评委」的人设取舍, 这些都不是「AI 能做或不能做」的问题, 而是需要同时具备 HCI 用户研究方法论 和 AI 产品工艺才能做出的产品决策。
一个纯工程师不会去想「用户卡壳时的心理摩擦如何降级」; 一个纯设计师不会去做 STAR 标记的评分公平性契约。OfferPilot 的核心壁垒,长在两个学科的交叉点上。
面试场景有一个独特优势:结果是可验证的。 用户用 OfferPilot 准备完, 最终在真实面试里通没通过、拿没拿到 offer, 是一个明确的 ground truth 信号。
积累一定用户量后,OfferPilot 会拥有一份其他工具没有的数据集:「应届生回答模式 → offer 转化率」。 这份数据可以反过来微调评分模型、优化提问策略, 形成不可被通用 AI 工具复制的飞轮。
这是 OfferPilot 想走的路径:不是更好的 prompt,是更深的产品。
坦白说,OfferPilot 的正式用户测试还没展开。 这是 case study 里我必须承认的最大空白。
但产品的核心决策并不是凭空想象的。 Origin 里那场我自己用 Gemini + 豆包做的 50 分钟实测, 本质上是一次启发式竞品评估(HCI 学术里叫 autoethnography): 我把自己作为目标用户,亲历通用 AI 工具失败的具体瞬间, 再反推 OfferPilot 应该在哪些地方做产品级回应。 通用工具失败的位置,正是 OfferPilot 设计要补的位。
下一步要做的事很清楚:
这一步还没做。但它会做。
诚实说,第一个 trade-off(速度焦虑 vs 对话结构)是最容易被复制的。 流式输出已经是 AI 产品的工业标准, 任何团队两天就能做出来; 四阶段框架 + round budget 这部分有产品判断, 但拆开看每条单独都不构成门槛。
回头看,trade-off 1 的真正价值不在传输技术或 UI, 而是「把面试官的隐性节奏经验显式编码」这一判断本身。 但作为 case study 里展示的护城河, 它的辨识度确实最低。 如果重写护城河叙事,我会把它从「核心决策」降级为「基础设施」, 把笔墨更多投入到 trade-off 2 和 3, 那两条才真正长在 HCI 方法论的交叉点上。
我最想动手改的,是 Interview 页左侧的简历显示。 现在它只是一块静态的「已上传简历」文本。 但我最初的设想是:当 AI 面试官追问简历中的某段经历时, 对应的句子在左侧自动高亮。
这是一个能让候选人在被问的瞬间 「立刻知道 AI 在追问哪里」的认知锚点。 它代表 OfferPilot 下一层的工艺提升: 从「单向文字对话」走向「同步可视化的双向引用」。 这件事我没在 v1 做出来,是 case study 里我自己最不甘心的地方。
做 OfferPilot 之前, 我对 AI PM 的理解大致是:定好产品方向 → 做调研 → 把产品落地。
做完之后,我觉得这个理解只对了三分之一。 真实的 AI 产品工作里:
我对这三件事的理解依然模糊。 但相比做 OfferPilot 之前, 我至少知道了「我应该往这三件事走」。