M8-01：AI 产品经理面试核心题库（Top 30）

使用指南：本题库涵盖 AI PM 面试中最高频的 30 道题，按类别组织。每题附答题框架、必答要点和常见失误。建议先独立作答，再对照参考答案。

一、AI 基础知识（5 题）

Q1：请解释一下大语言模型（LLM）的基本工作原理，以及它与传统 NLP 的区别。

答题框架：原理 → 关键突破 → 与传统方法的本质区别

必答要点：

LLM 基于 Transformer 架构，通过在海量文本上预训练，学习语言的统计规律
核心机制：Next Token Prediction（下一个 Token 预测），不是"理解"而是"预测"
与传统 NLP 的区别：传统方法（SVM、规则系统）需要手工特征工程，针对特定任务；LLM 是通用基础模型，通过 few-shot / zero-shot 适应新任务
涌现能力（Emergent Ability）：规模到达阈值后，突然出现推理、代码、数学等能力

产品视角加分点：

LLM 最大的产品价值在于：它把"从数据到能力"的边际成本大幅降低。传统 AI 每上一个新场景要重新训练，LLM 可以通过 Prompt 快速迁移到新场景。

常见失误：

❌ 把 LLM 描述为"理解语言的 AI"，实际上是统计预测
❌ 只讲原理不讲产品影响，显得像工程师而非 PM

Q2：RAG 和 Fine-tuning 分别适用于什么场景？作为 PM 你会如何选择？

答题框架：定义 → 适用场景 → 决策框架

必答要点：

维度	RAG	Fine-tuning
核心机制	检索外部知识，注入上下文	调整模型权重，内化知识
数据更新	实时更新，改知识库即可	需重新训练，成本高
适用知识	私有文档、时效性数据	固定领域知识、特定风格
成本	低（向量库 + Embedding）	高（GPU 算力 + 标注数据）
效果上限	受检索质量限制	深度内化，效果更稳定

决策框架：

知识会频繁更新 → RAG
需要改变模型输出风格/格式 → Fine-tuning
有大量领域专属术语和行话 → Fine-tuning
预算有限，需要快速上线 → RAG
最佳实践：RAG + Fine-tuning 结合（先 RAG 验证价值，再 Fine-tuning 提升效果）

常见失误：

❌ 认为 Fine-tuning 可以让模型"学会新知识"，实际上 Fine-tuning 主要改变行为风格，不能可靠地注入新事实
❌ 不提成本和时间的权衡

Q3：什么是 Hallucination（幻觉）？作为 PM 你如何在产品中降低它的影响？

答题框架：定义 → 产生原因 → 产品层应对策略

必答要点：

定义：模型生成了听起来合理但实际错误或无中生有的内容
产生原因：训练数据的统计模式 ≠ 事实；模型倾向于"填充"而非"不知道"
产品层策略（重点考察）：
1. RAG 接地：让答案有来源，可追溯
2. 引用展示：显示"来源：XX文档第3页"，用户可验证
3. 置信度提示：低置信度场景显示"建议人工确认"
4. 限制作答域：Prompt 约束"只根据提供的资料回答，资料中没有则说不知道"
5. 人机协作：高风险决策（医疗、法律）必须有人工复核节点
6. 监控与标注：上线后持续收集用户反馈，识别幻觉案例

常见失误：

❌ 只从技术角度讲（Temperature 调低等），不讲产品层设计
❌ 认为幻觉是"Bug"可以彻底消除，实际上是概率性问题，需要系统性管理

Q4：请解释 Token、Context Window 对产品设计的影响。

答题框架：概念解释 → 产品约束 → 设计决策

必答要点：

Token：LLM 处理的基本单位，大约 1 Token ≈ 0.75 个英文单词，≈ 0.5 个汉字
Context Window：模型一次能处理的最大 Token 数，决定了"短期记忆"的上限

对产品的影响：

场景	Context 约束	产品应对
长文档分析	超出 Context 无法全部处理	切片 + 检索 / Map-Reduce 分块处理
长对话	历史消息超出 Window 被截断	对话摘要压缩 / 滑动窗口
代码审查	大文件超出限制	按函数/文件分块处理
成本控制	Token 数 = 费用	压缩 Prompt / 缓存重复内容

常见失误：

❌ 背诵各模型的 Context Window 数字，没讲产品影响
❌ 忽略 Token 与成本的直接关系

Q5：你如何理解 AI Agent？它与普通 LLM 应用的区别是什么？

答题框架：定义对比 → 核心能力 → 产品机会与风险

必答要点：

维度	普通 LLM 应用	AI Agent
交互模式	单次问答	多步骤自主决策
工具使用	无	可调用外部工具/API
目标导向	即时响应	执行长期任务直到完成
状态管理	无（或简单历史）	有状态，跨步骤记忆

Agent 的核心循环：Think（思考） → Act（行动） → Observe（观察） → 循环

产品机会：自动化复杂工作流（研究报告生成、代码调试、数据分析）

产品风险：

错误会级联放大（第一步错，后续全错）
成本不可控（无限循环调用工具）
用户信任建立困难（"AI 替我做了什么？"）

常见失误：

❌ 只讲技术实现，不讲产品价值和风险
❌ 把 Agent 描述为"全自动化"，忽略 Human-in-the-Loop 的必要性

二、产品设计（5 题）

Q6：请设计一个面向医疗行业的 AI 问诊助手产品。

答题框架：CIRCLES 框架 — 用户群体 → 场景拆解 → 核心功能 → 差异化 → 风险与约束

必答要点：

用户分层：

患者：导诊/初步症状描述
医生：辅助诊断参考/病历整理
医院管理：运营数据/质量监控

核心功能设计（以患者端为例）：

症状描述引导（结构化问诊，避免患者描述模糊）
预检分诊（轻症自助/建议就医科室/紧急情况识别）
用药科普（通用药品说明，明确"非处方建议"）
就医准备（预约挂号指引、需准备的材料清单）

关键约束（AI PM 必须说）：

合规：不能做"诊断"，只能做"建议"，需符合医疗器械法规
免责声明设计：显著位置展示"本内容不构成医疗建议"
幻觉风险：高风险场景（药物相互作用、罕见病）必须转人工
数据隐私：患者数据的存储和使用需要严格的合规设计

常见失误：

❌ 忽略监管合规，只谈功能
❌ 没有明确 AI 的边界（什么能做/什么不能做）

Q7：你的 AI 产品上线后，用户反映"AI 回答太啰嗦，不够准确"，你如何分析和解决？

答题框架：问题拆解 → 数据验证 → 假设排查 → 解决方案 → 效果验证

必答要点：

数据收集：

量化"啰嗦"：平均回答字数 vs 用户预期字数，完读率
量化"不准确"：用户反馈评分、差评分类、退出节点

问题分类与对应解法：

问题类型	可能原因	解决方案
回答啰嗦	System Prompt 没有约束输出长度	调整 Prompt，指定回答格式和长度
回答啰嗦	Temperature 过高	降低采样温度
回答不准确	知识库内容质量差	清洗、标注、更新知识库
回答不准确	检索召回不准	优化 Embedding 模型，调整 Top-K
回答不准确	模型能力本身限制	评估换模型或 Fine-tuning

常见失误：

❌ 直接给解决方案，没有先数据验证
❌ 认为改 Prompt 能解决所有问题

Q8：请描述你会如何设计 AI 产品的评测（Evaluation）体系。

答题框架：评测的层次 → 指标体系 → 评测方法 → 持续迭代机制

必答要点：

评测三层次：

模型层：基础能力评测（准确率、延迟、幻觉率）
产品层：任务完成率、用户满意度、会话成功率
业务层：转化率、客服成本降低、用户留存

评测方法：

自动化评测：LLM-as-Judge（用 GPT-4 评判 GPT-3.5 的输出）
人工标注：黄金标准数据集，专家评审
A/B Test：对照实验，数据驱动决策
用户反馈：点赞/踩，显式反馈

持续评测机制：

新版本发布 → 自动化回归测试 → 通过阈值才上线
上线后 → 实时监控 → 触发阈值告警 → 快速回滚

常见失误：

❌ 只提 BLEU/ROUGE 等学术指标，不联系业务指标
❌ 没有提评测的持续性，只讲一次性验证

Q9：如果你是某电商平台的 AI PM，你会优先在哪个场景切入 AI？为什么？

答题框架：场景筛选标准 → 候选场景分析 → 优先级排序 → MVP 方案

必答要点：

场景筛选标准（先亮出框架）：

用户价值：解决真实痛点，频次高
技术可行：当前 AI 能力可以覆盖
业务价值：对核心指标有正向影响
实施难度：数据基础、工程成本

候选场景评分：

场景	用户价值	技术可行	业务价值	难度	综合
智能客服	高	高	高（降本）	低	⭐⭐⭐⭐⭐
商品描述生成	中	高	中	低	⭐⭐⭐⭐
个性化推荐	高	中	高	高	⭐⭐⭐
AI 导购	高	中	高（提转化）	中	⭐⭐⭐⭐

推荐切入点：智能客服（AI 接管 FAQ，降低人工客服成本，数据闭环快）

常见失误：

❌ 没有筛选标准就直接说答案
❌ 忽略"数据基础"这个 AI 落地的前提条件

Q10：如何平衡 AI 产品的创新性与用户可信度之间的张力？

答题框架：问题本质 → 信任建立的方法论 → 产品设计原则 → 案例

必答要点：

核心矛盾：AI 越自动化，用户越不理解，信任越难建立

信任建设的产品设计原则：

透明度：解释 AI 为什么这么建议（"因为您最近浏览了XX，我推荐..."）
可控性：用户能覆盖 AI 的决策（"我不同意，帮我换一个"）
渐进式自动化：先辅助，后自动（先让用户确认，逐步提升自动化程度）
失败可恢复：AI 出错后，用户能轻松恢复到之前状态
边界明确：AI 不擅长的场景，主动说"建议联系人工客服"

常见失误：

❌ 认为"AI 准确了就自然有信任"，忽略信任的社会性维度
❌ 没有提出具体的产品设计手段

三、技术理解（5 题）

Q11：Prompt Engineering 的核心技巧有哪些？PM 需要掌握到什么程度？

答题框架：核心技巧 → PM 的角色定位 → 实战技巧

必答要点：

Prompt 核心技巧：

技巧	说明	示例
角色设定	给模型一个明确身份	"你是一个资深法律顾问"
少样本示例 (Few-shot)	给出2-3个示例	"输入:XX，输出:XX"
链式思考 (CoT)	让模型步骤推理	"请一步步思考..."
输出格式约束	指定 JSON/Markdown	"请以JSON格式输出"
负向约束	明确不要做什么	"不要猜测，不确定请说不知道"

PM 需要掌握的程度：

能独立写出可用的 System Prompt（不需要最优，但能跑通）
能判断 Prompt 问题 vs 模型能力问题
能和工程师讨论 Prompt 优化方向，不是旁观者

常见失误：

❌ 只列举技巧，没有说 PM 自己在 Prompt Engineering 中的角色
❌ 把 Prompt Engineering 说成"纯工程师的事"，暴露出 PM 的技术脱节

Q12：你如何理解向量数据库在 AI 产品中的作用？

答题框架：传统数据库 vs 向量数据库 → 核心原理 → 产品应用

必答要点：

传统数据库：精确匹配（SQL WHERE name = '张三'）
向量数据库：语义相似度搜索（找"最像这个问题的内容"）
工作原理：文本 → Embedding 模型 → 高维向量 → ANN 近似最近邻搜索
主要产品：Pinecone、Weaviate、Qdrant、Chroma、pgvector（PostgreSQL 插件）

应用场景：

知识库 RAG：召回最相关的文档段落
用户记忆：存储用户偏好和历史，个性化推荐
相似内容：图片/商品的"找相似"功能
内容去重：检测重复/抄袭内容

常见失误：

❌ 把向量数据库当成"AI 独有的技术"，实际上推荐系统早就在用

Q13：当工程师告诉你"这个功能 AI 做不到"，你如何判断和应对？

答题框架：验证问题本质 → 可行性探索 → 替代方案

必答要点：

先搞清楚"做不到"的原因：

技术真做不到（当前模型能力边界）
工程做不到（技术上可以，但时间/成本不允许）
不知道怎么做（需要探索）
担心质量不达标（可以做，但效果不确定）

应对策略：

要求具体化：在哪个用例/输入上失败？失败率多少？
提出降级方案：能做 80% 的场景吗？剩下 20% 人工兜底
亲自验证：用 ChatGPT/Claude 手动测试核心用例，感知可行性
引入外部参考：同类竞品是怎么实现的？（竞品分析）
时间换空间：这个功能不能做，但 6 个月后 AI 能力提升后呢？

常见失误：

❌ 直接接受"做不到"，不深入探索
❌ 强行要求工程师实现，不尊重技术边界

Q14：请解释 AI 产品的 Latency（延迟）优化。PM 应该如何看待延迟？

答题框架：延迟的组成 → 用户体验影响 → 产品层优化策略

必答要点：

延迟的组成：

总延迟 = 网络传输 + 模型推理（TTFT + 生成速度）
TTFT = Time to First Token（首个 Token 出现时间）

延迟 vs 用户体验：

TTFT < 1s：用户感知良好
TTFT 1-3s：可接受，需要加载动画
TTFT > 3s：用户开始焦虑，需要进度提示

产品层优化策略（PM 能提出的）：

策略	说明
流式输出（Streaming）	边生成边显示，TTFT 降低，用户感知快
提前预加载	用户点击前预测意图，提前发请求
加载状态设计	骨架屏、进度动画，让等待"有感"
缓存	高频问题缓存答案，秒级响应
异步处理	长任务后台处理，完成后通知

常见失误：

❌ 只谈技术优化（换更快的模型），不谈产品层感知优化
❌ 把 Latency 等同于"模型速度"，忽略感知设计

Q15：什么是 AI 产品的冷启动问题？如何解决？

答题框架：定义冷启动 → AI 产品特殊性 → 解决策略

必答要点：

AI 产品的冷启动特殊性：

传统产品：没有用户数据，推荐效果差
AI 产品：双重冷启动——新用户没有个性化数据 + 模型没有领域适配数据

解决策略：

用户侧冷启动：

引导问卷：用户注册时收集偏好
探索式推荐：主动展示多样内容，观察反馈
通用默认策略：用群体偏好代替个人偏好

模型侧冷启动：

借用通用大模型能力（GPT-4 开箱即用）
构造合成数据：用大模型生成训练数据（Data Flywheel 启动）
人工标注种子数据集
渐进式在线学习：实时用用户反馈更新模型

常见失误：

❌ 只答传统的"协同过滤冷启动"，没有结合 AI 特性
❌ 忽略合成数据生成这个 AI 时代特有的解法

四、数据与指标（5 题）

Q16：如何为 AI 客服产品设计核心指标体系？

答题框架：北极星指标 → 分层指标树 → 指标陷阱

必答要点：

北极星指标：AI 问题解决率（不需要转人工的比例）

指标树：

AI 问题解决率（北极星）
├── 效率指标
│   ├── 平均首次响应时间（< 2s）
│   ├── 平均会话时长
│   └── 每日处理会话量
├── 质量指标
│   ├── 用户满意度（CSAT，1-5分）
│   ├── 幻觉率（需要人工核实的比例）
│   └── 答案相关性评分（自动评测）
└── 业务指标
    ├── 人工转接率（越低越好）
    ├── 人工客服成本节省（$）
    └── 用户重复提问率（越低越好）

常见失误：

❌ 把"用户满意度"作为唯一指标，忽略效率和质量指标
❌ 没有区分过程指标和结果指标

Q17：A/B Test 在 AI 产品中有哪些特殊挑战？

答题框架：传统 A/B 挑战 + AI 特殊挑战 → 解决方案

必答要点：

AI 产品的特殊 A/B 挑战：

挑战	说明	应对方法
输出不确定性	同样的 Prompt，每次输出不同	固定 Temperature，或多次采样取均值
评测主观性	"好的回答"难以自动判断	人工标注 + LLM-as-Judge 结合
用户污染	对照组用户互相交流（社区产品）	按用户 ID 隔离，而非会话隔离
模型版本耦合	更换底层模型时，历史数据不可比	明确记录模型版本，分版本分析
样本量要求	LLM 生成方差大，需要更多样本	延长实验周期，提高置信要求

常见失误：

❌ 只讲传统 A/B Test，没有结合 AI 特性
❌ 忽略 LLM 输出的随机性对实验的影响

Q18：你如何识别 AI 产品的数据飞轮效应，并设计促进它的产品策略？

答题框架：数据飞轮定义 → AI 产品的特殊性 → 设计策略

必答要点：

数据飞轮：更多用户 → 更多数据 → 更好的模型 → 更好的体验 → 更多用户

AI 产品的数据飞轮设计：

显式反馈设计：点赞/踩、"这个答案有帮助吗？"、满意度评分
隐式反馈设计：用户是否继续追问（追问 = 不满意）、是否复制答案（= 满意）
数据标注闭环：坏案例 → 人工标注 → 加入训练集 → 模型迭代
边际用户捕获：新用例上线时，主动收集这个场景的反馈

注意：数据飞轮在 AI 时代不是自动的，需要主动设计反馈机制。

常见失误：

❌ 认为"用户多了数据自然好"，没有设计主动收集机制
❌ 忽略数据质量问题（垃圾进垃圾出）

Q19：如何向非技术的业务方解释 AI 的局限性？

答题框架：沟通框架 → 常见误解 → 落地沟通技巧

必答要点：

常见的业务方误解：

"AI 应该什么都会，为什么这个不行？"
"只要数据够多，AI 就会越来越准"
"AI 出错了，换个更好的模型就行了"

沟通框架（STAR 变体）：

类比解释：把 AI 类比为"非常博学但会自信说错话的实习生"
边界明确：列出 AI 擅长做的事 vs 不适合做的事（二分表格）
失败案例预演：提前讲"当 AI 出错时，我们的方案是..."
指标沟通：用准确率、可靠性数字代替"AI 很聪明"这种模糊描述

常见失误：

❌ 用技术术语解释（对业务方说"幻觉率"）
❌ 过度承诺 AI 能力，导致后期信任危机

Q20：如果发现 AI 产品的指标很好，但用户还是在流失，你怎么分析？

答题框架：指标 vs 体验的背离 → 可能原因 → 诊断方法

必答要点：

背离的常见原因：

指标本身定义有问题（衡量了错误的东西）
AI 质量在特定用户群体差（核心用户 vs 普通用户）
非 AI 因素导致流失（竞品、定价、UI）
用户预期提升速度快于产品改进速度

诊断方法：

分群分析：流失用户 vs 留存用户的 AI 使用行为差异
定性访谈：直接问流失用户"为什么不用了"
指标复查：当前指标是否真的衡量了用户价值
竞品对比：流失用户去哪了？用的是什么替代方案？

常见失误：

❌ 第一反应是"继续优化 AI 质量"，没有先排除非 AI 原因
❌ 过于依赖指标，不做用户定性研究

五、商业判断（5 题）

Q21：如何评估一个 AI 产品机会是否值得投入？

答题框架：机会评估框架 → 关键问题清单 → 决策

必答要点：

AI 产品机会评估框架：

维度	关键问题
市场规模	TAM 多大？是否在增长？
用户痛点	现有解决方案有多痛？用户愿意付多少钱解决？
AI 差异化	AI 带来的体验/效率提升有多大？能否量化？
技术可行性	当前 AI 能力能达到用户可接受的质量门槛吗？
竞争格局	竞品在哪里？护城河是什么？
数据优势	我们有独特的数据吗？这是壁垒吗？
商业模式	如何定价？AI 成本可持续吗？

常见失误：

❌ 只看市场规模，忽略 AI 能力是否达到商用质量
❌ 不考虑 API 调用成本和商业模式的匹配性

Q22：AI 产品如何定价？有哪些主流模式？

答题框架：主流模式 → 各模式优劣 → 选择框架

必答要点：

定价模式	示例	优点	缺点
按用量计费（Token/调用次数）	OpenAI API	成本透明，无门槛	用户难以预测费用
订阅制（月/年费）	ChatGPT Plus	收入可预期，用户粘性高	轻度用户觉得不值
Freemium	Notion AI	快速获客	转付费率低
座位制（按用户数）	企业 SaaS	易于销售，随企业增长	可能限制使用深度
结果计费	按成功招募数收费	与价值强绑定	结果难以定义和测量

AI 产品定价的特殊考量：

需要覆盖 LLM API 成本（毛利率可能比传统 SaaS 低）
用量越多成本越高，设计时需要考虑"重度用户"的成本控制
企业客户通常接受订阅制，个人用户更适合 Freemium

常见失误：

❌ 忽略 AI API 调用成本对定价的影响
❌ 只说"参考竞品"，没有定价逻辑

Q23：如何看待 OpenAI 等模型厂商与应用层产品的竞争关系？

答题框架：历史先例 → 当前态势 → 应对策略

必答要点：

"平台吃应用"的历史规律：

AWS 推出数据库服务，冲击 RDS 创业公司
Apple 推出原生 App，冲击第三方 App
OpenAI 推出 GPTs，对简单 Prompt Wrapper 产品形成威胁

AI 应用的护城河：

护城河类型	说明	示例
垂直数据	专属领域数据，模型厂商无法复制	医疗影像数据
工作流深度集成	嵌入客户现有流程，切换成本高	ERP 集成
行业 Know-how	对特定行业的深度理解	法律合规逻辑
品牌与信任	特定用户群体的信任	针对医生的 AI 工具
网络效应	用户越多越好用	协作式 AI 平台

常见失误：

❌ 认为"紧跟 OpenAI"是最佳策略（随时可能被颠覆）
❌ 忽略商业模式和护城河，只谈产品功能

Q24：AI 产品如何做国际化？有哪些特殊挑战？

答题框架：AI 国际化特殊挑战 → 核心策略

必答要点：

AI 产品的国际化特殊挑战：

挑战	说明
多语言能力不均衡	英文能力 >> 中文 >> 小语种，质量差异大
数据合规	GDPR（欧洲）、PIPL（中国）对数据存储和处理有严格要求
模型审查要求	不同国家对 AI 生成内容的审查要求不同
文化适配	不同文化对 AI 的接受度、使用习惯差异大
模型访问限制	中国无法直接访问 OpenAI，需要国内模型替代

常见失误：

❌ 认为"翻译 UI 就是国际化"
❌ 忽略不同国家的 AI 监管差异

Q25：你如何看待 AI 产品的伦理与风险？举例说明如何在产品中落地。

答题框架：主要伦理风险 → 产品设计应对 → 组织机制

必答要点：

主要伦理风险：

偏见与歧视：训练数据的偏见被模型放大（如性别、种族偏见）
隐私泄露：用户数据被用于训练，或 AI 泄露私人信息
内容安全：生成有害内容（仇恨言论、虚假信息、CSAM）
过度依赖：用户对 AI 建议的盲目信任（医疗、法律场景）

产品层落地：

内容安全过滤（Moderation API、内容审核层）
隐私设计：对话数据不用于训练，明确告知用户
免责声明设计（高风险场景的显著提示）
可解释性：AI 建议附带"为什么这么说"

常见失误：

❌ 认为伦理是"法务部门的事"
❌ 只谈原则，不讲具体的产品设计手段

六、行为与情境题（5 题）

Q26：请描述一个你推动 AI 功能从 0 到 1 落地的经历。

STAR 框架：

要素	关键内容
Situation	业务背景、团队规模、你的角色
Task	要解决的具体问题，成功标准
Action	如何做需求分析、技术评估、推进落地
Result	量化结果（准确率提升X%，效率提升X倍）

AI PM 特别要展示的：

如何评估 AI 技术可行性
如何设计 Evaluation 体系
如何管理业务方对 AI 的预期

Q27：你与工程师在 AI 功能优先级上产生分歧时，如何处理？

答题要点：

先理解工程师的顾虑（技术风险？质量？时间成本？）
用数据和用户价值量化双方的立场
寻求共识点：是否可以用 MVP 先验证假设？
必要时升级到 Tech Lead / 产品总监仲裁
无论结果如何，复盘决策过程

Q28：如果一个 AI 功能上线后效果很差，你如何向上汇报？

答题要点：

不要掩盖：主动上报，第一时间说明情况
带方案：不只是"出问题了"，同时给出原因分析和应对方案
量化影响：多少用户受影响？对核心指标影响多大？
预防未来：我们的测试流程在哪个环节出现了盲区？

汇报结构：问题 → 原因 → 影响范围 → 已采取的措施 → 后续计划 → 系统性改进

Q29：你如何保持对 AI 技术动态的跟踪？具体说说你的方法。

优质答案要素：

固定信息源：列出 2-3 个核心信息源（论文：arxiv.org；社区：Twitter AI 圈；Newsletter：AI Weekly）
动手实践：不只是看，要亲自测试新模型/新工具
知识沉淀：建立个人的 AI 应用笔记体系
社区交流：参与 AI PM 交流群、线下活动

不要说的：

❌ "我关注 ChatGPT 的公众号"（过于泛泛）
❌ 列了一堆信息源但没有说如何转化为产品认知

Q30：5 年后 AI PM 这个岗位会怎么演变？你如何准备？

优质答案框架：

趋势判断：AI 会让更多 PM 工作被自动化，但也创造新的判断需求
核心壁垒：人类的商业判断、用户 Empathy、复杂决策协调能力不会被 AI 替代
新技能要求：Prompt 工程、AI 评测能力、数据工程基础
个人准备：持续构建实战经验，避免只停留在理论层

备考建议

每题限时 3 分钟：面试中 AI PM 题目一般 3-5 分钟回答，练习时控制时长
用 STAR 结构：尤其是行为题，一定要有具体案例
量化意识：每个观点尽量用数字支撑（"提升了 30%"优于"提升了很多"）
表达 PM 视角：区分"技术理解"和"产品判断"，展示你是 PM 不是工程师
准备反问题：面试结束时，问关于团队 AI 技术栈、产品挑战的问题，展示好奇心