AI 产品需求分析与 PRD 写作
传统 PRD 写的是「系统应该做什么」,AI PRD 写的是「系统在什么情况下应该做什么,在什么情况下应该优雅地失败」。这一字之差,是 AI 产品与传统软件产品需求分析的根本差异。
1. AI 产品需求的本质差异
1.1 传统产品 vs AI 产品的需求对比
| 维度 | 传统产品需求 | AI 产品需求 |
|---|---|---|
| 输出确定性 | 确定(1+1=2) | 概率性(可能正确、可能幻觉) |
| 失败模式 | 明确(报错/崩溃) | 模糊(「似是而非」的错误答案) |
| 质量衡量 | 功能正确/不正确 | 准确率、召回率、用户满意度分布 |
| 需求验证 | 单元测试即可 | 需要评估集 + 人工抽样 |
| 迭代方式 | 改代码逻辑 | 改 Prompt + 改模型 + 改数据 |
| 边界定义 | 明确(if-else) | 模糊(需要定义「足够好」是什么) |
1.2 AI 产品需求的三个特有维度
1. 置信度与回退策略 AI 不会「报错」,它会给出一个「听起来有道理」的错误答案。需求必须明确:当置信度不足时,系统如何行动?
2. 数据依赖性 AI 能力的上限由训练数据决定。需求必须包含:模型需要什么数据?数据从哪来?谁负责标注?
3. 演化性 AI 产品不是「上线即完成」,而是持续迭代。需求要预留模型更新、Prompt 优化的机制。
2. AI PRD 核心模块
2.1 AI 能力描述(Capability Definition)
这是 AI PRD 区别于传统 PRD 的核心模块。
## AI 能力描述
### 核心任务
[用一句话描述 AI 要完成的核心任务]
### 输入规范
- 输入类型:文本 / 图片 / 音频 / 多模态
- 最大输入长度:[Token 数 / 字数 / 文件大小]
- 支持语言:[中文 / 英文 / 多语言]
- 输入约束:[格式要求、内容限制]
### 输出规范
- 输出类型:文本 / 结构化数据 / 分类标签
- 输出格式:[JSON / Markdown / 纯文本]
- 输出长度:[预期范围]
- 确定性要求:[是否需要固定输出,Temperature 设置]
### 能力边界
- 明确可以做:[列举 3-5 个典型成功场景]
- 明确不能做:[列举 3-5 个不在范围内的场景]
- 灰色地带处理:[如何处理模糊输入]
真实案例:智能客服意图识别模块
### 核心任务
识别用户消息的服务意图,分类到预定义意图列表
### 输入规范
- 输入类型:纯文本(用户消息)
- 最大长度:500 字
- 支持语言:中文(简体)、英文
### 输出规范
- 格式:JSON
{
"intent": "退款申请",
"confidence": 0.87,
"entities": {"order_id": "2024xxxxx"},
"fallback_reason": null
}
### 能力边界
可以做:退款、换货、查物流、投诉、产品咨询(5 类意图)
不能做:法律咨询、竞品比较、隐私信息查询
灰色地带:多意图混合消息 → 取置信度最高的意图,标记 multi_intent: true
2.2 质量标准(Quality Standards)
## 质量标准
### 准确率目标
| 场景 | 目标准确率 | 最低可接受值 | 测量方式 |
|------|-----------|------------|---------|
| 意图识别(主流意图) | ≥ 92% | 85% | 人工标注评估集(n=500) |
| 意图识别(长尾意图) | ≥ 75% | 60% | 人工标注评估集(n=200) |
| 信息提取(订单号) | ≥ 99% | 97% | 正则验证 |
### 性能目标
- P50 响应时间:< 500ms
- P99 响应时间:< 2s
- 可用性:99.5%
### 安全标准
- 有害内容拦截率:> 99.9%
- 误拦截率(正常内容被拦截):< 0.5%
2.3 降级与回退策略(Fallback Strategy)
这是最容易被忽略、也是最关键的 AI PRD 模块。
## 降级与回退策略
### 触发条件
| 条件 | 触发阈值 | 处理方式 |
|------|---------|---------|
| 置信度过低 | confidence < 0.6 | 转人工 / 要求用户澄清 |
| 模型超时 | > 3s | 返回默认兜底回答 |
| 内容安全拦截 | 触发安全过滤 | 礼貌拒绝 + 引导合规表达 |
| 输入过长 | > 500字 | 提示压缩 / 截断处理 |
| 模型不可用 | API 错误率 > 5% | 切换备用模型 / 静默降级 |
### 回退层级
第一层:重试(同一模型,最多 2 次)
第二层:降级模型(用更快的小模型)
第三层:规则引擎兜底(关键词匹配)
第四层:转人工客服
第五层:系统维护提示
### 用户透明度原则
- 不向用户暴露技术失败细节
- 降级时保持体验一致性
- 记录降级事件用于后续分析
2.4 数据需求(Data Requirements)
## 数据需求
### 训练/微调数据
| 数据类型 | 数量 | 来源 | 标注方式 | 负责人 |
|---------|------|------|---------|-------|
| 意图分类样本 | 10,000 条 | 历史客服对话 | 外包标注 | 数据团队 |
| 对话摘要样本 | 2,000 条 | 人工编写 | 内部标注 | 产品团队 |
### 评估数据集
- 规模:每类意图至少 100 条,总计 ≥ 500 条
- 更新频率:每季度更新,确保覆盖新场景
- 标注质量:双人标注,Kappa 系数 ≥ 0.8
### 数据合规
- 用户数据使用需获得隐私政策授权
- 标注数据不含 PII(个人可识别信息)
- 数据存储符合等保要求
3. 完整 AI PRD 模板
# [功能名称] PRD
## 一、需求背景
- 业务问题:[描述待解决的问题]
- 目标用户:[用户画像]
- 期望价值:[对用户/业务的价值]
## 二、功能概述
- 功能形态:[UI 交互方式]
- AI 能力类型:文本生成 / 分类 / 检索增强 / 多模态
## 三、AI 能力描述
[参考 2.1 节模板]
## 四、用户故事与流程
- 主流程图
- Happy Path 用例
- Edge Case 用例(至少 5 个)
## 五、质量标准
[参考 2.2 节模板]
## 六、降级与回退策略
[参考 2.3 节模板]
## 七、数据需求
[参考 2.4 节模板]
## 八、成功指标
- 用户层:[任务完成率、用户满意度]
- 系统层:[准确率、响应时间、降级率]
- 业务层:[成本节省、转化提升]
## 九、风险与缓解措施
| 风险 | 影响 | 概率 | 缓解措施 |
|------|------|------|---------|
| 模型幻觉导致错误信息 | 高 | 中 | 事实核查层 + 用户举报机制 |
| 供应商 API 不可用 | 高 | 低 | 备用供应商 + 规则兜底 |
## 十、上线计划
- Alpha(内测):[范围、时间、通过标准]
- Beta(灰度):[范围、时间、通过标准]
- GA(全量):[时间、回滚条件]
4. AI 产品需求的常见错误
错误一:把 AI 当成确定性系统
❌ 错误需求:系统应识别所有用户的情绪
✅ 正确需求:系统应在置信度 ≥ 0.8 时识别用户情绪,否则标记为「需人工确认」
错误二:没有定义「足够好」
❌ 错误需求:AI 应准确理解用户意图
✅ 正确需求:主流意图(覆盖 80% 流量)的识别准确率 ≥ 90%,
长尾意图准确率 ≥ 70%,以 500 条人工标注评估集为基准
错误三:忽略失败模式
❌ 错误需求:AI 自动回答客户问题
✅ 正确需求:AI 自动回答客户问题;当置信度 < 0.7 或涉及退款金额时,
自动创建人工工单并显示「正在为您转接专属客服」
错误四:遗漏数据来源
❌ 错误需求:AI 需要了解公司所有产品知识
✅ 正确需求:AI 通过 RAG 检索产品知识库(数据来源:官网 FAQ + 产品手册),
知识库每周一自动同步,由内容团队维护
5. 案例分析:写作助手 PRD 关键片段
某内容平台要上线 AI 写作辅助功能,以下是需求分析的关键判断:
需求场景:用户粘贴文章草稿,AI 提供改写建议
产品经理的需求分析思路:
1. 这是生成任务还是分类任务?
→ 生成任务(改写),输出不确定,需要定义「好的改写」标准
2. 用户如何判断 AI 输出的好坏?
→ 用户接受/拒绝建议 → 可作为隐性反馈信号
3. 最坏情况是什么?
→ AI 改写后破坏原意 → 必须保留原文,对比展示
4. 用量/成本如何控制?
→ 按段落触发(非全文),设每日使用上限
5. 如何收集改进数据?
→ 记录接受/拒绝行为,形成 RLHF 训练数据
6. 本节要点
- AI 需求的核心是定义「足够好」:准确率目标、评估方式、验收标准必须具体可测。
- 回退策略是 AI PRD 的必选项,不是可选项:每个 AI 功能都必须设计降级路径。
- 数据需求与功能需求同等重要:没有数据来源的 AI 需求是空中楼阁。
- 用肯定句 + 置信度阈值替代模糊表述:「AI 应理解用户」不是需求,「置信度 ≥ 0.85 时自动处理」才是。
- AI PRD 需要 Edge Case 覆盖:至少穷举 5 个异常场景及其处理方式。