AI 产品需求分析与 PRD 写作

传统 PRD 写的是「系统应该做什么」，AI PRD 写的是「系统在什么情况下应该做什么，在什么情况下应该优雅地失败」。这一字之差，是 AI 产品与传统软件产品需求分析的根本差异。

1. AI 产品需求的本质差异

1.1 传统产品 vs AI 产品的需求对比

维度	传统产品需求	AI 产品需求
输出确定性	确定（1+1=2）	概率性（可能正确、可能幻觉）
失败模式	明确（报错/崩溃）	模糊（「似是而非」的错误答案）
质量衡量	功能正确/不正确	准确率、召回率、用户满意度分布
需求验证	单元测试即可	需要评估集 + 人工抽样
迭代方式	改代码逻辑	改 Prompt + 改模型 + 改数据
边界定义	明确（if-else）	模糊（需要定义「足够好」是什么）

1.2 AI 产品需求的三个特有维度

1. 置信度与回退策略 AI 不会「报错」，它会给出一个「听起来有道理」的错误答案。需求必须明确：当置信度不足时，系统如何行动？

2. 数据依赖性 AI 能力的上限由训练数据决定。需求必须包含：模型需要什么数据？数据从哪来？谁负责标注？

3. 演化性 AI 产品不是「上线即完成」，而是持续迭代。需求要预留模型更新、Prompt 优化的机制。

2. AI PRD 核心模块

2.1 AI 能力描述（Capability Definition）

这是 AI PRD 区别于传统 PRD 的核心模块。

## AI 能力描述

### 核心任务
[用一句话描述 AI 要完成的核心任务]

### 输入规范
- 输入类型：文本 / 图片 / 音频 / 多模态
- 最大输入长度：[Token 数 / 字数 / 文件大小]
- 支持语言：[中文 / 英文 / 多语言]
- 输入约束：[格式要求、内容限制]

### 输出规范
- 输出类型：文本 / 结构化数据 / 分类标签
- 输出格式：[JSON / Markdown / 纯文本]
- 输出长度：[预期范围]
- 确定性要求：[是否需要固定输出，Temperature 设置]

### 能力边界
- 明确可以做：[列举 3-5 个典型成功场景]
- 明确不能做：[列举 3-5 个不在范围内的场景]
- 灰色地带处理：[如何处理模糊输入]

真实案例：智能客服意图识别模块

### 核心任务
识别用户消息的服务意图，分类到预定义意图列表

### 输入规范
- 输入类型：纯文本（用户消息）
- 最大长度：500 字
- 支持语言：中文（简体）、英文

### 输出规范
- 格式：JSON
  {
    "intent": "退款申请",
    "confidence": 0.87,
    "entities": {"order_id": "2024xxxxx"},
    "fallback_reason": null
  }

### 能力边界
可以做：退款、换货、查物流、投诉、产品咨询（5 类意图）
不能做：法律咨询、竞品比较、隐私信息查询
灰色地带：多意图混合消息 → 取置信度最高的意图，标记 multi_intent: true

2.2 质量标准（Quality Standards）

## 质量标准

### 准确率目标
| 场景 | 目标准确率 | 最低可接受值 | 测量方式 |
|------|-----------|------------|---------|
| 意图识别（主流意图） | ≥ 92% | 85% | 人工标注评估集（n=500） |
| 意图识别（长尾意图） | ≥ 75% | 60% | 人工标注评估集（n=200） |
| 信息提取（订单号） | ≥ 99% | 97% | 正则验证 |

### 性能目标
- P50 响应时间：< 500ms
- P99 响应时间：< 2s
- 可用性：99.5%

### 安全标准
- 有害内容拦截率：> 99.9%
- 误拦截率（正常内容被拦截）：< 0.5%

2.3 降级与回退策略（Fallback Strategy）

这是最容易被忽略、也是最关键的 AI PRD 模块。

## 降级与回退策略

### 触发条件
| 条件 | 触发阈值 | 处理方式 |
|------|---------|---------|
| 置信度过低 | confidence < 0.6 | 转人工 / 要求用户澄清 |
| 模型超时 | > 3s | 返回默认兜底回答 |
| 内容安全拦截 | 触发安全过滤 | 礼貌拒绝 + 引导合规表达 |
| 输入过长 | > 500字 | 提示压缩 / 截断处理 |
| 模型不可用 | API 错误率 > 5% | 切换备用模型 / 静默降级 |

### 回退层级
第一层：重试（同一模型，最多 2 次）
第二层：降级模型（用更快的小模型）
第三层：规则引擎兜底（关键词匹配）
第四层：转人工客服
第五层：系统维护提示

### 用户透明度原则
- 不向用户暴露技术失败细节
- 降级时保持体验一致性
- 记录降级事件用于后续分析

2.4 数据需求（Data Requirements）

## 数据需求

### 训练/微调数据
| 数据类型 | 数量 | 来源 | 标注方式 | 负责人 |
|---------|------|------|---------|-------|
| 意图分类样本 | 10,000 条 | 历史客服对话 | 外包标注 | 数据团队 |
| 对话摘要样本 | 2,000 条 | 人工编写 | 内部标注 | 产品团队 |

### 评估数据集
- 规模：每类意图至少 100 条，总计 ≥ 500 条
- 更新频率：每季度更新，确保覆盖新场景
- 标注质量：双人标注，Kappa 系数 ≥ 0.8

### 数据合规
- 用户数据使用需获得隐私政策授权
- 标注数据不含 PII（个人可识别信息）
- 数据存储符合等保要求

3. 完整 AI PRD 模板

# [功能名称] PRD

## 一、需求背景
- 业务问题：[描述待解决的问题]
- 目标用户：[用户画像]
- 期望价值：[对用户/业务的价值]

## 二、功能概述
- 功能形态：[UI 交互方式]
- AI 能力类型：文本生成 / 分类 / 检索增强 / 多模态

## 三、AI 能力描述
[参考 2.1 节模板]

## 四、用户故事与流程
- 主流程图
- Happy Path 用例
- Edge Case 用例（至少 5 个）

## 五、质量标准
[参考 2.2 节模板]

## 六、降级与回退策略
[参考 2.3 节模板]

## 七、数据需求
[参考 2.4 节模板]

## 八、成功指标
- 用户层：[任务完成率、用户满意度]
- 系统层：[准确率、响应时间、降级率]
- 业务层：[成本节省、转化提升]

## 九、风险与缓解措施
| 风险 | 影响 | 概率 | 缓解措施 |
|------|------|------|---------|
| 模型幻觉导致错误信息 | 高 | 中 | 事实核查层 + 用户举报机制 |
| 供应商 API 不可用 | 高 | 低 | 备用供应商 + 规则兜底 |

## 十、上线计划
- Alpha（内测）：[范围、时间、通过标准]
- Beta（灰度）：[范围、时间、通过标准]
- GA（全量）：[时间、回滚条件]

4. AI 产品需求的常见错误

错误一：把 AI 当成确定性系统

❌ 错误需求：系统应识别所有用户的情绪
✅ 正确需求：系统应在置信度 ≥ 0.8 时识别用户情绪，否则标记为「需人工确认」

错误二：没有定义「足够好」

❌ 错误需求：AI 应准确理解用户意图
✅ 正确需求：主流意图（覆盖 80% 流量）的识别准确率 ≥ 90%，
           长尾意图准确率 ≥ 70%，以 500 条人工标注评估集为基准

错误三：忽略失败模式

❌ 错误需求：AI 自动回答客户问题
✅ 正确需求：AI 自动回答客户问题；当置信度 < 0.7 或涉及退款金额时，
           自动创建人工工单并显示「正在为您转接专属客服」

错误四：遗漏数据来源

❌ 错误需求：AI 需要了解公司所有产品知识
✅ 正确需求：AI 通过 RAG 检索产品知识库（数据来源：官网 FAQ + 产品手册），
           知识库每周一自动同步，由内容团队维护

5. 案例分析：写作助手 PRD 关键片段

某内容平台要上线 AI 写作辅助功能，以下是需求分析的关键判断：

需求场景：用户粘贴文章草稿，AI 提供改写建议

产品经理的需求分析思路：

1. 这是生成任务还是分类任务？
   → 生成任务（改写），输出不确定，需要定义「好的改写」标准

2. 用户如何判断 AI 输出的好坏？
   → 用户接受/拒绝建议 → 可作为隐性反馈信号

3. 最坏情况是什么？
   → AI 改写后破坏原意 → 必须保留原文，对比展示

4. 用量/成本如何控制？
   → 按段落触发（非全文），设每日使用上限

5. 如何收集改进数据？
   → 记录接受/拒绝行为，形成 RLHF 训练数据

6. 本节要点

AI 需求的核心是定义「足够好」：准确率目标、评估方式、验收标准必须具体可测。
回退策略是 AI PRD 的必选项，不是可选项：每个 AI 功能都必须设计降级路径。
数据需求与功能需求同等重要：没有数据来源的 AI 需求是空中楼阁。
用肯定句 + 置信度阈值替代模糊表述：「AI 应理解用户」不是需求，「置信度 ≥ 0.85 时自动处理」才是。
AI PRD 需要 Edge Case 覆盖：至少穷举 5 个异常场景及其处理方式。