故障首次发生时间
时 ____________
分 ____________
故障影响范围
核心业务系统
内部办公系统
对外用户服务
合作伙伴接口
数据服务
其他
故障严重等级(基于影响范围与时长)
P0-重大事故
P1-严重故障
P2-一般故障
P3-轻微异常
初步定位的故障根因类别
代码缺陷/程序Bug
配置变更错误
硬件/网络故障
第三方依赖故障
容量不足/性能瓶颈
人为操作失误
安全攻击
需求/设计缺陷
其他
故障造成的业务影响(如:交易失败笔数、用户无法登录时长等)
现有监控系统对本次故障的覆盖与告警有效性(1-5分,1为完全无效,5为非常有效)
分数 ★ ★ ★ ★ ★
标签 ★ ★ ★ ★ ★
本次故障处理流程是否顺畅?
非常顺畅
基本顺畅,但有阻滞
不顺畅,存在明显问题
为防止同类故障再次发生,计划或已采取的改进措施
修复代码缺陷
优化配置管理流程
增强监控覆盖与告警
扩容或性能优化
完善应急预案与演练
加强人员培训
改进架构设计
建立/完善复盘机制
其他
您对本次故障从发生到复盘全过程的整体满意度如何?(0-10分,0为非常不满意,10为非常满意)
本次故障复盘是否已完成?
是,复盘报告已归档
是,但报告待完善
否,计划中
否,暂无计划