快速修复生产问题

当我们建立了项目管理体系和产品发布管道后,我们将有能力大幅度降低生产问题的平均修复时间(MTTR),平均恢复时间是评估一个开发团队效率的重要指标,只有具备了成熟的DevOps实践的团队才有能力对生产问题做出快速,准确而且可靠的响应。

在这个实验中,我们将在生产环境中模拟一个严重事故,由您和您的团队完成问题的发现,评估,分配和修复过程;并使用我们之前建立的产品发布管道部署一个新版本到生产环境。在这一过程中,您将需要对已有的测试用例进行改进,以便可以避免同样问题的再次出现。

如果时间允许,您可以模拟正常迭代开发与问题修复并行的场景,这样更加接近真实项目中的情况。

../_images/FB-overview.png

内容