DevOps年度报告:部署频率提高200倍,宕机成本降低100倍

发布于 2016年07月05日

作者:Kai编译

一、内容摘要

DevOps发展情况第五年度报告重点阐述了以下事实:

优秀的IT和团队表现是跨开发和运维的团队协作的结果,对IT和团队的投资可以带来丰厚的回报。

本年度DevOps报告展示了如何通过改进整个产品生命周期(从产品规划到质量和安全保障,再到客户反馈)来加速产品的交付,同时优化产品的质量、安全和业务成果。DevOps实践也可以改进组织文化,增强员工的参与感。

在过去的五年里,我们调查了来自世界各地的25000多个专业技术人员。通过调查,我们更好地理解DevOps带来的技术实践、文化规范和精益管理是如何影响IT和团队表现的。

去年我们调查了DevOps的几个维度,包括精益管理实践、应用架构、IT经理在DevOps转变中的角色、多样性、部署难题、工作倦怠等。最后我们证实,技术实践只是IT性能提升所有因素中的一小部分。

为了创造持续的IT高性能表现,组织在对技术本身进行投资的同时,需要增加对人员和研发过程的投资。

今年我们针对当前DevOps社区面临的最紧迫的问题进行了调查,这些问题包括:

  DevOps的投资回报率(ROI)

  DevOps实践的作用及价值

  如何将安全与DevOps进行整合

  员工投入和组织成功之间的关系

关键发现

  1、高效组织的生产能力明显超越他们的低效同行。

  高效组织比低效者的部署频率高200倍,交付周期快2555倍。此外,高效组织的故障恢复时间比低效者快24倍,修改失败率低3倍,明显优于低效者。

  高效组织公布,他们从部署更改到生产的交付时间(例如,从代码提交到成功部署至生产环境)平均交付时间为60分钟,低效组织的平均交付时间为3.5个月,因此交付周期快2555倍。

  2、以员工净推荐值(eNPS)作为衡量标准,高效组织的员工具有更高的员工忠诚度。

  高效组织的员工更有可能向其朋友推荐本组织作为理想工作场所,其概率比低效组织高2.2倍。

  同时,高效组织的员工更有可能向其朋友推荐所在小组作为理想工作环境,其概率比低效组织高1.8倍。

  其他研究显示,员工忠诚度越高,业务产出越高。

  3、提高质量是每个人的工作。

  高效组织花在计划外工作和返工的时间比低效组织少22%,同时,高效组织能够比低效组织在新工作(新功能、代码)上多花29%的时间。

  他们之所以能够如此,是因为高效组织通过持续交付把质量融入到开发流程的每个阶段,而不是在开发结束时再对产品进行翻新。

  4、高效组织花在修复安全问题方面的时间比低效组织少50%。

  通过更好地将信息安全目标整合到日常工作中,团队可以实现更高层次的IT性能,并建立更安全的系统。

  5、改进产品研发流程可以提高您的IT和团队表现。

  产品开发周期在开发人员开始编码之前很久就开始了。产品团队需要的能力包括:

  分解产品和功能的能力。

  将从理念到产品的工作流程可视化的能力。

  收集用户反馈,持续迭代和改进的能力。

  根据团队能力的水平,可以预测其IT表现和部署难题。

  6、进行技术改造可以为任何组织产生相当大的成本节约。

  技术领导者都想知道投资技术改造后,可以获得什么样的回报。

  您可以使用本报告的关键指标和行业基准,并通过我们提供的准则来量化潜在的成本节约。

  潜在的成本节约可以使用您自己组织的指标来量化。

  节约的成本可以进行再投资,以提高IT和团队表现,本报告也对此提供了相应的建议。

二、调查参与者

  今年我们调查了来自世界各地的超过4600名专业技术人员。

  与去年相比,从事DevOps相关工作的人数有所增加。但是令人失望的是,女性受访者的人数只有微小增加。

  我们在其他行业调查中也发现了相同的现象。我们仍然有很多工作要做来提高DevOps领域的多样性和包容性。

三、IT表现和员工忠诚度

  我们发现高效组织中积极员工的比例明显高于低效组织。这是有道理的,因为只有忠诚度最高的员工才会把公司推荐给朋友,而只有高效组织才可以培养出忠诚的员工。

  历年IT表现:

  我们研究了过去三年有价值的数据,发现高效组织正在脱颖而出。

  DevOps带来的持续改进是实实在在,且令人兴奋的。

  DevOps正驱动公司向最好的方向发展,并把其他公司抛在身后。三年前的最高水平已经不能适应当前的商业环境。

  通过对DevOps投资回报率(ROI)的分析,我们发现宕机对公司有非常大的影响。客户、企业高管会深切体会到宕机的影响,在某些情况下,媒体对此也会很敏感。

  因此,宕机不仅会带来财政上的损失,也会造成声誉损失。

四、将质量根植于产品之中

  DevOps的理念与组织融合越深,组织就越深刻的体会到:质量和安全是每个人的工作。我们想确定是否持续交付会改变产品质量的管控方式。

  更多内容请参见“阅读原文”链接。

五、生产管理精益化

  精益化方法注重从产品的生命周期开始,通过频繁的用户研究来测试产品的设计和商业模式。我们发现当产品团队采用精益化方法来设计和交付产品时,组织的IT表现和文化都会有明显提升,其整体表现也会更好。

  经过统计分析,我们发现产品管理精益化可以提高IT表现,减少部署问题。有趣的是,前两个因素(将产品分解的能力、对产品开发和交付过程的理解)是共同起作用的。

  以上所述表明了一个观点:流程可视化和工作分解对产品生产至关重要。下图展示了以上因素产生的影响。

六、改变组织文化及员工认同感

  员工是组织最宝贵的资源,然而他们经常会被随意抛弃。当领导者对员工进行投资,使他们尽最大努力工作的时候,员工会对组织产生更强烈的认同感,员工也会更加努力来帮助企业成功。

  员工对所在组织认同,也可以带来注重成果、绩效导向的企业文化,并且提升组织表现(例如生产效率、市场占有率、利润)。

七、DevOps的投资回报

  技术领导者都想知道投资技术改造后,是否可以获得良好的投资回报。通过使用一些关键指标和行业基准,我们对DevOps实践给组织带来的潜在成本节约进行了计算。

  根据计算结果,我们将组织分为高效组织、中等组织、低效组织。此外,我们还研究了怎样使用节约下来的时间和金钱进行再投资,才能给组织带来更大、更持久的价值。

  传统上,IT被看做成本中心,说服管理者对IT进行投资很难。直到最近,都没有有力的证据来说明,对IT的投资可以带来丰厚的回报。

  在过去的报告中,我们发现IT表现和组织整体表现有明显关联。从而证明了,IT可以带来真正的业务价值,提升组织的业务竞争力。

  今年,我们发现高效团队在计划外工作和返工上,花费的时间最少(21%)。因此,他们能够将49%的时间花在增加价值的新工作上。

  低效组织和中等组织的情况却恰好相反。低效组织比中等组织花在返工上的时间少(分别为27%和32%),花在新工作上的时间多(分比为38%和34%)。

  一种可能的解释是,低效组织会忽略产品中的严重缺陷,并不断推进新功能开发。但是缺陷的不断叠加,会使他们在以后付出惨重的代价。

  中等组织在返工上会比低效组织花费更多的时间,从而消除技术隐患,与此同时,中等组织也会有更高的修改失败率。但是,因为中等组织的部署频率高于低效组织,所以他们可以快速试错。

  过去,中等组织通过提高速度、优化投入产出来实现利益最大化。随着时间的推移,他们更有可能通过持续优化生产过程来实现利益最大化。

  这些有趣的发现强调了以下事实:每个组织都必须把钱花在刀刃上。

  我们再次强调,虽然低效组织的返工成本较低,但我们相信那是以掩耳盗铃为代价的。随着缺陷的不断叠加,他们以后会为此付出惨重的代价。

  每年因宕机产生的成本(宕机成本)

  根据IDC的StevenElliot的近期报告,对一家世界财富1000强企业来说,每小时宕机所产生的损失从12.5亿美元到22亿美元不等。

  关键程序故障所造成的损失平均为每小时50万美元到100万美元不等。

  当然,宕机所造成的损失随着业务的不同而不同。比如说,高容量的金融交易机构因宕机造成的损失,肯定比为写字楼管理清洁工的公司造成的损失大。

  另外,IT架构的不同,会导致宕机造成的影响和恢复的难度越会不同。从而导致宕机所造成的损失也不同。

  在今天的商业环境中,稍微复杂的业务都高度依赖软件和计算机网络,宕机会对严重威胁业务的健康。

  鉴于此,每个组织都应该根据自身的业务模型和架构,衡量宕机可能给自身造成的损失。

  本报告中,我们会提供给您计算宕机成本的方法。同时,我们也使用业内数据,对高效组织、中等组织和低效组织的宕机成本进行了计算。

  宕机成本=部署频率*修改失败率*故障恢复平均时间*停产每小时造成的损失。

  部署频率。我们对此次调查的数据进行了平均。高效组织可以根据需求进行部署,Etsy每天部署80次,Amazon和Netflix每天部署数千次。

  我们更加保守的估计了高效组织的部署频率:每天4次,每年1460次。中等组织的部署频率从每年12次到每年52次不等,平均下来,中等组织每年部署32次。

  低效组织的部署频率从每年2次到每年12次不等,平均下来,低效组织每年部署7次。您可以根据您公司自身的部署频率进行计算。

  修改失败率。修改失败率是指导致停产的修改数量占总修改数量的比例。

  根据本次调查的数据显示:

  高效组织的平均修改失败率为7.5%(从0到15%)

  中等组织的平均修改失败率为38%(从31%到45%)

  低效组织的平均修改失败率为23.5%(从16%到30%)

  您可以根据您公司自身的修改失败率进行计算。

  平均故障恢复时间(MTTR)。根据今年的调查数据,高效组织的故障恢复时间小于一小时,中等组织和低效组织的故障恢复时间都小于一天。

  中等组织和低效组织故障恢复时间的中值是相同的,但其平均值不同。低效组织故障恢复时间的平均值明显高于中等组织。

  为了进行示例计算,我们采用了比较保守的数字:

  高效组织的MTTR为1小时

  中等组织和低效组织的MTTR为24小时

  您可以根据您公司自身的MTTR进行计算。

  停产损失。因为DevOps在一些组织的软件开发和核心程序交付中已经开始使用,为了避免误差,我们采用IDC较早前公布的数据。

  据保守估计,核心程序每小时的停产损失为500000美元。您可以根据您公司自身的每小时停产损失进行计算。

  虽然低效组织的宕机成本较低,但是他们却为部署不频繁付出了隐藏的代价。一个公司如果不能高频次的发布产品,那么它就失去了不断获取用户反馈的机会。

  企业可以根据用户反馈不断进行实验,持续改进产品,从而提高客户满意度。这可以让企业领先竞争者,紧随市场变化进行创新,最终使企业鹤立鸡群。

  我们推测高效组织所获得的收入和利润,远远超出他们的宕机成本。

  对于部署频率较低的公司,虽然总体部署成本较低,但是单次部署成本很高。除了用美元进行衡量,我们可以其他角度进行分析。

  部署不频繁的必然结果是,每次部署都会将又大又复杂的代码包部署到生成环境中,导致集成和维护困难。而且,当故障发生时,很难定位。

  部署不频繁还会带来其他的负面影响。因为部署不频繁,每次部署都会将又大又复杂的代码包部署到生成环境中,此时会导致大量问题产生。

  工程师和运维人员必须匆忙的去修复这些问题,这时每个人埋头工作去找出问题所在和解决办法。

  这个过程无疑是令人沮丧的,其中必然充满抱怨。

  这些痛苦的部署场景是反面教材,不会教给团队正确的做事情的方法。勇于探索、不断学习、持续改进的良性循环不会再这个环境下出现。组织想要提升业务产出更是难上加难。

  DevOps带来的价值

  我们必须指出,对IT进行投资不能仅考虑成本节约。成本节约可以带来短期积极影响,但是大家对第二年节约的成本却习以为常。

  你必须能够说明节约下来的员工时间用来进行其他提高产量、增加价值的活动。

  重新利用节约下来的员工时间、创造力和激情,会取得丰富的业务产出。最好的组织深谙此道,他们在计算投资回报率(ROI)时,会考虑技术改造的价值。

  技术改造所带来的未来价值不能被低估。无论是将节约下来的时间用于开发新的产品和功能,还是改进生成过程,未来都会取得良好的收益。

八、结论

  DevOps不再只是一个时尚用语,它已经成为一系列可以被理解的具体实践和文化模式。

  转向DevOps的人们不仅仅可以改善日常工作,给家人、朋友、同伴更多的时间,同时DevOps可以提升组织表现,增加收入、提高利润和其他可衡量的产出。

  五年前,我们就开始进行DevOps调查,并发布DevOps发展情况报告。我们已经明白了DevOps工具、实践和文化价值是怎样影响IT团队和组织的。

  今年,我们对DevOps进行了更广泛的数据收集,更深入的分析。我们希望通过今年的报告,能够使您更好的理解DevOps给您的组织带来的影响。

文章作者:Kai编译