「为什么世界需要私有云」之我见

发布于 2016年08月01日

最近,头条君翻译了一篇文章,讨论「为什么世界需要私有云」(以下行文使用"原文"代表该文章)。原文作者在其中阐述了私有云的多个好处,如成本因素、合规、全球部署以及厂商锁定等。整篇文章作者一直在强调私有云相对于公有云的诸多优势。但是,恕我愚见,个人很难认同其中的大部分观点。

我为什么不赞同原文观点

首先,让我们看看原文提到的第一条理由,即成本。原文中提到用户虚机数目超过2000台后私有云的整体成本(TCO)会比公有云更有优势,并引用了451Research的研究报告来论证这一点。但从产品逻辑上,我很难接受这一个结论。具体来说:

  1. 如果说规模优势,公有云拥有绝对的优势。这个从主流公有云运营的规模就可以看出。而且,公有云因为规模的原因还可以更加高效的整合产业链。比如,Intel可以给AWS数据中心定制CPU,这估计是任何一家私有云厂家都无法做到的。
  2. 如果说资源复用,公有云也拥有绝对优势。它可以利用不同类型用户错峰负载,提升整个系统的利用率。

  3. 如果说产品更新,公有云在发挥摩尔定律上有绝对优势。AWS现在基本上每年换一代CPU,在价格基本不变的情况下用户可以持续使用最好的基础设施。在云上成本核算应该充分考虑这个因素,而不是算一个静态成本。

那目前为什么公有云看起来的成本(或者价格)比私有云部署还显得更高。个人觉得第一个原因就是竞争仍然不够。在国外市场上,AWS在公有IaaS市场上仍然占住绝对优势,其营运利润也超过20%(注:AWS目前收入的主要来源是S3和EC2)。可以看出公有IaaS仍然有不小的让利空间。第二个原因就如上所述,现在针对公有云成本分析都是按照静态成本计算,而不考虑摩尔定律在公有云上带来的成本快速下降。第三个原因就是在计算成本时候没有充分考虑资源利用率和按需付费的潜在成本优化空间。本人就亲身经历过在很短时间把云上服务成本快速优化到原来1/4的真实经历,而且公有云成本优化的效益在你实施的哪一刻就马上体现出来。

其次,原文中提到的私有云优势包括全球部署和合规。个人同样觉得这也是公有云非常明显的优势所在。主流公有云供应商都是全球布局,在全球主要区域都已经有标准化数据中心和产品提供。用户一套代码和程序可以在全球一致化部署(可能有部分配置修改)。而公有云在各地的合规工作也比绝大部分用户直接去操作要有效得多。你很难想像一个中国企业在美国部署业务需要自己去完成PCI DSS或者HIPAA认证工作的工作量。原文中提到大众选择私有云部署是因为其要在全球180个地方部署业务。但是我相信这180个地方绝大部分都可以由AWS当前的数据中心所覆盖,而如此分散部署带来的运维工作是巨大的。所以,我不认为大众选择私有云部署是因为公有云覆盖不了其全球部署的要求。就算有这方面的考量,我相信也是一个非常小的考量。

最后,原文中提到的厂商锁定因素。同样公有云的厂商锁定程度也不会比私有云解决方案重。由于公有云的巨量,对生态的重视,标准化的文档和接口。围绕公有云的跨云管理、共享和迁移方案要比私有云更加成熟和经济。相反,私有云上的相应解决方案反而会被云平台及少数供应商垄断。举个例子,你认为目前AWS生态与VMWare生态哪个更好?

为什么世界需要私有云?

如上所述,我个人并不能认同原文中提到的关于公有云和私有云的对比理由。那我们应该如何看待公有云、私有云和历史传统IT之间的关系?我们应该制定怎样的应对策略参与到企业用户上云的历程中去?

首先,根据我个人过去一年多和客户的沟通和了解,可把当前用户对于私有云建设的期待(也可以理解他们为什么会选择私有云的理由)总结如下:

  • 首先,解决供应商锁定的问题。虚拟化环境成为企业当下甚至未来一段时间最主要的基础设施形态。但是,在这个领域,VMWare的产品解决方案垄断性非常强(注:Citrix的虚拟化解决方法更多仍然定位在VDI领域),严肃的企业用户基本没有其他的选择(当然,华为的Fusion Sphere最近几年逐步进入这个市场)。由于供应商垄断的原因,产品的授权费用非常高,而且还经常需要购买VMWare庞大的管理套件才能够真正用好。当下,以OpenStack为代表的私有云解决方案基于开源平台打造,供应商众多,产品授权费用不高,是一个非常诱人的解决方案。

  • 其次,希望更完整的基础设施解决方案。以OpenStack为代表的私有云解决方案提供了一篮子解决方案,包括计算(虚拟化)、存储(对象存储、块存储)、网络(SDN)等。而且整合在统一的身份认证和权限管理系统内部,这对于企业内部整合基础设施管理有很大的吸引力。

  • 再次,提升企业基础设施的管理和自动化能力。由于云平台提供了对于各种基础设施(计算、存储、网络)的虚拟化和可编程能力,让很多传统的管理工作都可以通过程序和工具自动化完成。这对于企业提升日常管理效率和质量是一个非常好的帮助。

  • 最后,非技术因素要求的项目。典型的非技术因数包括如自主可控、跟紧公计算潮流等。当然,长官意志也是一个常见的因素。关于这一点就不展开讨论。

如果仔细分析如上几条理由(最后一条除外),你会发现企业建设私有云的时候更多是在和传统IT做对比,而不是和公有云做对比。也就是说,如果企业私有基础设施在未来一段时间会长期存在,那只要私有云能够提供比传统IT更好的解决方案,就值得企业关注和投入。当下,混合云成为未来相当长一段时间的主流趋势,企业私有基础设施的存量会非常巨大,理论上去私有云确实比传统IT基础设施有明显优势,是更好的IT基础设施。所以,企业因此需要私有云。

除上面提到的企业私有云建设原因外,是否还有其他原因也是企业需要私有云的理由,甚至是非常重要的的理由之一呢?个人认为答案是肯定的,甚至这会成为企业私有云建设成败的关键所在。

在阐述这个理由前,我想引用 AWS 高级副总裁Andy Jassy 在2014年AWS Summit旧金山峰会上的一页 Slide(如下图)。他在解释为什么企业用户在采纳云和AWS时如此积极时候,其第一条原因是「敏捷性」

而下图则从用户角度解释了为什么IT敏捷度对于企业业务如此重要

那这和企业私有云建设有什么关系?简单来说,私有云在IT敏捷度比传统IT有很大的改进和提升。下图则详细解释了这点。

如上图所示,私有云在基础设施敏捷度上比以虚拟化为代表的传统IT有明显提升。展开来说,私有云在提供IT敏捷性上体现在如下两点:

  • 基础设施的自助能力。传统IT(无论是物理数据中心还是虚拟化环境)管理的基本指导原则是“IT基础设施是稀缺资源,且是公司的成本中心”。所以,我们需要集中化管理,为控制成本可以牺牲IT基础设施使用的便捷性。在这种指导思想下,大量的基础设施交付软件都按照集中管理、事前审批的思路设计,普遍缺少支持自助服务需要的“多租户隔离”,“分租户计量计费”等设计。如果仍然套用原来的思路管理云平台,则会大大抹杀云的自助能力。而自助能力恰是云支撑业务敏捷性的关键所在之一,因为业务部门可以按照业务需求随时快速获取资源,使用完成后随时自助归还资源。

  • 基础设施的可编程能力。传统IT基础设施基本不具备「可编程能力」。尽管如虚拟化软件等提供了部分API,但这些API基本是为基础设施管理者提升管理效率设计的,而不是为基础设施使用者在获取和使用基础设施而设计的。相反,云平台的设计初衷之一就是通过互联网给基础设施最终用户提供服务,所以其普遍都提供面向基础设施使用者的API(目前以HTTP API为主)。由于基础设施最终使用者拥有了「可编程能力」,其就可以让整个软件研发自动化链条包括基础设施的创建(Provision),自动化配置和编排。这样,业务团队就有了对业务系统的“全控制权”和真正意义上的“全栈自动化”。业务团队可以不依赖外部任何人员自动化完成从零开始到业务上线的全栈工作。这无论从灵活性还是效率上都有巨大优势,是云平台支撑业务敏捷性的关键因素之一。

企业在规划未来基础设施形态时候,除了需要考虑使用更好的IT基础设施支持现有传统业务,还有一个重要考量就是如何面向未来支持越来越多的敏捷性业务(以互联化业务为代表)。云平台在支持业务敏捷性有着明显的优势,而企业在部分业务是否上公有云还有疑虑或者有合规问题的时候,私有云是企业满足这块需求的务实选择。这也是企业需要私有云的重要原因。

企业实施私有云的几点建议

在本文以上部分提到了企业建设私有云的两个关键因素,即更好的基础设施来支持传统业务,更敏捷的基础设施来支持未来的敏捷性互联网化业务。但这只是企业部署私有云获取成功的理论前提,在企业落实私有云建设过程中,仍然有非常多的坑要跨过,尤其是如何面向未来支持越来越多的互联网化业务。个人觉得如下几点实践或许对企业建设私有云有所帮助:

  • 资源交付方式尽可能向自服务模式转变。这其中除了要改变传统的资源审批机制外,还需要资源交付的全流程自动化能力(包括资源申请、创建和初始化整个流程)和资源使用的计量计费能力(包括不同业务部门的资源使用分账、结合预算体制给不同业务设置资源使用上限、资源使用情况可视化和趋势分析、资源使用量预警和告警等)。其实,云平台上的自助式服务目录应该是这些能力的最好产品载体。相比较传统服务目录来说,这种新型服务目录需要能够提供“多资源池管理”、“交付全链路自动”和“完整费用管理”的能力。

  • 实现异构基础设施的统一管理和交付。尽管企业已经开始建设和使用私有云,但是仍然有大量的传统基础设施(以虚拟化环境为主)并在长时间内和私有云环境共存。如前所述,传统IT基础设施的管理和使用方式与云有巨大的差距,如果企业内部管理和资源交付不能很好弥合这种差距,会对私有云落地,业务迁移带来很多困惑和阻力。在这方面,比较明确的一个趋势就是虚拟化环境云化。通过在已有虚拟化环境上增加如“多租户隔离”、“计量计费”,“面向用户的API”等能力实现虚拟化环境的云化,降低虚拟化环境和云环境在管理和使用上的差异,最终能够让它们被统一的管理和交付平台接管,并对业务团队提供一致界面和接口。

  • 提供云平台层以上的增值服务。为了让越来越多的业务能够接受并喜欢上私有云。在私有云平台之上提供更多的增值服务是一个非常有效的方式。由于私有云的「可编程」特征,让很多增值服务能紧密嫁接和集成到私有云平台上,这其中又以DevOps实践工具链最为典型。例如,统一监控平台可以直接和云平台对接,把云平台动态创建的主机自动加入到监控体系中,自动化安装监控Agent,自动下发监控采集指标等。类似的还有自动化部署系统,可以实现部署系统和云平台的对接。在云平台主机动态创建主机时就能自动部署业务并完成上线配置。类似的还有很多可能,需要IT基础设施管理部门和企业内部的业务部门以及外部供应商共同努力,逐步提升增值服务的含金量。

总结

总结来说,这篇文章详细阐述了本人理解的企业需要“私有云”的理由。简单来说就是下面两点:

  • 相比较企业传统IT,私有云是支撑企业传统业务的更好IT;

  • 相比较企业传统IT,私有云为支持企业面向未来支持敏捷性业务提供了更好的解决方案。

如上总结可以看出,当我们讨论私有云时更多地需要和传统IT做对比,而不是公有云。在当下中国,私有云和公有云的共同敌人是传统IT,而传统IT的存量市场足够庞大,大到还根本谈不上公有云和私有云现在就要走上直接激烈PK的舞台。在当前阶段,即使私有云需要和公有云在具体案例中争取蛋糕,原文当中提到的那些比较点也不是关键所在。相反,企业的第一考量是私有云或者公有云与传统IT之间的融合程度。谁的方案能够更好融合自身产品和传统IT,谁就越有可能获得企业芳心,在企业上云过程中切得更多蛋糕。而这方面私有云的本地部署反而更有优势。所以,你看到公有云厂商都在拼命地推出如专线直连、VPN、AD集成及虚拟化环境纳管等功能,以实现和私有云在这个方面的对抗。

本文作者:徐桂林 FIT2CLOUD(飞致云)首席布道师、东区总经理。