新增多集群管理,支持GPU及批量导入主机,KubeOperator v3.4.0发布丨Release Notes

发布于 2020年12月15日

12月14日,开源容器平台KubeOperator发布v3.4.0版本。在这一版本中,KubeOperator新增了多集群管理(X-Pack增强包内)、GPU支持、集群操作日志、批量导入主机、集群日志支持Loki等功能,同时针对FusionCompute支持默认模板,在应用商店中增加了Kuboard和TensorFlow。

新增功能

1. 新增多集群管理(X-Pack增强包内)

KubeOperator多集群管理遵循声明式GitOps理念的持续部署功能,通过此功能可以帮助用户完成多集群应用部署,并且可以通过Github版本库进行版本控制。使用此功能的步骤如下:

① 在KubeOperator创建好Kubernetes集群;

② 在Github、Gitlab准备好应用的Kubernetes Manifest文件;

③ 在KuberOperator的多集群管理中创建应用,应用来源为Github中应用的地址;

④ 进入应用,将应用与集群进行关联,等待应用同步部署成功。

说明:案例中的应用地址为https://github.com/KubeOperator/MultiClusterRepositoryExample.git。

使用多集群管理的优势体现在以下几方面:

■  应用定义、配置和环境信息是声明式的,并且可以进行版本控制;

■  应用部署和生命周期管理是全自动化的,可审计的,清晰易懂;

■  支持对多个环境、多个Kubernetes集群上的应用进行统一部署和管理。

▲图1 在多集群管理中创建一个应用,将应用托管于Github
▲图2 应用已经成功部署到两个Kubernetes集群中

2.  新增GPU支持 

除了传统的无状态Web应用外,越来越多的数据库负载、实时计算负载、AI 机器学习负载会运行在Kubernetes之上。尤其是AI机器学习负载,天然适合运行在Kubernetes之上。对于一些用户,其构建Kubernetes集群就是专门用来运行机器学习、通用GPU、高性能计算,以及受益于专用硬件加速器的其他工作负载的。

KubeOperator v3.4.0版本可以较好地完成与NVIDIA GPU的适配,其中包括NVIDIA驱动安装、Kubernetes插件安装等,可以直接向用户提供支持GPU高性能计算的Kubernetes集群。

▲图3 Kubernetes集群部署时开启安装GPU套件

3.  批量导入主机

通过批量导入功能,用户可以下载主机Excel模板,并在填写主机信息后,通过Excel表格批量导入主机。在手动部署模式下,若需要录入的主机数量庞大,通过批量导入功能可以大大提高工作效率,显著提升用户体验。

▲图4 Kubernetes集群主机节点批量导入

4. 系统操作日志支持Loki

Loki是受Prometheus启发的水平可扩展、高可用的多租户日志聚合系统。它的设计具有很高的成本效益,并且易于操作。它不索引日志的内容,而是为每个日志流设置一组标签。

在KubeOperator工具栏目开启Loki之后,即可在集群日志栏目中,通过Loki使用标签对Kubernetes集群日志进行过滤。注意:KubeOperator的集群日志搜索目前支持Loki和Elastic Search两种方式,两者使用时只能二选一,不支持同时启用。

▲图5 在工具栏目开启Loki

5. 集群备份支持SFTP

在KubeOperator v3.4.0版本中,备份账号新增对SFTP的支持。SFTP根据SSH协议进行文件传输,在大多数用户场景中更为常用,用户可以通过SFTP将Kubernetes集群备份文件保存到服务器的目标文件夹。

▲图6 集群备份账号添加SFTP类型

6.  针对FusionCompute支持默认模板

在KubeOperator v3.4.0版本中,KubeOperator为FusionCompute提供了标准的镜像模板,在使用FusionCompute自动部署Kubernetes集群时,用户可以使用KubeOperator提供的默认模板进行集群创建。

▲图7 自动部署模式支持FusionCompute默认模板

7.  用户登录支持“忘记密码”功能

通过“忘记密码”的功能,用户可以根据邮件地址找回自己的密码。使用此功能的前提条件是,要先在“系统设置”→“邮件”中,配置好邮件服务器,之后确保用户信息中邮件地址正确,才可以通过邮件找回自己的密码信息。

▲图8 通过邮箱找回密码

8.  应用商店增加Kuboard和TensorFlow

Kuboard是一款免费的Kubernetes图形化管理工具,旨在帮助用户快速在Kubernetes上落地微服务。TensorFlow是一个端到端开源机器学习平台,通过TensorFlow用户可以快速开始机器学习。

▲图9 应用商店新上架Kuboard和TensorFlow

优化改进

■ 主机、备份账号页面可以直接授权到项目;

■ ARM64集群支持ChartMuseum;

■ 启用工具支持选择namespace和node节点;

■ 手动模式状态为Failed的集群,删除操作时触发集群卸载脚本;

■ 集群日志终端增加“停止”、“开启”按钮;

■ 格式化显示创建集群的错误信息;

■ 优化集群脚本默认并发数量;

■ 优化日期控件;

■ 优化用户密码、用户邮箱等敏感数据的显示方式;

■ 上传文件控件国际化;

■ 优化工具部署超时时间;

■ 工具卸载时状态重置为“销毁中”;

■ 优化文档、Rest API等页面跳转方式;

■ 优化集群创建时默认网络参数。

BUG修复

■ 修复使用VMware自动模式缩容时重启节点的问题;

■ 修复使用FusionCompute创建主机失败的问题;

■ 修复消息中心中消息删除失败的问题;

■ 修复部分国际化翻译的问题。