12月14日,开源容器平台KubeOperator发布v3.4.0版本。在这一版本中,KubeOperator新增了多集群管理(X-Pack增强包内)、GPU支持、集群操作日志、批量导入主机、集群日志支持Loki等功能,同时针对FusionCompute支持默认模板,在应用商店中增加了Kuboard和TensorFlow。
新增功能
1. 新增多集群管理(X-Pack增强包内)
KubeOperator多集群管理遵循声明式GitOps理念的持续部署功能,通过此功能可以帮助用户完成多集群应用部署,并且可以通过Github版本库进行版本控制。使用此功能的步骤如下:
① 在KubeOperator创建好Kubernetes集群;
② 在Github、Gitlab准备好应用的Kubernetes Manifest文件;
③ 在KuberOperator的多集群管理中创建应用,应用来源为Github中应用的地址;
④ 进入应用,将应用与集群进行关联,等待应用同步部署成功。
说明:案例中的应用地址为https://github.com/KubeOperator/MultiClusterRepositoryExample.git。
使用多集群管理的优势体现在以下几方面:
■ 应用定义、配置和环境信息是声明式的,并且可以进行版本控制;
■ 应用部署和生命周期管理是全自动化的,可审计的,清晰易懂;
■ 支持对多个环境、多个Kubernetes集群上的应用进行统一部署和管理。
2. 新增GPU支持
除了传统的无状态Web应用外,越来越多的数据库负载、实时计算负载、AI 机器学习负载会运行在Kubernetes之上。尤其是AI机器学习负载,天然适合运行在Kubernetes之上。对于一些用户,其构建Kubernetes集群就是专门用来运行机器学习、通用GPU、高性能计算,以及受益于专用硬件加速器的其他工作负载的。
KubeOperator v3.4.0版本可以较好地完成与NVIDIA GPU的适配,其中包括NVIDIA驱动安装、Kubernetes插件安装等,可以直接向用户提供支持GPU高性能计算的Kubernetes集群。
3. 批量导入主机
通过批量导入功能,用户可以下载主机Excel模板,并在填写主机信息后,通过Excel表格批量导入主机。在手动部署模式下,若需要录入的主机数量庞大,通过批量导入功能可以大大提高工作效率,显著提升用户体验。
4. 系统操作日志支持Loki
Loki是受Prometheus启发的水平可扩展、高可用的多租户日志聚合系统。它的设计具有很高的成本效益,并且易于操作。它不索引日志的内容,而是为每个日志流设置一组标签。
在KubeOperator工具栏目开启Loki之后,即可在集群日志栏目中,通过Loki使用标签对Kubernetes集群日志进行过滤。注意:KubeOperator的集群日志搜索目前支持Loki和Elastic Search两种方式,两者使用时只能二选一,不支持同时启用。
5. 集群备份支持SFTP
在KubeOperator v3.4.0版本中,备份账号新增对SFTP的支持。SFTP根据SSH协议进行文件传输,在大多数用户场景中更为常用,用户可以通过SFTP将Kubernetes集群备份文件保存到服务器的目标文件夹。
6. 针对FusionCompute支持默认模板
在KubeOperator v3.4.0版本中,KubeOperator为FusionCompute提供了标准的镜像模板,在使用FusionCompute自动部署Kubernetes集群时,用户可以使用KubeOperator提供的默认模板进行集群创建。
7. 用户登录支持“忘记密码”功能
通过“忘记密码”的功能,用户可以根据邮件地址找回自己的密码。使用此功能的前提条件是,要先在“系统设置”→“邮件”中,配置好邮件服务器,之后确保用户信息中邮件地址正确,才可以通过邮件找回自己的密码信息。
8. 应用商店增加Kuboard和TensorFlow
Kuboard是一款免费的Kubernetes图形化管理工具,旨在帮助用户快速在Kubernetes上落地微服务。TensorFlow是一个端到端开源机器学习平台,通过TensorFlow用户可以快速开始机器学习。
优化改进
■ 主机、备份账号页面可以直接授权到项目;
■ ARM64集群支持ChartMuseum;
■ 启用工具支持选择namespace和node节点;
■ 手动模式状态为Failed的集群,删除操作时触发集群卸载脚本;
■ 集群日志终端增加“停止”、“开启”按钮;
■ 格式化显示创建集群的错误信息;
■ 优化集群脚本默认并发数量;
■ 优化日期控件;
■ 优化用户密码、用户邮箱等敏感数据的显示方式;
■ 上传文件控件国际化;
■ 优化工具部署超时时间;
■ 工具卸载时状态重置为“销毁中”;
■ 优化文档、Rest API等页面跳转方式;
■ 优化集群创建时默认网络参数。
BUG修复
■ 修复使用VMware自动模式缩容时重启节点的问题;
■ 修复使用FusionCompute创建主机失败的问题;
■ 修复消息中心中消息删除失败的问题;
■ 修复部分国际化翻译的问题。