学习笔记丨开源BI工具DataEase的数据处理能力实测

发布于 2022年08月25日

编者注:

本文为知乎博主LBOO的原创文章。

原文链接:

https://zhuanlan.zhihu.com/p/556281830

DataEase是一个号称“人人可用”的开源数据可视化分析工具,支持以拖拉拽的方式组建仪表板,而且有很多美观的图表类型。最近DataEase还发布了官方模板市场,提供了很多场景的大屏模板,实用又好看。

但是我们在进行数据分析的时候重点还是数据,如果数据没有实际价值只是将图做得好看,则是本末倒置的行为。我们在业务系统中获取的数据通常是需要处理才能放在图表中展现的,那么DataEase能够提供哪些数据处理能力呢?这篇文章我就来测验一下,DataEase的数据处理能力到底行不行。

功能使用

一、多表合并

如果你需要将两个数据表的字段合并,联合为一张新表,DataEase提供了可以在界面操作的数据表合并功能,不需要懂SQL,直接在DataEase的界面就可以实现数据表的左右合并。比如这里的两个表:

▲ 表1 各省百强县数量
▲ 表2 2020年至2021年GDP统计

如果我想在同一个表中既显示省份的百强县数量,又显示2020年和2021年GDP值,就需要将两个表关联。此时在DataEase中新建一个关联数据集即可,操作十分简单,直接在页面中勾选要显示的字段并配置关联关系即可:

▲ 图1 编辑关联数据集页面

关联后结果如下:

▲ 图2 关联数据集预览页面

二、数据集计算字段

在上面说到的表中有2021年GDP和2020年GDP两个字段,那么如果我想计算2021年GDP增长率,该如何处理?DataEase提供了一个计算字段功能,可以实现这种需求。

在字段管理界面,点击新建计算字段:

▲ 图3 字段管理页面
▲ 图4 添加计算字段页面
▲ 图5 数据预览页面

当然,你可能更希望增长率以百分比的形式来展示,DataEase同样提供数值格式配置的功能,本文后面也会提到。

三、视图计算字段

如果你需要对数据做分组汇总计算,则需要用到视图计算字段功能,此处以电动车增值服务销售分析表举例,表格式如下:

▲ 图6 数据集字段管理页面

此表中记录了按日期、车型、用户等维度统计的当天销售金额及去年同天的销售金额。下面我们来看一下如何按产品汇总计算销售额增长率:

1. 在仪表板编辑页面中的视图编辑栏中,进入视图字段管理页面;

▲ 图7 打开视图字段管理页面

2. 新建计算字段。在视图计算字段中,你可以使用如AVG、SUM等聚合函数来生成新的字段;

▲ 图8 视图字段管理页面
▲ 图9 视图计算字段添加页面

3. 字段添加完成后,在视图中,将“车型”选项拖入维度框,将“增长率”选项拖入指标框,就可以根据维度实时的分组计算增长率了。

▲ 图10 按照产品分析增长率

四、快速计算同比环比

如果你有按日期计算的数据,想计算分析同比/环比值,DataEase提供了同比/环比快速计算功能,可以在仪表板的视图配置界面中的相关指标中直接配置。

▲ 图11 打开同环比配置界面
▲ 图12 同环比设置页面
▲ 图13 月环比增长率视图

五、数据汇总计算

在仪表板的视图配置区域,可以对指标的汇总方式进行配置,支持求和、平均、最大值、最小值、标准差、方差、计数、去重计数等汇总方式。

▲ 图14 汇总方式配置

六、数值格式

通过数值格式配置,你可以给数据添加数量单位、单位后缀、千分符,配置小数保留位数、百分比等。

▲ 图15 打开数值格式配置模块
▲ 图16 数值格式-数量单位
▲ 图17 数值格式-单位后缀、千分符
▲ 图18 数值格式-小数位数
▲ 图19 数值格式-百分比

总结

总的来看,DataEase开源数据可视化分析平台提供了可直接操作的多表合并功能,支持函数的多字段数据整合处理功能、分组数据处理功能、便捷的同环比计算和数据汇总功能,能够满足企业用户大部分的数据处理需求。DataEase的操作方法也十分简单方便,在使用上述功能时不需要使用SQL语句,实现了它的定位——“人人可用”。