仪表板展示丨用DataEase开源工具分析高考录取信息

发布于 2021年08月11日

2021年高考录取正在紧张的开展,陕西考生招生网每天准时准确的发布录取动态,每次发布都牵动着每个考生及家庭成员的心。今年特别关注了陕西省2021年度国家/专项计划录取发布信息,数据量非常庞大,但发布信息仅基于一个网页做了个简单的展示,着实无法快速获取考生及家长重点关注的录取信息,也无法为下一届考生提供参考。

好事的我就在GitHub上找到了DataEase,这是一款开源的数据可视化工具。我们基于DataEase对陕西省国家/地方专项计划的招生录取信息做了汇总展示,方便各位考生及家长参考。

在使用DataEase之前,我们先做个简单的了解。DataEase是开源的数据可视化分析工具,专门帮助用户快速分析数据并洞察业务趋势,从而实现业务的改进与优化。DataEase支持丰富的数据源连接,能够通过拖拉拽方式快速制作图表,并可以方便地与他人分享。

功能方面,DataEase提供了图表展示、图表制作、数据引擎和数据连接四大功能,支持PC端、移动端和大屏的展示,用户使用拖拉拽的方式就可以制作仪表板,支持关系型数据库、Excel文件、Hadoop大数据平台、NoSQL数据库等多种数据源。

基于以上,感觉基本满足本次我做陕西省国家/地方专项计划录取信息分析的要求,果断开干:

第一步:安装部署

总的来说整个安装部署过程是比较简单的,自己在阿里云平台上建了一台Centos 7.5的ECS。按照官网部署指导,快速完成部署,具体参见:

https://dataease.io/docs/installation/online_installation/ 

第二步:数据分析

简单看了下官网文档说明,详见:

https://dataease.io/docs/user_manual/general/ ,依据操作手册,开始了我的高考数据分析,具体的步骤如下。

数据准备

将地方专项计划和国家专项计划两个页面上表格内容复制粘贴下来后,保存在Excel中,数据整理的步骤包括:

1. 两份录取结果合并到一张Excel中,合计6000+行;

2. 考生号转换成数值型,不保留小数;

3. 将录取专业中的地方专项和国家专项(即录取类型)拆分为独立列,方便后续分析使用;

确定数据分析的维度

比较关心的录取结果信息包括:

1. 多少人被国家/地方专项计划录取了?

2. 大家基本都报考的什么专业,男生女生有什么偏好吗?

3. 好学生都集中在哪些地方,被哪些学校录取了?

4. 好学校的最低录取分数大概是多少?

5. ……

数据导入

通过DataEase的数据集将已经准备好的Excel数据直接导入即可。导入过程还是蛮顺利的,导入后即可进行预览。

数据视图的制作

按照分析的内容做了几个数据视图,具体参见下图。

在图表制作过程中,使用到了几个小技巧:

1. 大概使用了六种图表类型;

2. 通过图表标题调整功能定义了自己想要的标题名称;

3. 通过指标显示名称修改了诸多指标名称;

4. 通过插件样式调整了是否展示横轴和纵轴;

5. 通过结果过滤器过滤了不同维度的数据筛选过滤,例如性别等;

6. 通过每个指标的过滤项设置增加了分数展示内容的控制,例如只显示大于630分的成绩等。如果能支持TOP过滤数据展示就更好了,因为数据量很大,不可能全部展示,有TOP就不需要自行进行伪TOP过滤了;

7. 本来想通过柱状图展示出男女生考生的录取数量,发现去掉横轴和纵轴后无法很优雅地展示,希望DataEase后续能够在取出图表所有信息的情况下,将图表自适应至最大,而不是去掉也无法自适应至最大;

8. 设置了图表的背景,默认背景为透明色。这个有点坑,建议改为默认为不透明,不然太费劲了,每次都需要修改调整;

9. 图例设置时选择了不同的图例展示效果,瞬间让我的图表更精致了,这个功能还是得点个赞。

数据仪表板制作

制作仪表板也比较简单,拖拖拽拽,然后总体预设配色,很快就完成了仪表板制作:

1. 首先,创建仪表板,并基于仪表板添加视图、组件和图片文字说明等,拖拖拽拽,调整布局和视图大小;

2. 然后,为了方便考生可以直接在仪表板上通过大学、区县等进行快速过滤,了解重点关心地区、大学的录取情况,添加了过滤条件并且支持多选;

3. 最后,整体配色,我选择了基于仪表板的样式设计,瞬间漂亮的仪表板展现出来了,通过一键分享,所有考生都可以一览高考录取情况。

使用体验

通过这次的尝试,发现DataEase这款开源数据可视化分析工具有很多地方是值得肯定的:

1. 安装部署简单,基本一条命令完全搞定;

2. 平台功能架构简单易懂,各种操作便捷易上手,基本不需要花费什么学习成本;

3. 最后的一键分享更是让我觉得很赞,简单实用,快速提升了我仪表板的价值;

当然,也有一些需要改进的地方。我在这里简单罗列了一下,希望这个项目越做越好,为我们带来更加极致的数据可视化体验:

1. 设置图表背景颜色时默认透明度改为100%;

2. 图表不显示标题、横轴和纵轴、图例等内容时能够统计图表显示内容最大化;

3. 支持更多的预设大屏样式和图表样式;

4. 支持指标和维度显示名称为空;

5. 支持TOP数据过滤展示方式;

6. 优化数据导入后的预览响应速度。