模板学堂|DataEase协助电商企业开展用户运营

发布于 2023年10月17日

DataEase开源数据可视化分析平台于2022年6月正式发布模板市场(https://dataease.io/templates/)。模板市场旨在为DataEase用户提供专业、美观、拿来即用的仪表板模板,方便用户根据自身的业务需求和使用场景选择对应的仪表板模板,并在优质模板的基础上轻松制作自己的仪表板。目前,DataEase模板市场的模板数量已经超过了100个。

2023年9月上新模板

DataEase模板市场定期进行模板上新。2023年9月共上新6个模板,涉及能源、交通、直播运营、地产运营等主题,欢迎大家在DataEase模板市场下载使用。

1 某城市智慧电力监控平台.png3 新能源汽车工业经济运行情况.png4 视频号助手直播数据大屏.png2 电力检修智慧云平台.png5 小区物业消防巡检状态看板.png6 物业车位管理看板.png

模板技巧

本月的模版技巧和大家分享一下如何使用DataEase开源数据可视化分析工具进行电商行业的用户运营分析。

一、数据来源

数据来源:https://tianchi.aliyun.com/dataset/649 (阿里天池数据集:淘宝用户行为数据)

1. 字段定义

截屏2023-10-17 11.23.22.png2. 用户行为类型定义

截屏2023-10-17 11.23.33.png二、数据清洗

1. 列名的重命名

将获取的原数据导入到数据库中生成数据集时,原数据集中不包含表头。因此需要为列名进行重命名操作。

ALTER TABLE userbehavior CHANGE COLUMN `1` user_id VARCHAR(255);
ALTER TABLE userbehavior CHANGE COLUMN `2268318` item_id VARCHAR(255); 
ALTER TABLE userbehavior CHANGE COLUMN `2520377` cat_id VARCHAR(255); 
ALTER TABLE userbehavior CHANGE COLUMN pv behavior_type VARCHAR(255); 
ALTER TABLE userbehavior CHANGE COLUMN `1511544070` time_stamp VARCHAR(255);

2. 重复值与缺失值检验

导入数据后,需要先检查数据集中是否包含重复值或是否有缺失值。

# 重复值检验 
SELECT * 
FROM userbehavior 
GROUP BY user_id,item_id,cat_id,time_stamp 
HAVING COUNT(*)>1; 
# 缺失值检查 
SELECT   COUNT(user_id) AS 用户数量
         ,COUNT(item_id) AS 商品数量
         ,COUNT(cat_id) AS 商品类目数量
         ,COUNT(behavior_type) AS 用户行为数量
         ,COUNT(time_stamp) AS 时间戳数量
FROM userbehavior;

根据查询结果,数据集中并不包含重复值,也不存在缺失值。

3. 时间戳格式化

需要将原数据集中的时间戳格式转换为日期的时间格式,以便后续分析处理。

# 新增日期列 
ALTER TABLE userbehavior ADD COLUMN `date` VARCHAR(255); 
UPDATE userbehavior SET `date`=FROM_UNIXTIME(time_stamp,'%Y-%m-%d'); 


# 新增时间列 
ALTER TABLE userbehavior ADD COLUMN `time` VARCHAR(255); 
UPDATE userbehavior SET `time`=FROM_UNIXTIME(time_stamp,'%H:%i:%s'); 


# 新增小时列 
ALTER TABLE userbehavior ADD COLUMN `hour` VARCHAR(255); 
UPDATE userbehavior SET `hour`=hour(time);

三、数据分析

1. 用户访问分析

1)数据预处理

将新建的SQL数据集导入DataEase后,在DataEase的数据集“字段管理”页面可以看到各字段均为初始的“文本”类型,需要数据集创建者自行将字段修改为合适的字段类型。如下图所示,将“date”和“time”修改为对应的时间格式,将“user_id”和“item_id”转换为维度。

7 数据预处理.png2)视图设计

在DataEase中新建仪表板。选择刚创建的数据集userbehavior,在仪表板中新建名为“用户访问分析”的组合图。如下图所示,在仪表板制作页面右侧编辑栏的空白框中拖入对应字段并进行修改。

视图中需要展示的指标及其含义为:

UV(Unique Visitor):即独立访客。访问某网站的1台电脑客户端即为1个独立访客;

PV(Page View):即页面浏览量,或点击量。用户每1次对网站中的每个网页访问均被记录1次。

具体操作步骤如下:

① 将字段“data”拖入“类别轴/维度”空白框中,并设置排序为“升序”;

② 将字段“user_id”拖入“主轴值/指标”空白框中,设置汇总方式为“计数”,并将显示名改为“PV”;

③ 将字段“user_id”拖入“副轴值/指标”空白框中,选择汇总方式为“去重计数”,并将显示名改为“UV”;

④ 将字段“date”和字段“hour”按顺序拖入“钻取/维度”空白框中。

8 视图设计.png3)分析结果

9 分析结果.gif配置视图下钻后,点击视图中想要查看的数据点,视图将根据下钻结果跳转至该日期的具体时段数据,以便于观看者查看“UV”和“PV”两项指标的当日数据趋势变化。

从折线图中可以看出:11月25日至12月1日的PV和UV数据波动相对稳定,12月2日至12月3日的PV、UV数据曲线则有明显增幅。其中11月25至26日和12月2至3日均为周末,但11月25、26日和工作日的PV、UV数据相近,而12月2日至3日却有明显增幅。

2. 用户留存分析

1)数据预处理

① 设定自11月25日起新登录的用户为新增用户,查询每位新增用户第一次登录的日期;

# 创建视图,查询用户第一次登录的日期 
CREATE VIEW first_log 
AS 
SELECT user_id,MIN(date) first_logday 
FROM userbehaviorGROUP BY user_id;

数据预览如下:

10 登陆日期.png

② 查询每日新增用户数;

SELECT first_logday,COUNT(user_id) 日新增用户 
FROM first_log 
GROUP BY first_logday 
ORDER BY first_logday;

数据预览如下:

11 每日新增用户数.png③ 创建视图,查询用户登录当天与第一次登录的间隔天数;

# 创建视图,查询用户登录当天与第一次登录间隔天数 
CREATE VIEW day_diffAS 
SELECT a.user_id,b.first_logday, 
DATEDIFF(a.date,first_logday) day_diff 
FROM userbehavior a 
INNER JOIN first_log b 
ON a.user_id=b.user_id 
GROUP BY a.user_id,a.date;

数据预览如下:

12 登录间隔天数.png

④ 在DataEase中新建SQL数据集,查询不同登录日期的用户每日留存统计。

SELECT first_logday, 
SUM(CASE day_diff WHEN 0 THEN 1 ELSE 0 END) day_0, 
SUM(CASE day_diff WHEN 1 THEN 1 ELSE 0 END) day_1, 
SUM(CASE day_diff WHEN 2 THEN 1 ELSE 0 END) day_2, 
SUM(CASE day_diff WHEN 3 THEN 1 ELSE 0 END) day_3, 
SUM(CASE day_diff WHEN 4 THEN 1 ELSE 0 END) day_4, 
SUM(CASE day_diff WHEN 5 THEN 1 ELSE 0 END) day_5, 
SUM(CASE day_diff WHEN 6 THEN 1 ELSE 0 END) day_6, 
SUM(CASE day_diff WHEN 7 THEN 1 ELSE 0 END) day_7, 
SUM(CASE day_diff WHEN 8 THEN 1 ELSE 0 END) day_8 
FROM day_diff 
GROUP BY first_logday 
ORDER BY first_logday;

2)视图设计

在仪表板中新建“明细表”视图,选择刚创建的用户每日留存统计SQL数据集,并按下图所示将各字段拖入“数据列/维度或指标”空白框中。

13 明细表.png3)分析结果

在11月25日至30日之间首日登录的用户,在12月2日之前每日的留存率在50%-80%之间浮动;而在12月2日至3日不同批次的用户留存率均有大幅提升(超过90%),可能是由于平台或店铺推出了促销活动,或者每日打卡积分活动等提升了用户活跃度与留存率。

3. 用户复购分析

1)数据预处理

① 在DataEase中新建SQL数据集,查询用户的购买次数;

# 查询用户的购买次数 
SELECT user_id,COUNT(user_id) AS 购买次数 
FROM userbehavior 
WHERE behavior_type='buy' 
GROUP BY user_id 
ORDER BY 购买次数 DESC;

② 选择“字段管理”→“新建计算字段”,对购买频次做数据映射;

字段名称:用户分层

字段表达式,具体如下图所示:

CASE WHEN [购买次数] >=1 AND [购买次数] <= 4 THEN '1-4' 
WHEN [购买次数] >=5 AND [购买次数] <= 9 THEN '5-9' 
WHEN [购买次数] >=10 AND [购买次数] <= 14 THEN '10-14' 
WHEN [购买次数] >=15 AND [购买次数] <= 19 THEN '15-19' 
WHEN [购买次数] >=20 AND [购买次数] <= 24 THEN '20-24' 
WHEN [购买次数] >=25 AND [购买次数] <= 29 THEN '25-29' 
ELSE '>30' 
END

14 新建计算字段.png数据预览如下:

15 数据预览.png2)视图设计

在仪表板中新建“基础柱状图”视图,选择刚创建的用户购买次数数据集。如下图所示,在“仪表板制作”页面右侧的编辑栏中将对应的字段拖入空白框并做修改。

① 将新建的“用户分层”字段拖入“类别轴/维度”空白框中;

② 将“购买次数”字段拖入“值轴/指标”空白框中,选择汇总方式为“求和”;

③ 将“记录数”字段拖入“值轴/指标”空白框中,选择汇总方式为“计数”,并将显示名修改为“购买人数”。

16 基础柱状图.jpg3)分析结果

有超过66%的用户发生过复购行为,但多数用户复购次数不超过5次,商家在提升用户复购意愿方面仍有进步空间。

4. 用户转化分析

1)视图设计

新建“漏斗图”视图,选择userbehavior数据集。如下图所示,将对应字段拖入到“仪表板制作”页面右侧编辑栏的空白框中。

① 将“behavior_type”字段拖入“漏斗分层/维度”空白框中,并将显示名修改为“行为类型”;

② 将“user_id”字段拖入“漏斗层宽/指标”中,选择汇总方式为“计数”,并将显示名修改为“用户数”。

17 漏斗图.png2)分析结果

从漏斗图中可知,从“点击”到“收藏”的路径中用户流失较多,而“添加购物车”到“购买”的路径中用户流失极少。

总结

随着“社交电商”、“直播电商”等一次次的电商转型升级,电商平台不仅为企业提供了全新的商业模式,也为消费者带来了更为便捷和多样化的购物体验。然而,随着电商市场竞争的日益激烈,“如何更好地进行用户运营,满足用户需求,提升用户忠诚度”,就成为了电商企业亟需解决的关键问题之一。

数据分析与数据可视化作为强有力的工具,为电商企业开展用户运营提供了深入洞察消费者行为、趋势和偏好的途径。通过DataEase开源数据可视化分析工具进行仪表板制作与展示,电商企业可以对用户数据进行更为全面的分析,并且更准确地了解用户的购物习惯、兴趣爱好,甚至是情感态度。这些数据及其可视化视图不仅有助于企业优化产品和服务,更为重要的是,可以帮助电商企业制定精准的用户运营策略,从而更好地吸引、留存和发展用户群体。