问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

2024双十一数据分析:京东3C家电占比近半,消费升级趋势明显

创作时间:
作者:
@小白创作中心

2024双十一数据分析:京东3C家电占比近半,消费升级趋势明显

引用
CSDN
16
来源
1.
https://blog.csdn.net/Dalao_zzl/article/details/139783639
2.
https://blog.csdn.net/2501_90181610/article/details/145021183
3.
https://www.digitaling.com/articles/1285619.html
4.
https://finance.sina.com.cn/jjxw/2024-11-14/doc-incvzmwk7198163.shtml
5.
https://blog.csdn.net/weixin_47772925/article/details/136334309
6.
https://blog.csdn.net/2401_90031899/article/details/145044794
7.
https://mobile-phone.taobao.com/baike/k/shuangshiyi_38/3d7af316e528977e483d9b7ee360a584.html
8.
https://fddi.fudan.edu.cn/b0/a2/c18985a700578/page.htm
9.
https://www.fxbaogao.com/detail/4515936
10.
67619dee000000000b016149
11.
67627e210000000013009ac9
12.
6775172f000000000b00d900
13.
676131c5000000000b020474
14.
https://www.comadou.com/article/swimring/
15.
http://www.biocloudservice.com/wordpress/?p=50758
16.
https://www.questmobile.com.cn/research/report/1859483339439837185/

双十一购物狂欢节,作为全球最大的在线购物节日,每年都会产生海量的交易数据。这些数据背后隐藏着无数商机和消费者行为的洞察。掌握R语言中的正则表达式技巧,不仅可以高效处理文本数据,还能让你在数据分析中游刃有余。本文将带你一起用R语言玩转双十一的数据分析,挖掘数据背后的故事。

01

数据背景与获取

2024年双十一期间,各大电商平台再次交出了亮眼的成绩单。根据复旦大学消费大数据实验室发布的《2024年“双11”线上消费数据观察》显示,天猫淘宝、京东、抖音、拼多多等平台均实现了两位数以上的增长。其中,京东在3C数码和家电领域的市场份额接近50%,成为消费者购买高价值电子产品的首选渠道。

要进行数据分析,首先需要获取可靠的数据源。双十一期间的交易数据通常包含以下关键信息:

  • 交易时间
  • 商品类别
  • 销售额
  • 用户ID
  • 平台来源

这些数据可以从电商平台的公开API、第三方数据服务提供商或公开报告中获取。例如,复旦大学消费大数据实验室发布的报告就是一个很好的数据来源。

02

数据预处理

在进行数据分析之前,需要对原始数据进行预处理,包括数据清洗、格式转换和缺失值处理等。R语言提供了强大的数据处理功能,可以轻松完成这些任务。

数据加载与查看

首先,我们需要使用read.csv函数加载数据集,并查看数据的基本结构。

# 加载数据集
retail_data <- read.csv("online_retail.csv", stringsAsFactors = FALSE)

# 查看数据前几行
head(retail_data)

数据清洗

在数据清洗阶段,我们需要处理缺失值、异常值以及重复值等问题。对于本数据集,我们发现存在大量的取消订单(Returns)记录,这些记录可能会对分析结果产生干扰,因此需要将其删除。同时,我们还需要删除包含缺失值的记录。

# 删除取消订单记录
retail_data <- retail_data[retail_data$InvoiceNo != "RETURN", ]

# 删除包含缺失值的记录
retail_data <- na.omit(retail_data)

数据转换

为了便于后续分析,我们需要将某些字段从字符串类型转换为日期类型,并计算销售额(数量乘以单价)。

# 转换发票日期字段为日期类型
retail_data$InvoiceDate <- as.Date(retail_data$InvoiceDate, "%Y-%m-%d")

# 计算销售额
retail_data$Sales <- retail_data$Quantity * retail_data$UnitPrice
03

正则表达式的应用

正则表达式是处理文本数据的强大工具,可以帮助我们快速提取和清洗数据。在R语言中,可以使用grepgreplgsub等函数来应用正则表达式。

例如,假设我们需要从商品描述中提取特定关键词,可以使用以下代码:

# 提取包含"智能"的商品
smart_products <- grep("智能", retail_data$Description, value = TRUE)

或者我们需要清理商品描述中的特殊字符:

# 清理商品描述中的特殊字符
retail_data$Description <- gsub("[^A-Za-z0-9]", " ", retail_data$Description)
04

数据分析与可视化

完成数据预处理后,我们可以开始进行数据分析和可视化。R语言的ggplot2包提供了强大的绘图功能,可以帮助我们直观地展示数据特征。

销售额的时间分布

我们可以绘制销售额的时间序列图,观察销售额在不同时间段的分布情况。

library(ggplot2)

ggplot(retail_data, aes(x = InvoiceDate, y = Sales)) +
  geom_line() +
  labs(title = "Sales Over Time", x = "Invoice Date", y = "Sales") +
  theme_minimal()

通过时间序列图,我们可以发现销售额在节假日期间通常会有明显的增长。

不同产品的销售额分析

为了了解不同产品的销售额情况,我们可以按照商品类别对销售额进行分组求和,并绘制条形图进行可视化。

product_sales <- aggregate(Sales ~ StockCode, data = retail_data, FUN = sum)

ggplot(product_sales, aes(x = StockCode, y = Sales)) +
  geom_bar(stat = "identity", fill = "steelblue") +
  labs(title = "Sales by Product", x = "Stock Code", y = "Sales") +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 90, hjust = 1))

通过条形图,我们可以发现少数产品的销售额占据了绝大部分,说明这些产品可能是该零售商的畅销品。

05

用户行为分析

根据达摩盘和阿里妈妈营销研究中心发布的《2024双十一消费人群白皮书》,双十一期间的用户行为呈现出以下特点:

  1. 高阶消费者持续增长:在淘内成交/点击行为均处于较高分层的高阶消费者,为淘系最核心的消费群体。此类高阶消费者在淘内规模仍然持续增长,且人均购买金额、购频、购宽等指标全线上涨。

  2. 流失用户加速回流:365天未购的流失用户在大促期间挽回效率同比提升15%,流失用户回淘购买品类主要集中在家清、洗护、食品、日百等生活必需品类。

  3. 跨类目购买成常态:大促期间,消费者跨类目购买的习惯已经形成,特别是在不同波段中,跨类目购买的比例显著增加。

  4. 消费升级趋势明显:消费者在双十一期间更倾向于购买高价值商品,如AI手机、高端家电等。

06

总结与展望

通过本次双十一数据分析,我们发现:

  1. 双十一期间,各大电商平台均实现了显著增长,其中京东在3C数码和家电领域占据近50%的市场份额。
  2. 高阶消费者持续增长,成为电商平台的核心用户群体。
  3. 流失用户在大促期间有明显的回流趋势,特别是对生活必需品类的购买需求增加。
  4. 消费者在双十一期间更倾向于购买高价值商品,消费升级趋势明显。

对于商家而言,这些发现可以为制定营销策略提供重要参考。例如,加强节假日的促销活动、优化库存管理以提高畅销品的供应能力等。未来,我们还可以进一步探索其他维度的分析,如顾客行为分析、市场竞争分析等,以获取更全面的洞见。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号