基于大数据挖掘分析的客户细分:K-means聚类分析实战
创作时间:
作者:
@小白创作中心
基于大数据挖掘分析的客户细分:K-means聚类分析实战
引用
CSDN
1.
https://blog.csdn.net/caxiou/article/details/137166959
本文将介绍如何使用K-means聚类分析算法对超市客户数据进行细分。通过数据分析和可视化,我们可以更好地理解客户群体的特征和行为模式,为商业决策提供数据支持。
数据分析步骤
- 导入必要的库
- 了解数据
- 数据可视化
- 使用K-means进行聚类分析
数据观察与预处理
引入库
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline
import seaborn as sns
plt.style.use('fivethirtyeight')
from sklearn.cluster import KMeans
import plotly as py
import plotly.graph_objects as go
import warnings
import os
warnings.filterwarnings('ignore')
查看数据
df=pd.read_csv('/home/kesci/input/1564558710/超市数据.csv')
df.head()
数据可视化
查看数据分布
样本数据中的性别比
年龄与年收入之间的关系
年龄与消费得分之间的关系
年龄与消费得分与年收入之间的分布
K-means聚类分析
确定聚类数量
x1=df[['Age','Spending Score (1-100)']].iloc[:,:].values
from sklearn.cluster import KMeans
inertia=[]
for i in range(1,11):
km=KMeans(n_clusters=i,init='k-means++',max_iter=300,n_init=10,random_state=100)
km.fit(x1)
inertia.append(km.inertia_)
plt.figure(1,figsize=(12,6))
plt.plot(range(1,11),inertia)
plt.title('The Elbow Method',fontsize=20)
plt.xlabel('Number of Clusters')
plt.ylabel('inertia')
plt.show()
聚类结果可视化
km = KMeans(n_clusters = 4, init = 'k-means++', max_iter = 300, n_init = 10, random_state = 100)
y_means = km.fit_predict(x1)
plt.figure(1 , figsize = (12 , 6) )
plt.scatter(x1[y_means == 0, 0], x1[y_means == 0, 1], s = 200, c = 'salmon')
plt.scatter(x1[y_means == 1, 0], x1[y_means == 1, 1], s = 200, c = 'yellowgreen')
plt.scatter(x1[y_means == 2, 0], x1[y_means == 2, 1], s = 200, c = 'cornflowerblue')
plt.scatter(x1[y_means == 3, 0], x1[y_means == 3, 1], s = 200, c = 'magenta')
plt.scatter(km.cluster_centers_[:,0], km.cluster_centers_[:, 1], s = 100, c = 'black' , label = 'centeroid')
plt.ylabel('Spending Score (1-100)') , plt.xlabel('Age')
plt.legend()
plt.show()
映射到三维空间上的分布如下:
热门推荐
肠痉挛平时吃什么调理
插花风格大盘点:东西方插花艺术的美学盛宴
暴饮暴食后胃痛呕吐?科学缓解方法全解析
什么是可信网站?如何识别可信网站?
实时数据是什么意思?实时数据监控
道德经中"柔弱胜刚强"的智慧:从班超到郑伯的历史启示

口腔全科包括什么
厦金大桥(厦门段)建设取得重要进展,西锚碇首个沉井成功下沉
新生儿呼吸急促正常吗?
孕期自行测量的血糖值正常范围是多少
糯米鸡—冬季暖身
家庭教育与孩子抗压力与逆境适应的培养
香港交易所优化证券市场股份交收费结构
英伟达业绩超预期但市场有“三问” 黄仁勋称Blackwell需求惊人
如何让团队成员听话的话
核能新用途:X射线偏转技术守护地球免受小行星撞击
彻底搞懂球体体积计算:公式解析及应用实例
盆栽小番茄的种植方法与管理 阳台小番茄栽培时间及技术
英语阅读6大阶段,你家在第几阶段?
做生意该怎么选择项目
湿度是什么意思?湿度的正常范围
痘痘是挤出来好还是不挤好
多介质过滤器冲洗方式及反冲洗维护详解
气色不好皮肤暗沉怎么调理
怎么构建应急能力评估体系架构?
如何进行卫生间的排水系统设计?卫生间排水设计有哪些要点?
流感拭子采样部位和方法
地名趣谈:除了成都和昌都,你还知道哪些带“都”的地名?
无损检测技术:确保安全与质量的隐形守护者
户籍地填写规范与法律效力解析