问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

关联规则与聚类的关系与区别

创作时间:
作者:
@小白创作中心

关联规则与聚类的关系与区别

引用
CSDN
1.
https://blog.csdn.net/dundunmm/article/details/144471663

关联规则挖掘与聚类算法都是无监督方法,那一起来了解一下这两种算法的关系和区别。

概念

  • 关联规则(Association Rule):数据挖掘中用于揭示数据项之间关系的技术,通常用于市场篮子分析(Market Basket Analysis)。它的目标是发现不同数据项之间的关联模式,例如“购买面包的人通常会购买牛奶”。

常见模型

  • 支持度(Support):某项集合在数据集中出现的频率。

  • 置信度(Confidence):在一个规则 A→B 中,事件 A 发生时,事件 B 也发生的概率。

  • 提升度(Lift):衡量 A 与 B是否独立。提升度大于 1 表示 A 和 B 之间有正相关关系。

  • 聚类(Clustering):一种无监督学习方法,用于将数据划分为不同的组(簇),使得同一组中的数据对象在某种度量上更相似,而不同组之间的数据差异较大。常见的聚类算法包括 K-Means、DBSCAN、层次聚类等。

区别

特性
关联规则
聚类
任务类型
关联分析,寻找数据项间的关系
数据划分,寻找相似性较高的簇
数据要求
通常是离散型事务数据(如购物篮数据)
可处理数值型和类别型数据
算法输入
数据事务(如购物记录、事件组合)
数据点和距离度量
输出结果
条件规则(如 A→B)
数据划分(如 C1,C2,C3)
目标
揭示数据项之间的强关联关系
最大化簇内相似性,最小化簇间差异
监督性
无监督(部分任务可包含规则约束)
无监督

关系

尽管关联规则和聚类的目标和应用场景不同,但两者可以结合使用,以提升数据分析的效果:

  • 结合场景 1:对聚类后的结果应用关联规则
    聚类算法将数据划分为若干组(如按顾客购买行为将顾客分为不同的群体),然后对每个簇单独应用关联规则挖掘,揭示每个群体的特征或行为模式。例如:

  • 聚类得到不同客户群体后,使用关联规则挖掘每个群体中的商品组合偏好。

  • 结合场景 2:关联规则指导聚类过程
    在某些场景下,关联规则的结果可以为聚类提供特征或指导。例如:

  • 挖掘商品的关联规则后,将商品的组合信息转化为新的特征,再应用聚类算法对顾客进行细分。

具体应用案例

  • 零售分析

  • 关联规则:发现哪些商品经常被一起购买(如面包和牛奶)。

  • 聚类:根据购买行为将顾客分为不同群体(如价格敏感型和品牌忠诚型)。

  • 社交网络分析

  • 关联规则:挖掘用户间的交互模式(如用户 A 关注用户 B,用户 B 常关注用户 C)。

  • 聚类:根据社交关系将用户分组(如兴趣相同的用户分为一类)。

  • 推荐系统

  • 关联规则:推荐与用户购买历史相关的商品(如推荐与最近购买商品相关的配件)。

  • 聚类:根据用户特征(如购买习惯)对用户进行分组,提供群体推荐。

总结

关联规则和聚类虽然在任务目标和技术实现上存在差异,但可以互为补充。聚类侧重于揭示数据的整体结构,关联规则专注于发现细节中的模式。在实际应用中,将两者结合可以更全面地挖掘数据的潜在价值。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号