问小白 wenxiaobai

资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

关联规则与聚类的关系与区别

创作时间:

作者:

@小白创作中心

关联规则与聚类的关系与区别

引用

CSDN

1.

https://blog.csdn.net/dundunmm/article/details/144471663

关联规则挖掘与聚类算法都是无监督方法，那一起来了解一下这两种算法的关系和区别。

概念

关联规则（Association Rule）：数据挖掘中用于揭示数据项之间关系的技术，通常用于市场篮子分析（Market Basket Analysis）。它的目标是发现不同数据项之间的关联模式，例如“购买面包的人通常会购买牛奶”。

常见模型：

支持度（Support）：某项集合在数据集中出现的频率。
置信度（Confidence）：在一个规则 A→B 中，事件 A 发生时，事件 B 也发生的概率。
提升度（Lift）：衡量 A 与 B是否独立。提升度大于 1 表示 A 和 B 之间有正相关关系。
聚类（Clustering）：一种无监督学习方法，用于将数据划分为不同的组（簇），使得同一组中的数据对象在某种度量上更相似，而不同组之间的数据差异较大。常见的聚类算法包括 K-Means、DBSCAN、层次聚类等。

区别

特性	关联规则	聚类
任务类型	关联分析，寻找数据项间的关系	数据划分，寻找相似性较高的簇
数据要求	通常是离散型事务数据（如购物篮数据）	可处理数值型和类别型数据
算法输入	数据事务（如购物记录、事件组合）	数据点和距离度量
输出结果	条件规则（如 A→B）	数据划分（如 C1,C2,C3）
目标	揭示数据项之间的强关联关系	最大化簇内相似性，最小化簇间差异
监督性	无监督（部分任务可包含规则约束）	无监督

关系

尽管关联规则和聚类的目标和应用场景不同，但两者可以结合使用，以提升数据分析的效果：

结合场景 1：对聚类后的结果应用关联规则
聚类算法将数据划分为若干组（如按顾客购买行为将顾客分为不同的群体），然后对每个簇单独应用关联规则挖掘，揭示每个群体的特征或行为模式。例如：
聚类得到不同客户群体后，使用关联规则挖掘每个群体中的商品组合偏好。
结合场景 2：关联规则指导聚类过程
在某些场景下，关联规则的结果可以为聚类提供特征或指导。例如：
挖掘商品的关联规则后，将商品的组合信息转化为新的特征，再应用聚类算法对顾客进行细分。

具体应用案例

零售分析
关联规则：发现哪些商品经常被一起购买（如面包和牛奶）。
聚类：根据购买行为将顾客分为不同群体（如价格敏感型和品牌忠诚型）。
社交网络分析
关联规则：挖掘用户间的交互模式（如用户 A 关注用户 B，用户 B 常关注用户 C）。
聚类：根据社交关系将用户分组（如兴趣相同的用户分为一类）。
推荐系统
关联规则：推荐与用户购买历史相关的商品（如推荐与最近购买商品相关的配件）。
聚类：根据用户特征（如购买习惯）对用户进行分组，提供群体推荐。

总结

关联规则和聚类虽然在任务目标和技术实现上存在差异，但可以互为补充。聚类侧重于揭示数据的整体结构，关联规则专注于发现细节中的模式。在实际应用中，将两者结合可以更全面地挖掘数据的潜在价值。

热门推荐

智能解决方案应用推动行业转型与创新发展

智能解决方案应用推动行业转型与创新发展

提前还贷，不再是“最好的理财”？

提前还贷，不再是“最好的理财”？

VXLAN、VLAN有何不同?

VXLAN、VLAN有何不同?

揭秘明朝攻打日本本土的计划

揭秘明朝攻打日本本土的计划

2025年全国硕士研究生招生考试统考科目考试大纲汇总

2025年全国硕士研究生招生考试统考科目考试大纲汇总

个人档案的重要性及正确存放方式

个人档案的重要性及正确存放方式

三国时期的薪资考察：古人的“工资”水平如何？

三国时期的薪资考察：古人的“工资”水平如何？

故事创编方案

故事创编方案

红枣泡水可以天天喝吗

红枣泡水可以天天喝吗

公历与农历日历对照表解析及其重要意义

公历与农历日历对照表解析及其重要意义

生产安全事故调查与分析方法

生产安全事故调查与分析方法

Web上如何查行业顶刊

Web上如何查行业顶刊

人工智能技术的演变与未来前景

人工智能技术的演变与未来前景

人工智能的发展简史

人工智能的发展简史

原切？整切？调理？快速区分教你一篇搞定！

原切？整切？调理？快速区分教你一篇搞定！

秋冬大衣穿搭指南：材质选择与搭配技巧

秋冬大衣穿搭指南：材质选择与搭配技巧

肿瘤标志物异常一定是癌？解开肿瘤标志物CA199迷雾

肿瘤标志物异常一定是癌？解开肿瘤标志物CA199迷雾

如何有效利用手机定位功能保障安全与便利生活

如何有效利用手机定位功能保障安全与便利生活

“人工关节”一文详解，涉及这些高分子材料！

“人工关节”一文详解，涉及这些高分子材料！

如何让工作汇报不再平庸？

如何让工作汇报不再平庸？

关联方交易定价原则

关联方交易定价原则

如何查找论文原始数据？

如何查找论文原始数据？

节食减肥的原理

节食减肥的原理

工作演讲项目管理怎么写

工作演讲项目管理怎么写

负债80万后，银行还愿意贷款吗？

负债80万后，银行还愿意贷款吗？

银耳小孩子能不能吃小孩子吃银耳有什么好处

银耳小孩子能不能吃小孩子吃银耳有什么好处

生辰八字怎么算结婚日期

生辰八字怎么算结婚日期

全息智能手环的准确性如何，例如在测量心率等方面？

全息智能手环的准确性如何，例如在测量心率等方面？

能够起诉债权人确认欠款还清吗

能够起诉债权人确认欠款还清吗

招聘流程的实施是如何进行的？

招聘流程的实施是如何进行的？

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号