【快速选择算法】数组分三段快排选择——TopK问题
创作时间:
作者:
@小白创作中心
【快速选择算法】数组分三段快排选择——TopK问题
引用
CSDN
1.
https://blog.csdn.net/2302_79031646/article/details/141647151
TopK问题在算法领域是一个常见的问题,它要求在一组数据中找出最大(或最小)的前K个数。这个问题在搜索引擎、推荐系统和数据分析等领域都有广泛的应用。本文将详细介绍两种常见的解法:堆排序和快速选择排序,并通过示例代码展示如何使用快速选择排序来解决TopK问题。
1.前言
什么是TopK问题?
TopK问题指在一组数据中找出最大(或最小)的前K个数。
常见例子包括
搜索引擎的前K个最相关结果
、
推荐系统的前K个最感兴趣产品
、
数据分析中的前K个高频元素等
。
常见的TopK问题的问法:
- 找出前K个大的数 该问法需要返回数组
- 找出第K个大的数 该问法需要返回一个数字
常见的解法: - 堆排序(更适合k值比较小的时候)
- 快速选择排序(更适合k值比较大的时候)
拓展:堆排序与快速选择排序解决TopK问题的区别
TopK问题可以用快速选择排序解决,同时也可以使用堆排序解决。两种方法在解决TopK问题时各有特点。
快速选择排序解决TopK问题
快速选择排序是基于快速排序的划分思想,但不同于快速排序的递归排序整个数组,快速选择排序只关注包含所求元素的那一部分。具体来说,它通过一次划分将数组分为两部分,其中一部分的所有元素都比另一部分的所有元素小,然后判断第k小的元素位于哪一部分,并继续在该部分进行划分,直到找到第k小的元素为止。这种方法的时间复杂度平均情况下为O(n),但在最坏情况下会退化到O(n^2)。
堆排序解决TopK问题
堆排序解决TopK问题则是通过维护一个大小为K的堆(大顶堆或小顶堆),遍历数组中的每个元素,并与堆顶元素进行比较。如果当前元素满足成为TopK元素的条件(对于最大TopK,即大于堆顶元素;对于最小TopK,即小于堆顶元素),则将其与堆顶元素交换,并重新调整堆。这种方法的时间复杂度为O(nlogk),因为它需要对每个元素执行一次堆操作,而堆操作的时间复杂度为O(logk)。
两者的区别 - 时间复杂度:
快速选择排序在平均情况下时间复杂度为O(n),但在最坏情况下会退化到O(n^2)。
堆排序解决TopK问题的时间复杂度稳定为O(nlogk)。 - 空间复杂度:
快速选择排序通常是原地排序,空间复杂度较低,为O(1)(不考虑递归栈空间)。
堆排序需要额外空间来维护堆结构,空间复杂度为O(k)。 - 稳定性:
快速选择排序是不稳定的排序算法,即相等的元素可能在排序后的序列中改变顺序。
堆排序同样是不稳定的排序算法。 - 适用场景:
快速选择排序在处理大数据集且k值相对较大时可能更有效率,特别是当数据分布较均匀时。
堆排序则更适合处理TopK问题,特别是当k值较小时,因为它可以稳定地以O(nlogk)的时间复杂度找到答案。
综上所述,快速选择排序和堆排序都是解决TopK问题的有效方法,但在具体应用中需要根据数据集的大小、k值的大小以及数据的分布特性来选择合适的方法。
2.题目简介
题目链接:LINK
3.求解思路
如何解决?可以用堆排序也可以用快速选择排序,在本题中我们使用快速选择排序。
4.示例代码
class Solution {
public:
int findKthLargest(vector<int>& nums, int k)
{
//假设k>=nums.size()
srand(time(nullptr));
return qsort(nums, 0, nums.size() - 1, k);
}
int qsort(vector<int>& nums, int begin, int end, int k)
{
if(begin == end) return nums[begin];
//数组分三块
int left = begin - 1, right = end + 1, i = begin;
int key = GetRandom(nums, begin, end);
while(i < right)
{
if(nums[i] < key)
{
swap(nums[i++], nums[++left]);
}
else if(nums[i] == key)
{
i++;
}
else//nums[i] > key
{
swap(nums[i], nums[--right]);
}
}
//分情况讨论
int c = end - right + 1;
int b = (right - 1) - (left + 1) + 1;
int a = end - begin + 1 - c - b;
if(c >= k) return qsort(nums, right, end, k);
else if(b + c >= k) return key;
else return qsort(nums, begin, left, k - b - c);
}
int GetRandom(vector<int>& nums, int begin, int end)
{
int r = rand();
return nums[(r % (end - begin + 1)) + begin];
}
};
EOF
热门推荐
工作、社交、内心:现代人生活平衡实用指南
植物的萌芽:从生物学原理到实践应用
他莫昔芬新突破:从耐药机制到优化治疗
中国中铁Q3财报出炉:营收利润双降,应收账款激增53.5%
学好人工智能学习的课程体系四部曲,想要了解人工智能的朋友收藏
独孤皇后:隋文帝背后的“女帝”
科学应对狐臭:4个日常护理方案帮你摆脱异味困扰
水温23-28度,pH值6.0-7.5:黄金胡子鱼的精准饲养法
脑动脉狭窄治疗迎来新突破!
冬季甲状腺保健:3种养生粥和生活注意事项
辽宁舰中期升级归来,战斗力爆表!
河北涉县黑枣:冬季补气血神器
从主题公园到千年神社:日本十大情侣约会胜地
非布司他怎么吃才最有效?
探秘文化瑰寶,此生必打卡的中國著名博物館
拼豆DIY:打造桌面迷你花园
庐山古迹探秘:白鹿洞与东林大佛
武大团队利用星链信号探测隐身飞机,无源雷达技术获突破
朝霞:一天之始的自然礼赞与文化寓言
二十四岁杜甫作《望岳》:泰山激发的壮志豪情
呼和浩特十大硬菜:烤全羊领衔草原美食精华
日本经济:外需强劲内需疲软,退出负利率难阻颓势
告别手机充电慢:从硬件检查到软件设置
碎银子普洱茶和普洱茶哪个好:区别、味道对比及优劣分析
中国最好的军校有哪些?四大顶尖军校详解
彩虹蔬菜沙拉,让孩子爱上吃蔬菜
应对全球降息:一文读懂最优资产配置方案
成都望江楼:39米高古塔见证蓉城三百年变迁
“仙人指路”选股策略:助你捕捉涨停牛股
动态血压仪使用指南:24小时监测,准确记录血压变化