数据结构——希尔排序(详解)
数据结构——希尔排序(详解)
希尔排序是插入排序的一种优化版本,通过引入增量序列将数组分割成多个子序列分别进行插入排序,从而提高排序效率。本文将从插入排序的基础知识开始,逐步讲解希尔排序的原理和实现方法。
插入排序
直接插入排序是一种简单的插入排序法,其基本思想是:把待排序的记录按其关键码值的大小逐个插入到一个已经排好序的有序序列中,直到所有的记录插入完为止,得到一个新的有序序列。实际上我们玩扑克的时候就运用了插入排序的思想。
插入排序的特点如下:
- 元素集合越接近有序,直接插入排序算法的时间效率越高
- 时间复杂度:O(N^2)(逆序情况) 最好情况为O(N)(数组比较有序)(为希尔排序提供了思路)
- 空间复杂度:O(1),它是一种稳定的排序算法
- 稳定性:稳定
下面是插入排序的代码实现:
void InsertSort(int* a, int n)
{
for(int i = 0;i<n-1;i++)
{
int end = i;
int tmp = a[end + 1];
while (end>=0)
{
if (a[end] > tmp)
{
a[end + 1] = a[end];
end--;
}
else
{
break;
}
a[end + 1] = tmp;
}
}
}
希尔排序(缩小增量排序)
希尔排序的思想是先选定一个整数,把待排序文件中所有记录分成个组,所有距离为的记录分在同一组内,并对每一组内的记录进行排序。然后,取,重复上述分组和排序的工作。当到达=1时,所有记录在统一组内排好序。
在希尔排序中,我们要引入gap(间隔),我们来画图理解。当gap不为1时,我们可以把它看做为一个预排序,先把数组变成比较有序。然后当gap为1时就是直接插入排序了,因为插入排序对比较有序的数组排列效率更高,所以希尔排序就为先预排序,再直接插入排序。
预排序
在讲希尔排序的代码实现前,我们先来讲预排序。我们先定义一个长度为6的逆序数组{6,5,4,3,2,1}.再来假设gap为3。 我们知道插入排序再排逆序的数组时时间复杂度为最坏的情况。所以我们才要进行预排序。
我们一组一组排
经过预排序后数组,已经变得比较有序了,这对后面的直接插入排序是有好处的,提高效率。
下面是预排序的代码实现:
int gap = 3;
for(int i = 0;i<n-gap;i++)
{
int end = i;
int tmp = a[end + gap];
while (end >= 0)
{
if (a[end] > tmp)
{
a[end + gap] = a[end];
end -= gap;
}
else
{
break;
}
a[end + gap] = tmp;
}
}
希尔排序的代码实现
在现实情况下,我们能知道gap为多少吗?像前面我的只排6个数据,gap=3还是可以的,但是如果我们要排一百万,一千万,一亿甚至更多的数呢?gap又要怎么算呢?我们要知道。gap越小预排序越接近有序,但也排的越慢。gap越大,预排序越不接近有序,但排的越快。但是我们找不到gap应该取多少,所以我们可以让gap等于一个随机的数但要越来越小直到gap=1进行插入排序。
下面是希尔排序的完整代码实现:
void ShellSort(int* a, int n)
{
int gap = n;
// gap > 1时是预排序,目的让他接近有序
// gap == 1是直接插入排序,目的是让他有序
while (gap>1)
{
gap = gap / 3 + 1;//也可以写成gap/2.目的都是为了最后一次gap一定要为1.
for (int i = 0; i < n - gap; i++)
{
int end = i;
int tmp = a[end + gap];
while (end >= 0)
{
if (a[end] > tmp)
{
a[end + gap] = a[end];
end -= gap;
}
else
{
break;
}
a[end + gap] = tmp;
}
}
}
}
希尔排序的特性
希尔排序的特性总结:
- 希尔排序是对直接插入排序的优化。
- 当gap > 1时都是预排序,目的是让数组更接近于有序。当gap == 1时,数组已经接近有序的了,这样就 会很快。这样整体而言,可以达到优化的效果。我们实现后可以进行性能测试的对比。
- 希尔排序的时间复杂度不好计算,因为gap的取值方法很多,导致很难去计算,因此在好些树中给出的 希尔排序的时间复杂度都不固定。下面是严蔚敏老师和殷人昆老师的解释:
《数据结构(C语言版)》— 严蔚敏
《数据结构-用面相对象方法与C++描述》— 殷人昆