问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

数据结构和算法的重要性及复杂度详解

创作时间:
作者:
@小白创作中心

数据结构和算法的重要性及复杂度详解

引用
CSDN
1.
https://blog.csdn.net/m0_74722801/article/details/136862616

数据结构和算法

什么是数据结构?

数据结构(Data Structure)是计算机存储、组织数据的方式,指相互之间存在一种或多种特定关系的数据元素的集合。

数据结构和数据库是有区别的:

  • 数据结构:在内存中管理数据
  • 数据库:在磁盘中管理数据

内存和磁盘的区别(相对而言):

  • 内存带电存储(临时存储),读取速度快
  • 磁盘不带电存储(永久存储),读取速度慢

什么是算法?

算法(Algorithm)就是定义良好的计算过程,它取一个或一组的值为输入,并产生出一个或一组值作为输出。简单来说算法就是一系列的计算步骤,用来将输入数据转化成输出结果。

数据结构和算法的重要性

在校园招聘的笔试中:
当前校园招聘笔试一般采用Online Judge形式, 一般都是20-30道选择题,3-4道编程题。

在校园招聘的面试中:
面试中经常会问到数据结构和算法相关的问题,例如:

  1. 怎么计算一个类到底实例化了多少对象?
  2. 如果还有一个派生类继承了这个类,那么如何计算这两个类,各自实例化了多少对象?
  3. 你了解联合体和结构体吗?
  4. 如何测试一个机器是大端还是小端?
  5. 你了解队列和栈吗?
  6. 怎么用两个栈实现一个队列。
  7. 你使用过模版吗?
  8. 写一个比较两个数大小的模板函数。
  9. 你使用过容器吗?
  10. 判断两个链表是否相交。
  11. Vector和数组的区别。
  12. 你在学校里做的最满意的一个项目是什么?简述一下这个项目。

在未来的工作中:
学好算法对一个程序员来说是必须的吗?如果是,至少应该学到哪种程度?

如何学好数据结构和算法

  1. 死磕代码
  2. 注意画图和思考

时间复杂度和空间复杂度

算法效率

如何衡量一个算法的好坏

如何衡量一个算法的好坏呢?比如对于以下斐波那契数列:

long long Fib(int N)
{
    if (N < 3)
        return 1;
    return Fib(N - 1) + Fib(N - 2);
}

斐波那契数列的递归实现方式非常简洁,但是简洁就一定好吗?那如何衡量其好与坏呢?

算法的复杂度

算法在编写成可执行程序后,运行时需要耗费时间资源和空间(内存)资源,因此衡量一个算法的好坏,一般是从时间和空间两个维度来衡量的,即时间复杂度和空间复杂度

时间复杂度主要衡量一个算法的运行快慢,而空间复杂度主要衡量一个算法运行所需要的额外空间,在计算机发展的早期,计算机的存储容量很小,所以对空间复杂度很是在乎;但是经过计算机行业的快速发展,计算机的存储容量已经达到了很高的程度,所以我们如今已经不需要特别关注一个算法的空间复杂度

时间复杂度

时间复杂度的概念

时间复杂度的定义:在计算机科学中,算法的时间复杂度是一个函数(数学中的函数式),它定量描述了该算法的运行时间,一个算法执行所耗费的时间,从理论上来讲,是不能被算出来的,只有程序在机器上跑起来才能知道,但是上机测试很明显是有限的,所以才有了时间复杂度这个分析方式

一个算法所花费的时间与其中语句的执行次数成正比例,算法中的基本操作的执行次数,为算法的时间复杂度

即:找到某条基本语句与问题规模N之间的数学表达式,就是算出了该算法的时间复杂度

我们举个例子:

void Func1(int N)
{
    int count = 0;
    for (int i = 0; i < N; ++i)
    {
        for (int j = 0; j < N; ++j)
        {
            ++count;
        }
    }
    for (int k = 0; k < 2 * N; ++k)
    {
        ++count;
    }
    int M = 10;
    while (M--)
    {
        ++count;
    }
    printf("%d\n", count);
}

我们画图分析一下

Func1执行的基本操作次数:
F(N)=NN+2N+10

  • N=10 F(N)=130
  • N=100 F(N)=10210
  • N=1000 F(N)=1002010

我们转化一下这个表达式,保留对它影响最大的项,即NN
那这个表达式就变成了
F(N)=N
N

  • N=10 F(N)=100
  • N=100 F(N)=10000
  • N=1000 F(N)=1000000

我们可以看到,N越大,后两项对结果的影响越小
所以时间复杂度为:O(N^2)

大O的渐进表示法

大O符号(Big O notation):是用于描述函数渐进行为的数学符号。

推导大O阶方法:

  1. 用常数1取代运行时间中的所有加法常数
  2. 在修改后的运行次数函数中,只保留最高阶项
  3. 如果最高阶项存在且不是1,则去除与这个项目相乘的常数。得到的结果就是大O阶

使用大O的渐进表示法以后,Func1的时间复杂度为:
O(N^2)

  • N = 10 F(N) = 100
  • N = 100 F(N) = 10000
  • N = 1000 F(N) = 1000000

通过上面我们会发现大O的渐进表示法去掉了那些对结果影响不大的项,简洁明了的表示出了执行次数。

另外有些算法的时间复杂度存在最好、平均和最坏情况:

  • 最坏情况:任意输入规模的最大运行次数(上界)
  • 平均情况:任意输入规模的期望运行次数
  • 最好情况:任意输入规模的最小运行次数(下界)

例如:在一个长度为N数组中搜索一个数据x
最好情况:1次找到
最坏情况:N次找到
平均情况:N/2次找到

在实际中一般情况关注的是算法的最坏运行情况,所以数组中搜索数据时间复杂度为O(N)

空间复杂度

空间复杂度也是一个数学表达式,是对一个算法在运行过程中临时占用存储空间大小的量度 。

空间复杂度不是程序占用了多少bytes的空间,因为这个也没太大意义,所以空间复杂度算的是变量的个数。 空间复杂度计算规则基本跟实践复杂度类似,也使用大O渐进表示法。

注意:函数运行时所需要的栈空间(存储参数、局部变量、一些寄存器信息等)在编译期间已经确定好了,因此空间复杂度主要通过函数在运行时候显式申请的额外空间来确定。

常见时间复杂度

一般算法常见的复杂度如下:

实例1
实例1基本操作执行了2N+10次,通过推导大O阶方法知道,时间复杂度为O(N)

实例2
实例2基本操作执行了M+N次,有两个未知数M和N,时间复杂度为O(N+M)

实例3
实例3基本操作执行了100次,通过推导大O阶方法,时间复杂度为O(1)

实例4
实例4基本操作执行最好1次,最坏N次,时间复杂度一般看最坏,时间复杂度为O(N)

实例5
实例5基本操作执行最好N次,最坏执行了(N*(N+1))/2次,通过推导大O阶方法时间复杂度一般看最坏,时间复杂度为O(N^2)

实例6
实例6基本操作执行最好1次,最坏O(logN)次,时间复杂度为 O(logN)

ps:logN在算法分析中表示是底数为2,对数为N。有些地方会写成lgN。(建议通过折纸查找的方式讲解logN是怎么计算出来的)

二分查找的时间复杂度为 O(log2n),其中n表示元素的数量
这是因为每次查找都可以将待查找区间缩小一半
所以最坏情况下需要进行的比较次数为 log2n --- O(logN)

实例7
实例7通过计算分析发现基本操作递归了N次,时间复杂度为O(N)

实例8
实例8通过计算分析发现基本操作递归了2^N次,时间复杂度为O(2^N)
(建议画图递归栈帧的二叉树讲解)

常见空间复杂度

实例1
实例1使用了常数个额外空间,所以空间复杂度为O(1)

实例2
实例2动态开辟了N个空间,空间复杂度为O(N)

递归空间复杂度计算:也是空间累加,但是不同的是空间可以重复利用

实例3
实例3递归调用了N次,开辟了N个栈帧,每个栈帧使用了常数个空间
空间复杂度为O(N)

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号