问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

线程介绍:从诞生背景到多线程编程实践

创作时间:
作者:
@小白创作中心

线程介绍:从诞生背景到多线程编程实践

引用
CSDN
1.
https://m.blog.csdn.net/m0_66491750/article/details/137976142

线程是现代软件系统中一个重要的概念,它与进程一起构成了计算机资源管理的基础。本文将从线程的诞生背景开始,详细解释线程与进程的关系,并通过工厂和工人的类比帮助读者理解这一概念。此外,本文还将介绍多线程编程的基础知识,包括POSIX标准在类UNIX系统中的应用,以及如何编写第一个多线程程序。

1、线程的诞生背景

  • 现代软件系统中,除了进程之外,线程也是一个十分重要的概念。

  • 线程一词于 1967 年左右首次提出,是计算机硬件和软件发展过程中诞生的产物。

  • 一台计算机能利用的资源是有限的,人们想出了很多种提高计算机资源利用率的方法,比如让多个程序同时执行(多进程)。

  • 继多进程编程后,多线程编程是另一种实现程序同时执行的有效方法,特别是随着 CPU 频率的增长速率趋于平缓,开始往多核的方向发展,多线程编程变得越来越重要。

  • 一台计算机所能利用的资源总是有限的,比如 CPU 在 1 秒钟之内最多执行 1 亿条指令,计算机一共有 1GB 的内存空间等等。因此,“如何提高计算机资源的利用率”是人们一直思考的问题,这个问题也一直带动着计算机硬件和软件的发展。

  • 计算机诞生初期,任何操作系统和软件,只能运行机器指令,完成一些简单的数学运算。

  • 受到当时价格因素的制约,计算机并不普及,拥有者主要是政府、大型机构和公司,一台计算机往往由多个用户共同使用。计算机由专人负责操控,如果有用户想让计算机运行一段指令,必须先将指令输入到打孔卡(一种存储设备)中,然后交给计算机管理员,由计算机管理员负责将指令输入到计算机中执行。

  • 随着对计算机资源利用率的要求不断提升,人们逐渐发现,计算机资源的利用率受管理员的影响非常大。例如,计算机每执行完一个任务,都要等待管理员输入下一个任务,期间很多硬件资源(比如 CPU、某些输入输出设备)都处于空闲状态。

  • 为此,人们设计出了批处理操作系统,由它代替计算机管理员完成任务的切换工作。当计算机执行完某一任务时,批处理系统会自动将下一个要执行的任务输入到计算机中,缩减了任务切换所花费的时间,提高了计算机资源的利用率。

  • 渐渐地人们又发现,批处理系统操控计算机执行的过程中,计算机的 CPU 资源仍经常处于空闲状态。当执行中的程序进行 I/O 操作时,CPU 只能等待其 I/O 操作完成后继续工作,这段时间内 CPU 就处于空闲状态。

  • 在批处理系统(又称单道批处理操作系统)的基础上,人们又设计出了功能更强大的多道批处理操作系统。和先前的系统相比,多道批处理系统主要有以下两点优势:

    • 它将计算机的内存分成很多区域,每个区域都可以存储一个程序
    • 当执行的程序执行 I/O 操作时,操作系统会将 CPU 资源分配给其它等待执行的程序
  • 也就是说,多道批处理操作系统可以“同时”执行多个程序,这样的操作系统又称多任务操作系统。

  • 为了使多任务系统更高效地完成计算机资源的分配和回收,便于管理各个程序的执行过程,人们提出了“进程”的概念。

  • 进程指正在执行的应用程序。多任务操作系统可以控制各个进程的执行状态,例如终止某个正在执行的进程,启动某个暂停执行的进程等。操作系统负责为每个进程分配独立的内存空间和其它所需资源(例如 I/O 设备、文件等),进程执行完毕后,操作系统会将进程占用的资源全部回收。

  • 早期的多任务操作系统,以进程为单位管理各个程序的运行以及计算机资源的分配和回收,进一步提高了计算机资源的利用率。但随着计算机硬、软件的发展,人们发现还可以做进一步优化,例如:

    • 操作系统将 CPU 资源从一个进程分配给另一个进程时,开销较大
    • 各个进程占用的内存空间是相互独立的,大大增加了进程间通信的实现难度
    • 一个进程可能会执行多个任务,当某个任务因 I/O 操作暂停执行时,其他任务将无法执行
  • 计算机软、硬件快速发展,人们对计算机运行效率的要求越来越高,“线程”应运而生。

2、线程介绍

  • 一个进程指一个正在执行的应用程序。线程对应的英文名为“thread”,它的功能是执行应用程序中的某个具体任务,比如一段程序、一个函数等。

  • 线程和进程之间的关系,类似于工厂和工人之间的关系,进程好比是工厂,线程就如同工厂中的工人。一个工厂可以容纳多个工人,工厂负责为所有工人提供必要的资源(电力、产品原料、食堂、厕所等),所有工人共享这些资源,每个工人负责完成一项具体的任务,他们相互配合,共同保证整个工厂的平稳运行。

  • 每个进程执行前,操作系统都会为其分配所需的资源,包括要执行的程序代码、数据、内存空间、文件资源等。一个进程至少包含 1 个线程,可以包含多个线程,所有线程共享进程的资源,各个线程也可以拥有属于自己的私有资源。

    • 进程仅负责为各个线程提供所需的资源,真正执行任务的是线程,而不是进程。
    • 代码:即应用程序的代码
    • 数据:包括全局变量、函数内的静态变量、堆空间的数据等
    • 进程空间:操作系统分配给进程的内存空间
    • 打开的文件:各个线程打开的文件资源,也可以为所有线程所共享,例如线程 A 打开的文件允许线程 B 进行读写操作。
  • 各个线程也可以拥有自己的私有资源,包括寄存器中存储的数据、线程执行所需的局部变量(函数参数)等。

3、多线程

  • 多线程:一个进程中拥有多(≥2)个线程,线程之间相互协作、共同执行一个应用程序。

  • 通常将以“多线程”方式编写的程序称为“多线程程序”,将编写多线程程序的过程称为“多线程编程”,将拥有多个线程的进程称为“多线程进程”。

  • 当进程中仅包含 1 个执行程序指令的线程时,该线程又称“主线程”,这样的进程称为“单线程进程”。

  • 如今很多应用程序(软件)都是多线程程序,例如 QQ 具备同时和多人聊天的能力、迅雷具备同时下载多个资源的能力、很多杀毒软件可以同时开启杀毒、清理垃圾、电脑加速等功能。

  • 大多数操作系统都支持同时执行多个程序,包括常见的 Windows、Linux、Mac OS X 操作系统等。为了避免多个程序访问系统资源(包括文件资源、I/O 设备、网络等)时产生冲突,操作系统会将可能产生冲突的系统资源保护起来,阻止应用程序直接访问。如果程序中需要访问被操作系统保护起来的资源,需使用操作系统规定的方法(函数、命令),我们习惯将这些调用方法(函数、命令)称为接口( A pplication P rogramming I nterface,API)。

  • 事实上,无论用哪种编程语言编写多线程程序,最终都要借助操作系统预留的接口实现。

4、POSIX 标准

  • 类 UNIX 系统有很多种版本,包括 Linux、FreeBSD、OpenBSD 等,它们预留的系统调用接口各不相同。但幸运的是,几乎所有的类 UNIX 系统都兼容 POSIX 标准。

  • POSIX( P ortable O perating S ystem I nterface,可移植操作系统接口)最后的字母 X 代指类 UNIX 操作系统。POSIX 标准发布的初衷就是为了统一所有类 UNIX 系统的接口,只要我们编写的程序严格按照 POSIX 标准调用系统接口,它就可以在任何兼容 POSIX 标准的类 UNIX 系统上运行。

    • 很多支持 POSIX 标准的类 UNIX 操作系统并没有从根本上修改自己的 API,它们仅仅通过对现有的 API 进行再封装,生成了一套符合 POSIX 标准的系统接口,进而间接地支持 POSIX 标准。
  • POSIX 标准中规范了与多线程相关的系统接口。在 Linux 系统上编写多线程程序只需在程序中引入<pthread.h>头文件,调用该文件中包含的函数即可实现多线程编程。

  • 注意:pthread.h 头文件中只包含各个函数的声明部分,具体实现位于 libpthread.a 库中。

5、第一个多线程程序

//定义线程要执行的函数,arg 为接收线程传递过来的数据    printf("https://www.yuque.com/it-coach/c_cpp\n");// 定义线程要执行的函数, arg 为接收线程传递过来的数据    pthread_t mythread1, mythread2;    NULL: 不传递给 ThreadFun() 函数任何参数    返回值 res 为 0 表示线程创建成功, 反之则创建失败    res = pthread_create(&mythread1, NULL, Thread1, NULL);    res = pthread_create(&mythread2, NULL, Thread2, NULL);    等待指定线程执行完毕(令主线程等待 mythread1 线程执行完毕后再执行后续的代码)    &thead_result: 接收 ThreadFun() 函数的返回值, 或接收 pthread_exit() 函数指定的值    返回值 res 为 0 表示函数执行成功, 反之则执行失败    res = pthread_join(mythread1, &thread_result);    printf("%s\n", (char*)thread_result);    // 令主线程等待 mythread2 线程执行完毕后在执行后续的代码    res = pthread_join(mythread2, &thread_result);    printf("%s\n", (char*)thread_result);
# 必须包含 "-plthread" 参数, 否则会导致程序链接失败gcc thread.c -o thread.out -lpthreadhttps://www.yuque.com/it-coach/c_cpp
  • 程序中共存在 3 个线程,包括本就存在的主线程以及两个调用 pthread_create() 函数创建的线程(又称子线程),其中名为 mythread1 的线程负责执行 thread1() 函数,名为 mythread2 的线程负责执行 thread2() 函数。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号