Go语言协程（goroutine）的工作原理与调度机制详解

创作时间:

作者:

@小白创作中心

Go语言协程（goroutine）的工作原理与调度机制详解

引用

来源

https://yuanjava.com/gorountins/

Go语言的并发模型主要基于协程（goroutine），与其他编程语言（比如Java）的线程相比，Go协程以其轻量、易用和高效的特点吸引了大量开发者。本文将深入分析goroutine的工作原理及其调度机制。

1. 理解协程（goroutine）

1.1 什么是协程？

协程是协作式的线程，实现并发编程时，通过多任务协作运行。Go中的协程，本质上是一种轻量级的线程，由Go运行时（runtime）进行管理和调度。与操作系统级的线程相比，协程具备以下明显的优势：

创建和销毁的开销更低：Go的协程基于用户态实现，因此其创建和销毁的代价远低于系统线程。
比线程更轻量：协程的栈大小是动态可扩展的，远小于内核线程的初始内存占用，因此Go可以轻松创建成千上万的协程。
调度独立于操作系统的调度机制：协程的调度是由Go runtime完全自主实现的，不依赖于可能更耗时的内核调度系统。

1.2 协程的轻量性分析

每个Go协程的初始栈大小约为2KB（相较于系统线程的1MB左右的栈内存空间），这一大小确保了Go程序可以轻松管理大量的并发任务。例如，在一个高吞吐量的HTTP服务器上，可能需要为每个连接创建一个新的协程，在这种场景下，使用传统的系统线程会导致极大的内存开销和上下文切换成本，而协程则显得尤为轻便。

在程序执行过程中，协程的栈空间会根据需要动态扩展，使用满足需求的更大空间，从而避免程序因栈空间不足而崩溃。同时，当不再需要这么多栈空间时，Go运行时甚至还会释放多余的栈内存，保证使用最小的内存资源。

2. Go调度器：GPM模型

2.1 什么是GPM模型？

为了高效管理和调度Go协程，Go语言运行时引入了GPM模型，其中G、P和M分别代表：

G（Goroutine）：即Go协程，表示一个具体执行的任务。
P（Processor）：表示可执行G的处理器，它维护着一个局部的队列，用来保存准备好执行的G。
M（Machine）：表示系统线程，与操作系统的内核线程一一对应，M负责真正执行G，并与P关联。

整个调度模型的核心目标是让M通过P来执行G。简化来说，P就像是一个调度器，它维护着队列和资源，而M则是与操作系统交互的实体，当M获得一个P后，就可以开始执行其队列中的G。

2.2 GPM模型的工作流程

初始化时，Go运行时会创建M和P。通常，P的数量是通过环境变量GOMAXPROCS控制的，默认值为系统CPU的核心数。
当需要执行新的协程时，Go运行时会将新的G分配到某个P，并像排队一样加入P的任务队列。
然后，P会寻找空闲的M来执行这些G。如果没有多余的M，则可能会创建新的M。
每个M都会获取P中的任务进行执行，如果P中没有足够的可用任务，M也可能尝试从其他P的全局队列或者其他P中“窃取”任务，从而提高任务的利用率。

这种机制下，调度器实现了Work Stealing（任务窃取）模型，可以平衡不同P之间的负载，在高并发场景下高效分配工作。

2.3 调度中的细节

上下文切换

Go的调度器管理着G的协程上下文和执行。在切换上下文的时候，协程有自己的寄存器集和栈，Go通过保存和恢复不同的G来达到调度的目的。相比于操作系统线程的上下文切换，协程之间的切换开销要小得多，因为它们共享同一个OS线程运行，不涉及到用户态和内核态的转换，因此更加高效。

协作式调度与抢占式调度

Go 1.14及之后的版本引入了抢占式调度，但仍然保留了协作式调度的部分特性。在Go 1.14之前，调度器是以协作的方式进行的，即一个G协程需要主动让出CPU时间，其他G才能有机会运行。这种方式的弊端是，如果一个协程长时间运行且没有主动让出CPU，整个程序的并发性就会受到影响。

从Go 1.14开始，Go引入抢占式调度，意味着即使某个协程长时间执行而没有主动退出，Go运行时也可以中断它并切换到其他协程。不过，它的抢占操作主要针对某些特定的点，比如运行栈溢出检查或系统调用等。

全局队列和本地队列

每个P都有一个本地队列，存放一些待执行的G。如果本地队列耗尽，P则从全局队列或者其他P偷窃任务，这是一种平衡负载的手段。此外，全局队列则是一个共享的结构，相较于本地队列，频繁进行全局队列的任务调度会带来更多的锁竞争开销。所以，Go更推荐通过局部P的本地队列来管理任务以提高并发效率。本地队列的大小默认是256。