突破计算机性能瓶颈的利器：CPU Cache

创作时间:

作者:

@小白创作中心

突破计算机性能瓶颈的利器：CPU Cache

引用

来源

https://www.cnblogs.com/xiaoniuhululu/p/18628127

在计算机体系结构中，CPU与内存之间的速度差异一直是影响系统性能的关键问题。为了解决这一问题，计算机科学家引入了CPU缓存（Cache）这一关键技术。本文将详细介绍CPU缓存的工作原理、发展历程以及它如何帮助突破计算机性能瓶颈。

计算机性能的瓶颈

在冯诺依曼架构下，计算机存储器是分层次的，存储器的层次结构如下图所示，是一个金字塔形状的东西。从上到下依次是寄存器、缓存、主存(内存)、硬盘等等

离CPU越近的存储器，访问速度越来越快，容量越来越小，每字节的成本也越来越昂贵

比如一个主频为3.0GHZ的CPU，寄存器的速度最快，可以在1个时钟周期内访问，一个时钟周期(CPU中基本时间单位)大约是0.3纳秒，内存访问大约需要120纳秒，固态硬盘访问大约需要50-150微秒，机械硬盘访问大约需要1-10毫秒，最后网络访问最慢，得几十毫秒左右。

这个大家可能对时间不怎么直观，那如果我们把一个时钟周期如果按1秒算的话，那寄存器访问大约是1s，内存访问大约就是6分钟，固态硬盘大约是2-6天，传统硬盘大约是1-12个月，网络访问就得几年了！我们可以发现CPU的速度和内存等存储器的速度，完全不是一个量级上的。

电子计算机刚出来的时候，其实CPU是没有缓存Cache的，那个时候的CPU主频很低，甚至没有内存高，CPU都是直接读写内存的

随着时代的发展，技术的革新，从1980年代开始，差距开始迅速扩大，CPU的速度远远超过内存的速度，在冯诺依曼架构下，CPU访问内存的速度也就成了计算机性能的瓶颈！！！

DRAM为内存颗粒,也叫动态随机存取存储器，图片来源于：How L1 and L2 CPU Caches Work, and Why They're an Essential Part of Modern Chips

为了弥补CPU与内存两者之间的性能差异，也就是要加快CPU访问内存的速度，就引入了

缓存CPU Cache

，缓存的速度仅次于寄存器，充当了CPU与内存之间的中间角色

缓存及其发展历史

缓存CPU Cache

用的是SRAM(Static Random-Access Memory)的芯片，也叫静态随机存储器。其只要有电，数据就可以保持存在，而一旦断电，数据就会丢失。

CPU Cache 如今通常分为大小不等的3级缓存，分别是L1 Cache、L2 Cache和L3 Cache，

部件 CPU访问所需时间备注大小
L1 高速缓存 2~~4 个时钟周期每个 CPU 核心都有一块属于自己的 L1 高速缓存，L1 高速缓存通常分成指令缓存和数据缓存。一般256KB~~1MB
L2 高速缓存 10~~20 个时钟周期 L2 高速缓存同样是每个 CPU 核心都有的一般2~~8MB
L3 高速缓存 20~~60个时钟周期 L3 高速缓存是多个 CPU 核心共用的一般10~~64MB

我们可以发现越靠近 CPU 核心的缓存，其访问速度越快，其大小越来越小，其制造成本也越昂贵，常见的Cache典型分布图如下：

回顾Cache发展历史，我们可以发现Cache其实一开始并不是在CPU的内部，我们这里以intel系列为例

在80286之前，那个时候是没有缓存Cache的，那个时候的CPU主频很低，甚至没有内存高，CPU都是直接读写内存的

从80386开始，这个CPU速度和内存速度不匹配问题已经开始展露，并且差距开始迅速扩大，慢速度的内存成为了计算机的瓶颈，无法充分发挥CPU的性能，为解决这个问题，Intel主板支持

外部Cache

，来配合80386运行