Elopez

公告

Welcome to my blog!

Learn More

963 字

5 分钟

CSAPP 第六章 - 存储器层次结构

2025-10-23

计算机系统

CSAPP

/

存储器

/

缓存

/

内存

第六章存储器层次结构#

6.1 存储器#

6.1.1 存储器的分类#

6.1.2 随机访问存储器（Random Access Memory，RAM）#

StaticRAM（SRAM）#

DynamicRAM（DRAM）#

6.1.3 只读存储器（Read Only Memory，ROM）#

机械磁盘（Hard Disk Drive, HDD）#

固态硬盘（Solid State Drive，SSD）#

6.1.4 层次性存储结构#

herachy

从上至下：存储速度越来越慢、存储容量越来越大，单位价格越来越低

6.2 局部性#

局部性原理（Principle of Locality）：程序倾向使用最近一段时间，距离其较近地址的指令和数据

时间局部性（Temporal Locality）：当前被访问的信息近期很可能还会被再次访问

空间局部性（Spatial Locality）：在最近的将来将用到的信息很可能在空间地址上是临近的

6.2.1 局部性示例#

1
sum = 0;
2
for (i = 0; i < n; i++)
3
  sum += a[i];
4
return sum;

对数据的引用：

顺序访问数组元素（步长为1的引用模式）——空间局部性

变量sum在每次迭代循环中被引用一次——时间局部性

对指令的引用：

顺序读取指令——空间局部性

重复循环执行for循环体——时间局部性

6.2.2 对局部性的定性评价#

关于数据a，分析下列函数的局部性好坏

代码1：

1
int sum_array_rows(inta[M][N]){
2
  int i, j, sum =0;
3
  for (i = 0; i < M; i++)
4
    for (j = 0; j < N;j++)
5
      sum += a[i][j];
6
  return sum;
7
 }

代码2：

1
int sum_array_cols(inta[M][N]){
2
    int i, j, sum =0;
3
  for (j = 0; j < N; j++)
4
    for (i = 0; i < M;i++)
5
      sum += a[i][j];
6
    return sum;
7
 }

行优先的访问顺序和C语言的行主页的内存布局一致，它有良好的空间局部性

然后，我们继续来看看另外一个例子：

修改循环的顺序，使得它以步长为1的引用模式扫描三维数组a（从而具有良好的局部性）？

1
int sum_array_3d(int a[M][N][P]){
2
  int i, j, k, sum = 0;
3
  for (i = 0; i < M; i++)
4
    for (j = 0; j < N; j++)
5
       for (k = 0; k < P; k++)
6
        sum += a[k][i][j];
7
  return sum;
8
}

结果是显而易见的：

1
int sum_array_3d(int a[M][N][P]) {
2
    int i, j, k, sum = 0;
3
    for (i = 0; i < M; i++)
4
        for (j = 0; j < N; j++)
5
            for (k = 0; k < P; k++)  // P 是最内层维度，连续
6
                sum += a[i][j][k];
7
    return sum;
8
}

6.3 缓存（Cache）#

herachy_2

存储器的基本思想：

对于每个k，位于k层的更快更小存储设备作为位于k + 1层的更大更慢存储设备的缓存

缓存（Cache）的基本概念#

cache

缓存命中：需要的数据块在缓存中找得到，无需访问下层存储器即可获得数据

缓存不命中：

冷（强制型）不命中

当缓存为空时，对任何数据的请求都会不命中，此类命中称为冷不命中

容量不命中

发生在当活跃集合（工作集合working set）的大小比缓存大

简单地说，就是缓存不够大，，装不下要用的所有东西

冲突不命中

根据映射策略，大多数缓存将k + 1层的某个块限制放置在第k层块的一个很小的子集中

缓存够大，但你访问的数据因为映射策略的问题，全都跑到一个小位置上互相冲突

6.4 高速缓存存储器#

高速缓存存储器是小型的、快速的基于SRAM的存储器，是在硬件中集中管理的

cpu

那么就是出现了一个问题：信息从主存流向Cache中，如何进行定位呢？

**地址映射：**CPU访问时，将贮存地址按照某种映射函数关系变成Cache的地址

地址映射的方式：直接映射、组相联映射、全相连映射

直接映射#

组相联映射#

全相联映射#