虚拟内存

约 2492 个字 6 张图片预计阅读时间 8 分钟

背景

虚拟内存

虚拟内存隔离了用户的逻辑地址和物理地址，多个进程可以同时在内存中执行和高效地创建。虚拟内存可以比物理内存大，因为只有部分程序在内存中，且存在换入换出操作

虚拟内存的其他优点还有：

系统库可以被共享
支持共享空间
进程创建过程中可以采用共享页（COW）机制

局部性原理

局部性原理(Principle of Locality)，指程序在执行中的一个较短时间执行的指令地址和指令的操作数地址，分别局限于一定区域，表现为：

时间局部性：一条指令的一次执行和下次执行，一个数据的一次访问和下次访问都集中在一个较短时期
空间局部性：当前指令和临近的几条指令，当前访问的数据和临近的数据都集中在一个较小区域

内存映射文件

将文件的内容映射到进程地址空间，可以像访问内存一样访问文件内容，而无需显式地进行读写操作，这种技术在处理大文件、提高文件访问性能以及实现进程间通信等方面非常有用。

写时复制

写时复制(Copy on Wirte)是指父子进程可以在创建之初共享物理页，直到需要修改页的内容时才复制页，延迟拷贝可以提高进程创建的效率。这部分在lab5中可选，难度不是很大，具体的操作是：

在fork时子进程的虚拟地址映射到和父进程相同的物理页，需要将页表项的权限改成不可写
当有进程要写这些页时，会触发异常，在中断处理中拷贝问题页
拷贝的新页是可写的，原来的页保持不可写继续被其它进程共享

请求分页

核心思想

只有在需要时才将一页加载到内存中

标志位

页表项中有一位有效位，初始化为invalid，访问到会产生异常，trap到内核态处理。此外，还有一些附加位：

状态位P：用于指示该页是否已经调入内存
访问字段A：用于指示该页在一定时间内被访问的次数，或最近已有多长时间没被访问，用于页置换时参考
修改位M：表示该页在被调入内存后有没有被修改（R/W）
外存地址：用于指示该页在外存上的地址，用于调入页时参考

缺页异常

缺页异常按照如下流程处理：

查找PCB中的段表
如果是无效地址则终止，否则是仅仅不在内存中
获取空物理帧
交换页到帧
重新设置页表
将有效位设为1
重新执行产生错误的指令

进程出现缺页异常时处于什么状态？

阻塞(blocked)，因为是进程主动进入的

但是重新执行指令是存在问题的：

数据的地址有可能改变，因为页的位置改变了
部分执行的指令需要回滚

效率

定义Effective Access Time = (1-p)$\times $memory access + p$\times $(page fault overhead + swap page out + swap page in + restart overhead)，其中p是缺页率

页面置换算法

如果没有空闲物理帧该怎么办？进行页面置换，找到内存中暂时没有使用的页，将它们置换出去。页面置换算法在数据库中学过，目标是尽可能产生少的缺页异常，可以使用dirty bit来减少页面置换的开销，因为只有改过的页需要写回去。

都是很常见的算法，这里不赘述：

FIFO：队列，存在Belady’s Anomaly，帧数越多反而缺页数越多，这是因为帧数增多反而使访问序列满足最差情况
Optimal Algorithm：替换未来最长时间不被使用的页，但是这不可能做到，因为无法预测未来，所以最佳算法只用来比较不同替换算法效率
LRU：替换最久没有使用的页，这是基于局部性原理，性能接近最佳算法，但是由于要记录页面没有使用时间，硬件开销大

LRU

LRU有多种不同实现：

每一页有一个计数器，每次访问页时更新计数器（上次被访问到的时间），需要替换时计算哪一页最久没被访问
栈实现（严格来说不是栈）：使用双向链表，当页被访问时移动到表头，表尾是最久未使用的页
移位寄存器：被访问的页左边最高位置1，定期右移，寄存器值最小的是最久未访问页面

时钟算法

second-change(clock)算法：

需要一个引用位
当页被访问时，引用位置1
循环替换时遍历，如果页的引用位为1，将其置0，并保留在内存中，然后继续尝试下一页，直到找到引用位为0的页替换

增强的时钟算法

增加一个修改位，（引用位，修改位）一共有四种可能状态：

(0, 0) 最佳的替换，因为较久未使用且不需要写回
(0, 1) 不好的替换，因为一定需要写回
(1, 0) 下一轮会被使用
(1, 1) 最糟糕的

淘汰顺序：(0, 0) > (0, 1) > (1, 0) > (1, 1)

当需要置换一个页面时，循环遍历列表：

第一次扫描：寻找最佳候选者(0, 0)，不做任何清零操作
第二次扫描：如果没有找到，则再扫一次，目标是(0, 1)，扫描过程中将引用位清零
如果还是没有，再扫一次，目标是(0, 0)
还没有则直接选择当前页即可

基于计数的算法

需要记录每个页面的引用计数，有两种算法：

LFU 算法：替换引用计数最小的页面
MFU 算法：替换引用计数最大的页面，这是由于考虑到引用计数小的页面有可能是刚交换进内存

页面缓冲算法

页面缓冲会影响缺页率吗？

不会，空闲页面链表是在内存中，该缺页还是缺页，只不过发生缺页后可能可以从空闲页面链表中取得页，从而提升页面置换的效率。

Windows、Linux页面置换基于页面缓冲算法：

用FIFO算法选择被置换页，把被置换的页面放入两个链表之一:
如果页面未被修改，就将其归入到空闲页面链表的末尾
否则将其归入到已修改页面链表。
需要调入新的页面时，将新页面内容读入到空闲页面链表的第一项所指的页面，然后将其从链表中删除
空闲页面和已修改页面，仍停留在内存中一段时间，如果这些页面被再次访问，则这些页面还在内存中。
当已修改页面达到一定数目后，再将它们一起调出到外存，写回后将它们归入空闲页面链表。

页分配

背景

每个进程有自己最少需要的页数，通常是由体系结构决定，有两种主要的分配策略——固定分配和优先级分配。

固定分配

最简单的想法是平分，这个没什么好说的。稍微复杂一点可以按比例分配，通常是按进程的大小（逻辑内存大小）

优先级分配

其实还是按比例分配，不过是按进程的优先级，如果进程发生了缺页，从比它优先级低的进程剥夺一物理页。

全局 VS 局部

全局：物理页是从全局选择，可以剥夺分配给其它进程的物理页，缺陷很明显，被剥夺的进程更可能发生缺页了，导致缺页异常率不可控
局部：每个进程只能从分配给自己的物理页选择，缺点是空闲的物理页不能共享

从定义看的出来局部分配不可能和优先级分配组合

抖动

抖动(Trashing)是指一个进程没有足够的物理页，导致缺页率很高，这会导致：

低CPU利用率
ready queue中的进程减少
OS认为CPU利用率低说明内存中的进程不够多，反而会增加multiprograming程度
另一个进程被加载进内存，加剧了内存紧张

解决方案，需要反过来，减少内存中的进程数：

~~增加物理内存~~
优化页面置换算法
在cpu调度中引入工作集算法
动态调整进程的内存分配
限制并发进程数
内存压缩

工作集模型

定义：

$\Delta $ $\equiv $working-set-window$\equiv $a fixed number of page reference
working set WS
WSSi(working set size of process Pi)$\equiv $total number of pages referenced in the most recent $\Delta $
D$\equiv $$\Sigma $WSSi$\equiv $total demand of frames for all processes in the system
m$\equiv $total available frames

如果$D>m $则认为会发生trhrashing，需要终止一个进程

假设$\Delta $=10, 000，时钟中断每5000个时钟周期触发一次，为每一页在内存中记录两位：

访问到某个页面时，将第一位置1
发生时钟中断时，将记录的两位右移
如果有任意一位为1，说明这一页在工作集中

缺页率机制

为每个进程设置可以接受的缺页率：

如果实际缺页率偏低，则失去页
如果实际缺页率偏高，则获得页