高速缓冲器(缓冲器类型)
现代操作系统加载可执行文件后,会创建一个进程,进程中的每条指令和数据都会被分配一个虚拟地址。CPU得到这个虚拟地址后,需要将其翻译成内存的物理地址,才能访问指令和数据。本文主要讨论将虚拟地址转换成物理地址的过程和实践,因此分为两部分。
1.虚拟地址翻译成物理地址的过程?
2.举例练习?
虚拟地址翻译成物理地址的过程?
CPU第一次访问虚拟地址时,虚拟地址所在的虚拟页不在内存中,虚拟页表项(PTE)也不在TLB,所以要执行的步骤很多,如下图所示。
首次访问虚拟地址
1.处理器将虚拟地址(VA)发送给MMU(内存管理单元)
虚拟地址格式
如上图所示,虚拟地址长度为n,虚拟页面偏移量长度为p。
2.MMU获取虚拟地址中的虚拟页号(VPN),然后将虚拟页号发送给TLB(翻译备份缓冲区),TLB根据虚拟页号从TLB映射表中查询PTE(页表项)。
页表条目
3.TLB(翻译后备缓冲器)将查询结果返回给MMU(内存管理单元)
4.MMU(内存管理单元)分析查询结果中是否有PTE(页表项),发现PTE为空,于是MMU根据页表基址寄存器(PTBR)中的页表起始地址加上虚拟页号(VPN)得到虚拟页表项的物理地址PTEA(页表项地址),然后将这个物理地址发送给缓存。
5.缓存(L1)根据PTEA查询内部缓冲区映射表,发现没有找到PTEA映射的内容,即PTE(页表项),然后向内存请求PTEA下的内容。
6.内存将PTEA下的内容PTE发送到缓存(L1),缓存(L1)建立PTEA和PTE的映射关系。
7.Cache (L1)再次根据PTEA查询内部缓冲区映射表,这次找到了,然后将PTE发送给TLB。
8 ~ 9.TLB收到PTE后,建立虚拟页号(VPN)和PTE (8)之间的映射,然后将PTE发送给MMU。
10.MMU收到PTE后,检查PTE的有效位,看虚拟页面是否在内存中。
11.MMU检查PTE后,发现虚拟页不在内存中,于是向CPU发送缺页中断,CPU开始执行缺页中断处理程序。
12.根据页面替换算法,缺页中断处理程序选择一个缓冲的虚拟页面作为牺牲页面(如果这个虚拟页面发生变化,它将被更新到磁盘),并将这个牺牲页面的PTE的有效位设置为0,表示这个牺牲页面已经不在内存中。
13.缺页中断处理程序将缺页从磁盘更改到空的空闲物理内存中,将缺页虚拟页面的PTE有效位设置为1,并更新物理编号。
14.缺页中断处理程序执行后,跳转到发生缺页的指令,然后CPU重新执行指令,重新发送虚拟地址到MMU,跳转到1,开始下一个周期。
当CPU第二次访问同一个虚拟地址时,虚拟地址所在的虚拟页已经在内存中,虚拟页表项(PTE)也在TLB中,所以要执行的步骤就少了很多,如下图所示。
第二次访问虚拟地址
1.处理器将虚拟地址(VA)发送给MMU(内存管理单元)
2.MMU获取虚拟地址中的虚拟页号(VPN),然后将虚拟页号发送给TLB(翻译备份缓冲区),TLB根据虚拟页号从TLB映射表中查询PTE(页表项)。
3.TLB(翻译后备缓冲器)将查询结果返回给MMU(内存管理单元)
4.MMU(内存管理单元)分析查询结果中是否有PTE(页表项),发现PTE有值并命中,然后检查PTE的有效位,发现有效位为1,所以没有缺页。根据虚拟地址中PTE plus (VPO)中的物理号,计算指令或数据的物理地址PA,并将PA发送到cache (L1)
5.缓存(L1)根据PA查询内部缓冲区映射表,发现没有找到PA映射的内容,即指令或数据,然后向内存请求PA下的内容。
6.内存将PA下的内容发送到缓存(L1),缓存(L1)建立PA和内容的映射关系。
7.Cache (L1)根据PA再次查询内部缓冲区映射表,这次找到,然后将代码或指令发送到数据总线。CPU从数据总线收到数据后感叹,终于拿到数据了。
当CPU第三次访问同一个虚拟地址时,与第二次不同是因为虚拟地址对应的物理地址的数据已经映射到缓存(L1)中,所以不再从内存中查询。
好了,把虚拟地址翻译成物理地址的整个过程已经解释完了。我们举个具体的例子来实践一下吧!
举个例子来练习。
最后一部分是将虚拟地址转换成物理地址的过程。现在,在实践中,两个概念TLB和缓存应该在实践之前推广。
TLB
TLB的全称是翻译备份缓冲区,是一个映射表。它建立了虚拟页号(VPN)和页表项(PTE)之间的映射关系。每次访问一个虚拟地址,都需要找到这个虚拟地址对应的页表项。每次在内存中查找都需要几十甚至几百个时钟周期。虽然页表项缓存在缓存中,消耗的周期可以减少到1-2个周期,但是在TLB中缓存后,页表项需要缓存。
那么,虚拟地址如何通过TLB映射页表项(PTE)?让我们先看看TLB。我们说TLB是一张映射表。我们先来看看这个映射表是什么样子的,如下图所示。
如上图所示,一个TLB由m个TLB组组成,每个TLB组有n个条目,每个条目包含PTE和标志位。
标志位是一个数字,每个TLB组的标志位不能重复,所以可以根据这个标志位在一个TLB组中定位一个条目。
每个组都有一个唯一的编号,称为组号。
因此,TLB是一个二维数组,唯一的PTE(页表项)可以通过知道组号和标记位来定位。
虚拟地址中的虚拟页号(VPN)可以分成两部分,即组号和标签位。假设一个长度为N位的虚拟地址,如下图所示
虚拟地址的TLB部分
从上图可以看出,VPN由标签位(TLBT)和组号组成,也称为标签索引(TLBI)。组号占用T位,标签位占用虚拟页号的其余部分。
如果一个TLB有4个组,总共64个条目,每个组有16个条目,那么VPN中的组号占用2位(2的2次方=4),flag位占用4位(2的4次方=16)。
高速缓冲器
缓存通常存储在SRAM(静态随机存取存储器)中,比DRAM(动态随机存取存储器)快几十倍甚至上百倍。因此,为了加快CPU的数据采集速度,最近访问的数据被存储在缓存中。
缓存内部有一个映射表,建立了物理内存地址PA和物理内存地址下内容的映射关系,如下图所示。
高速缓存映射表
如上图所示,映射表分为M组,每组由一个标志位、一个有效位和N个块组成。有效位1表示缓冲区未过期,值0表示缓冲区已过期。
物理地址由组号+标签位+块号组成,如下图所示。
物理地址的组成
从上图可以看出,物理地址是M位,块号占用P位,组号占用T位,剩下的位是标记位占用的位数。
我们可以根据物理地址的组号在映射表中定位一个组,然后看这个组下的有效位是否为1。如果不是1,说明这个组的内容无效,不需要比较,所以不存在缓冲区命中。如果为1,则将该组下的标记位与物理地址中的标记位进行比较。如果不相等,则没有命中。如果相等,继续按照物理地址中的块号去对应的组。
假设一个cache有16个组,每个组有4个块,那么物理地址中组号占用的空是4位(2的4次方等于16),块号占用的位数是2位(2的2次方等于4),剩下的位是tag位占用的位数。
好了,既然概念已经普及了,那就正式从一个例子开始吧。
假设第一
1.内存按字节寻址,每个字是一个字节(32位系统通常是4个字节)。
2.虚拟地址的长度是14位,假设页表有256个页表项,那么虚拟页号(VPN)占用8位,虚拟一偏移(VPO)占用6位。
3.物理地址长12位。
4.页面大小为64字节(P=64)
5.TLB有4个小组,每个小组有4个条目,总共有16个条目。
6.高速缓存(L1)有16个组,每个组有4个块。
7.使用一级页表(多级页表比较复杂,但原理差不多)。
先看一下虚拟地址和物理地址的格式,如下图:
虚拟地址
从上图可以看出,组号(TLBI)占用2位,因为我们假设TLB有4个组,tag位占用6位。
物理地址
从上图可以看出,集合号(CI)占用4位,因为我们假设缓存中有16个集合,每个集合下有4个块,所以块号(CO)占用2位,剩下的6位是标签位(CT)。
假设TLB,缓存映射表如下:
TLB映射表
高速缓存映射表
表中有256项。我们列出了前16项,如下图所示。
表格的前16项
好了,一切准备就绪。假设CPU访问的虚拟地址是0x03d4,其二进制是00000111010100,而虚拟地址只有14位,所以舍弃了高2位,如下图所示。
0x03d4虚拟地址分布图
从上图可以看出,set number (TLBI)为11,即0x03,tag bit (TLBT)为00011,即0x03。从TLB映射表中查找并找到一个匹配项,如下图所示。
击中TLB
在上图中,红色部分的标记位被击中。PTE中PPN=0x0D,有效位为1。然后,我们根据PPN添加虚拟页面偏移量,如下图所示。
虚拟地址
由上图可知,虚拟页偏移量(VPO)为010100=0x14,虚拟页偏移量(VPO)=物理页偏移量(PPO),即PPO = 0x14,PPN与PPO的连接为物理地址PA,即001101010100=0x354,如下图所示
物理地址
从上图可以看出,组号为0101,即0x05,块号(CO)为00,即0x00,标志位为001101,即0x0D。通过组号+标志位+块号,可以定位缓存数据0x36,如下图所示。
物理地址命中数据
对应于物理地址的数据被找到并返回给CPU。当然,也可能出现其他情况,例如TLB未命中、高速缓存未命中、页面未命中等。这些读者可以自己练习。
好了,虚拟地址翻译物理的过程和实践。介绍完了,接下来说下一个话题。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,请发送邮件至 ZLME@xxxxxxxx@hotmail.com 举报,一经查实,立刻删除。