25-26-2-计算机系统结构-期末

选择题(25题, 每题1分)

  1. 阵列机按照 Flynn 分类法,应属于哪一种类型?( )
  1. 按照“最大并行度”对计算机系统进行分类的方法是?( )
  1. 下列关于动态流水线的说法,正确的是?( )
  1. 已知向量长度为 150,最大向量长度 MVL 为 64,则该向量需要分成几组处理?( )
  1. 用阵列机递归折叠法计算 8 个数的和或积,需要几轮?( )
  1. 下列哪一种互连网络属于静态互连网络?( )
  1. 关于 VLIW 的说法,正确的是?( )
  1. 在动态互连网络中,能够实现全置换且硬件开销最大的是?( )

填空题(20空,每空1分)

  1. 冯·诺伊曼结构计算机包括输入设备,【暂无答案】【暂无答案】【暂无答案】、输出设备。
  2. 定量设计原理包括【暂无答案】【暂无答案】【暂无答案】和CPU性能公式。
  3. 两个或两个以上的事件在同一时刻发生的是【暂无答案】,两个或两个以上的事件在同一时间间隔发生的是【暂无答案】
  4. 用软件的方法在一台现有的机器上实现另一台机器的指令集的是【暂无答案】,用一台现有机器上的微程序去解释实现另一台指令集的是【暂无答案】
  5. 【暂无答案】流水线的输出端任务流出的顺序与输入端任务流入的顺序完全相同。
  6. 交换函数Ck,N=log2(n)C_k, N= \log_2 (n),取反的是二进制编号的【暂无答案】位。

计算题

1. (6分)

某计算机系统在采用浮点乘法加速技术之后,浮点乘法运算速度提升至原来的 20 倍,计算机运行某一程序的整体性能提升至原来的 2 倍。求在采用加速技术之前,浮点乘法运算操作在该程序执行时间中的占比。如果有一种技术可以无限加速浮点乘法运算操作,那么该程序获得的整体加速比是多少?

2. (6分)

某程序有三种指令,指令比例和 CPI 如下图。CPU 频率为 2.5 GHz,程序动态指令条数为 1.2×1061.2 \times 10^6 条。求该程序的平均 CPI、CPU 运行时间,运行时间单位为微秒,并求 MIPS。

占比CPI
40%1
35%2
25%5

3.(6分)

某向量处理机启动存储器、流水部件、寄存器打入和标量寄存器读出各需要两拍。如果向量长度为 20,且小于MVL,指令如下,求最短执行时间。

  • V3V3 \leftarrow 存储器 8拍 (指令 1:从寄存器中读出向量,8 拍)
  • V2V1+5V2 \leftarrow V1 + 5 8拍 (指令 2:向量与标量相加,8 拍)
  • V4V2×V3V4 \leftarrow V2 \times V3 12拍 (指令 3:向量相乘,12 拍)

4.(6分)

某流水线处理器能以 2 GHz 运行五段流水线,即取指、译码、执行、访存和写回。流水线中除执行段外,每段占一个时钟周期。执行段中 ADD 和 SUB 占一个周期,MUL 占 3 个周期,DIV 占 2 个周期。指令如下:

ADD F1, F2, F3
SUB F3, F1, F2
MUL F4, F1, F5
DIV F6, F3, F4
  1. 列出上述代码中的真数据相关部分。
  2. 画出采用数据定向技术的流水线时空图,并求出相应的执行时间。

简答题

1.(6分)

为什么Tomasulo算法可以解决WAW冲突和WAR冲突,但是无法解决RAW冲突?

2.(6分)

有一个五维超立方体网络,起始节点 S=(0,1,1,0,0)S = (0,1,1,0,0),目的节点 D=(1,1,0,1,0)D = (1,1,0,1,0),求两点之间的最短路由路径。

3.(6分)

采用总线监听写作废协议的处理机具有 MSI 三种状态。求下列情况发生时处理机的操作:

  1. CPU 写命中 S 状态块;
  2. S 状态块接收远端 Write Miss。

4.(13分)

假设采用 Tomasulo 算法,单发射,有三个加减保留站 ADD1 到 ADD3,两个乘除保留站 MULT1 到 MULT2,LOAD 指令采用独立 Load Buffer,延迟如下:LOAD 指令占一个周期,ADD、SUB 指令占两个周期,MUL 占10 个周期,DIV 占 20 个周期,写入结果占一个周期。

假设每个周期只能发射一条指令,且操作数就绪后的下一个周期才能开始执行。指令如下:

LD  F2, (R0)
LD  F4, 8(R0)
MUL F10, F2, F4
SUB F8, F4, F2
ADD F6, F2, F8
DIV F12, F10, F4

在某指令结束后,尚未写入结果前,填写下列保留站状态表、指令状态表、寄存器状态表。