什么是流水线速度计算的速度瓶颈

生产线平衡_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
生产线平衡
上传于||文档简介
&&很​好​的​资​料​哦​ ​分​享​下
阅读已结束,如果下载本文需要使用1下载券
想免费下载本文?
定制HR最喜欢的简历
下载文档到电脑,查找使用更方便
还剩2页未读,继续阅读
定制HR最喜欢的简历
你可能喜欢【图文】流水线的平衡率课程_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
评价文档:
流水线的平衡率课程
上传于||暂无简介
大小:124.97KB
登录百度文库,专享文档复制特权,财富值每天免费拿!
你可能喜欢11.存储器采用单体单字,还是多体交叉并行存储,对系统结构设计应是透明的。 (
12.系列机各档机器不同的数据总线线数,对计算机系统程序员和应用程序员都是不透明的。
13.多数I/O系统的结构应面向操作系统设计,考虑如何在操作系统与I/O系统之间进行合理的软、硬件功能分配。(
14.在存储体系中,地址的映象与地址的变换没有区别。(
15.Cache存储器等效访问速度达不到接近于第一级Cache的,可以增加Cache容量来解决。(
16.只要将子程序进一步细分,就可以使流水线吞吐率进一步提高。(
17.CRAY_1向量机相邻向量指令之间,既无向量寄存器组的使用冲突,又无流水线的功能部件争用,它们可以同时并行。(
18.在集中式共享存储器的阵列处理机构形中,处理单元数N应大于或等于系统存储体体数K,是各个体都能充分忙碌的工作。(
19.在多处理机系统中,两个程序段的变量可以顺序串行x和y之间,为了交换数据,程序段1中有x=y,程序段2中有y=x,则这两个程序段可以顺序串行和交换串行,也可以并行执行,不必采取专门的同步措施。
20.在多处理机上,各个任务的执行时间不同时,在各处理机总的运行时间均衡的前提下,
采用不均匀分配,让各处理机所分配的任务数要么尽量的多,要么尽量的少,这样,才可使总运行时间减少。(
21.软硬功能分配时,提高软件功能的比例会提高系统灵活性,也会提高解题速度。(
22.系列机应用软件应做到向前兼容,力争向下兼容。(
23.在高性能计算机上,信息在存储器中应按整数边界存储,即使会造成存储空间浪费也问
题不大。(
24.中断嵌套时,在处理某级中断中的某个中断请求过程中是不能被同级的其他中断请求所
中断的。(
25.Cache组相联映象的块冲突概率比直接映象的高。(
26.流水线调度是看如何调度各任务进入流水线的时间,使单功能线性流水线有高的吞吐率
和效率。(
27.CRAY_1向量吉相邻向量指令之间,既无向量寄存器组的使用冲突,又无流水线的功能
部件争勇,它们可以同时并行。(
28.0~15共16个处理单元用Cube2单级互联网络连接,第10号处理单元将连至第8号处
理单元。(
29.N个输入、N个输出的立方体log2N级互联网络,在一次运行中,能实现任意一个入端
连到任意一个出端,但不能实现这N个端子任意排列的连接。
30.在多处理机上,各个任务的执行时间不同时,在各处理机总的运行时间均衡的前提下,采用不均匀分配,让各处理机所分配的任务数要么尽量的多,要么尽量的少,这样,才可使总运行时间减少。(
四、简答题(25分)
1. 简要描述计算机系统结构、计算机组成与计算机实现的定义内容。
2. 简要叙述模拟和仿真的异同点。
3. 什么是峰值性能、持续性能?持续性能有哪几种表示方法?
4.实现软件移植的途径有哪些?各受什么制约?
5.什么是流水线的速度瓶颈?消除这种瓶颈的方法有哪两种?
6.在流水线中,什么是全局性相关? 处理全局性相关的方法有哪些? 简要说明。
7.多处理机操作系统有哪三种类型?各适合于哪类机器?
8.CISC和RISC机各有哪些主要特征?
9、简要叙述“阿姆达尔定律”的内容和含义。
10、RISC机在CPU内部设置大量寄存器,并采用窗口重叠技术有什么好处?
11、什么是资源冲突,什么情况下产生?如何解决?
13、提高计算机系统并行性的技术途径有哪三个 ?简要解释并各举一例。
14.、CPU写Cache时,会发生Cache与贮存的对应复本内容不一致的现象,解决这个问题有哪些方法? 各需要增加什么开销?
15.、计算机访存有哪二种局部性规律?什么是存贮器的层次结构?
五、设计与论述题(30分)。
1、 假设Cache存储器的速度是主存储器速度的5倍,程序执行时90%的时间可以访问到
Cache存储器,采用这种Cache存储器后,加速比多大?(8分)
2、某一动态流水线有S1、S2、S3、S4段,其特性有以下的预约表表示,
(1) 确定禁止表F和冲突向量C。(4分)
(2) 画出状态图,确定其最小平均等待时间和最佳调度方案,以及最大吞吐率。(8分)
3、试确定在下列两种计算机系统中计算算术表达式
S=A[1]B[1]+A[2]B[2]+A[3]B[3]+A[4]B[4]的时间
(1) 具有4个PE的SIMD系统
(2) 具有4个处理机的MIMD系统
加法需要2个单位时间。乘法需要4个单位时间。取指令和取数据所需存储器访问时间忽略不计。数据从一个PE到另一个PE的传输时间均为一个单位时间。在SIMD系统中,PE间以线性环形连接,即每个PE与两个相邻的PE相连。在MIMD系统中,每个PE可以直接与其他的PE通信。
4.CRAY_1机启动存储器、流水部件及寄存器写入各需一拍,“加”6拍,“乘”7拍,“访存”6拍。现有向量指令串:
向量长度均为N,计算指令串最短的执行时间。(给出必要的步骤和说明)
(1)三条指令串行执行;
(2)前两条并行执行后,再执行第三条指令;
(3)采用链接技术;
5、某一5段的流水线需经9拍才能完成一个任务,其预约表如下表示,
(3) 确定禁止表F和冲突向量C。
(4) 画出状态图,确定其最小平均等待时间、最大吞吐率及其调度方案。
6、编号分别为0、1、2、…、7的8个处理器之间要求按下列配对通信:
(0、2),(1、3),(4、6),(5、7)。
试选择互联网络类型、控制方式及各级交换开关状态图。
系统结构标准答案(一)
一、1(a), 2(d), 3(d), 4(b), 5(c), 6(x)(1/86 ),7(a), 8(c), 9(c), 10(b), 11(d), 12(b), 13(a), 14(4), 15(c)
16(d), 17(d), 18(b), 19(a), 20(a), 21(b), 22(x) (1-1/168 )), 23(c), 24(a), 25(a), 26(d), 27(d), 28(c), 29(a), 30(a),31(c), 32(c), 33(b), 34(b),35(d), 36(b), 37(b), 38(d), 39(d), 40(a), 41(c), 42(b), 43(c), 44(d), 45(b)
二、1. 模拟,仿真
2. 位片串字并,全并行
3.数据,需求
4.减小,低
5.高速度,低
6.硬,主存
7. HT1+(1-H) T2
9.同时性,并发性
10.派生,汇合
12.指令内部,作业和程序
13.流水线,阵列(并行)
14.带标志符数据表示,数据描述符
15.应用,系统
16.Cache,主存
17. P1 P0 P2
18.推后法,设置相关专用通路
19.平静子程序进一步细分,瓶颈子程序并联多套
20.并行,完全同步
21.同时性,并发性
22.资源重复,资源共享
23. 单指令流、多数据流,多指令流、多数据流
24.范围,精度
25.容量,速度
26.直接,全相联
28.全“0”,全“1”
29.紧密耦合,松散耦合
30.作业,任务
三、1.(对)
1.计算机系统结构是指多级层次结构中传统机器级的结构,它是软件和硬件/固件的主要交界面,是让编制的机器语言程序、汇编语言源程序及高级语言源程序编译生成的机器语言目标程序能在机器上正确运行所看到的计算机属性。
计算机组成,主要指的是机器级内部数据流和控制流的组成及逻辑设计。它主要与计算机操作的并行度、重叠度及部件的共享度等有关,直接影响系统的速度与价格。
计算机实现是计算机组成的武力实现。它着眼于用什么样的器件技术和微组装技术。它也直接影响系统的速度和价格。
2.模拟和仿真能在结构不同的机器之间实现机器语言程序的移植。模拟是用机器语言程序解释另一机器的机器指令实现软件移植的方法。模拟方法在机器指令系统差异比较大时,会使程序运行速度严重下降。仿真是用微程序直接解释另一机器的机器指令实现软件移植的方法。仿真可以提高被移植软件运行速度,但及其结构差异较大时,很难实现。
区别是模拟用机器语言解释,其解释程序在主存中;仿真用微程序解释,其解释程序在控制存储器中。
3.峰值性能是指在理想的状况下计算机系统可获得的最高理论性能值,它不能真实反映系统的实际性能。
持续性能又称实际性能,使计算机系统可获得的平均理论性能值,通常用算术平均、几何平均、和调和平均三种方法表示
4.CISC设计风格的主要特点是:
(1)指令系统复杂;
(2)绝大多数指令需要多个机器周期方可执行完毕;
(3)各种指令都可访问存储器;
(4)采用微程序控制;
(5)有专用寄存器;
(6)难以用优化编译器生成高效的目标代码程序。
RISC机的特点:
(1)简化指令系统;
(2)除了LOAD/STORE指令外,所有指令都在一个时钟周期内执行完毕;
(3)除了LOAD/STORE指令外,其余指令只与寄存器打交道;
(4)绝大部分采用硬联线控制,不用或少用微程序实现;
(5)使用较多的通用寄存器,一般至少有32个,绝没有专用寄存器;
(6)采用优化编译技术,生成高效的目标代码程序。
计算机访存有两种局部性规律:
(1) 时间局部性:如果一个存储项被访问,则可能很快会再次被访问。
(2) 空间局部性:如果一个存储项被访问,则其领近的项也可能很快被访问。 存储器的层次结构是指:构成存储系统有n 种不同的存储器(M1~ M2)之间,增加辅助的软件或硬件,使之从应用程序员角度上看,他们在逻辑上是一个整体。使得存储层次的等效访问速度接近于最高层M1 ,容量接近于最底层Mn ,每位价格也接近于Mn ,典型的层次存储结构如:Cache存储器―〉主存―〉虚拟存储器。
6.实现软件移植的主要途径有:统一高级语言、采用系列机、模拟和仿真等。
统一高级语言:只能实现高级语言软件的移植,目前高级语言种类繁多,无法完全统一成一种。
系列机:由于系列内各档机器的结构变化不能太大,到一定时候会阻碍系列发展。只能实现在结构相同或相近的机器间的汇编语言应用软件的移植。
模拟:用宿主机的机器指令解释,机器语言差别大时,速度慢。
仿真:用宿主机的微程序解释,机器差别大时,仿真难、仿真效率和灵活性差。
7.一个由若干段组成的流水线,在达到稳定状态后所获得的吞吐率与其中延迟最大的那一如何优化流水线提高流水线作业效率
 && 工业生产中扮演着非常重要的角色,产品的质量和生产的效率都是由流水线的优化决定的,因此流水线成为企业不得不关注的话题。下面输送机械设备网小编就为大家讲解下流水线的作用,以及怎样优化流水线:
1、流水线的优化首先是作业时间,和多久放一片板子,这是为满足生产计划量所必须的投入cycle时间。下面是输送机械设备网小编总结的一些输送带速度的公式:
输送带的速度=记号间隔距离/输送带的pitch时间
输送带的pitch时间=整日的上班时间/日产量*(1+不良率)
所谓记号间隔距离,就是在流水线的皮带上所做的记号间的距离,希望流水线作业者依记号流经的速度完成作业并放置在上。但链条线并没有做记号,就以板子的长度当做记号间隔距离。为何要用输送带?除了输送物品外,还有半强制作业者依计划完成作业的功能,但不是一味地加快去试试看,而应依上述公式去计算求得。
2、其次观察流水线上哪一站是瓶颈站:
(1)从该站开始,原本一片接着一片的板子,中间出现了间隔;
 && (2)永远忙个不停的站;
(3)老是将板子往后拉的站。
上面三点是目视就可察觉的,再来就是用秒表量,作业时间是所有站中最长的。
瓶颈站的作业时间就变成了整条流水线实际产出的cycle时间,而日产量公式如下:
日产量=实整日的上班时间/实际cycle时间
故现场干部只要减少其作业时间,就可明显提升产量,如将零件拿一些给别站做、使用治工具以节省动作、改善作业域的配置等等。但在解决瓶颈站后,可能会出现新的瓶颈站,所以又要对此新的瓶颈站进行改善。因此持续盯着瓶颈站改善,整条流水线的效率就会日日提升。
3、观察流水线最后一站收板子的cycle时间,也就是实际产出的cycle时间,这站的cycle时间必相等于瓶颈站。从这站可推算出这条流水线的效率如何,公式如下:
效率=投入cycle时间/实际cycle时间=第一站的作业时间/最后一站的作业时间
当然也可用瓶颈站的作业时间来算,不过观察最后一站总是较简单、实际。
 && 4、稼动率的观察
稼动率=在作业的时间/整日的上班时间
5、流水线作业者坐在位子上并不表示他在认真的工作,所以最后就是观察每一个作业者的作业速度,光从目视很难来比较跟量化,所以在心里建立起一个标准速度,快过它就算动作精简、固定而有节奏地进行,往往有较好的作业速度,反之不佳,如此来观察就比较简单。
 &&&并不是快就是好,其动作必须是有附加价值的,还要看其动作是否简单扼要,所以要求动作经济原则的观念。简单地说,人类手部的动作可分为移动、握取、放开、前置、组立、使用、分解,还有一种心理的精神作用,其中严格来说只有两种动作有附加价值:组立、使用,所以在能满足生产要求的条件下,尽量排除或简化其它的动作。其原则如下:
1、移动:使物料自动到达所要的位置、缩短移动距离、减少需移动物品的重量、移动路径周围避免有东西会妨碍移动、让料盒斜置以缩短绕过边缘的距离等。
2、握取:料盒里的物料尽可能整齐排放,不要杂乱堆积、不方便拿取的东西能先预留握取的空间等。
3、前置:同握取一样,料盒里的物料尽可整齐排放,不要杂乱堆积等。
4、组立:以治工具代替手作业等。
5、使用:使机械全自动化等。
6、精神作用:利用机械取代人为判断、减少作业者目光的移动等。
已投稿到:
以上网友发言只代表其个人观点,不代表新浪网的观点或立场。

我要回帖

更多关于 流水线是什么意思 的文章

 

随机推荐