Bochs线程化改进性能测试ppt资料
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
CPU_0 CPU_1 …… CPU_n i_1
…… …… ……
CPU_0 CPU_1
CPU_n i_m
第三页,编辑于星期五:十三点 四十九分。
理论加速比
▪ CPU:n ▪ 加速比=CPU=n
第四页,编辑于星期五:十三点 四十九分。
测试环境
▪ HOST配置:安腾2 1.6G×16,16G内存 ▪ Bochs配置:512ram,ips=20000000 ▪ virtual OS:RH7.2,2.4 kernel
第五页,编辑于星期五:十三点 四十九分。
测试程序
▪ 积分法,多线程计算pi ▪ 主要参数:
num_step 积分步长,越大越精确 num_thread 任务划分数,即采用的线程数 ▪ 每个任务执行num_steps/num_thread次浮点 运算,最后结果累加即可得到pi值 ▪ 性能衡量:整个计算过程的时间花费
Bochs线程化改进 性能测试
第一页,编辑于星期五:十三点 四十九分。
标准版Bochs执行原理
CPU_0 i_1 CPU_0 CPU_0 CPU_0 CPU_0 i_5 CPU_1 i_1
……
CPU_1 i_5
……
CPU_n i_5
第二页,编辑于星期五:十三点 四十九分。
改进版Bochs执行原理
num_step 积分步长,越大越精确 共享资源需要互斥 第九页,编辑于星期五:十三点 四十九分。
积积分分法 法▪,,多多由线线程程计计结算算ppii 果(2),线程化实现的单CPU效率理论
第九页,编辑于星期五:十三点 四十九分。
应低于普通实现,测试成绩更好主要在于限定 由结果(1),改进版Bochs在计算pi这类应用上达到了接近理论的加速比
谢谢观看
第十一页,编辑于星期五:十三点 四十九分。
num_step 积分步长,越大越精确
大,线程版时间缩短明显,说明线程化改进对 这类多线程应用有明显的加速效果
第九页,编辑于星期五:十三点 四十九分。
存在的问题
▪ 系统稳定性 可能导致的原因: 某些指令间需要同步 共享资源需要互斥 各个线程间要预防可能的死锁
第十页,编辑于星期五:十三点 四十九分。
测试结果(2)
CPU=2 Num_thread=1
1169.697 1005.493
改进版 原版
Time cost(s)
9.949 11.693
1000000
109.180116.841
10000000 Num_step
100000000
第八页,编辑于星期五:十三点 四十九分。
结果分析
▪ 由结果(1),改进版Bochs在计算pi这类应用 每个任务执行num_steps/num_thread次浮点运算,最后结果累加即可得到pi值 上达到了接近理论的加速比 性能衡量:整个计算过程的时间花费
标准版Bochs执行原理
的指令间隔数m更大 第七页,编辑于星期五:十三点 四十九分。
改进版Bochs执行原理 标准版Bochs执行原理 Bochs配置:512ram,ips=20000000
▪ 结果(1)和(2)之间对比,原版时间差别不 结果(1)和(2)之间对比,原版时间差别不大,线程版时间缩短明显,说明线程化改进对这类多线程应用有明显的加速效果
第六页,编辑于星期五:十三点 四十九分。
测试结果(1)
CPU=2 Num_thread=2
1084.992
Time cost(s)
540.344
改进版 原版
5.400 10.874
1000000
108.367 54.081
10000000 Num_step
1000十九分。