Bochs线程化改进性能测试ppt资料

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

CPU_0 CPU_1 …… CPU_n i_1
…… …… ……
CPU_0 CPU_1
CPU_n i_m
第三页，编辑于星期五：十三点四十九分。
理论加速比
▪ CPU：n ▪ 加速比＝CPU＝n
第四页，编辑于星期五：十三点四十九分。
测试环境
▪ HOST配置：安腾2 1.6G×16，16G内存 ▪ Bochs配置：512ram，ips＝20000000 ▪ virtual OS：RH7.2，2.4 kernel
第五页，编辑于星期五：十三点四十九分。
测试程序
▪ 积分法，多线程计算pi ▪ 主要参数：
num_step 积分步长，越大越精确 num_thread 任务划分数，即采用的线程数 ▪ 每个任务执行num_steps/num_thread次浮点运算，最后结果累加即可得到pi值 ▪ 性能衡量：整个计算过程的时间花费
Bochs线程化改进性能测试
第一页，编辑于星期五：十三点四十九分。
标准版Bochs执行原理
CPU_0 i_1 CPU_0 CPU_0 CPU_0 CPU_0 i_5 CPU_1 i_1
……
CPU_1 i_5
……
CPU_n i_5
第二页，编辑于星期五：十三点四十九分。
改进版Bochs执行原理
num_step 积分步长，越大越精确共享资源需要互斥第九页，编辑于星期五：十三点四十九分。
积积分分法法▪，，多多由线线程程计计结算算ppii 果（2），线程化实现的单CPU效率理论
第九页，编辑于星期五：十三点四十九分。
应低于普通实现，测试成绩更好主要在于限定由结果（1），改进版Bochs在计算pi这类应用上达到了接近理论的加速比
谢谢观看
第十一页，编辑于星期五：十三点四十九分。
num_step 积分步长，越大越精确
大，线程版时间缩短明显，说明线程化改进对这类多线程应用有明显的加速效果
第九页，编辑于星期五：十三点四十九分。
存在的问题
▪ 系统稳定性可能导致的原因：某些指令间需要同步共享资源需要互斥各个线程间要预防可能的死锁
第十页，编辑于星期五：十三点四十九分。
测试结果（2）
CPU=2 Num_thread=1
1169.697 1005.493
改进版原版
Time cost(s)
9.949 11.693
1000000
109.180116.841
10000000 Num_step
100000000
第八页，编辑于星期五：十三点四十九分。
结果分析
▪ 由结果（1），改进版Bochs在计算pi这类应用每个任务执行num_steps/num_thread次浮点运算，最后结果累加即可得到pi值上达到了接近理论的加速比性能衡量：整个计算过程的时间花费
标准版Bochs执行原理
的指令间隔数m更大第七页，编辑于星期五：十三点四十九分。
改进版Bochs执行原理标准版Bochs执行原理 Bochs配置：512ram，ips＝20000000
▪ 结果（1）和（2）之间对比，原版时间差别不结果（1）和（2）之间对比，原版时间差别不大，线程版时间缩短明显，说明线程化改进对这类多线程应用有明显的加速效果
第六页，编辑于星期五：十三点四十九分。
测试结果（1）
CPU=2 Num_thread=2
1084.992
Time cost(s)
540.344
改进版原版
5.400 10.874
1000000
108.367 54.081
10000000 Num_step
1000十九分。