一种支持多媒体计算的可重构Cache设计方案

合集下载

基于程序段的可重构cache与处理器低能耗算法

基于程序段的可重构cache与处理器低能耗算法

t et t t nc i cm ua o m B . h grh a enrazdi e i —aa zr B m lt g u e u i eta o - p o pttnt e( ) T e o tm hs e l e t m pnl e. ys uan m r s m oh o l h i i l a i b e i nh S y i i n o
能耗 平均节 省 了4 .% , 9 1 而平均性 能损 失为 8 7 。 .% 关键词 :可 重构 高速 缓冲存储 器 ;动 态电压缩放 ; 自适应 算 法;运行程序 段 ;低 能耗
中图分 类号 : P0 T 33
文献标 志码 :A
文章编 号 :10 .65 20lc e u n y n e e yr n i g p o r m p a e, h lo t m s d a sae ma h n rg v r ig c c ea d d — ot e a d co k f q e c .I v r n n — r g a h s t e ag r h u e tt c i ef o en n a h n e a r u i o tr nn a h Ssz ,a ds t n r c s o ’ o a e a d co k fe u n yb a c lt g te r t f h oa f-h p a c s e mi i g c c e’ ie n et g p o e s r Sv h g n lc q e c y c lu ai ai o e ttlo c i c e s i r n h o t
彭蔓蔓 ,李仁发 ,彭 方 ,王宇明
( 南大 学 计 算机 与通信 学 院, 沙 408 ) 湖 长 10 2
摘 要 :运 用可重构 cce和动 态 电压 缩放技 术 , ah 为处理 器及 其 cc e提 出了一种 基 于程 序段 的 自适 应低 能耗 ah

可重构计算技术

可重构计算技术

可重构计算技术是一种新型的计算机技术,它允许用户根据需要重新配置硬件,以适应不同类型的计算任务。

这种灵活性使得在许多领域都具有广泛的应用前景,特别是在人工智能、量子计算、云计算、分布式计算和物联网等领域。

本文主要介绍的基本原理和应用情况。

一、的原理和分类基于可编程的逻辑门电路,允许用户根据需要进行硬件重新配置,以实现不同的计算任务。

它包括各种类型的可编程逻辑器件,如可编程门阵列(FPGA)、场可编程门阵列(CPLD)和数字信号处理器(DSP)等,这些器件具有高度的灵活性和可定制性,使得用户可以根据自己的需求设计和构建各种类型的计算系统。

根据的硬件结构和运行方式,它可以分为三类:基于FPGA的、基于CPLD的和基于DSP的。

FPGA是一种大规模的可编程门阵列,它可以被重新编程以实现不同的逻辑功能。

FPGA有很高的灵活性和可定制性,因此被广泛用于数字信号处理、图像处理、通信等领域。

CPLD是一种中等规模的可编程门阵列,它也可以被重新编程以实现不同的逻辑功能。

CPLD不如FPGA灵活,但它的功耗较低、价格较便宜,因此被广泛用于系统控制、数据采集、网卡等领域。

DSP是一种数字信号处理器,它可以高效地处理数字信号,并实现各种类型的数字信号处理算法。

DSP被广泛应用于语音识别、音频处理、图像处理、雷达信号处理等领域。

二、的应用在人工智能、量子计算、云计算、分布式计算和物联网等领域具有广泛的应用。

1、人工智能人工智能是当前计算机技术的热点之一,在人工智能领域有广泛的应用前景。

可以用于深度学习、计算机视觉、自然语言处理等方面,以实现更高效的人工智能算法。

2、量子计算量子计算是一种新型的计算方式,它基于量子力学的原理,在某些特定的计算任务中具有比传统计算机更高的速度和效率。

可以用于构建量子计算机的控制逻辑和数据路径,以实现更高效的量子计算。

3、云计算云计算是一种基于互联网的分布式计算模式,它可以将计算资源和服务组合起来,以满足用户的需求。

一种低功耗可重构Cache的重构算法

一种低功耗可重构Cache的重构算法

d sg o s an u ce s o r e st. cu e n c i a h n fh i uc s f P lw-o r a h rhtcu e ei c n t it e oi ra eip we n i Be a s .hpc c ei o eo temans re C U, o p we c e c i tr n r d t n n d y o S o o c a e
r t ue .An wa o tm -o -ih u dr L )agr h f c n g rt nigvn T e x e metleuth wt t aenrd cd e grh - lw hg o n a ( HB lo tm reo f uai ie. h pr nars lso a i o li b y i or i o s e i h
Ke r s c c e l w o r r ・ o f u a l ; a c i c u e r - o f u a in a g r h y wo d : a h ; o p we ; e c n g r b e r h t t r ; ec n g r t l o t m ・ i e - i o i
L loi m etr a eo gn l lo tm o efr n c dp we o smp in HB ag r h ib t n t r ia g rh i b t p ro ma ea o rc n u t . t S et h h i a i n h n o
Ab t a t W i ea v n e e io d c o c n l g , t e ei al mp c n c i e i n t a ep we n a e n a e o ea sr c : t t d a c s n s m c n u t r e h o o y h r li a t h p d sg t h o r hh i t s o h t ma g me t s c m h b

低功耗的可重构数据Cache设计

低功耗的可重构数据Cache设计

0 引 言
近 年来 , 嵌入式 系统在便携设备上得 到广泛应用 。对 于
大 多 数 以 电池 作 为 电源 的移 动 设 备 , 着 嵌 入 式 系 统 计 算 性 随 能 的 不 断 提 高 , 耗 也 逐 渐 成 为 设 计 者 考 虑 的重 点 。在 嵌 入 功 式 处理 器 中 , 储 器 已经 成 为最 大 的组 成 部 分 , 成 为 最 主 要 存 也 的 功 耗 来 源 。例 如 SrnAR 中 的 C ce 存 储 器 系 统 占 芯 t g M o ah 和 片 面 积 的 印 %, 耗 的 4 %。而 且 随 着 嵌 入 式 处 理 器 设 计 的 功 3 发 展 , 储 器 所 占 的 比重 也 有 不 断 提 高 的趋 势 。 此 , C ce 存 因 对 ah
Hale Waihona Puke d t einb s do c lya dfe u n au cl v siae .Mie c dMe ib n hsmuainrs l dc t a,t m- aad s ae nl ai q e t lel ai i i e t td g o tn r v o t sn y g b n ha da e c i lt ut i iaet t o n o e sn h
维普资讯
第 2 卷 第 7 8 期
VO128 .
N O. 7
计 算机 工程 与设 计
Co u e n ie r ga d De i n mp trE gn e i n sg n
20 年 4 07 月
Apr 0 7 .2 0
低功耗的可重构数据 C ce ah 设计
Ab ta t Ca h s o o elre n g r r p rini ep we o smp ino e e d dpo es r.A w- o r e o fg rbe sr c: c e mp s g r dl e o ot t o r n u t f mb d e r c sos c a a a r p o nh c o l p we c n u a l o r i

支持多媒体计算的可重构Cache研究与设计的开题报告

支持多媒体计算的可重构Cache研究与设计的开题报告

支持多媒体计算的可重构Cache研究与设计的开题报告一、研究背景随着计算机应用场景的不断扩展,多媒体计算的需求越来越大。

而对于多媒体计算来说,它的特点在于数据量大且复杂,因此需要高效、灵活的计算架构来支持。

而可重构计算架构可以灵活地适应计算需求,支持高效的多媒体计算。

在可重构计算架构中,Cache是一项关键技术,它直接影响系统的性能和电能效率。

因此,研究并设计一种能够支持多媒体计算的可重构Cache,对于提高多媒体计算的性能和效率具有重要的意义。

二、研究内容1.对多媒体计算的需求进行分析,以了解多媒体计算所需的处理能力、内存带宽、存储容量等方面的要求。

2.研究当前可重构Cache的设计和实现方式,探究其存在的问题和不足。

3.基于对多媒体计算和可重构Cache的研究,设计一种支持多媒体计算的可重构Cache的架构,包括Cache的大小、组成、映射策略、替换策略等。

4.实现所设计的可重构Cache的结构并进行仿真验证,验证其支持多媒体计算的效果。

三、研究意义1.提高多媒体计算的性能和效率:所设计的支持多媒体计算的可重构Cache将能够提高多媒体计算的数据处理效率,减少由于高数据量带来的计算延迟,提高多媒体数据的处理完成速度。

2.促进可重构计算技术的发展:可重构Cache是可重构计算系统的一项核心技术,通过对其设计和实现的研究,能够对可重构计算技术进行进一步推进。

3.有助于推动计算机应用场景的拓展:多媒体计算应用已经成为计算机应用的重要组成部分,所设计的支持多媒体计算的可重构Cache具有广泛的应用前景,能够推动电子设备在多媒体方面的应用场景的拓展。

四、研究方法1.资料调研法:对多媒体计算和可重构Cache的相关资料进行深入调研,了解多媒体计算的需求和目前可重构Cache的设计与实现方式。

2.实验仿真法:设计所支持多媒体计算的可重构Cache的结构并进行仿真验证,验证其支持多媒体计算的效果。

3.实际测试法:对所设计的支持多媒体计算的可重构Cache进行实际测试,获得其在实际应用中的性能表现数据,完善其设计。

多核处理器片上可重构Cache系统及其机制设计

多核处理器片上可重构Cache系统及其机制设计

多核处理器片上可重构Cache系统及其机制设计
谢憬;章裕;王琴;毛志刚
【期刊名称】《微电子学与计算机》
【年(卷),期】2016(33)12
【摘要】针对多核处理器规模化数据访存与并行线程交叉数据使用的特性,提出了一种可重构Cache的设计方案,包含其基本硬件逻辑结构和工作机制;同时提出了一种可在线动态重构Cache结构配置字生成的DCAC配置方法。

实验证明,上述设计方案配合在线配置方法工作,能有效实现多核处理器系统根据不同的应用实时地配置共享Cache的组相联度,使得近处理器内核的Cache系统有效提升了命中率,在硬件开销增加4.07%的情况下,缺失代价平均下降约16.13%,从而达到了多核处理器性能优化的目标。

【总页数】5页(P1-5)
【关键词】多核;可重构;Cache;配置;缺失代价
【作者】谢憬;章裕;王琴;毛志刚
【作者单位】上海交通大学电子信息与电气工程学院
【正文语种】中文
【中图分类】TN4
【相关文献】
1.多核处理器片上Cache的选择性复制策略 [J], 郭惠芳;姜鲲鹏;赵荣彩;姚远
2.片上多核处理器共享Cache划分的公平性研究 [J], 方娟;蒲江;张欣
3.片上多核处理器Cache一致性协议优化研究综述 [J], 胡森森;计卫星;王一拙;陈旭;付文飞;石峰
4.片上多核处理器Cache访问均衡性研究 [J], 王子聪; 陈小文; 郭阳
因版权原因,仅展示原文概要,查看原文内容请购买。

多核处理器可重构Cache功耗计算方法的研究

多核处理器可重构Cache功耗计算方法的研究

多核处理器可重构Cache功耗计算方法的研究
方娟;陈欣
【期刊名称】《计算机科学》
【年(卷),期】2014(041)0z1
【摘要】多核动态可重构Cache是解决Cache功耗困扰的一个重要方法.现有Cache功耗模拟器并不能很好地支持多核动态可重构Cache功耗研究,通过对多核动态可重构Cache的功耗模型进行研究,找到了计算可重构Cache的方法和思路,应用CACTI来分别构建各个组成结构的Cache功耗模型,以较为准确地测算可重构Cache的功耗.在Simics模拟器下构建动态可重构Cache,运行测试程序,对比传统的体系结构,可重构Cache的功耗能够得到10.4%的降低.同时,实验中发现功耗的降低不仅仅是动态可重构Cache贡献的,而是由系统综合产生的,因此在低功耗设计中,要综合考虑整体系统的功耗和性能,避免片面地考虑Cache结构而导致整体功耗的提高.
【总页数】4页(P114-117)
【作者】方娟;陈欣
【作者单位】北京工业大学计算机学院北京100124;北京工业大学计算机学院北京100124
【正文语种】中文
【中图分类】TP393
【相关文献】
1.多核处理器共享Cache低功耗可重构方法 [J], 方娟;雷鼎
2.多核处理器面向低功耗的共享Cache划分方案 [J], 熊伟;殷建平;所光;赵志恒
3.WPP-L2:多核处理器中共享Cache低功耗路预测算法 [J], 方娟;郭媚;杜文娟
4.面向低功耗的多核处理器Cache设计方法 [J], 方娟;郭媚;杜文娟;雷鼎
5.多核处理器片上可重构Cache系统及其机制设计 [J], 谢憬;章裕;王琴;毛志刚因版权原因,仅展示原文概要,查看原文内容请购买。

可重构阵列处理器中分布式Cache设计

可重构阵列处理器中分布式Cache设计

可重构阵列处理器中分布式Cache设计
蒋林;刘阳;山蕊;刘鹏;耿玉荣
【期刊名称】《电子技术应用》
【年(卷),期】2018(044)012
【摘要】随着片上集成的处理器核数日益增多,可重构阵列处理器中的“存储墙”问题日益加剧,而传统采用多级共享Cache硬件设计复杂度高,并行访问度有限,难以满足可重构阵列处理器的访存需求.设计了一种本地优先、全局共享的“物理分布、逻辑统一”分布式Cache结构,该结构硬件开销小,并行访问性高.通过Xilinx 公司的Virtex-6系列xc6vlx550T开发板对设计进行测试,实验结果表明,该结构相比于同类结构,平均延迟减少最高达30%,硬件开销仅为Cache容量的5%,最高可提供10.512 GB/s的访存带宽.
【总页数】5页(P9-12,16)
【作者】蒋林;刘阳;山蕊;刘鹏;耿玉荣
【作者单位】西安邮电大学电子工程学院,陕西西安710121;西安邮电大学计算机学院,陕西西安710121;西安邮电大学电子工程学院,陕西西安710121;西安邮电大学电子工程学院,陕西西安710121;西安邮电大学计算机学院,陕西西安710121【正文语种】中文
【中图分类】TP302
【相关文献】
1.一种嵌入式处理器的动态可重构Cache设计 [J], 张毅;汪东升
2.可重构处理器中Mini-Cache的设计 [J], 邬保有;盛超华;柴志雷
3.阵列处理器分布式Cache的局部优先访问结构设计 [J], 刘有耀; 张园; 山蕊
4.可重构视频阵列处理器中全局控制器的设计与实现 [J], 张雪婷;蒋林;邓军勇;吕青;武鑫
5.多核处理器片上可重构Cache系统及其机制设计 [J], 谢憬;章裕;王琴;毛志刚因版权原因,仅展示原文概要,查看原文内容请购买。

低功耗的可重构数据Cache设计

低功耗的可重构数据Cache设计

低功耗的可重构数据Cache设计
肖斌;方亮;柴亦飞;陈章龙;涂时亮
【期刊名称】《计算机工程与设计》
【年(卷),期】2007(28)7
【摘要】在嵌入式处理器中,Cache功耗所占的比重越来越大.提出了一种可重构的低功耗数据Cache,能够利用程序运行过程中的空间和时间局部性以及高频数据值局部性来节省功耗.Mibench和Mediabench的仿真结果表明,对于多媒体应用为主的测试程序,采用基于高频值的可重构低功耗数据Cache与普通Cache相比,平均能量消耗降低34.45%,平均能量延迟乘积降低27.50%.
【总页数】4页(P1508-1510,1707)
【作者】肖斌;方亮;柴亦飞;陈章龙;涂时亮
【作者单位】复旦大学,计算机科学与工程系,上海,200433;复旦大学,计算机科学与工程系,上海,200433;复旦大学,计算机科学与工程系,上海,200433;复旦大学,计算机科学与工程系,上海,200433;复旦大学,计算机科学与工程系,上海,200433
【正文语种】中文
【中图分类】TP333
【相关文献】
1.利用基地址相关的低功耗数据cache设计 [J], 张宇弘;王界兵;严晓浪;汪乐宇
2.一种低功耗可重构Cache的重构算法 [J], 方亮;肖斌;柴亦飞;陈章龙;涂时亮
3.一种低功耗的动态可重构Cache设计 [J], 何勇;肖斌;陈章龙;涂时亮
4.嵌入式系统中低功耗动态可重构Cache的研究 [J], 刘楚;
5.基于Load重用的低功耗数据Cache设计 [J], 李泉泉;薛志远;张铁军;王东辉;侯朝焕
因版权原因,仅展示原文概要,查看原文内容请购买。

多媒体网络文件系统的Cache算法设计与实现

多媒体网络文件系统的Cache算法设计与实现

多媒体网络文件系统的Cache算法设计与实现詹玲;彭海云;万继光【期刊名称】《小型微型计算机系统》【年(卷),期】2009(030)009【摘要】通过分析多媒体文件存储和文件访问的特点,在TCP/IP协议和本地文件系统的基础上,针对多媒体应用设计一种高性能的多媒体网络文件系统MNFS(Multimedla Network File System).MNFS采用目录和文件数据两级Cache组织结构,便于Cache的维护和快速查询;为了提高系统性能,采用顺序优化的Cache预测算法;Cache的替换算法采用常用的LRU(Least Re-cently Used)算法,分别将目录Cache和文件数据Cache组织成不同的LBU链表.在以太网环境下对MNFS性能进行了测试,测试结果表明,MNFS随机读的性能同SMB(Server Message Block Protocol)相接近,而MNFS顺序读的性能要比SMB高10-20%左右.【总页数】4页(P1873-1876)【作者】詹玲;彭海云;万继光【作者单位】华中科技大学计算机学院信息存储系统教育部重点实验室,武汉光电国家实验室,湖北武汉,430074;周口师范学院计算机科学系,河南周口,466000;华中科技大学计算机学院信息存储系统教育部重点实验室,武汉光电国家实验室,湖北武汉,430074【正文语种】中文【中图分类】TP303【相关文献】1.基于内存文件系统的分布式文件服务器Cache系统 [J], 程宏波;伦利;郑宗校2.面向虚拟机环境的Cache动态划分算法设计与实现 [J], 李家文;沈立3.并行文件系统中适度贪婪的Cache预取一体化算法 [J], 卢凯;金士尧;卢锡城4.文件系统备份的流式处理算法设计与实现 [J], 肖克辉;倪德明5.基于Cache算法的多媒体网络文件系统设计 [J], 曾超因版权原因,仅展示原文概要,查看原文内容请购买。

一种嵌入式处理器的动态可重构Cache设计

一种嵌入式处理器的动态可重构Cache设计

一种嵌入式处理器的动态可重构Cache设计张毅;汪东升【期刊名称】《计算机工程与应用》【年(卷),期】2004(040)008【摘要】一般的处理器芯片都有片上高速缓存Cache,它一般是由固定大小的一级Cache(L1)和二级Cache(L2)构成,文章介绍了一种在嵌入式处理器设计中实现的动态可重构Cache.动态可重构Cache的思想最早是罗彻斯特大学(University of Rochester)的学者在他们的一篇关于存储层次的论文[1]中提出的,当时主要是针对高性能的超标量通用处理器.在此嵌入式处理器设计过程中,笔者创造性地继承了这一思想.通过增加少量硬件以及编译器的配合,在嵌入式处理器中L1 Cache和L2 Cache总体大小不变的情况下,L1 Cache和L2Cache的大小可以根据具体的应用程序动态配置.通过时高速缓存的动态配置,不仅可以有效地提高Cache的命中率,还能够有效降低处理器的功耗.【总页数】4页(P94-96,232)【作者】张毅;汪东升【作者单位】清华大学计算机科学与工程系,北京,100084;清华大学计算机科学与工程系,北京,100084【正文语种】中文【中图分类】TP3【相关文献】1.一种嵌入式处理器Cache的可在线配置和低功耗设计 [J], 刘坤杰;孟建熠;严晓浪;葛海通2.一种低功耗动态可重构cache方案 [J], 赵欢;苏小昆;李仁发3.一种低功耗动态可重构cache算法的研究 [J], 任小西;刘清4.一种低功耗的动态可重构Cache设计 [J], 何勇;肖斌;陈章龙;涂时亮5.嵌入式处理器中降低Cache缺失代价设计方法研究 [J], 黄海林;许彤;范东睿;唐志敏因版权原因,仅展示原文概要,查看原文内容请购买。

一种低功耗动态可重构cache方案

一种低功耗动态可重构cache方案

一种低功耗动态可重构cache方案
赵欢;苏小昆;李仁发
【期刊名称】《计算机应用》
【年(卷),期】2009(029)005
【摘要】嵌入式系统中,处理器功耗是十分受关注的,研究表明嵌入式系统中cache 存储器的功耗占处理器总功耗的30%~60%.为此提出一种低功耗动态可重构的cache方案Tournament cache,该cache方案通过在传统cache结构的基础上增加三个计数器和一个寄存器,在程序运行的过程中,根据计数器统计的结果动态调整cache的相联度,使得相联度在1、2或4路之间变化,以适应不同程序段的需要,从而降低系统的功耗.实验结果表明,此cache方案对比传统的四路组相联的cache能耗节省超过40%,而且性能的降低几乎可以忽略.
【总页数】4页(P1446-1448,1451)
【作者】赵欢;苏小昆;李仁发
【作者单位】湖南大学,计算机与通信学院,长沙,410082;湖南大学,计算机与通信学院,长沙,410082;湖南大学,计算机与通信学院,长沙,410082
【正文语种】中文
【中图分类】TP302
【相关文献】
1.一种低功耗动态可重构cache算法的研究 [J], 任小西;刘清
2.一种低功耗的动态可重构Cache设计 [J], 何勇;肖斌;陈章龙;涂时亮
3.嵌入式系统中低功耗动态可重构Cache的研究 [J], 刘楚;
4.一种改进的记录缓冲低功耗指令cache方案 [J], 马志强;季振洲;胡铭曾
5.用于低功耗的动态可重构cache结构 [J], 陈黎明;邹雪城;雷鑑铭;刘政林
因版权原因,仅展示原文概要,查看原文内容请购买。

基于程序段的可重构cache与处理器低能耗算法

基于程序段的可重构cache与处理器低能耗算法

基于程序段的可重构cache与处理器低能耗算法彭蔓蔓;李仁发;彭方;王宇明【期刊名称】《计算机应用研究》【年(卷),期】2008(25)9【摘要】运用可重构cache和动态电压缩放技术,为处理器及其cache提出了一种基于程序段的自适应低能耗算法PBLEA(phase-based low energy algorithm).该算法使用建立在指令工作集签名基础上的程序段监测状态机来判断程序段是否发生变化,并作出cache容量及CPU电压和频率的调整决定.在程序段内,使用容量调整状态机和通过计算频率缩放因子β来先后对cache容量及CPU电压和频率进行调整.在Sim-panalyzer模拟器上完成了该算法的实现.通过对MiBench测试程序集的测试表明:与传统的cache和CPU相比较,该算法使系统能耗平均节省了49.1%,而平均性能损失为8.7%.【总页数】5页(P2692-2696)【作者】彭蔓蔓;李仁发;彭方;王宇明【作者单位】湖南大学,计算机与通信学院,长沙,410082;湖南大学,计算机与通信学院,长沙,410082;湖南大学,计算机与通信学院,长沙,410082;湖南大学,计算机与通信学院,长沙,410082【正文语种】中文【中图分类】TP303【相关文献】1.基于多核处理器的低能耗任务调度优化算法 [J], 刘亚秋;陈雨佳;景维鹏;王鹍2.基于多核处理器的K线程低能耗的任务调度优化算法 [J], 王科特;王力生;廖新考3.多核处理器可重构Cache功耗计算方法的研究 [J], 方娟;陈欣4.可重构阵列处理器中分布式Cache设计 [J], 蒋林;刘阳;山蕊;刘鹏;耿玉荣5.多核处理器片上可重构Cache系统及其机制设计 [J], 谢憬;章裕;王琴;毛志刚因版权原因,仅展示原文概要,查看原文内容请购买。

基于Tournament Caching的低功耗动态可重构Cache研究的开题报告

基于Tournament Caching的低功耗动态可重构Cache研究的开题报告

基于Tournament Caching的低功耗动态可重构Cache研究的开题报告一、研究背景及意义随着嵌入式系统的普及和终端设备的多样化,电池寿命的延长成为了一个重要的问题。

在这种情况下,低功耗计算成为更为关键的问题之一。

Cache是计算机系统中最常用的存储单元之一,而Cache的使用对系统的功耗影响很大。

因此,开发低功耗的Cache对于设计低功耗嵌入式系统非常重要。

在嵌入式系统中,Cache存在着数据局部性的特征,即在相邻时间内访问的地址空间可能会存在重叠。

为了利用这一特征,Tournament Caching技术被提出,通过利用Cache元素之间的相似性以提高Cache 访问命中率,减少系统的能耗。

Tournament Caching技术是一种基于相似度的Cache管理策略,可以应用于现代处理器中,在嵌入式系统中应用广泛。

另一方面,动态可重构技术的不断发展,使得系统能够自适应地根据应用程序进行配置,以优化系统资源的利用率并提高系统的性能和效率。

而这一技术也能被应用于Cache设计中,可以根据应用程序的需求动态地修改Cache结构和存储方式,以实现更好的性能和功耗平衡。

因此,本研究旨在探索基于Tournament Caching的低功耗动态可重构Cache设计,结合处理器架构和应用程序需求进行优化,以最大限度地提高Cache访问命中率并降低系统的功耗。

二、研究方法本研究将采用如下研究方法:1. 研究基于Tournament Caching的Cache管理策略,分析其对于系统能耗的影响。

2. 研究动态可重构技术在Cache设计中的应用,分析其对Cache性能和功耗的影响。

3. 结合处理器架构和应用程序需求进行系统模拟和仿真,验证基于Tournament Caching的低功耗动态可重构Cache设计的有效性和可行性。

4. 分析实验结果和系统模拟数据,从系统能耗和性能两个方面评估Cache设计的优劣,提出改进方案并进行优化。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一种支持多媒体计算的可重构Cache 设计方案舒 晰,李小坚,李仁发湖南大学计算机与通信学院,长沙(410082)E-mail:shuxi1982@摘要:多媒体是一种将音频、视频、图像集成到同一数字环境中,以协调表示丰富复杂信息的技术。

随着消费类嵌入式设备以及通信技术的不断发展,多媒体技术已经成为一个研究的热点。

本文针对多媒体应用程序中数据块内具有较高的空间局部性的特点,在体系结构上提出了一种行可重构的D-Cache 设计方案。

MediaBench 基准测试结果表明,该方案能有效的降低D-Cache 失效率,达到高性能低功耗的要求。

关键词:多媒体,可重构Cache ,高性能,低功耗中图分类号:TP3021. 引言多媒体技术是指通过计算机将文本、图形、声音、动画等多种媒体综合起来,结合通信技术,使多种信息建立逻辑连接,并能对它们进行获取、压缩、加工、存储,形成一个具有交互性的系统。

随着芯片集成度与通信技术的不断进步,多媒体的应用已从PC 扩展到各种嵌入式设备,从简单的文字和图片浏览发展到在线电影、视频会议。

消费者不仅关心多媒体应用程序的流畅度等性能指标,同时也关心耗电量等功耗指标。

为了加快多媒体信息的处理速度,许多公司在CPU 芯片中专门扩展了多媒体功能。

目前,多媒体技术已经成为计算机研究的一个重要领域。

在计算机存储层次结构中,Cache 作为处理器与主存之间的桥梁,其作用至关重要。

Cache 利用程序的时间局部性和空间局部性,通过从主存中移入部分数据,极大的缩短了CPU 的访存时间,弥补了CPU 和主存不断增大的速度差距。

另一方面,Cache 占据了大量的芯片面积,也带来了较大的能耗。

例如:片内cache 分别占用了Alpha 21264和Strong ARM 微处理器面积的30%和60%,它们的功耗分别占整个芯片功耗的16%和43%[1]。

因此,针对多媒体应用程序的特点,设计一种高性能低功耗的Cache 结构,具有非常强的现实意义。

与其他程序相比,多媒体应用程序处理的数据类型较多,如视频、音频、图片,并且输入数据量大。

处理器需要对这些数据进行压缩、解码等多种操作,计算量较大。

因此,一些学者认为现有Cache 的基本结构和策略不能适应多媒体程序的需要[2][3]。

Zhiyong Xu 等[4]对此持不同意见。

他们通过量化比较MediaBench 中的多媒体程序与SPEC2000中的传统程序在存储器中的各项性能指标后指出,多媒体程序通常具有一种数据分块策略,分割后的数据块具有良好的可重用性,传统Cache 的基本结构和规则仍然有效。

这一结论给后来的Cache 优化提供了良好的理论前提。

国内外许多研究人员均提出了多媒体应用下Cache 的优化方案。

Wen Shuhong 等人[5]针对多媒体程序数据量大的特点,提出了一种低功耗的优化结构。

他们将Cache 分为三个部分:指令循环缓冲、指令Cache 和scratchpad memory 数据缓存,并且采用由一条程序总线和多条数据总线构成的多总线方式。

数据通过DMA 的方式直接进入scratchpad memory 供处理器使针对多媒体程序中数据复用性较强的特点,提出了一种高频值压缩存取方案,以压缩编码的形式替代高频数据存储在Cache 中,从而减少高频值的Cache 失效率,降低系统功耗。

Ju-Hyun Kim 等人[7]为优化H.264/A VC 解码程序中运动补偿的数据访问,提出了两种新的Cache 结构。

一种称为索引分离直接映射Cache ,它将主存中的一页映射到Cache 中的连续两行;另一种称为循环Cache(Circular Cache),它不是存入一个完整的Cache 行数据,而是仅仅取得其需要访问的部分。

这两种结构可以降低对存储带宽的需求,提高系统性能。

目前提出的这些Cache 优化方案,在一定程度上可以改善多媒体程序的性能和功耗,但它们也存在一定的缺憾。

有的与传统Cache 相比,结构变化过大,需要重新进行硬件设计和验证;有的仅针对某种多媒体程序进行局部调整,应用范围有限。

因此,需要根据多媒体程序的整体特点,设计一种适用范围较广,结构变化相对较小的Cache 结构,以满足多媒体发展的需要。

2. 可重构数据Cache 设计方案2.1 多媒体程序的特点分析多媒体应用通常是对图片、声音、动画等进行获取、压缩、加工、存储等操作,其数据处理量大。

但这些程序通常会采用某种策略先将数据分块,然后对每一小块进行循环处理。

以JPEG 图片格式的压缩程序为例,第一步是将图片从常规的RGB 模式转换为亮度/色度模式,然后将整个图片的数据按8*8的像素进行分块。

对每一个分块先后进行离散余弦变换、量化矩阵转换、Z 型对角线矩阵转换以及熵编码等操作,最后得到压缩后的图片。

从这个例子可以看出,多媒体程序是按块对数据进行操作,在某一时间段内,块内数据具有很好的空间局部性。

若Cache 行的大小与应用程序中块的大小相当(一次失效替换能正好获取整个块),则能大大提高预取数据的效率,降低失效次数;若Cache 行明显小于块大小,则容易造成失效次数增多,频繁访问主存;若Cache 行明显大于块大小,则会获取一部分无效数据,浪费Cache 空间,降低主存带宽的利用率。

2468101214cjpeg djpeg Mpeg2enc Mpeg2dec Epic Unepic mipmap texgenC a c h e 失效率(%)图1 不同行大小Cache 在MediaBench 测试程序中的失效率2.2 行可重构Cache的基本思想行是Cache存取数据的基本单元,分为标识(tag)和数据(data)两个部分。

若从存储结构上对行进行重构,硬件开销过大,且重构会带来的较大的性能损失。

因此,本文重构的行大小是指Cache失效后,从主存中预取的数据大小。

这里把存储数据的行称为基本行(base-line),把可重构的行称为置换行(replace-line)。

置换行的大小为一个或多个基本行。

将基本行设为32Byte,置换行有三种模式:小(32Byte)、中(64Byte)、大(128Byte)。

小模式是按基本行大小进行Cache失效替换;其他模式则是将失效的数据块以及主存中的邻近块一起置换进入Cache。

主存中的块与Cache基本行大小相同,为32Byte。

由于Cache采用直接映射的方式,因此主存中的邻近块在Cache中的位置也相邻。

邻近块与直接访问的失效块在主存地址上是对齐的,例如,直接访问块的地址为1001(最后四位),在中模式下,其邻近块地址为1000;在大模式下,其邻近块地址为1000、1010、1011。

为了动态改变置换行大小,特别加入一个行重构状态机。

在一定的时间间隔内,每次Cache访存时,会根据访问行及其邻近行的历史访问记录,统计相关数据。

当时间间隔结束时,通过这些统计量与相应阀值的比较,激发某些特定条件,从而引起状态机发生变化,实现置换行的自适应重构。

2.3 邻近行的历史访问统计与行重构状态机如图2所示,主存中地址对齐的四块为一个相邻区,相邻区内的数据块互为邻近块,邻近块的地址除最低两位外,其余均相同。

因此,邻近块在映射的Cache行中具有相同的标识(tag)。

地址后两位相同的块成为一个子列(sub-array),主存中的每个子列对应于Cache中的一个子列(sub-array)。

Cache中相邻的四个基本行组成一个相邻组,相邻组中的基本行互为邻近行,每个相邻组由访存地址中的索引(Index)唯一标识。

主存中的相邻区根据地址映射到Cache 中唯一的相邻组,而Cache中的相邻组有多个主存相邻区映射其上。

每个Cache基本行都添加了一个访问位,用以表示该行中的数据是否曾被访问。

’1’表示已被访问,’0’表示未被访问。

当Cache进行失效置换后,包含处理器所需数据的基本行,其访问位写为’1’,未包含所需数据的写为’0’。

当Cache命中时,命中基本行的访问位写为’1’。

每次Cache访存时,需要对所访基本行及其邻近行的历史信息进行统计,用Tag hit表示命中行的tag值,Reference-bit表示访问位,Count adjacent表示统计结果。

(1)当Cache失效时,Count adjacent = 0;(2)当Cache命中时,统计满足条件Tag = =Tag hit && Reference-bit = =1的邻近行的个数n。

有Count adjacent = 1 + n,其中0≤n≤3。

Count adjacent的值越大,说明当前程序段的空间局部图2 邻近块存储结构示意图行重构状态机是Cache优化方案的核心部件,是可重构算法的硬件实现。

它通过在一个固定的时间片内,统计与程序段空间局部性相关的参数,在时间片结束时进行状态变化,从而实现对置换行的重构。

由于应用程序在一定时间内其行为特征通常处于一个稳定的状态,因此,可将程序划分成相等的时间间隔(例如500000次访存操作)。

本文使用下列参数来监视和调整系统的动态行为和需求。

1.Cache访问次数 Cache Access Number(CAN) 用以记录时间片内Cache的访问次数。

当访问次数达到时间片阀值时(例如500000次访存),状态机根据统计量进行状态变换和重构操作,并将访问次数清零。

2.增大置换行倾向值Increase Size Value(ISV): 用以记录访存时具有增大置换行倾向的次数。

若Count adjacent = n,当前模式下置换行大小为m (m = Size置换行/Size基本行)。

若n>m,则ISV++;否则,ISV不作变化。

3.增大置换行阀值 Increase Size Bound(ISB):用以设定进行增大置换行操作的下限值。

当时间片结束时,若ISV≥ISB,说明满足增大置换行的条件。

4.减少置换行倾向值 Decrease Size Value(DSV): 用以记录访存时具有减少置换行倾向的次数。

设Count adjacent = n,当前模式下置换行大小为m (m = Size置换行/Size基本行)。

若n<m,则DSV ++;否则,DSV不作变化。

5.减少置换行阀值Decrease Size Bound(DSB):用以设定进行减少置换行操作的下限值。

当时间片结束时,若DSV≥DSB,说明满足减少置换行的条件。

图3 重构状态机状态变化示意图如图3所示,重构状态机有4种状态,其中S0为起始状态,表示维持置换行大小不变的正常态;S1表示增大置换行的预备态,如果在下一时间片内仍满足增大置换行的条件,则进行重构;S 2表示减少置换行的预备态,如果在下一时间片内仍满足减少置换行的条件,则进行重构;S 3表示重构态,根据不同情况对置换行进行增大或减小操作,完成后自动转换到正常态。

相关文档
最新文档