多核DSP及keystone架构

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

校长办公室
the Office of the President
4
基于Keystone架构的DSP
4.2、keystone架构的层级存储器
三个存储等级说明
本地L1:内存32KB,可配置成全速缓冲贮存、全 内存映像SRAM或者是4、8或16KB快速缓冲贮存区 选项的组合。L1P始终为直接映像,L1D始终为双 向集合关联。
Corepac允许将系统主控器ID映像到保护逻辑中 使用的ID,实现强大的保护功能。
校长办公室
the Office of the President
4
基于Keystone架构的DSP
4.2、keystone架构的层级存储器
共享内存的存储保护
C66X DSP透过XMC中的本地MPAX访问MSMC信道。 数据I/O透过MSMC中的MPAX访问MSMC信道。并分 别对内部和外部共享内存控制。
校长办公室
the Office of the President
4
基于Keystone架构的DSP
4.2、keystone架构的层级存储器
第二级效率
LL2内存以等同于CPU的时钟速率运行,可减少因 L1快速缓冲贮存失效造成的停滞,在此情况下, 必须从LL2快速缓冲贮存或SRAM获取内存。
无论是由使用者隐藏的还是有软件命令驱动的快 速缓冲贮存一致性都会变得高效,而且执行周期 数也更少。
校长办公室
the Office of the President
4
基于Keystone架构的DSP
4.1、keystone架构组成部分
4).TeraNet交换结构:芯片内部总线矩阵。
5).多内核导航器(Multicore Navigator):将 上述组件连接在一起,是一个创新的基于包的管 理器,它控制8192个队列,当任务被分配到队列, 多核导航器提供硬件加速分配(把任务分配给相 应的可采用的硬件),不需要耗费TeraNet资源, 包的搬移不会被内存存取阻塞。
本地L2:内存高达1MB,可配置成全快速缓冲贮 存、全内存映像SRAM,或32、64、128或512KB四 路集合关联快速缓冲贮存的组合。
校长办公室
the Office of the President
4
基于Keystone架构的DSP
4.2、keystone架构的层级存储器
三个存储等级说明
共享内存子系统:MSMC允许corepac动态地分享 程序和数据的内外部内存。MSMC内部存储器被配 置成共享二级(SL2)RAM或者共享三级(SL3) RAM,SL2仅能在本地L1D和L1P快速缓冲贮存区中 缓存,SL3还可在本地L2快速缓冲贮存区中缓存, 外部存储器内存视为SL3,可在L1和L2中缓存。
1896
1920
1987
2006
多核DSP的概念 TI多核DSP及keystone架构概述
内容大纲
1. 多核DSP概述 2. 多核DSP生产厂商 3. TI 多核DSP概述 4. 基于Keystone架构的DSP 5. 多核DSP的发展趋势与挑战
校长办公室
the Office of the President
校长办公室
the Office of the President
1
多核DSP概述
1.2、多核DSP的概述
所谓的多核DSP,顾名思义,就是在单一硅片上 集成更多的处理器核。 当前,国外成熟的高性能DSP的研究与产品主要 集中在片上多核结构方面,通过片上集成多个高 性能DSP核来提升处理能力。 ห้องสมุดไป่ตู้核DSP由于内核功能完整和强大,产品规模较 大、功耗较高,其资源利用率和能源效率等有待 进一步提高。
MPAX给每个交易事务承载特权ID,相关联的MPAX 单元在内部共享内存和外部内存支持16个内存段 定义,大小介于4KB-4GB,地址扩展功能可将外 部空间从32位扩展到36位。
校长办公室
the Office of the President
4
基于Keystone架构的DSP
4.2、keystone架构的层级存储器
校长办公室
the Office of the President
4
基于Keystone架构的DSP
4.2、keystone架构的层级存储器
共享内存效率
预取功能不仅能在造访内存之前拉近内存与DSP 核心之间的距离来降低存取延时,还能减缓其他 corepac和数据I/O透过MSMC争夺同于内存资源的 竞争局面。
从外部内存执行程序时,XMC提供最佳通道,大 幅提高L1/L2快速缓冲贮存效率,并在多个核心 与数据I/O对外部内存同时并行判优时,显著降 低延迟。
校长办公室
the Office of the President
4
基于Keystone架构的DSP
4.2、keystone架构的层级存储器
外部内存效率:外部内存控制器的改善
校长办公室
the Office of the President
4
基于Keystone架构的DSP
4.1、keystone架构组成部分
1).全新的C66x定点/浮点内核:速度高达 1.25GHz的高性能DSP内核,单个器件上可实现最 高320GMAC和160GFLOP定点及浮点整合性能,整 合多个DSP,节省板级空间,降低成本和电源需 求。 2).可配置协处理器:用于减轻系统微处理器的 特定处理任务。 3).层级存储器:重点讲述。
2.3、飞思卡尔
DSP56724和dsp56725:采用双核架构,允许分割 处理任务。 校长办公室
the Office of the President
2
多核DSP生产厂商
2.4、Motorola公司
Motorola公司的MCS8126的多核DSP:集成了4个 StarCoreTM核。 Motorola公司的DSP56654的双核DSP:针对窄带 无线系统开发出结构紧凑的双核DSP产品。
256位汇流
XMC
芯片
MSMC
256位接口
外部内存接 口控制器
校长办公室
外部存储器 4个1024位内部 存储器
外部存储器
the Office of the President
4
基于Keystone架构的DSP
4.2、keystone架构的层级存储器
共享内存效率
对于外部内存而言,keystone透过与共享内部存 储器相同的通道存取,信道宽度是之前结构的2 倍,速度是一半,能大大降低到外部DDR3内存控 制器(透过MSMC和XMC)的延迟。
快速缓冲贮存一致性控制
保证SL2和SL3与L1和L2快速缓存同步,用软件控 制往返于数据I/O页面的传输,以及对多核心之 间共享缓冲器的存取。
简化操作:将fence(围篱)操作增加到corepac 中,作为新的MFENCE指令实施fence操作,以保 证读/写存取群组之间序列一致。
校长办公室
the Office of the President
校长办公室
the Office of the President
4
基于Keystone架构的DSP
校长办公室
the Office of the President
4
基于Keystone架构的DSP
4.2、keystone架构的层级存储器
KeyStone架构具备三个存储等级
每个C66x内核均拥有自己的一级程序(LlP)和一 级数据(LID)存储器。
校长办公室
the Office of the President
3
TI 多核DSP概述
3.1、TI公司主要的多核DSP
5). TMS320C6474:集成了三个1GHz的 TMS320C64x+(TM)内核,可实现3GHz的原始DSP 性能,功耗和成本则分别比离散方案降低1/3和 2/3,可充分满足通信基础设施、医疗影像以及 工业视觉检验终端设备需求。
校长办公室
the Office of the President
2
2.1、AD公司
多核DSP生产厂商
AD公司嵌入式对称多处理器ADSP-BF561:其内核 采用动态功耗管理技术。
2.2、Cradle公司
Cradle公司推出的高性能CT3616处理器:其内部 集成了16个DSP核与8个GPP(通用处理器)核, DSP最高性能达到96GMACS,并具有可编程I/O。
1
多核DSP概述
1.1、多核DSP的产生
当人们选择DSP芯片时往往要面对一些两难的选 择,比如最求高性能时芯片的成本可能比较高, 追求高精度时运算可能比较复杂,追求低功耗时 支持的容量可能有限,要求速度非常快且能实时 处理任何任务时其灵活性不足。在这种情况下, 多核DSP应运而生,推动片上系统产业的成长和 壮大。
校长办公室
the Office of the President
4
基于Keystone架构的DSP
4.2、keystone架构的层级存储器
共享内存效率
扩展内存控制器(XMC):共享内部存储器 (SL2/SL3)和外部内存(DDR3 SRAM)通向MSMC的途 径。
预取功能:通往SL2的存取路径与通往LL2的存取 路径一样,在临近内部接口均有一个预取缓冲器, 可隐藏对共享RAM库的存取延迟并可优化程序代 码执行及对只读取数据的存取。
校长办公室
the Office of the President
4
基于Keystone架构的DSP
4.2、keystone架构的层级存储器
本地内存存储保护
C66X corepac可提供有软件控制的请求者到内存 的灵活映像,进一步从之前的C6000架构扩展内 存保护协议。
内存请求者均拥有相关联的特权ID,内存控制器 可区分6个不同的请求者,并配置其他请求者。
2.5、Renesas公司
Renesas公司推出的32位RISC处理器SuperHTM系 列的SH7720:结构上也是采用多核DSP。
校长办公室
the Office of the President
3
TI 多核DSP概述
3.1、TI公司主要的多核DSP
1).SMJ320C80:世界上第一个单芯片并行MIMD (多指令多数据)DSP,该处理器主要面向军用 领域。 2).TNETV3020:用于通信的多核DSP,主要用于 高密度核心网络。 3). TMS320VC6416:集成功能强大的C64xDSP核、 VCP协处理器、Turbo解码协处理器的多核DSP。 4). TMS320VC5441:浮点型DSP,内部集成了4 个C54x核,大大提高了并行处理能力。
每个内核还拥有局域的二级统一存储器,每个局 域存储器均能独立配置成存储器映射的SRAM、高 速缓存,或两者的组合。
KeyStone架构包含共享的存储器子系统,由通过 多内核共享存储器控制器(MSMC)连接的内部和外 部存储器组成。
校长办公室
the Office of the President
4
基于Keystone架构的DSP
4.3、keystone架构特点
1).具有动态资源/负载共享
2).跨系统通信时低CPU开销/延迟
3).基于硬件的任务优先级排序 4).动态负载平衡 5).适用于所有IP模块(软件、I/O和DⅡ速器) 的通用通信方法等特点
校长办公室
the Office of the President
Keystone能以1333MT/S以上速率支持高效能DDR3 SRAM内存。
汇排流支持总线高达64位,相比之前的架构,宽 度大,速度快,允许多个更高效能核心、加速器 和数据I/O整合。
校长办公室
the Office of the President
4
基于Keystone架构的DSP
4.2、keystone架构的层级存储器
错误侦测和纠正
Keystone将软错误保护扩展至内存所有层级。
L1P、L2、SL2(或SL3内部RAM)包含128/256位内 存段内单一位错误的奇偶校验讯息。 通过ECC逻辑可将软件错误进一步扩展到外部存 储空间。
校长办公室
the Office of the President
4
基于Keystone架构的DSP
4
基于Keystone架构的DSP
4.2、keystone架构的层级存储器
共享内存保护与地址扩展
Keystone将内存保护扩展至外部内存,还为内存 保护增加灵活度。另外,MSMC允许将外部内存地 址空间从32位扩展至36位。
每个C66X DSP都被分配一个独特的权限PrivID值, 数据I/O主系统也被分配一个PrivID,EDMA例外, 但可以继承为每次传输进行配置的主系统的 PrivID值。Keystone装置总共支持16个PrivID, 内存保护属性分别为管理员和用户分配访问权限。
相关文档
最新文档