龙芯2处理器设计
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Godson-2C主频
已完成多次流片,目前为C方案(Godson-2C) 已完成多次流片,目前为 方案( ) 方案
是0.18um的定型芯片 的定型芯片
正常电压范围(1.8v±10%)主频为 ± 主频为400MHz-450MHz 正常电压范围 主频为
目前由于封装散热较小(只能散 目前由于封装散热较小(只能散1w-2w,实测 ,实测400MHz时 时 3w左右),因此降低电压运行在 左右),因此降低电压运行在90MHz*3或90MHz*4 左右),因此降低电压运行在 或
300MHz的Untra Sparc II的分值为 的 的分值为100分. 的分值为 分 1.3GHz PIV实测结果:INT 346; FP 272. 实测结果: 实测结果 .
运行完整的64位 操作系统和X-window视窗系统,通 视窗系统, 运行完整的 位Linux操作系统和 操作系统和 视窗系统 过包括SPEC CPU2000在内的若干基准程序的功能和性能 过包括 在内的若干基准程序的功能和性能 测试,通过包括Office,浏览器,WEB服务器在内的一批 测试,通过包括 ,浏览器, 服务器在内的一批 应用程序的考核,可试运行电子政务等大型应用. 应用程序的考核,可试运行电子政务等大型应用.
2004.06-08
500-800MHz PIII 1.3-1.4GHz PIV 1.5-2.0GHz PIV TeraFLOPs CC-NUMA
2D
2004.09-12
2D1
2005.01-06
SOC
2006.01-06
9 Balance between frequency and architecture is most important
龙芯2号处理器设计
中国科学院计算技术研究所 CPU组 组 2004.11.10
1
内容提要
基本情况介绍
研究目标 研究目标 目前进展 目前进展 近期工作计划
关键技术
结构设计 处理器验证 物理设计
2
龙芯2号研究目标
研究目标
研制出具有自主知识产权,达到国际先进水平的64位高性 研制出具有自主知识产权,达到国际先进水平的 位高性 能通用CPU芯片和配套的 以及服务器系统样机. 芯片和配套的PC以及服务器系统样机. 能通用 芯片和配套的 以及服务器系统样机 建立开发平台,设计方法,研究队伍. 建立开发平台,设计方法,研究队伍.
Via C3 Godson 2C
基本完成院重大专项和863重点项目 重点项目 基本完成院重大专项和
实测性能是龙芯1号的 倍以上 实测性能是龙芯 号的10倍以上 号的 全面超过VIA的性能,实测性能达到 的性能, 全面超过 的性能 实测性能达到PIII的水平 的水平 完全可以满足桌面的应用
系统设计进展
完成PC和服务器主板的设计, 完成 和服务器主板的设计,正在进行笔记本主板的联调 和服务器主板的设计 64位北桥设计,已经完成 位北桥设计, 位北桥设计 已经完成RTL设计 设计 完成MIPS64 Linux kernel 和Debian的完整发行版的移植,包 完成 的完整发行版的移植, 的完整发行版的移植 8等 媒体播放, 括xwindows, Open Office, Mozilla, 媒体播放 Email, Xpdf等
龙芯2号研发历程
Version 2A Physical Design ASIC, 0.18um, 250MHz ASIC, 0.18um, 300MHz Tiled placement, 2B1
crafted cell, 0.18um,
Architecture Features 64-bit, 4-issue, OOO, 32KB+32KB L1 64-bit, 4-issue, OOO, 32KB+32KB L1 reduced queue size Split Read, BTB, RAS, Off-chip L2 9-stage pipeline, 64KB+64KB L1, paired single FP Multiply-Add, SMP, On-chip L2, Prefetch, Pico-architecture tuning DDR controller, interconnect, IO
3
部分处理器的SPEC CPU2000值
处理器
UltraSPARC-II UltraSPARC-III
参数
300MHz, 16K+16K(L1),L2 , 900MHz, 32K+64K(L1), 8M(L2) 500MHz, 64K+64K(L1), 4M(L2) 1001MHz, 64K+64K(L1), 8M(L2) 500MHz, 32K+32K(L1), 8M(L2) 500MHz, 32K+32K(L1), 8M(L2) 1GHz, 16K+16K(L1), 256K(L2,on) 2GHz, 12K+8K(L1), 256K(L2,on) 550MHz, 512K+1M(L1) 875MHz, 0.75M+1.5M(L1) 450MHz, 64K+32K(L1), 8M(L2)
采用0.18um CMOS标准单元工艺,500MHz 标准单元工艺 采用 标准单元工艺, 针对缓冲区溢出攻击的专门安全支持 MIPS兼容,支持 兼容, 兼容 支持LINUX, VxWorks, WinCE等主流操 等主流操 作系统 1350万晶体管,面积 万晶体管, 万晶体管 面积6.2mm*6.7mm 功耗: 功耗:2w-4w@500MHz 7 低成本: 套片<20美元 低成本:CPU+套片 套片 美元
程序
16 4. gz i 17 p 5. vp 17 r 6. gc 18 c 1 18 .mc 6. f cr 19 af 7. ty pa rs e 25 r 2. 25 e 3. on pe rl b 25 m 4. 25 g 5. ap vo r 25 tex 6. bz 30 ip 0. 2 16 tw 8. ol wu f pw i 17 se 1. s 17 wim 2. mg 17 ri 3. d ap p 17 lu 7. me s 17 a 9. 18 a 3. rt eq ua 18 ke 8. 20 0. amm si p xt ra 30 ck 1. ap si
主流CPU的谱系和龙芯的位置
440 / 750 / 970 / Power4+
低 能 耗
Low Power (mW)
MIPS
MIPS
龙芯
XScale ARM Low
龙芯
IA32
龙芯
IA64
High Performance (GHz)
高 性 能
Mid
High
5
龙芯处理器Roadmap
SPEC分值 分值 1000
龙芯2号进展
已经完成多次流片,包括0.18um的定型芯片 已经完成多次流片,包括 的定型芯片
2002年7月开始概念结构设计,10月开始详细结构设计 年 月开始概念结构设计 月开始概念结构设计, 月开始详细结构设计 2003年10月17日首片成功运行 年 月 日首片成功运行 2004年9月28日0.18um定型芯片的试流片运行 年 月 日 定型芯片的试流片运行
样机系百度文库指标
MIPS兼容,64位 超流水,4发射 MIPS兼容,64位,超流水,4发射,乱序执行 发射, 兼容 流片主频500MHz以上,SPEC CPU2000值为 分以上, 以上, 值为300分以上, 流片主频 以上 值为 性能与1GHz以上的 以上的PIII或PIV相当 性能与 以上的 或 相当
通过封装改进和工艺调整,正常电压范围达到 通过封装改进和工艺调整,正常电压范围达到 500MHz-600MHz
改进封装:通过散热片可以散 改进封装:通过散热片可以散3w-4w 沟道宽度: 沟道宽度:0.16um或0.17um 或 阈值电压: 阈值电压:-5%或-10% 或 不用改gds2版图,SMIC已经开始加工 版图, 不用改 版图 已经开始加工
1.45GHz, 64K+32K(L1), 1.5M(L2,on),8M(L3)
日期 SPECint2000 100 2001 1999 2001 2000 2001 2001 2002 2000 2002 2001 2003 466 313 621 347 412 403 684 422 676 334 910
SPECfp2000 100 410 422 756 343 386 264 745 414 651 433 1158
4
Alpha 21264 Alpha 21264C MIPS R12000 MIPS R14000 Pentium III Pentium IV PA-8600 PA-8700+ Power3-II Power4+
Tapeout Time 2003.07.13
Performance Failed 3X-5X Godson-1
2B
2003.08.13
2004.03.07
2X Godson-2B
350-400MHz 2C More custom, 0.18um, 450-500MHz 0.13um, Cu, 600-800MHz 0.13um, Cu, more custom, 800-1000 MHz Based on Godson2 IP
200
0.18um, 32位 位 单发射 龙芯1.2 龙芯 龙芯1.3 龙芯 以300MHz UltraSparc II为基准 为基准
龙芯1 龙芯
时间 2003 2004 2005 2006 2007
6
2001
2002
龙芯2号处理器特点
高性能
64位,四发射,乱序执行 位 四发射, 64KB+64KB片内一级 片内一级Cache, 1MB-8MB片外二级 片外二级Cache 片内一级 , 片外二级 IEEE 754兼容浮点部件,专门的媒体支持 兼容浮点部件, 兼容浮点部件 双精度浮点运算10亿次 亿次/秒 单精度浮点运算20亿次 亿次/秒 双精度浮点运算 亿次 秒,单精度浮点运算 亿次 秒 SPEC CPU2000实测性能相当于 实测性能相当于500MHz-1GHz的PIII系列 实测性能相当于 的 系列 完全满足桌面应用的要求
10
龙芯1号和龙芯2号
11
分值 100 120 140 160 20 40 60 80 0
SPEC初步性能比较(1)
Godson 2Cvs1A-ref-origin
266MHz Godson-1 vs. 270MHz Godson-2C 500MHz的龙芯 号性能是龙芯 号性能的 倍以上 的龙芯2号性能是龙芯 号性能的10倍以上 的龙芯 号性能是龙芯1号性能的
龙芯3.2 龙芯 0.13-0.09um, 64位,多线程 位 龙芯3.3 龙芯
龙芯3 龙芯
800
2GHz的P4 的 SPEC分值在 分值在 600到750之间 到 之间 龙芯2.3 龙芯 0.18-0.13um, 64位, 4发射 位 发射 龙芯2.2 龙芯
600
400
龙芯2 龙芯
1.3GHz的P4 的 实测分值为 定点342 定点 浮点272 浮点
Godson 1A Godson 2C
12
分值 120 140 160 100 20 40 60 80 0
SPEC初步性能比较(2)
Godson 2CvsVia C3-ref-origin
733MHz Via-C3 vs. 270MHz Godson-2C 500MHz的龙芯 号性能将大大超过 的龙芯2号性能将大大超过 的龙芯 号性能将大大超过VIA的处理器 的处理器
程序
16 4. gz i 17 p 5. vp 17 r 6. gc 18 c 1. 18 m 6. cf cr 19 af 7. ty pa rs e 25 r 2. 25 e 3. on pe rl b 25 m 4. 25 g 5. ap vo r 25 te 6. x bz 30 ip2 0. 16 tw 8. ol wu f pw i 17 se 1. s 17 wim 2. mg 17 rid 3. ap p 17 lu 7. me s 17 a 9. 18 a 3. rt eq ua 18 ke 8. 20 0. amm si p xt ra 30 ck 1. ap si