当前位置 >>  首页 >> 研究成果 >> 科研项目

龙芯2号高性能通用处理器设计

撰稿: 摄影: 发布时间:2007年08月29日
      自主研发的高性能通用处理器对解决我国信息产业由于“缺芯”所造成的利润率低的问题,以及要害部门和关键应用领域因为缺乏自主的高性能通用CPU芯片而造成的信息系统安全隐患非常重要。本项目目标是研制出具有自主知识产权、达到国内领先水平和国际先进水平的龙芯2号(Goodson-2)系列64位高性能通用处理器芯片,形成自主的64位通用CPU芯核,为建立国产通用CPU芯片和SOC芯片产业奠定基础。
 
      主要研究内容包括:(1)高性能CPU的设计技术;(2)高性能CPU的全定制物理设计技术;(3)高性能CPU验证技术,根据Goodson-2 CPU的结构和性能要求,建立深亚微米高速集成电路的设计流程;研究保障设计成功的设计方法学,如可重用设计、可扩展设计、物理综合方法等;研究建立深亚微米高速CPU芯片的设计流程。
 
      龙芯2号系列处理器的主要创新点包括:①在处理器的微体系结构方面,采用了通过对浮点部件的扩展实现媒体处理指令和定点指令;只用于寄存器跳转指令的BTB;使用内部指令维护指令TLB和数据TLB的子集关系;使用转移队列的快速转移预测取消机制;低开销的load猜测技术;无需重发射的访存队列等技术。②在物理设计及实现技术方面,采用了层次化布局和全局布线技术;定制逻辑单元,包括半动态扫描使能触发器、半动态扫描触发器;全定制多端口寄存器堆。③在测试及验证技术方面,采用了指令级随机测试和微处理器随机指令验证技术,在内部的指令产生算法上把传统的dijstra和模拟退火算法相结合。

      龙芯2号系列处理器主要包括龙芯2C和龙芯2E版本,龙芯2C的最高主频达到500MHz,龙芯2E的最高主频达到1GHz。目前定型芯片是龙芯2C,它采用先进的四发射超标量超流水结构,主频达到500MHz,功耗为3-5瓦,SPEC CPU2000标准测试程序的实测性能是龙芯1号的8-10倍,是1GHz的威盛处理器的2倍,已达到中高档PIII的水平。龙芯2C的应用领域极为广泛,包括:Linux桌面PC、低端服务器、网络防火墙、路由器交换机、网络计算机、无盘工作站等,具有广阔的应用前景。
 
      龙芯2C于2005年1月通过中科院组织的鉴定。鉴定委员会认为:龙芯2C高性能通用CPU芯片的总体性能已达到2000年左右的国际先进水平,居国内通用CPU研制领先水平。龙芯2C在国内外引起了广泛的影响,其研制成功被两院院院士评为2005年十大科技进展。国际微处理器权威刊物《Microprocessor Report》在2005年7月专门介绍了龙芯2C处理器,称其为世界级(World-class)处理器。
 
1.龙芯2号系列处理器介绍
 
      龙芯2号系列高性能通用处理器,目前主要包括龙芯2C和龙芯2E两个版本,其中龙芯2C的最高主频达到500MHz,龙芯2E的主频预计达到1GHz。目前定型芯片是龙芯2C,它采用先进的四发射超标量超流水结构,主频达到500MHz,功耗为3-5瓦,SPEC CPU2000标准测试程序的实测性能是龙芯1号的8-10倍,是1GHz的威盛处理器的2倍,已达到中高档Intel Pentium Ⅲ的水平。龙芯2E的主频预计达到1GHz,功耗为5-10瓦,SPEC CPU2000实测性能定点/浮点达到500分左右,性能相当于中档Intel Pentium Ⅳ水平。龙芯2号系列处理器的应用领域极为广泛,包括:Linux桌面PC、中低端服务器、网络防火墙、路由器交换机、网络计算机、无盘工作站等,在低成本信息化方面很有优势,具有广阔的应用前景。
 
(1)龙芯2C的主要技术指标和参数:
• 主频达到500MHZ;兼容MIPS III指令系统,字长64位。
• 9级指令流水线,包括取指、译码、重命名、发射、读寄存器、执行、提交等流水阶段,功能部件间实现Forward机制。
• 采用四发射结构,5个功能部件,包括两个定点部件、两个浮点部件、以及一个访存部件。浮点部件与IEEE 754标准兼容,全流水浮点加减乘运算,硬件实现的浮点除法和开方运算。
• 对浮点部件进行了功能扩充,实现了64位和32位的定点功能以及与SSE2类似的媒体处理功能。
• 实现乱序执行技术。使用Group保留站+ROB的动态调度结构,定点和 浮点保留站 各为16项,Reorder Buffer为32-64项;通过物理寄存器到逻辑寄存器映射进行寄存器重命名,定点和浮点物理寄存器各为64项;使用混合预测+Gshare + BTB + RAS的转移猜测方式,BHT表2K项,BTB表16项,RAS 4项。64项TLB,每项进行两页的虚实地址转化,页大小在4KB到4MB之间可变。一个独立的8项指令TLB。在TLB中增加可执行位抵御缓冲区溢出的攻击。
• 片上有分离的一级指令和数据CACHE各64KB,4路组相联。支持片外1MB-8MB的二级CACHE。
• 实现Non-blocking的CACHE访问结构、Load Speculation、动态Memory Disambiguation、Miss操作的关键字优先访问等访存优化技术、提高访存性能。
 
(2)龙芯2E的主要技术指标和参数如下:
• 主频达到1GHz,外频133MHz;
• 基本兼容64位MIPS指令系统并有所扩充,字长64位,通用寄存器和浮点寄存器各32个;
• 四发射的动态超标量体系结构,支持动态调度、猜测执行、转移预测、乱序执行、精确例外处理等技术;
• 9-10级超流水线结构;
• 浮点部件与IEEE 754标准兼容,全流水浮点乘加运算,硬件实现的浮点除法和开方运算;
• 在主频为1GHz时,双精度浮点峰值速度为40亿次每秒,单精度浮点峰值运算速度为80亿次每秒;
• 防止缓冲区溢出攻击的系统安全功能;
• 64项全相联TLB,每项两页,页大小在4KB到4MB间可变;独立的16-32项指令TLB;
• 片上有分离的一级指令Cache和数据Cache,大小各为64KB,4路组相联;片上二级Cache为512KB;
• 流水的访存接口和片上集成DDR控制器接口,访存接口支持4GB-64GB的物理内存;
• 低功耗设计,在1GHz主频的情况下,实测功耗不超过10W。
 
2. 主要创新点
 
      龙芯2号系列处理器设计在处理器微体系结构、物理设计及实现技术、测试及验证技术方面取得创新成果。具体如下:
• 处理器的微体系结构:只用于寄存器跳转指令的BTB(Branch Target Buffer);使用内部指令维护指令TLB(Translation Lookaside Buffer)和数据TLB的子集关系;使用转移队列的快速转移预测验证方法;细粒度软件可控指令串行化控制;使用内部例外实现停止取指;低开销的load猜测技术;无需重发射的访存队列。
• 物理设计及实现技术:层次化布局且全局布线技术,即在逻辑综合和物理布局阶段采用层次化设计方式,之后就将各个模块拼合在一起,进行整体布线;定制逻辑单元,包括半动态扫描使能触发器、半动态扫描触发器。
•  测试及验证技术:指令级随机测试和微处理器随机指令验证技术,在内部的指令产生算法上把传统的dijstra和模拟退火算法相结合。
 
3、龙芯2号的推广应用
 
      龙芯2号主要以嵌入式、桌面应用、中低端服务器应用为主,主要包括:Linux桌面PC、低端服务器、网络防火墙、路由器交换机、网络计算机、无盘工作站等,具有广阔的应用前景。通过龙芯产业化联盟,我们与操作系统企业(如新华Linux)、办公软件企业(如无锡永中)、应用集成企业(中软、长城软件等)、整机企业(曙光、海尔等)建立了密切的合作交流。并与民口和军口的多个应用单位合作,开展了多种应用样机的合作研制工作。另外,中科院计算所与江苏省、苏州市、常熟市政府及梦兰集团有限公司合作,建立梦兰龙芯产业化基地。。
 
      目前,龙芯产业链已经基本形成。在这条产业链中,中科院计算所注重芯片核心技术的研发,北京神州龙芯集成电路设计有限公司作为联系研发和产业的纽带,为下游整机厂商和系统集成商提供基于龙芯的IP及芯片解决方案,龙芯产业化联盟、龙芯开放实验室以及高校龙芯联合开放实验室等提供应用基础技术支持和服务,而梦兰龙芯产业化基地作为龙芯产业链下游伙伴则直接面向市场和用户提供行业应用解决方案和产品市场的开拓推广。
 
      已经开发的产品有:税控收款机、基于龙芯2号的4路高清晰视频服务器、低成本的龙芯2号专用PC机等。基于龙芯2号的产品在低成本方面很有优势,具有良好市场前景。
 
4. 龙芯2号的国内外影响
 
      龙芯2号的研制成功标志着我国已经掌握高端通用处理器芯片设计的核心技术。龙芯2号的研制成功被两院院士评为2005年的中国十大科技进展新闻。龙芯处理器的研制成功在国际上引起了很大反响。2005年7月,美国著名的市场分析公司In-stat公司在权威刊物《微处理器报告》上发表文章,详细介绍了龙芯2号的设计,文章中提到“中国已经有设计世界一流的处理器的能力”,“龙芯2号的设计说明中国人正准备生产不亚于世界上任何其他厂家的处理器”。英特尔处理器技术实验室主管也在2005年10月表示:“龙芯2号的突飞猛进让人感到惊异,其研发团队的设计和开发能力的提高相当迅速”。华盛顿著名的智囊机构哈德森研究所(Hudson Institute),向美国国会提交了一份名为《中国向前跳了一大步》的报告,分析了中国的科技和军事竞争力。在报告中,列举了我国自主创新的三个案例, 其中之一就是龙芯2号芯片问世。由于龙芯2号的影响及中国巨大的市场潜力,国外各大公司日益重视龙芯的地位,纷纷寻求与龙芯的合作,一些国外大公司开始和计算所商谈购买龙芯的知识产权用于他们的芯片生产。
附件下载: