您当前的位置:首页 > 研究成果 > 获奖成果 >
2012年实验室承担重点项目取得的进展
时间:2012-12-31 03:17:00      点击 :次      来源:      收藏

2012年度本实验室承担的重点项目所开展的研究内容,取得的研究进展与成果详述如下:

1)973项目“高通量计算系统的构建原理、支撑技术及云服务应用
“高通量计算系统的构建原理、支撑技术与云服务应用”项目是2011年1月正式启动的一项国家重点基础研究发展计划(“973计划”)。项目开展以来,整体部署循序渐进,进展顺利。本项目主要通过对效能问题、可靠性问题、可适性问题等三个科学问题的探索,重点研究新兴战略性应用(如物联网、三网融合、云计算等)的后端高通量处理的新原理、新方法和核心技术。主要研究内容包括由控制或数据驱动转向请求驱动的新原理、大规模可扩展微处理芯片的新结构及其相关核心技术,高通量低能耗的新型计算机体系结构、支撑其高效能执行的新型运行时管理系统和新的软件支持环境,虚拟化资源能力的部署、调度、管理和优化技术,为按需聚合、智能协同的高通量应用提供可保障的系统能力;同时要研究各个阶段的可靠性设计和验证的新机制,包括硬件级的芯片和系统的可靠性机制,软件级的容错、缺陷调试和程序分析验证等,以及高通量亿级并行系统的测试程序、健壮性、性能自动推演和性能瓶颈自动发现等技术。

在2012年度,本项目在核心科学问题的研究方面超额完成了预期目标。共发表论文81篇,其中,SCI收录21篇,包括Communication of the ACM、IEEE Micro、IEEE Trans. on Computers(TC)、IEEE Trans. on VLSI Systems(TVLSI)等国际期刊;在高水平国际会议上发表论文71余篇,包括DAC、DSN、Hot Chips、ITC、VTS等。申请并受理发明专利19项,出版专著《Distributed and Cloud Computing》等2部。所取得的阶段性研究成果对本项目后三年的研究奠定了坚实基础。各课题的主要成果统计如表一所示。

 
973项目2012年度成果统计表
 

课题
编号
课题名称 已发表
论文
发明
专利
出版
专著
国际 国内 其中SCI
收录
其中EI
收录
2011CB302501 面向高通量计算的可扩展、高效能并行微结构 12 0 2 10 5 0
2011CB302502 面向EB级数据并发处理的新型系统结构设计及评价方法 18 0 4 11 6 0
2011CB302503 大规模高通量计算系统的可靠性设计 4 0 0 2 0 1
2011CB302504 面向亿级并发负载的编程模型与支撑环境 13 2 9 2 0 0
2011CB302505 高通量计算系统的云计算服务环境 10 6 1 8 0 1
2011CB302506 高效可扩展移动服务关键技术及应用 14 2 5 10 8 0
合计 71 10 21 43 19 2
 
项目目前的成果产生的学术影响:
计算机领域国际知名杂志《EE Times》和《MICROPRPCESSOR REPORT》对基于本项目的众核处理器结构的研究工作给予了充分肯定。认可我们基于Godson-T处理器进行的大数据计算细粒度并行的探索研究从另一个角度挖掘大规模数据并行计算的可行性。认为“For China, Godson-T is no doubt a worthwhile investment”。在IPDPS大会中,Pete Beckman教授多次提到Godson-T的工作,并给予高度赞赏。

IEEE可持续计算专业委员会在第五期的News Letter中,将本项目在研的高通量众核处理器Godson-D作为高能效硬件结构的代表进行报道。



本项目研究的“基于云的开放移动互联网业务平台”,于2011年10月由中国移动发布了开放移动互联网业务平台方案,国内主流的云服务提供商和媒体参加了发布仪式,人民网、中国通信网、新浪、搜狐等媒体也对此发表评论。


美国University of Pittsburgh的Daniel Mossé教授的ACM Transactions on Architecture and Code Optimization论文“Writeback-Aware Partitioning and Replacement for Last-Level Caches in Phase Change Main Memory Systems“,韩国Postech大学的Sunggu Lee教授在其DAC’12的论文“Write Performance Improvement by Hiding R Drift Latency in Phase-Change RAM”,以及美国University of Pittsburgh大学的Ping Zhou的博士毕业论文,都对项目组在DAC’11上发表的论文(提出Wear Rate Leveling方法)进行了引用。韩国三星微电子对此技术表现了浓厚的兴趣,其Memory Division/Flash Design Team的技术总监Hyangja Yang与论文作者进行了深入的探讨。

龙芯团队在其研究论文(“RepTFD: Replay Based Transient Fault Detection”, CoRR abs/1206.2132)中,引用了项目组的DSN’11论文,用项目组提出的基于容错高速缓存一致性协议的多核处理器的透明动态绑定方法来说明其研究工作的动机,并对项目组的文献给予积极评价:“Instead of forwarding the load results of the checked core to the redundant core, some schemes [29,14, 25] allow both cores to independently access the memory. ……Recently, TDB [25] is proposed to guarantee the input coherence via cache coherence protocol. Although it has better performance and scalability (with respect to the number of cores) than DCC, its design complexity and risk are quite high, since it needs to redesign a new cache coherence protocol.”其中引文[25]是项目组的DSN’11论文。

 
2)NSFC创新群体“超并行高效能计算机体系结构与设计方法研究”
本项目在高性能和高效能计算机的超并行体系结构,多核/众核处理器的新型体系结构,以及多核处理器的测试、验证与高可靠性设计方法等方面取得多项重要成果,完成了项目预期目标。
在高性能和高效能计算机的超并行体系结构方面,提出了简洁有效的DMA Cache方案,从体系结构上来分离I/O数据与CPU数据;提出并设计了HMTT3内存分析系统,支持DDR3硬件采集和对象级访存行为分析;提出了稠密矩阵GPU优化的系列方法,并提炼出系统的方法;提出大规模计算系统的不停顿算法容错方法并应用于HPLinpack;提出了分布式能力流动理论,研究了其CPU、内存、磁盘等资源流动的关键技术,提出了绿色虚拟化平台框架Rainbow;提出了TRainbow可信高效软件架构,发展了内存监控、远程可信IO、IO隔离等可信关键技术;提出了云计算高效系统软件模型LogPCM;提出了统一多层次数据并行的UPC-H语言扩展和自适应任务机制;提出了面向领域专家的编译优化框架,以克服传统编译优化构架在成长性、适配性方面的问题,研究了迭代编译的关键问题并实现了面向数据中心和云服务器的在线迭代优化;在动态优化方面提出了性能公平的任务调度技术。

在多核/众核处理器的新型体系结构方面,提出了微体系结构设计方法,包括片内高速缓存结构、轻量级存储一致性、快速片上同步机制、显式片上存储管理、渗透式线程执行模型等;提出并实现了Godson-T大规模并行众核处理器模拟技术,众核原型芯片及配套系统,Godson-T众核板卡研究平台;提出了众核处理器结构的验证和调试机制,包括基于FPGA时分复用的验证方法,在片调试机制TJTAG方法,及众核结构中的确定性重放机制;提出了通过消除片内缓存空间中的冗余降低功耗的方法;提出了基于读访问的动态组相联低功耗高速缓存;提出了动态自适应的低功耗处理器结构,以及低功耗片上网络结构等。

在多核处理器的测试、验证与高可靠性设计方法方面,提出并完善了“自测试-自诊断-自修复”可靠性设计技术路线,并使用该技术解决了时序偏差的容忍问题;提出了考虑工艺偏差和通路相关性的通路选择和测试生成方法,基于GPU的高速仿真方法;提出了片上供电网络可靠性设计技术;提出了新型相变存储器均衡写可靠性设计;提出了透明动态绑定容错设计等。
在本项目的研究过程中,产生相关研究平台也是本群体的目标之一。在项目开展过程中,形成的平台包括:众核处理器的在线3S软硬件研究平台、系统级功耗和可靠计算研究平台、内存系统监控分析平台、部件级功耗监控系统、基于Godson-T的节点内处理器异构的集群系统的实验环境等。

本项目的主要研究工作取得了一系列成果,并得到了国际同行的肯定。截止2012年12月份为止,共发表学术论文129篇,其中EI索引118篇、SCI索引38篇,期刊论文35篇、会议论文94篇;发表专著3部;申请/授权发明专利31项。我们的工作主要发表在IEEE Micro、IEEE Transaction on VLSI、IEEE Transaction on Computer、ACM Transactions on Architecture and Code Optimization、Journal ofComputer Science and Technology等知名期刊上,以及ACM/IEEE International Symposium on Computer Architecture (ISCA)、ACM International Conference on Supercomputing (ICS)、ACM/IEEE Super Computing (SC)、IEEE International Conference on Code Generation and Optimization (CGO)、International Conference on Parallel Architectures and Compilation Techniques (PACT)、ACM/IEEE Design Automation Conference (DAC)、Design Automation and Test in Europe (DATE)、IEEE International Symposium on High Performance Computer Architecture (HPCA)、ACM/IEEE International Symposium on Microarchitecture (MICRO) 等领域顶级国际会议中。根据Google.scholar初步查询,2010年以来发表论文中69篇被引用243余次,其中他引211余次。引用我们工作的顶级期刊:IEEE Transcation on Computers、IEEE Transcation on VLSI、IEEE Transcation on CAD、Des Autom Embed Syst、JCST等,引用我们工作的顶级国际会议:MICRO、HPCA、DSN、IPDPS、FPL、DAC、CLUSTER、ITC、DATE等。

本创新群体通过在多种技术、方法和设计上的创新,为多个国家重大课题提供了有力的技术支持。在国家科技重大专项的核高基项目中,本群体所提出的众核处理器微体系结构、片上显示存储结构管理方案、低功耗片上网络结构设计等都得到了认可与应用。通过将这些技术应用于万亿次级CPU的设计方案,使之后续转化为适用于未来应用的国产芯片,为我国高性能计算机研发机构提供核心运算部件和关键技术,以实现“产学研用”的良好结合。在国家863重大专项中,GPU结构上稠密线性代数算法优化工作将当时最新的Fermi GPU单卡效率提高了40%,为曙光星云计算能力排名当年世界TOP500第二名做出了重要的贡献,该部分工作已集成到Nvidia公司后续的产品中,并应用于后续的天河1A、TSUBAME 2等HPC系统中。

国际学术合作交流是团队研究力量建设的重要手段。通过交流,了解国际学术前沿、促进群体的研究工作,同时扩大自己的影响。项目组成员范东睿副研究员分别被邀请参加2012年8月在美国Standford大学举行的HotChips会议,并作大会报告。项目组成员武成岗副研究员成功申请了CGO 2013的主办权。并邀请法国Inria Alchemy的Olivier Teman教授、美国加州大学生芭芭拉分校的Fred Chong教授、美国OhioState大学的Panda教授、孙贤和教授、Nvidia公司的Steve Scott等教授和知名学者来访,聘任洛桑理工大学的Paolo Ienne教授和Olivier教授为中科院计算所特聘研究员,进行多核处理器片上存储和众核结构设计的关键问题进行研究,并合作完成多篇学术论文。同时,课题组与乔治华盛顿大学的黄浩博士,以及韦恩州立大学的施巍松教授等,进行合作研究,并发表多篇论文;与美国普渡大学的李志远教授、美国明尼苏达大学的游本中教授、台湾国立交通大学的徐慰中教授、澳大利亚新南威尔士大学的薛京灵教授和美国罗切斯特大学的丁晨教授多次来访中科院计算所,很好地指导了我们一些研究工作的开展。

综上所述,通过本创新群体项目的执行,本群体在高性能和高效能计算机的超并行体系结构,多核/众核处理器的新型体系结构,以及多核处理器的测试、验证与高可靠性设计方法等方面取得了一批重要科研成果,产生了重要国际影响,群体成员的学术水平与国际学术影响有明显提升,圆满完成了项目的预期目标。