当前位置 >>  首页 >> 研究成果 >> 科研项目

2013年度实验室重点项目研究成果

撰稿: 摄影: 发布时间:2013年12月31日
2013年度实验室承担的重点项目所开展的研究内容,取得的研究进展与成果如下:
 
1)高通量计算系统的构建原理、支撑技术及云服务应用
“高通量计算系统的构建原理、支撑技术及云服务应用”(973项目,编号为2011CB302500),2013年度,在高通量计算系统的微结构设计、系统结构设计、可靠设计、云计算服务与应用等方面进行了探索研究,取得了一系列成果,超额完成了预期目标。下面介绍本项目各课题本年度取得的突出进展。
 
1、面向高通量计算的可扩展、高效能并行微结构
本年度的主要进展如下:(1)开展基于访存请求收集表的优化机制的研究;(2)通过硬件支持的实时性保证的多优先级任务分发机制,确保多个线程切换以提高吞吐和隐藏访存延迟的前提下,以线程优先级为基准,通过实时性任务管理机制调度核上硬件资源,保证并发实时性,来满足任务的实时性需求;(3)提出了基于执行踪迹抽取的自动测试程序生成方法,以及基于统计定时分析的测试通路选择方法;(4)结合所提出的研究成果开发设计了Godson-Dm众核处理器芯片,目前Godson-Dm众核处理器已经完成原型系统代码开发。
 
2、面向EB级数据并发处理的新型系统结构研究与评价
本年度的主要工作围绕高通量系统评测方法和高通量数据通道系统结构设计、高通量应用优化等方向进行:(1)推出了ICBbench的两个测试集合BigDataBench和DCBench;(2)基于FPGA设计了消息式内存原型系统I,目前该原型已经基本调试通过,正在进行优化,并与高通量处理器的FPGA原型系统进行联调;(3)提出了虚拟化细粒度锁,有效降低了物理锁的数量;提出并实现了稀疏矩阵向量乘法的输入自适应的自动调优器SMAT,可以感知体系结构特征和应用特征,自动找到合适的算法和实现代码。准确率达到92%。
 
3、大规模高通量计算系统的可靠性设计
围绕着自预测-自检测(测试)-自定位(诊断)-自隔离-自愈合(修复、恢复)5S关键技术开展研究,2013年度在故障预测、定位及隔离上重点部署了研究:(1)提出了基于漏电流测量的在线老化预测方法;(2)利用模拟退火和蚁群算法,在扫描链布局时进行优化,避免有扇入关系的寄存器放置在同一条扫描链上,大大提高了寄存器的诊断精度;(3)提出了一种放松的性能隔离方法,实现边界路由共享,通过共享既取得了规则路由算法简单的优点,又提高了利用率,降低了系统的执行时间,能提高系统吞吐40%左右。
 
4、面向亿级并发负载的编程模型与支撑环境
本年度针对Godson-D的芯片特征和亿级并发负载的特征,研究了层次化MapReduce编程模型,对上层应用呈现简洁的编程接口,并利用OpenCL来开发Godson-D芯片的计算能力。主要包括以下三个方面:(1)形成了完整的层次化MapReduce编程模型的框架(图1);(2) 提取并解决了层次化MapReduce编程模型中的三个关键问题;(3)提出使用OpenCL编写程序,并配套开发CPU+Godson-D异构系统中OpenCL编译/运行时系统的解决方案。

图1层次化MapReduce编程环境示意图
 
5、高通量计算系统的云计算服务环境开发及应用
本年度主要关注云服务环境的构建管理、资源调度和系统性能优化等问题:本年度的主要工作成果:(1)在虚拟计算方面,提出了支持严格公平的资源调度方法;(2)在云存储方面,针对虚拟机镜像文件特征,为虚拟计算环境设计实现了一个名为Liquid的分布式、去冗余的文件系统。
 
6、高效可扩展移动服务关键技术及应用
本年度主要工作:(1)开展云计算服务高效部署运行的关键技术的研究;(2)研究无线信道突发丢包问题优化纠错编码以及数据包调度方式,优化信源信道编码方式以适用于异构无线网环境下的移动视频分发等问题; (3)研究基于云计算的移动互联网应用运行引擎、开发引擎、开放引擎关键技术,互联网业务安全机制,能力开放、适配、封装、集成等关键技术,启动运行引擎、开发引擎、能力开放引擎的开发工作(图2)。

图2开放移动互联网业务平台的系统架构
 
在2013年度,本项目在核心科学问题的研究方面超额完成了预期目标。共发表论文116篇,其中,SCI收录29篇,包括IEEE Trans. on VLSI Systems(TVLSI), IEEE Trans. on Architecture and Code Optimization(TACO), Journal of Computer Science and Technology(JCST), IEEE Transaction on Computers, IEEE Transaction on Parallel Distributed Systems, EURASIP等国际期刊;在高水平国际会议上发表论文37余篇,包括VTS, PLDI, CGO, IISWC, FPGA, PACT, Euro-PAR, ASP-DAC, IEEE GLOBECOM, VTC, DAC, ITC, DATE等。申请并受理发明专利96项,获得发明专利权11项。出版专著1部。所取得的阶段性研究成果对本项目后两年的研究奠定了坚实基础。各课题的主要成果统计如表所示。
 
表973项目2013年度成果统计表
 

课题
编号
课题名称 已发表
论文
发明
专利
出版专著  
国际 国内 其中SCI收录 其中EI
收录
申请 授权  
 
2011CB302501 面向高通量计算的可扩展、高效能并行微结构 15 9 2 15 10 3 0  
2011CB302502 面向EB级数据并发处理的新型系统结构设计及评价方法 11 1 2 14 50 4 0  
2011CB302503 大规模高通量计算系统的可靠性设计 20 0 7 20 5 1 0  
2011CB302504 面向亿级并发负载的编程模型与支撑环境 10 6 3 13 12 2 0  
2011CB302505 高通量计算系统的云计算服务环境 13 2 10 12 1 1 1  
2011CB302506 高效可扩展移动服务关键技术及应用 23 6 5 23 18 0 0  
合计 92 24 29 97 96 11 1  
 
 
 
2)超并行高效能计算机体系结构与设计方法研究
 
“超并行高效能计算机体系结构与设计方法研究”是国家自然科学基金委员会创新研究群体科学基金项目,负责人是李国杰院士。本创新群体已经顺利通过了一期考核,顺延为二期(经费600万)。第二期起止时间是2013年1月至2015年12月。

研究群体在2013年度中,以高效能计算、低功耗计算、高可靠计算为研究方向,在高性能和高效能计算机的超并行体系结构,多核/众核处理器的新型体系结构,以及多核处理器的测试、验证与高可靠性设计方法等六个方面上开展研究,取得了一批国内外同行公认的重要成果。

在高性能计算机超并行体系结构方面:稀疏矩阵自动调优系统发布了V1.0版本,论文发表在PLDI’13上;提出了减少大规模图计算并行程序同步开销的虚拟锁机制,论文发表在CGO’13上。2013年在HPCA举办了Tutorial,发布了新的基于HMTT3的400G左右的trace。一篇关于HMTT的综述文章被ACM TACO录用。此外,在ISPA、ICCD等会议和期刊上发表文章。数据中心系统各个方向展开都展开广泛的系统调研,申请了一批专利成果。其中数据中心评测发布了BigDatabench,DCbench并受到关注。

高效能计算机设计方法方面:(1)针对由于服务器散热不均衡导致的过度制冷问题,提出通过负载(虚拟机)调度的方式,平衡服务器散热,从而升高制冷系统的温度设置,最终达到降低数据中心制冷能耗的目的;(2)大规模系统智能化运维部分包含两个分属于支撑层和应用层的五个主要子系统:大规模监控数据采集模块、存储冗余优化、内存冗余优化、故障检测模块和自我修复模块;(3)提出一种针对不同结点的处理能力的自适应分配任务的算法;(4)提出一种针对存储资源的可信计量的基本框架,为供应商和用户双方提供精确的存储资源使用计量服务。以上研究共发表2篇论文,申请专利6项。

在多(众)核处理器的新型体系结构和低功耗设计方法方面:(1)针对高通量信息处理的关键应用领域进行了调研,分析高通量应用程序的典型特点、性能瓶颈,从而得到对高通量处理器设计的结构需求;(2)通过对高通量应用领域的典型程序进行特征抽取和性能瓶颈分析,提出较为适合于高通量应用的众核处理器架构;(3)完成了高通量众核处理器设计探索与模拟平台的研究。

在多核处理器的测试、验证与可靠设计方法方面:(1)在测试验证方面,提出了基于统计定时分析的测试通路选择方法、基于执行踪迹抽取的自动测试程序生成方法,在TVLSI发表论文3篇;(2)在可靠性设计方面,提出了跨层次优化的SRAM型FPGA可靠性布局布线算法、基于版图感知的寄存器故障诊断技术、基于线程行为预测的电压紧急预防方法、基于BCH纠错码的相变存储器噪声容忍方法、基于层次化硬件检查点的SRAM型FPGA快速故障恢复技术,在TVLSI录用2篇论文,在ITC/DATE等领域旗舰会议上发表3篇论文;(3)在容错可靠方面,提出了基于双功能时钟电路设计、反沟道效应的时延测试和老化预测方法、基于事件率的数据中心计算机故障预测,在TVLSI/JCST发表4篇论文,DAC等领域顶级会议上发表2篇论文。

在高性能计算机的并行编译方法方面:(1)提出和实现基于组件的编程方案与编译框架,自动将程序中的串行算法替换成并行算法来解决并行编程难的问题;提出以数据为中心的并行模板语言,支持层次、异步并行的发掘和优化;(2)构建领域专家协同的编译优化框架原型,提出和实现基于模式匹配的源源翻译技术;(3)提出了一种基于统计学习的多核间性能干扰分析方法,为实现以QoS为目标的任务调度提供决策依据。发表论文两篇,其中期刊一篇(软件学报),会议一篇(PACT),申请专利4项;(4)对于共享存储模型的并行程序,提出了一种类线性复杂度的可能并发分析算法,可以显著提高错误检测的准确度;针对当前程序错误定位领域效率和精度不可兼得的矛盾,设计了一种基于最小调试边界的类分治自动调试方法,作为新型程序调试技术的基础。

在本项目的研究过程中,产生相关研究平台也是本群体的目标之一。在项目开展过程中,众核处理器的在线3S软硬件研究平台、系统级功耗和可靠计算研究平台、内存系统监控分析平台、部件级功耗监控系统、基于Godson-T的节点内处理器异构的集群系统的实验环境等五大自主研究平台也取得了预期进展。

本项目本年度的主要研究工作取得了一系列成果,并得到了国际同行的肯定。在2013年度发表学术论文62篇,其中EI索引54篇、SCI索引10篇。期刊论文29篇,其中在ACM TACO、IEEE TVLSI等顶级期刊上发表论文9篇;会议论文33篇,其中在CGO、DAC、DATE、ISLPED、ITC、PACT、PLDI、VTS等顶级会议上发表论文14篇。申请/授权发明专利20项。
附件下载: