当前位置 >>

开放课题

2017年开放课题指南

撰稿：摄影：发布时间：2017年09月30日

一、简介

计算机体系结构国家重点实验室是我国计算机系统结构领域的重要科研基地之一。它的主要任务是研究和发展计算机系统结构相关领域的基础理论和关键技术。现阶段重点围绕超并行计算机系统和多核处理器开展基础研究和高技术前沿探索，为高性能计算机系统和高性能处理器设计领域的发展持续提供创新方法和关键技术。为提高实验室的开放层次，提高学术水平和技术水平，增进国内外学术交流与合作，促进人才流动与学科交叉渗透，特设开放研究课题。欢迎国内外相关领域的科研工作者参与实验室的开放课题研究。

二、指南的制定原则

为促进计算机系统结构领域内的新理论、新思想和新技术、新方法的发展，加强国内外学术思想与人才的交流，本实验室特设立开放研究课题，资助有关人员来本实验室从事计算机系统结构的基础理论、关键技术研究和应用基础研究。
指南的制定原则如下：
1、根据我国计算机系统结构领域的发展战略，着眼于国民经济建设的当前和长远的需要和国际学科发展的前沿；
2、鼓励具有开拓性、前瞻性、创造性和高层次理论和技术的自主创新研究及具有重大应用前景的项目；
3、利于促进多学科的交叉渗透和多部门的联合攻关，有利于建立和发展国际合作的新格局，有利于人才培养和学科的发展；
4、鼓励和支持从事计算机系统结构的青年科技工作者，尤其是博士后、博士生和海外留学人员在本实验室进行开放课题研究；
5 、资助项目的申请者要求与本室科研人员协同工作。

三、本年度建议开放课题的研究方向

本年度建议开展课题如下（可不限于以下课题）：
题目1:云计算环境下闪存-瓦记录磁盘混合存储的性能优化与服务质量保障研究
研究内容：
瓦记录（Shingled Magnetic Recording）是一种新兴的磁盘存储技术，通过相邻磁道的部分重叠来增加存储密度，可以显著提升磁盘存储密度并降低成本，非常适合用在云计算环境中存储容量迅速增长的大数据。但是瓦记录磁盘在小粒度随机写的情况下写放大率较高、性能较差；且内部结构较为复杂，难以保持稳定的服务质量，在云计算平台的多租户场景下，更难以保障用户的服务质量。因此，将少量闪存存储与瓦记录磁盘组合为混合存储，可以充分利用闪存的高性能优势和瓦记录磁盘的存储空间和成本优势。但是云计算环境下的闪存-瓦记录磁盘混合存储上会遇到一些新的挑战：(1)在混合存储中如何通过数据分布和缓存算法等减小和控制瓦记录磁盘的写放大现象，从而提高和保障稳定的性能；(2)在云计算的多租户场景下，这种内部结构复杂的存储设备如何保障每个用户的服务质量；(3)云计算环境下经常将存储资源封装为键值存储的形式，为用户或上层关系数据库等提供服务，那么基于闪存-瓦记录磁盘混合存储的键值存储系统如何进行性能优化和服务质量保障也是一个重要的问题。本课题将在闪存-瓦记录磁盘混合存储中的数据分布、缓存算法、调度算法，以及基于混合存储的键值存储等方面展开研究工作。研究内容重点分布在：
1. 面向瓦记录磁盘写放大优化的闪存缓存替换算法研究；
2. 云计算多租户情况下，闪存-瓦记录磁盘混合存储的用户服务质量保障方法研究；
3. 基于闪存-瓦记录磁盘混合存储的键值系统的性能优化和服务质量保障研究。

题目2：加密芯片的安全可测试性设计技术研究
研究内容：
近年来，安全是芯片设计中的热点问题。对加密芯片而言，安全问题尤其突出。大量研究表明这些芯片很难抵抗一些旁路攻击。用于集成电路测试的扫描链结构就是一个不容忽视的旁路。
扫描链结构是目前应用最广泛的可测试性设计。但是，扫描链结构却对加密芯片的安全造成了极大威胁。因为攻击者可以轻松的利用芯片内的扫描链作为旁路进行密钥分析，破解加密芯片。与其他旁路攻击不同的是，扫描旁路攻击并不依赖那些用于搜集分析功耗、时序等参数信息的设备。这使得扫描旁路攻击的实施更加简便，潜在的危险性更高。从2004 年第一个扫描旁路攻击提出至今，扫描旁路引发的安全漏洞已经成为IC 设计和测试业界关注的焦点。
因此，必须研究安全的可测试性设计技术以解决加密芯片所面临的安全方面的挑战。本项目基于密码学哈希函数的安全性，研究兼顾密码芯片安全性和可测试性的扫描链设计技术，旨在通过对扫描链输出进行基于哈希函数的后处理，为加密芯片实现抗扫描旁路攻击的安全可测试性设计。
研究成果将以论文形式发表。

题目3：基于RNN-LSTM网络模型的计算机系统异常在线检测机制
研究内容：
随着VLSI的设计复杂度上升，时序电路以及基于时序电路构建的计算机体系结构中的异常行为，包括由于温度、电磁环境等复杂工作环境，以及多样化的工作压力（workload induced stress），电路老化等导致的间歇性故障；由于电路中的硬件木马导致的恶意攻击等。这些故障和攻击会通过触发器在电路中传播，通过影响系统状态寄存器传播到计算机体系结构层甚至软件层，最终降低系统的可靠性。异常行为往往表现为寄存器的异常状态值（或组合），因此电路层检查器无法检测；在线测试（online test）不仅影响系统可用性，而且在测试时异常可能已经静默/消失，因此需要实时监测和捕捉异常。通过机器学习预测是一个可行的方法，但复杂系统结构和时序导致异常状态之间存在高度的空间和时间耦合，常见的分类学习模型无法胜任。为此，本课题将探索一种基于带长短期记忆的循环神经网络的设计和训练方法，利用其捕捉特征的空域和时域耦合的能力来实时捕捉异常。
重点研究：
1、在电路和架构两个层次上探索高效、低成本、实时的提取系统关键状态的硬件架构设计，研究利用电路的DfT设计，系统的debug缓冲器等现存模块提取关键状态并进行压缩和传输的技术；
2、探索RNN-LSTM模型设计和训练方法，研究减小模型复杂性和训练代价的机制，分别论证基于冗余线程和专用硬件的在线异常检查器的部署方案；
3、开发电路层和架构层的在线异常检查器原型仿真器，将异常检测应用到间歇性故障，硬件木马，老化等场景。
研究成果将实现工具原型，发表高水平学术论文。

题目4:面向混合存储架构的数据中心资源调度机制研究
研究内容:
云数据中心正成为信息时代的社会基础设施，是社会生产生活不可或缺的一部分，探索如何优化资源利用率，对提高数据中心吞吐量、优化服务质量具有现实意义。随着大规模数据分析任务的涌现与新型非易失性内存的使用，数据中心将在任务对象和体系架构方面发生重大变化，以计算为中心的资源调度机制不再高效。面向大规模数据敏感型任务与新型混合存储架构，以优化任务执行效率为基本出发点，重构任务与数据间的关系，研究数据驱动的新型资源调度机制。具体研究任务主要包括：
1，研究内存级的数据部署问题，探索标签化的数据表达机制，实现运行时数据动态替换策略，优化任务执行效率；
2，探索任务感知的动态数据演化机制，实现数据与任务的联合部署，进一步优化数据本地化水平；
3，研究网络感知的数据副本更新与重配置，结合网络情境与数据标签，实现数据的预部署与预缓存，降低数据中心网络负载。

题目5：具有时间语义的指令集及其协处理器体系结构研究
研究内容：
安全关键的嵌入式实时系统主要应用于工业控制、航空航天和交通运输等领域，需要其功能行为和时间行为具有高可预测性，以满足严苛的时限需求。另一方面，现代微处理器的抽象计算模型以满足通用计算应用需求为目标，缺乏精确的时间语义。因此，在构建实时嵌入式系统时不得不基于计算机系统的时钟中断机制，存在高开销、高延迟和低精度等问题，且系统难以移植和扩展。
本课题将研究具有时间语义的微处理器指令集，并基于当前流行的商品化微处理器架构，研究该指令集的实现技术，为保证实时系统的可预测性和及时性提供体系结构层的技术支撑。主要研究内容包括：
1)      研究硬实时系统的时间触发编程模型的时间语义，基于时间触发语义设计微处理器的扩展指令集。该指令集支持周期精确的嵌入式计算操作。
2)      基于常见的通用嵌入式微处理器架构，设计支持上述指令集的协处理器。
3）基于上述协处理器，将RTOS内核的任务管理、I/O管理、时间管理等功能硬件化，提供RTOS的及时性，也进一步提升系统的时间可预测性。

题目6：大规模机器学习系统性能优化技术研究
研究内容：
机器学习直接从大数据中学习特征，能够更深刻地刻画出海量数据中蕴藏的丰富信息。近年来，以其强大的学习能力在图像识别、语音识别、自然语言理解等诸多应用领域取得了令人振奋的成果。大规模机器学习训练系统为提高模型的复杂程度、训练集的规模、加速训练模型参数的收敛、提升模型的表征能力带来了新的契机，但机器学习算法的计算密集型和I/O密集型特点一直是机器学习向更高性能发展面临的挑战。性能优化方法、资源动态管理是大规模机器学习训练系统面临的关键问题。已有的机器学习训练系统往往是以算法特性和特定机器属性作为系统设计和优化的主要依据，缺乏资源管理和机器学习应用共性特点的综合考虑。该项研究围绕密集迭代收敛型机器学习算法特性，通过重构算法执行过程进行性能优化，量化并行任务行为的收益和开销，解决数据和任务划分、通信与同步等问题。
研究内容重点分布在：
1)      研究机器学习的程序结构依赖性特性以及松散型任务调度方法，保证机器学习程序的收敛性和正确性。研究通过计算调度和负载均衡方法提升迭代吞吐量，最大限度的发挥集群硬件的性能优势。
2)      研究计算和通信重叠机制，通过持续通信方法和带宽优先级调度缓解通信风暴问题。改进参数服务器存储机制，结合机器学习方法特性，研究参数存储方法和通信拓扑调度方法。
3) 构建运行时开销分析模型，量化执行过程，分析机器学习模型在运行时的I/O、延迟和计算开销。

题目7：数据驱动的高性能计算机上并行程序性能预测研究
研究内容：
对高性能计算中的并行应用程序的性能进行分析建模，并将性能模型用于程序执行时间的预测具有重要的应用价值。准确的并行程序性能模型可以用于高性能计算机上的任务调度、计算资源需求估计、并行程序参数优化选择等实际问题。然而并行应用程序的执行时间受到相当多的因素影响，准确的预测相当困难。近年来，数据挖掘技术得到快速发展，为发掘数据中潜在的规律提供了有效的工具。并行应用程序在运行过程中可以产生大量可以反映程序的行为特征的数据。该项研究将对并行程序运行时的行为特征数据进行自动化收集、分析与筛选，并运用数据挖掘技术，对程序的性能表现进行建模，从而能在超级计算中心集群环境下对MPI并行应用程序的执行时间做出预测，并在相关实际问题中应用。研究内容重点分布在：
1)    高效的自动化数据收集方法，在较低的额外开销下获取能够反映并行程序性能的特征数据。
2)    基于所收集的特征数据，建立性能模型，从而能对并行程序在不同条件下的运行时间做出预测。
3）  利用并行程序的性能模型，帮助求解负载均衡、参数优化选择等并行程序        性能优化问题。

题目8：针对云平台的压力测试技术研究
研究内容：
随着虚拟化技术的快速发展，云平台技术逐渐成熟，出现了很多不同类型的云平台，云平台的性能、服务水平等特性越来越受到业界的关注，云平台测评是一个重要的研究方向。对云平台进行测评，压测技术是测评的核心技术。该项研究针对目前流行的压测技术，探讨其技术实现和应用场景, 结合云平台测评需求探讨压测技术的改造与融合创新，研究适合云平台测试的压测技术。研究内容重点分布在:
1)     研究压测数据模拟技术。基于真实的用户数据，构造云平台压测的模拟数据，并能模拟通过不同的协议，发送压测流量。
2)     研究分布式压测引擎，针对现有压测引擎在测评云平台时存在的性能、可扩展性等问题进行研究，设计适合云平台测评的分布式压测引擎。
3)     研究分布式压测流量平台技术，包括任务调度、数据调度，以及分布式压测流量平台设计等，实现百万级压测能力。

题目9：基于机器学习的并行文件系统性能预测
研究内容：
并行文件系统是任何大规模并行计算环境的重要组成部分，它的性能直接影响着整个并行计算环境的执行效率，它能有效解决高性能计算系统的海量数据存储和I/O瓶颈问题。由于影响系统性能的潜在因素错综复杂，所以并行文件系统的性能评估和性能预测一直是一个难点。常见的负载特征包括读/写请求大小、读-写请求比率，请示队列长度，顺序-随机请求比率、I/O到达时间隔、访问的突发性、时空相关性，常见的性能指标包括宽带、吞吐量、延迟等。本课题将以并行文件系统的性能评估和预测作为研究目标，基于Lustre文件系统，在研究文件系统的架构和性能指标后，设计一个基于机器学习的并行文件系统性能预测模型，运用特征选择算法对负载特征进行约简，挖掘出系统性能和负载特征之间的回归关系，以进行性能预测。为了验证本方法的有效性，将设计大量的实验用例，与现有方法进行全面的性能对比。

题目10：端到端通信中的中间盒子（Middle Box）安全隐患分析与检测
研究内容：
端到端（End to End）是互联网协议设计的基本原则之一，但是在网络的发展演化中许多应用和协议偏离的端到端的通信模式，为了解决性能和可靠性问题增加了许多代理、缓存等中间盒子，产生了许多安全隐患。互联网以端到端通信的安全需求与分布式网络结构之间的矛盾为出发点，剖析移动网络面临的新型安全威胁，基于网络测量的方法对大规模、分布式的移动网络核心设施的安全问题进行深入研究，并探索如何增强基础和共性的安全协议与相应防范机制。重点研究：（1）针对移动网络端到端通信中的安全漏洞或威胁，设计一种可控的、自动化的检测或验证方法，在确保安全的条件下发现现实网络中对用户隐私或安全的攻击行为，或者发现移动网络基础设施的安全隐患。（2）实时监测大规模移动网络中对安全漏洞的攻击和利用情况，建立网络整体安全态势的快速感知能力。着眼于移动网络生态系统的整体威胁状况，系统性地研究如何改进现有网络服务的安全机制，通过增强的安全协议和防范方法，以大幅减少端到端通信的攻击面。研究成果包括地安全协议安全分析和检测相关的学术论文1～2篇。

四、本年度开放课题申请书提交时间及联系方式

2017开放课题申请书提交时间：2017年10月30日之前。

附件：

uploadfile/2014/0930/20140930100920872.doc

申请书一式四份，签字盖章后寄至：

北京市海淀区科学院南路6号中国科学院计算技术研究所计算机体系结构国家重点实验室（邮编：100190）

金琳（收）

申请书电子版请传至：jinlin@ict.ac.cn

联系人：金琳，董慧；

电话：010-62600600；

Email：jinlin@ict.ac.cn 传真：010-62600600

附件下载：