当前位置 >>  首页 >> 研究成果 >> 科研项目

曙光4000系列高性能计算机设计

撰稿: 摄影: 发布时间:2007年08月29日
      曙光4000系列高性能计算机(简称曙光4000)由曙光4000A、曙光4000L、曙光4000H、曙光4000I 4套系统组成。曙光4000A面向网格环境,具有11万亿次浮点运算能力和8.06万亿次Linpack运算速度,位列2004年6月世界高性能计算机TOP500第十名,是一个通用的系统,具有良好的可扩展性,具有工业标准机群的功能和优点,具有大规模机群计算和面向网格的明显的技术特色。系统与主流的商品化系统的部件兼容、应用二进制兼容,能运行大量的商品化应用软件,在支持64位应用上有显著的优势。曙光4000L面向网络安全应用,具有百万亿字节数据处理能力,能接入和处理32Gbps主干网实时数据流。曙光4000H面向生物信息处理应用,具有5千亿次通用运算能力和4万亿次专用处理能力,采用可重构计算技术对关键算法最高加速3826倍。曙光4000I面向SAR实时成像处理应用,具有异构特性。
 
      曙光4000在海量数据处理、支持网格环境下的多种商业应用、追求性能价格比和性能功耗比、高性能计算机专用硬件加速部件方面进行了成功探索,总体上处于当前国际先进技术水平,在高组装密度商用服务器主板设计、大规模机群管理技术、网格路由器技术等方面达到国际领先水平,使我国成为继美、日之后第三个跨越了商用十万亿次高性能计算机研发、应用的国家。
       
主要技术创新点
 
原始性创新:
• 提出机群操作系统的核心:基于分布式构件的一体化机群操作系统核心;通过元组机制为上层软件提供高可用支持,采用分区多调度策略和资源租借机制提高作业处理能力。
• 提出面向网格的大规模机群结构:通过网格路由器接入网格;通过操作系统动态部署支持系统环境动态配置;通过大规模机群管理的网络化实现网格上单一系统映像。
• 提出高组装密度的商用服务器主板设计技术:国际上第一块2U机架服务器内装配4颗64位Opteron处理器,并集成管理网络接口的主板。
• 提出大规模机群管理网络:单一网络支持机群各节点KVM切换、电源开关控制、硬件状态信息采集。
• 提出多种网格零件:网格路由器与网格钥匙实现细粒度访问控制、用户身份持续验证及网格资源定位和服务路由;网格视图实现网格资源的实时监控,提供与物理位置无关的逻辑视图;网格网关支持网格中机群间互连网络的无缝通信。
 
集成创新:
• 实现高性能互连网络:网络交换芯片采用源址路由、缓冲虫洞路由、PECL接口连接、双路双沿源时钟同步,物理带宽达到双向10Gbps;通信协议支持多套网络消息分片和并行传输。
• 实现高可用性的机群文件系统:支持协作式多元数据服务器和基于日志及分布式事务处理的高可用;支持大文件系统和大目录。
• 实现轻核心操作系统:优化内存管理策略,保证物理内存的连续性,并据此优化通信协议,提高科学计算类应用性能。
• 实现核心级高速Socket:在操作系统核心中实现基于系统域网络的Socket,提高性能,并保证应用二进制兼容。
• 实现面向生物信息处理的硬件加速:实现了多种生物信息处理算法的硬件加速电路,每个加速部件可以包含3072个序列全局联配处理单元,性能达到每秒4096亿次Cell Update操作,和Xeon 2.8GHz相比,可以加速3826倍。
• 实现海量Internet数据在线处理:包括专用智能网卡、基于流的负载平衡、TCP/IP用户空间驱动、四层包过滤。
 
国内外影响
 
      曙光4000A的研制成功引起国内外的高度关注。2004年底美国科学院、工程院组织的“未来超级计算委员会”写给美国政府的研究报告“Getting Up to Speed: The Future of Supercomputing”中指出:“中国高性能计算机领域正在取得重大的进步,其策略是基于商用系统
附件下载: