当前位置 >>

研究成果

国家自然科学基金面上项目“面向物端应用的深度学习处理器自动设计技术”（批准号61876173）成果科普性介绍

撰稿：摄影：发布时间：2023年02月23日

项目名称：面向物端应用的深度学习处理器自动设计技术（批准号61876173）

项目负责人：李华伟研究员（中国科学院计算技术研究所）

项目时间：2019年1月-2022年12月

项目完成单位：中国科学院计算技术研究所

项目成果摘要

深度学习处理器对于物端智能应用日益重要。通用人工智能芯片编程容易但能效不高、专用深度学习芯片能效高但定制设计成本高与难度大，如何平衡“通用”与“专用”是实现物端计算智能需要解决的两难问题。亟需从深度学习软件模型到处理器硬件架构的设计自动化工具来满足碎片化物端应用对智能处理器的快速定制需求。

该项目针对物端应用的深度学习处理器自动定制框架，提出了系列从神经网络模型层到体系结构层、微体系结构层、电路层的自动映射与设计优化方法：

1）在神经网络处理器体系结构层自动映射方面，提出了基于计算存储器的向量检索架构自动设计方法VStore、用于高效设计神经网络加速器的神经网络搜索处理器、面向FPGA的图神经网络硬件加速器自动生成框架等，为神经网络处理器的体系结构自动设计和优化提出了有效解决方案。

2）在考虑应用约束的微体系结构参数自动优化方法方面，提出了基于图神经网络的片上网络功耗-性能-面积评估算法、处理压缩视频流的神经网络加速架构Alchemist、基于阻变式存储器的灵活精度调整卷积神经网络加速器等，在满足应用需求的情况下提升了系统的性能、能效和可靠性。

3）在面向物端定制神经网络的电路层自动映射与优化方面，提出了面向移动平台的实时性神经网络自动优化设计方法、云端与边缘协同的深度学习任务映射方法、面向状态感知的ReRAM神经网络计算方法等，针对物端资源受限的情况下设计了系列低功耗的神经网络加速器电路。

项目研究扩展了传统的高层次综合概念范畴，是高层次综合在深度学习处理器上的创新性应用，具有重要的科学意义。项目同时考虑了目标应用的实时性目标与能耗约束，创新了面向物端专用领域的深度学习处理器芯片设计自动化技术，以满足物端对人工智能应用的泛在、多样化需求，可有效助力物端计算的智能化。

该项目合计发表学术论文40篇，含IEEE/ACM期刊论文14篇，IEEE/ACM国际会议论文25篇。申请发明专利5项，获得软件著作权2项。

附件下载：