清华大学高性能计算中心“探索1000”集群用户交流会举办

6月10日,清华大学高性能计算中心“探索1000”集群系统用户交流会在FIT楼多功能厅举办。清华大学实验室管理处副处长江永亨,科研院项目部主任朱付元,高性能计算中心副主任武永卫、高性能所党支部书记赵颖,Intel高性能计算业务部总监张东升参会并致辞。会议由赵颖、高性能计算中心高级工程师张武生主持。

undefined  

张武生介绍“探索1000”集群系统

张武生首先对“探索1000”集群系统进行了整体介绍,重点展示了“探索1000”集群的使用方式、收费办法及科研成果奖励等内容。其中,对“探索1000”使用VPN、SSH客户端及密钥认证登录流程进行了说明,介绍了“探索1000”集群包年、非包年两类计费方式,并详细说明奖励机时、等量机时费的换算关系与次年机时费用的减免政策。

undefined  

龚正介绍“探索1000”在大规模颗粒-流场耦合计算领域的应用

水利系傅旭东教授课题组博士生龚正、宇航学院许春晓教授课题组博士生李瑞鑫、工程物理系马天予副教授课题组博士生刘凛康进行了组内科研成果及“探索1000”试用情况展示。其中,傅旭东教授课题组使用“探索1000”集群服务,成功实现了大规模颗粒-流场耦合计算平台的搭建,并在调用4480个“探索1000”CPU核的情况下,实现了对220万1mm粒径颗粒84.3亿网格的明渠沙纹运动的仿真计算,平均单步耗时2.66秒;许春晓教授课题组使用“探索1000”集群完成了对120亿网格大小的壁湍流可压缩边界层流动结构的计算,通过在“探索1000”中使用280核并行计算的方式,其计算速度相比另一个规模稍小的集群“探索100”提升了7%;马天予副教授课题组使用“探索1000”完成了自准直SPECT系统研究中关键四步的模拟验证,包括基于Geant4的系统建模、系统优化设计过程的快速模拟评估、系统性能指标的模拟评估以及系统成像性能的综合模拟评估。

张东升对有关HPC+AI融合和混合精度计算相关的内容进行展示。并对Intel Xeno SPR的HPC+AI工作负载能力,AI增强HPC在AI for Science领域的应用以及Intel最新的HPC与AI融合加速解决方案进行了重点介绍。

undefined  

会议现场

本次用户交流会面向校内外科研团队,就“探索1000”集群系统的建设情况、系统配置、使用方式及价格优惠等方面进行了详细介绍。大会还邀请校内用户代表分享了组内科研及“探索1000”的试用情况,以增进学术交流。本次会议的召开不仅增进校内外各科研团队对“探索1000”集群服务的了解,促进了HPC不同应用场景中各学术课题间的交流,也对高性能计算中心集群服务的推广与服务改进提供了支撑。

undefined  

高性能计算中心“探索1000”交流会现场合影

清华大学高性能计算中心于2005年成立,依托清华大学计算机系建设,为校内外各领域科学研究与工程应用提供高性能计算支撑环境。为满足领域用户日益增长的高性能计算需求,高性能计算中心先后建设了“探索3号”、“探索100”、“探索200”、“探索1000”等大型高性能计算集群。“探索1000”是清华大学投资建设完成的新一代机群系统,该系统拥有900个CPU节点,包含50400个处理器核。每个CPU节点配置2个Intel Xeon 6258R 处理器与196G的内存(即单节点56核),其理论峰值速度达4.35PFlops,足以支撑如复杂流体结构高精度仿真计算、大规模网格下的物理模型模拟预测、生物神经元连接结构仿真等高性能计算任务。此外,“探索1000”集群还配置10个GPU节点,每个GPU节点包含8 块 V100 加速显卡,同时搭配56核CPU协同进行数据处理。“探索1000”的GPU集群共包含80块显卡,后续拟继续上线700余A800显卡,用以支持包括大语言模型、多模态模型、3D场景重现等人工智能领域模型的训练。