新闻公告
上海交通大学获得第五届大学生RDMA编程挑战一等奖
更新日期:2017年10月20日 16:03

       近日,由 HPC Advisory Council (国际高性能计算咨询委员会) 主办的第五届大学生RDMA编程挑战赛落下帷幕。由上海交通大学高性能计算中心韦建文老师指导的参赛队从六十多个参赛队脱颖而出,与中国科学技术大学体系结构实验室指导的参赛队同获一等奖,比赛特等奖由国防科技大学体系结构实验室指导的参赛队获得。 

       RDMA(远程内存直接访问)是一种起源于高性能计算机的网络互联方案,它克服了传统以太网带宽低、缺乏流控机制、CPU占用率高等缺点,为上层应用提供了一个面向消息传输的、端到端的无损高速网络。由于RDMA性能优异且在Infiniband网络硬件上有良好的支持,在全球最强的100台超级计算机中,RDMA已经取代以太网成为主流的网络互连方案。此外,RDMA技术已经从高性能计算领域扩展到传统数据中心,测试结果显示,使用支持RDMA技术的RoCE网络硬件,相比传统万兆以太网方案,在数据库、存储等应用中都获得了更好的性能。本次比赛使用的示例代码MXNet是一个非常流行的分布式深度学习框架,在Pi集群上也有一定的应用。 

       在先前参加的两届RDMA竞赛中,上海交大参赛队获得过两次三等奖。本次参赛,指导老师调整了策略,组件了一支由两名研究生(刘畅、蔡林金)、一名大三学生(程盛淦)、两名大二学生(张栋、黄志杰)组成的参赛队。5位同学从暑假前就开始工作,从RDMA基本概念学起,结合比赛应用MXNet的软件架构,找到了合适的移植方案,优化的版本相比以太网有60%的性能提升。上海交大高性能计算中心管理的Pi超级计算机配备了56G Infiniband网络,以及K80、P100等多种型号的GPU加速卡,为参赛队提供了极大的便利。 

       比赛结束后,三位本科生继续留在高性能计算中心参与科研工作,工作内容包括进一步学习高性能计算知识、整理MXNet优化代码回馈开源社区、使用RDMA技术优化Pi超算上的其他高性能计算应用。对HPC感兴趣的交大同学,欢迎发送简历至 hpc@sjtu.edu.cn 参与实验室工作。