上海交通大学闵行校区图书信息楼内,一场别开生面的科教创新活动吸引了众多计算机、电子信息及人工智能领域的学生。3月26日下午,鲲鹏昇腾科教创新卓越中心特训营——DeepSeek专场在此成功举办,旨在通过深度解析DeepSeek本地化部署实践,激发学生的自主创新潜能。
活动伊始,昇腾生态技术专家ZOMI酱带来了精彩的技术分享。他深入剖析了DeepSeek大模型的核心架构,并详细讲解了如何利用昇腾Atlas 800 A2硬件优势,通过剪枝和量化技术,实现DeepSeek-R1/V3大模型的加速部署。ZOMI酱指出,借助昇腾芯片的稀疏计算单元,以及CANN的aclSparse接口,可以在保持模型精度损失极小的情况下,大幅压缩参数量并降低推理时延。同时,他还介绍了昇腾Attention计算优化方法Laser Attention,该技术的引入进一步提升了大模型的训练与推理效率。
随后,上海交大网络信息中心的王星泽工程师分享了DeepSeek在高校环境下的部署实践。他详细介绍了在交大本地昇腾服务器上部署DeepSeekV3/R1大模型的全过程,包括硬件设备选择、网络配置、API封装以及前端集成等关键环节。同时,王星泽还结合高校科研、教学和管理中的实际应用场景,分享了提示词技巧和使用案例,为参会学生提供了宝贵的实践经验。
在开发实战环节,昇思布道师非常work老师带领学生们体验了基于香橙派AI pro(20T)开发板的原生开发全流程。他详细介绍了MindSpore在香橙派开发板上的能力支持,并鼓励学生们动手实践。目前,昇思MindSpore AI框架已预置在香橙派AIpro开发板上,并提供了详细的开发指导教程。学生们可以通过动态图+类HuggingFace接口进行灵活调试,结合JIT即时编译技术,兼顾开发效率与执行性能,为边缘端AI部署提供了轻量化解决方案。
活动现场还展示了昇腾生态技术专家与上海交大教师团队共同研发的创新成果。这些成果不仅展示了昇腾技术在AI领域的强大实力,也体现了校企合作在推动科技创新和人才培养方面的积极作用。通过本次特训营,学生们不仅学到了前沿的AI技术知识,还深刻感受到了科技创新的魅力。
据了解,上海交通大学鲲鹏昇腾科教创新卓越中心自2024年6月揭牌成立以来,一直致力于构建基于鲲鹏昇腾技术路线的校级生态合作平台。中心围绕大学计算产业前沿课题研究、课程体系建设以及研究人才培养等方面展开深入合作,为产业输送了大量高质量的鲲鹏昇腾原生人才,并孵化和培育了一系列根植中国的世界级原生科研创新成果。
随着鲲鹏昇腾科教创新卓越中心特训营在全国重点高校的陆续开展,校企协同育人的创新模式正为国产化AI人才培养注入新的活力。未来,中心将继续发挥自身优势,推动产学研深度融合,为培养更多具有创新精神和实践能力的AI人才贡献力量。