
4月25日至26日,东南大学科学与教育创新孵化中心(第1阶段)的特殊训练营成功地在尤隆湖校园举行。该活动由Ascend Science和教育创新创新创新创新创新创新创新创新创新中心和东南大学的网络和信息中心发布。它专注于AI基本软件和硬件解决方案,大型模型培训和技术技术,DeepSeek Architecture Analysis和Edge Expanight,它为本科,硕士和计算机医生以及东南大学相关的主要社会专业的大满贯提供了深入的技术交换平台。该活动旨在根据Kunpeng上升基础和AccelerateG实施国内AI技术在科学研究和工业应用中,促进生态系统人才的建设。上升ai堆栈技术:软而困难的协作赋予了大型模型。在第一天的过程中,Ascend的专业产品线Yang Yueyang系统地引入了用于大型培训模型和促销场景的主要软件和硬件解决方案。他建议,大型模型从训练前训练 +训练后训练后移动,推理的体现从独立群体转移到群集,并且变化的变化速度得到了加速。其中,Ascend AI软件和硬件技术为技术支持提供了全面支持。在硬件级别上,完整的上升Atlas Server支持高带宽点对点通信,液体冷藏的设计以及盲目的插件操作和维护,可以涵盖中央练习,边缘推理和并行(EP)方案的大规模专家。同时,异质计算体系结构CAN提供了基础技术,例如操作员和Communi阳离子;在软件层面,思维孔,思维速度训练加速库,Mindie推理引擎和MindStudio Full Process链的框架,模型开发效率的显着提高。杨阳强调,通过与柔软而艰难的设计合作,Ascend为大型模型培训,工业和行业维修应用提供了高性能和高可用的技术基础。 。在这段时间里,他介绍了当前的超速行业套件和对Mindspeed的技术体系结构的重点分析:依赖NPU计算能力的依赖,训练效率通过压缩压缩,激活重新组件进行优化,优化计算(连接维修,压缩融合),融合(Swap,fusion)(Swap,Fusion,fusion formife forece forece forection force force force force force force forection forne)。最后,我们推出了三个主要套房,包括Mindspeed LLM,MM和RL。其中,LLM支持许多大型语言模型的预制模型,并为整个过程提供工具; MM专注于动态模态模型和模块化成分,专注于高性能和模块化。 RL可以支持扩大加强的部署,并提供全力学习的增强。 (Mindspeed R&D专家Liu Zhe)国内实践:从模型的建模到多模式开发上升计算工程师Lei Zhenzhen和Cheng Linsheng分享了在大型模型领域中撒尿的想法。 Lei Zhenzhen介绍了Mindspeed正在基于Ascend生态系统建立共享的培训框架,该培训框架可以经过良好的训练和主流模型。他还解析了模型开发的七个关键步骤,强调了与开放资源培训结果和共享性能技术相同的关键点。 Cheng Linsheng指出,Mindspeed MM是ASTENG多模式大型套件,用于大规模共享培训,并SUP端口多模式生成和多模式理解。它旨在针对Asteng芯片的最终多模式培训解决方案,包括预安装的基本行业模型,数据工程,分布式培训和加速,预培训,微调,在线侵害任务和其他功能。 Mindspeed MM具有统一体系结构,完整的任务流,灵活组装和二级开发的支持,丰富的数据工程,基本室外模型以及对Mindspeed-Core加速算法的本地支持,这些算法可以实现整个多模式训练过程的加速。完整的MM Suite模型迁移开发链接,从初始模型调查到最终调整和性能进度,实际移动模型可以方便地操作,并且已预装相关的有用工具以帮助对齐准确性和表现优化。 Mindspeed MM的成就有效地促进了国内AI生态系统的促进模态大型模型技术,并为工业应用开放新的可能性。 。专家介绍了Mindie推理引擎层次结构架构,包括ATB加速框架(在并行策略和内存管理中优化变压器),LLM组件(减少扩展阈值)和以服务为中心的支持(操作和操作工具)。在实际阶段,专家们展示了从拉动玻璃,调整服务模型的重量到扩展服务的整个过程,并讨论了热门问题,例如INT8音量的准确性和模型的大规模建模。鉴于对DeepSeek技术的原理和建筑的审查,专家们审查了Pandeepseek的现代技术,包括双向双向,MOE负载平衡,FP8混合精度培训,考虑到效率和准确性等。随后的版本和迭代值得希望。 。重量体积E,优化多机网络拓扑和服务调整,团队意识到了Assen服务器上对该模型的良好认可。强调“部署需要注意版本差异,而加强研究研究的模型更适合实际的互动情况”。与他共享视频记忆计算的错误和公式的经验,提供实用的参考学生。 。开发板具有内置的ASCEN AI处理器,该处理器结合了Mindspore轮廓图的动态图和静态优化功能,并支持CV/NLP/形成的字段上的典型模型和低于4B的大型模型的侧端inferrence。传教士解释了接口转换的衡量标准(pytorch to Mindspore),网络验证和性能调整,并展示了如何通过三行代码调用JIT汇编,以实现“集成训练并推动”轻量级开发。通过实用的操作,学生体验了扩展终端设备上模型和操作的整个过程。 。东南大学网络和信息中心副主任胡·扬宁(Hu Yining)得出结论:“孵化中心将继续促进'科学研究 - 教学行业'循环,并具有Ascend的土著发展能力的复合人才。” Ascend计算技术开发团队的负责人鼓励学生致力于建设国内AI生态系统:“从操作员的开发到完整的优化,每个链接都是技术成功的战场。”这个特殊的训练营,作为人才培训中孵化中心的重要技能,将继续进行。自2024年11月成立以来,该中心一直在削减大学计算行业的研究,课程系统建设,研究人才培训等。Enter将继续开展相关活动,以促进人工智能技术和工业发展的发展。