国产显卡加速替代CUDA 摩尔线程开源vLLM-MUSA
智能科技 2024-11-06 wer5556
近日,摩尔线程在推动国产GPU AI发展方面迈出了重要一步,正式上线了大语言模型高速推理框架开源项目vLLM的MUSA移植版本。这一举措为开发者提供了基于摩尔线程全功能GPU进行MUSA移植的范例,有助于进一步完善和拓展MUSA应用生态。

vLLM作为一个高效且易用的大模型推理和服务框架,在业界已得到广泛应用。摩尔线程基于vLLM的v0.4.2版本进行了移植适配,使其支持摩尔线程GPU后端Device,并实现了完全开源。这意味着开发者可以在此基础上进行二次开发、升级vLLM到社区更新版本等操作,进一步推动AI技术的发展。
值得一提的是,摩尔线程的MUSA架构具有先进性,并且其软件栈对CUDA具有优良的兼容性。通过MUSIFY代码自动转换工具,用户可以轻松地将原有的CUDA代码迁移到MUSA平台,实现替代。同时,CUDA相关库的调用也可以快速替换为相应的MUSA加速库,如算子库muDNN、集合通信库MCCL、线性代数库muBLAS等。
摩尔线程的这一举措不仅大幅提升了应用移植的效率,缩短了开发周期,还为开发者提供了一系列实用工具和脚本。这有助于加速国产GPU AI的发展,推动AI技术在更多领域的应用和落地。更多关于摩尔线程vLLM-MUSA开源项目的信息,可访问其GitHub页面进行了解。
(来源:中关村) The End
相关阅读
- 谷歌前CEO谈OpenAI CEO离职:他将公司从一无所有发展到价值900亿美元
- 海岱好市:齐风沉浸街区亮相
- 京东11.11暖暖惊喜日11月7日开启,立冬百亿补贴低至5折
- Google Glass 2.0来了!Google牵手XREAL发布全新AR眼镜
- 用户、开发者和机构强烈反对后,苹果撤销“在欧洲削弱PWA应用”计划
- 天猫精灵发布哇哦闺蜜机新品:100Hz高刷屏,2799元更普惠
- 抖音生活服务启动“Let's北京·夜京城2.0”活动,助燃夜经济
- 日本宣布2024年继续将核废水排海:5.46万吨 排30年
- 问界M9上春晚背后:赛力斯超级工厂硬实力如何炼成?
- 英伟达RTX 3050 A移动显卡曝光:64-bit位宽、4GB GDDR6显存、1792个CUDA核心