您的位置:首页 > 财经 >

OpenAITriton已开始合并AMDROCm代码,9月20日举行开发

2023-09-05 13:56:34 来源:IT之家阅读量:16928   

,Triton 是一种类似于 Python 的开源编程语言,它可以使没有 CUDA 经验的研究人员顺利编写高效的 GPU 代码,而且号称小白也可以写出与专业人士相媲美的代码,就是让用户用相对较少的努力实现最高的硬件性能,但 Triton 初期只支持英伟达 GPU。

OpenAI 声称:Triton 只要 25 行代码,就能在 FP16 矩阵乘法上达到与 cuBLAS 相当的性能。

从 Github 我们可以看到,OpenAI 已经开始在最新的Triton 版本中合并 AMD ROCm 相关分支代码,也正因此暴露了很多东西。也就是说,最新 Triton 后端已适配 AMD 平台,可谓意义重大。

通过官方的说法来看,他们已经通过了“test_core.py”上的大多数单元测试环节,但由于各种原因跳过了一些测试。

IT之家注意到,OpenAI 还宣布将于 9 月 20 日上午 10 点至下午 4 点在加利福尼亚州山景城的微软硅谷园区举行 Triton 开发者大会,而日程安排中就包括“将 Triton 引入 AMD GPU”和“Triton 的英特尔 XPU”两大环节,预计 Triton 将很快摆脱英伟达 CUDA 垄断的历史。

值得一提的是,Triton 是开源的,比起闭源的 CUDA,其他硬件加速器能直接集成到 Triton 中,大大减少了为新硬件建立 AI 编译器栈的时间。

在此前发布的 PyTorch 2.0 版本中,TorchInductor 便引入了 OpenAI Triton 支持,可为多个加速器和后端自动生成快速代码,同时实现用 Python 取代 CUDA 编程来写底层硬件的代码。也就是说,Triton 已经是PyTorch2.0 后端编译器关键构成部分。

实际上,此前 AMD ROCm 则主要是采用 Hipify 工具实现CUDA 兼容,而随着 AMD 开始为 RDNA 3 消费级显卡提供 ROCm 支持,预计后续将会有更多平台选择适配 AMD 硬件。

相关阅读:

《AMD 将为 RDNA 3 消费级显卡提供 ROCm 支持,从 Radeon RX 7900 XTX 和 Pro W7900 开始》

《AMD 正式推出 HIP SDK:拓展 ROCm 生态,支持运行英伟达 CUDA 应用》

广告声明:文内含有的对外跳转链接,用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。

栏目导读
北汽极狐阿尔法S获耐腐蚀性能白金等级证书

北汽极狐阿尔法S获耐腐蚀性能白金等级证书

CA-CAP(中国汽车耐腐蚀与老化性能评价规程)在海南博鳌举办,标志着我国汽车行业耐腐蚀与抗老化测评领域向前迈进一大步,

2022-02-14 19:44
从口罩到健康码,冬奥会如期举行背后的四重科技助力

从口罩到健康码,冬奥会如期举行背后的四重科技助力

北京冬奥会开幕在即,新冠病毒已经进化出传染力更强的奥密克戎新变种,加上病毒喜寒畏热的特性,叠加春运大范围的人员流动,其防

2022-01-28 08:13
好空气“随叫随到”,米家空气净化器4让健康生活更有趣

好空气“随叫随到”,米家空气净化器4让健康生活更有趣

又是一年岁末时,按照惯例,春节应是亲友团聚的欢乐时期。然而疫情的突袭,让家人的团聚变得更加珍贵,也让更多的家庭明白健康的

2022-01-26 16:31
沃尔沃方锡智:用户的困惑和需求,“沃”都在心里

沃尔沃方锡智:用户的困惑和需求,“沃”都在心里

在这个飞速发展的信息化时代,高端产品已经越来越不是“一锤子买卖”,售后服务成为了增强用户黏性、促成口碑向销量转化的关键所

2022-01-26 14:51
钦培吉:借IPO,沃尔沃迎来更大施展舞台

钦培吉:借IPO,沃尔沃迎来更大施展舞台

今年以来,沃尔沃动作频繁,受到了业界内外的广泛关注。3月,沃尔沃宣布将在2030年实现全面电动化,成为纯电豪华品牌,且所

2022-01-18 14:34