请输入关键字
搜索

太初资讯

跨越技术壁垒,打破固有模式,用智慧重新链接关系。

太初元碁正式发布:高兼容性虚拟指令集 PCX,高性能工业级编译器 PCXAC


【引言】

当前,AI算力需求呈指数级增长,国内AI产业迎来前所未有的发展窗口期,构建自主可控、高效安全的AI基础设施已成为产业发展的核心所在。然而,软件生态的兼容性与编译效率始终是制约国产AI加速卡规模化应用的关键——国际主流指令集的技术壁垒、编译器的性能瓶颈,导致不同硬件平台间迁移成本高、硬件算力难以充分释放。


太初元碁首次正式发布高兼容性虚拟指令集PCX、高性能工业级编译器PCXAC,为上述行业痛点提供切实解决方案。PCX虚拟指令集的强兼容特性,能够显著降低跨硬件平台的迁移成本;PCXAC编译器,在性能上目前已超越业界主流的 LLVM,充分释放硬件算力,将硬件算力极致、稳定地释放给每一行代码。

PCX(Parallel Computing eXecution)是太初元碁推出的与硬件架构无关的虚拟指令集。PCX通过对底层的各类计算单元进行逻辑抽象,提供了稳定且可移植、可扩展的并行计算模型。

PCXAC是PCX虚拟指令集的编译系统,由太初元碁自主研发,能够将PCX虚拟指令转换为指定系列的太初AI加速卡的机器指令,从而屏蔽不同系列硬件的底层差异,即同一版本的PCX指令集可以在太初元碁多种系列的硬件上直接编译并高效执行,将程序与不同系列的硬件解耦。有效解决硬件迭代快,软件适配成本高的问题。


产品亮点


  • 高性能:精准适配太初元碁硬件,释放异构众核架构算力

PCX虚拟指令集深度匹配太初元碁的硬件特性,支持用户在SDAA C程序中嵌入PCX指令,实现对关键计算路径的精细优化,有效提升程序在太初元碁系列硬件上的执行效率,充分释放太初元碁异构众核架构的澎湃潜力。


  • 强兼容:无缝适配不同系列硬件,屏蔽硬件底层差异

PCX能够屏蔽太初元碁不同系列的硬件的指令差异。基于PCX开发的应用程序,无需修改,重新编译后,即可在不同系列的太初元碁硬件上运行。严格的向后兼容性,有效保障软件资产的长期可用性,降低因硬件系列不同所带来的迁移成本。


  • 轻量级:轻量级架构设计,资源占用少

PCXAC是一个轻量级的编译器,仅需基础编译环境即可运行,减少开发环境搭建的复杂度与兼容性问题,用户可快速启动编译工作,降低环境配置成本;且在编译过程中对系统资源占用少,避免因编译器运行导致的资源争抢,提升资源利用率。


  • 低成本:简化开发流程,降低技术门槛

PCX通过屏蔽底层物理指令集的复杂性,大幅降低太初元碁众核异构架构的开发复杂度。PCX无需用户深入掌握不同系列硬件的差异,只需专注核心算法逻辑的设计与优化,减少硬件适配的重复开发工作;同时,支持由SDAA C的编译器TecoCC自动生成PCX指令,有效降低编码门槛与调试成本,提升开发效率。


  • 功能全:工具集丰富,问题场景覆盖全面

PCX提供完整的开发分析工具集,覆盖从编码到运行的全流程。静态检查工具,在PCX程序编译期间,提前预警内存泄漏等隐患;动态检查工具,在PCX程序执行期间,动态检测越界访问、未初始化使用等深层问题。助力用户更早发现、更快定位潜在缺陷,提升开发效率与代码质量。


性能实测


在太初元碁 T100 加速卡上,太初元碁对深度学习算子(卷积、规约等)进行严格的单卡性能对比测试。实测结果显示:使用 PCX 虚拟指令集编译生成的程序,其运行时性能较基于 LLVM 编译的版本有大幅提升。


实测数据表明,PCX 能够深度适配国产硬件,且其编译器 PCXAC 能够充分将硬件算力转化为性能优势。PCXAC 相较 LLVM 的性能提升,不仅证明 PCXAC 编译器在国产算力转化效率上的领先性,更预示着在实际场景中能够大幅降低训练与推理的时间成本。


学习资源


更多详细信息,可以登录太初官方文档中心(http://docs.tecorigin.com/),或扫描下方二维码,快速获取太初元碁PCX虚拟指令集的学习资源。

以兼容破壁垒、以性能释算力,PCX 与 PCXAC 的正式发布,不仅是国产基础软件领域的一次关键突破,更是国产 AI 产业从 “硬件突围” 迈向 “生态自立” 的重要里程碑。


未来,太初元碁将持续深耕软硬件协同创新,以开放姿态携手行业伙伴共建自主可控的算力生态,共同推动国产 AI 计算底座走向更高水平的自主与繁荣。