谷歌 TPU 对英伟达 GPU 的直接竞争,引发市场广泛关注。而如今,中国 AI 芯片领域也正加速布局,发力非GPU芯片突破。

12月2日,非GPU赛道的核心AI芯片公司清微智能宣布完成超20亿元人民币 C 轮融资。

本轮融资由北京市属国企京能集团领投,北创投、建投投资、武岳峰科创、成都科创投、华泰紫金、智路资本、中南泊富、凯联资本、图灵资产、硬核坚果资本、拓锋投资、米聚资本、允泰资本、和而泰、中科元创跟投,老股东京国瑞(北京信息产业发展投资基金)、中关村科学城公司、商汤国香资本、闻名投资、卓源亚洲、源余投资、考拉基金持续追投。

据悉,清微智能亦是国内研发“非 GPU”新型架构 AI 芯片的代表企业。其研发的可重构AI芯片既能够保留GPU通用性的同时,通过算子的动态重构,趋近TPU等专用AI芯片的能效优势,也被称为“通用型TPU”。

“我们正处在一个AI模型爆炸的年代,模型的迭代速度已经从过去的以年、以月为单位,进化到今天开始以周为单位进行演进。”在近期举行的2025集成电路发展论坛(成渝)暨三十一届集成电路设计业展览会(ICCAD-Expo2025)上,清微智能副总裁陈逸伦表示,从GPT-5、Qwen到DeepSeek等大模型的快速迭代,背后是对计算能力永无止境的苛求。

wKgZO2kuxwaAMR3JAA3XP_ECYFo584.png

图:清微智能副总裁陈逸伦

陈逸伦表示,若按照当前趋势持续扩张,预计到2030年,全球前沿AI的算力集群成本将超过1000亿美元。

成本降50%、能效升3倍,可重构推进国产AI算力

据悉,可重构计算架构技术兼具通用芯片灵活性与专用集成电路高效性的优点,能根据不同的算法和应用需求灵活配置硬件资源,带来更高有效的算力和更低的功耗。《国际半导体技术路线图》曾表示,可重构技术是最具前景的未来计算架构。

清微智能是全球少数将可重构计算实现大规模产业化的公司,走出了与传统GPU芯片完全不同的路径,利用非先进工艺达到同样甚至更优的能效和性能,并利用晶圆级芯片等创新技术,不断优化芯片性能,并保持优秀迭代能力。

作为源自清华大学的全球可重构架构计算领导者,清微智能已量产TX5边缘算力系列、TX8云端算力系列等产品。

截至目前,清微智能可重构芯片累计出货量已经超过3000万颗。

在云端层面,清微智能可重构AI芯片已在全国十余座千卡规模智算中心实现规模化落地,以独特“C2C算力网格技术”为核心,构建出高带宽、低延迟的数据流通路。相较于依赖外部交换机的传统方案,清微在扩展性、灵活性和传输效率上实现了架构级的代际提升。

搭载TX81芯片的REX1032训推一体服务器可支持万亿以上参数大模型部署,整体解决方案成本相比同行业产品降低50%,能效比提升3倍。

根据IDC数据,2025年上半年清微智能AI加速卡出货量位列国产商用类企业“第一梯队”。

“三层兼容”的可重构算力软件生态

清微智能的可重构计算技术并非孤例,而是全球业界的共识性方向。

陈逸伦指出,从国外斯坦福孵化的Sambanova,还有采用类似的谷歌TPU,全世界顶尖科研机构和公司都在这个方向上做持续探索。这表明可重构计算已获全球验证,是通往未来的关键赛道。

在生态建设方面,面对“90% AI开发者仍习惯CUDA”的现实,清微智能采取了”三层兼容”策略,与传统CUDA生态形成差异化优势。

其一是对国外生态的兼容,例如兼容CUDA API,像cuDNN(专为深度学习设计的库)、cuBLAS(用于线性代数运算的库)用户都可以使用,清微智能和英伟达CUDA生态的兼容也在持续完善。还有一些主流的神经网络框架,比如PyTorch,TensorFlow等,清微智能也都做了完整兼容适配,保证框架上编程用户做到无感迁移。

其二是与特色生态建设。Triton是OpenAI主推的开源编译器,行业内主流大模型厂商都在向Triton做迁移,清微联合智源研究院,积极参与国内Triton生态的建设工作。

其三,可重构芯片融合可重构计算与RISC-V指令集架构,由于其底层兼容RISC-V指令集,用户可以用RISC-V去做整个芯片的编程,便于性能调优。

另外,像一些主流的神经网络框架,比如PyTorch,TensorFlow等,清微智能也都做了完整兼容适配,保证框架上编程用户做到无感迁移。因此,通过拥抱开源Triton+RISC-V生态,同时也兼容CUDA,清微智能可以为不同类型客户提供适配方式。

“我们希望能够做到客户是对底层架构是无感知的,所以我们在中间做了相应的封装。”陈逸伦表示。

在产品规划上,陈逸伦透露,明年公司计划推出性能更高的TX82系列产品。

未来中国不应错过国产非GPU架构窗口期

纵观当前国际厂商的芯片架构迭代,往往采用先进工艺提高晶体管密度、处理器架构微调、增强带宽等方式,而可重构计算的优势是像搭积木一样构造电路,利用数据流的形式使得计算数据在芯片内部单元流动,减少与外部存储的交互。同时3D堆叠技术、晶圆级芯片也为可重构计算架构的发展提供很多新的思路。

关于技术迭代速度,陈逸伦认为,清微智能的“可重构架构”计算是动态的,像搭积木一样去构造电路,并采用了数据流形式,计算时数据在芯片内部单元流动,不会到显存上频繁做交互,因此能效可以超过同类产品。

陈逸伦进一步强调,“在我们看来,可重构计算+3D Chiplet+晶圆级集成至少还可以探索很多年,这相当于‘芯片界的电磁弹射’,每一步都在对软件、硬件作重新定义,在这条路上有更广阔的发展空间。”

事实上,国产替代、自主创新已经是大势所趋,且刻不容缓。而基于可重构等新架构国产AI加速卡芯片,已经迎来了换道超车的最佳机遇。

“国产非GPU架构窗口期只有两年,错过就不再。”陈逸伦直言,清微智能所代表的可重构计算路径,正为中国算力自主可控开辟出一条切实可行的创新之路。

文章来自:电子发烧友

Loading

作者 yinhua

发表回复