导读:多家上海芯片企业准备IPO之际,“独角兽”壁仞科技传来了融资消息。3月11日晚,上海国投先导基金在公众号宣布,近日上海国投先导人工智能产业母基金联合领投壁仞科技,数家知名投资机构及产业资本跟投。“本次联合领投壁仞科技,不仅在资本层面耐心加持,未来将在技术攻关、产业赋能、生态链接等方面深化资源协同,彰显了上海加速构建全国产自主可控智能算力体系的决心。” 上 ……
大模型浪潮下迎算力巨变,上海芯片企业争做AI“潮人”

多家上海芯片企业准备IPO之际,“独角兽”壁仞科技传来了融资消息。3月11日晚,上海国投先导基金在公众号宣布,近日上海国投先导人工智能产业母基金联合领投壁仞科技,数家知名投资机构及产业资本跟投。

“本次联合领投壁仞科技,不仅在资本层面耐心加持,未来将在技术攻关、产业赋能、生态链接等方面深化资源协同,彰显了上海加速构建全国产自主可控智能算力体系的决心。” 上海国投先导基金表示。

大模型拔高AI芯片整体需求量、提高AI芯片厂商市场关注度的背景下,上海的壁仞科技、沐曦、燧原科技正在寻求业务扩展和资金注入,它们也成为近期这波AI芯片企业上市潮的主力。DeepSeek火爆之后,“国产模型+国产芯片”组合受市场关注,则成为这些芯片公司近期大步拓展的契机。

大模型浪潮下迎算力巨变,上海芯片企业争做AI“潮人”

沐曦CTO杨建告诉第一财经记者,全球算力底座正在发生变化,目前全球98%大模型训练的算力基座还是英伟达,但随着海外芯片算力限制带来的难题逼近,全球算力路径将逐渐演变为两条并行路线,海内外路径有所不同。到今年年底,可能会有部分预训练转入非英伟达的卡,从今年开始,业内也会逐渐看到国产芯片在推理场景的机会。

密集融资

上海多家AI芯片公司频传上市或获得融资的消息。自去年起,与壁仞科技准备IPO相关的消息不断。2024年9月,壁仞科技在上海证监局办理辅导备案登记,拟首次公开发行股票并上市,辅导券商为国泰君安。今年2月,还有消息称壁仞科技考虑港股IPO、拟集资3亿美元,商议仍在进行,但该公司未公开明确回应此事。

在正式IPO之前,壁仞科技近日获得了由上海国投先导人工智能产业母基金联合领投的融资。上海国投先导基金表示,这是上海国投先导人工智能产业母基金首个直投项目,也是上海国资在AI生态布局中的重要一子。

壁仞科技是GPU(图形处理器)芯片厂商,2022年该公司曾推出GPU产品BR100和BR104,均采用7nm工艺,其中BR104对标英伟达2020年推出的A100。BR104 FP32算力为128TFLOPS(每秒浮点运算次数),BR100 FP32算力为256TFLOPS,当时壁仞科技号称其产品创全球算力新纪录。

准备IPO的上海芯片厂商还有多家。今年1月,中国证监会官网显示,沐曦集成电路(上海)股份有限公司已启动A股IPO上市辅导,由华泰联合证券担任辅导机构。沐曦也是GPU厂商,旗下有人工智能推理GPU、通用计算GPU和图形处理GPU。2024年8月,燧原科技则与中金公司签署上市辅导协议。燧原科技旗下有人工智能推理加速卡、训练加速卡等产品,公司聚焦人工智能云端和边缘算力场景。

这几家上海芯片企业掀起IPO潮的背景,是人工智能训练和推理需求增长下,市场对AI芯片企业的关注度上升。针对人工智能带来的大算力等需求,去年起,这几家芯片厂商对大算力集群和异构算力就多有布局。

2024年,沐曦在全国相继交付九大算力集群,全年布局算力集群规模超万卡。壁仞科技则已实现国内首个四种及以上异构芯片混训技术落地,首代壁仞科技通用GPU产品基于原创训推一体芯片架构,该产品已在多地智算中心落地。

上海芯片+国产模型

乘着AI热潮,包括芯片公司在内的AI产业链公司正在形成更紧密的生态协同关系。

在模型与芯片之间,适配正在进行。知名的开源技术社区开源中国旗下有一站式大模型托管平台模力方舟(Gitee AI)。开源中国董事长马越告诉记者,公司合作最多、时间最长的天数智芯,已适配了500多个模型。

天数智芯也是上海的AI芯片公司。天数智芯相关人士告诉记者,2024年5月DeepSeek V2 发布时,公司便注意到并迅速完成与该模型的适配工作。今年1月DeepSeek-R1推出后,天数智芯又很快完成适配。近日,天数智芯还与佳都科技合作推出DeepSeek一体机。

天数智芯相关人士告诉记者,目前的AI产业中,芯片与模型开发合作渐成风气。国产模型取得突破是加快国内“模型+系统+芯片”闭环形成的一个机会,国产模型性能提升能吸引更多国内系统和芯片厂商合作,芯片厂商也会为了支持国产模型而研发更适配的芯片。此外,DeepSeek-R1开源会吸引大量企业和开发者使用,可能带来更大算力需求。

沐曦、壁仞科技、燧原科技也纷纷完成DeepSeek模型适配。2月,DeepSeek开源代码库FlashMLA,沐曦的团队花费2个小时完成了该代码库与沐曦GPU的适配工作。壁仞科技适配DeepSeek-R1全系列蒸馏模型后,今年3月,阿里推出推理模型QwQ-32B,壁仞又推出了QWQ-32B大模型一体机。燧原科技则在全国各地的智算中心完成了DeepSeek全量模型部署。

在业内人士看来,DeepSeek火爆给国产芯片带来了增长的机会。杨建对记者表示,DeepSeek促使的应用端爆发,可能是从私有化部署开始的。鉴于英伟达芯片的主要销售渠道不在零售市场,而私有化部署较依赖零售市场,2025年国产GPU的一大机会就在于私有化部署。

已经有一些国内大模型厂商在使用国产算力。2024年,上海的AI算力基础设施层企业无问芯穹发布了全球首个支持单任务千卡规模异构芯片混合训练的Infini-AI异构云平台,该平台支持AMD、华为腾、天数智芯、沐曦、摩尔线程、英伟达六种异构芯片大模型混合训练。记者从无问芯穹了解到,以上Infini-AI异构云平台上线以来,Kimi、生数科技、智谱AI等大模型厂商已在该平台上使用异构算力。

上海AI生态“黏合”

算力、语料、大模型都是上海人工智能生态的关键环节,整个生态目前正在逐渐“黏合”,形成一个国产AI生态闭环。

以无问芯穹为例,该企业在研发连接多种芯片和多种模型的相关技术,这类企业已在吸引人工智能厂商使用包括AI芯片在内的多元算力。今年2月的2025年全球开发者先锋大会上,无问芯穹、模速空间和上海仪电牵头推出国内首个“算力生态超市”模速空间算力生态平台,为入驻模速空间的人工智能企业提供一站式服务。

该平台的算力扶持计划专区展示政府算力券补贴政策,完成注册的入驻企业可获得由上海市徐汇区、模速空间和无问芯穹定制的100万元等价算力大礼包。

上海企业在语料领域也有所积淀。上海库帕思科技有限公司是一家立足上海、服务全国的语料数据公司,该公司由多家国企及上海头部人工智能企业共同出资。库帕思方面透露,公司在过去的大半年时间里投了很多精力和经费,来研究数据的自动清洗和标注平台。今年年底公司会研发出300个智能清洗算子和300个智能标注算子,来代替绝大部分甚至90%以上的人工清洗和标注。

大模型浪潮下迎算力巨变,上海芯片企业争做AI“潮人”

“我们可以微利或者微亏,来支持产业发展,这是我们的功能性定位。库帕思虽然有点辛苦有点难,但是我们认为应该要兼顾低成本和高质量以支持整个大模型产业的发展。”库帕思CEO黄海清对记者表示。

就在3月12日,库帕思与上海智元新创技术有限公司签署战略合作协议。双方将围绕具身相关产业生态建设、行业标准共建、行业语料库构建等方面,开展长期深度业务合作,共同推动具身智能产业快速发展。

上海的大模型厂商也在与芯片厂商加强合作,并不断进入新的应用场景。上海目前知名的大模型独角兽包括MiniMax、阶跃星辰等。今年2月,天数智芯副总裁汪凌表示,天数智芯与瑞幸咖啡已基于全国两万个门店共同开发了一些应用场景,近期还与阶跃星辰合作了千卡训练集群。阶跃星辰、天数智芯和瑞幸咖啡宣布达成战略合作,三家公司将共同研发新零售垂类领域专属大模型并推动AI应用落地。

文章来自:人工智能实验室

Loading

作者 yinhua

发表回复