“芯原视频处理器VPU全球第一,全球数字中心的许多客户都采用我们的技术。AI领域芯原也在持续发力,截止到今年2月底,集成芯原神经网络处理器(NPU)IP的人工智能类芯片已在全球范围内出货量超过1亿颗,在10个应用领域超过70家客户使用我们的IP,生产出128款AI芯片。芯原图形处理器(GPU)产品全球累计出货量20亿颗。” 芯原执行副总裁汪洋近日在深圳举办的高峰论坛上对媒体表示。

近年来生成式AI的进展是怎样的?生成式AI对半导体行业有哪些推动作用?芯原微作为国内半导体IP的领先公司,如何在普惠性AI技术领域,推出了客户需求的亮眼IP产品?本文进行详细分析。

生成式AI半导体需求高速增长,2030年市场规模超8000亿美元

受到AIGC的影响,各个行业加速了对AI的应用。亿级以上大模型参数在推动各行业对爆发式增长的算力需求。

汪洋表示,随着模型规模的不断增大,训练计算量呈现指数型增长。ChatGPT3拥有1750亿个参数,计算需求约为315000百亿亿次;GPT4约有1.7万亿个参数,计算需求约为1.35亿百亿亿次。一个拥有10万亿个参数的理论模型将需要我130亿百亿亿次的计算量,将需求1060万个A100 PCle 80GB芯片或者3336个采用256个Grace Hopper芯片的DGX GH200系统。

算力增大,模型不断迭代,形成螺旋上升的态势。我们如何看待AI带来的市场机会?芯原执行副总裁汪洋认为,2028年,用于端侧微调卡和推理卡的销售额将超过用于云端的训练卡。除了大芯片之外,推理和端侧芯片也是我们需要关注的领域。

IBS预测,全球半导体市场规模在2030年可以达到1.25万亿美元。其中与生成式AI相关的将占据8392亿美元的市场份额,覆盖云端和端侧,消费和汽车领域。到2030年,生成式AI将占据70.9%的市场份额。

生成式AI将从三大领域带来增长动能:一、到2030年,生成式AI将使服务器领域的半导体收入增至三倍。2024年到2030年,服务器没有采用AI技术将成为少数,快速增长的服务器主要是采用AI的领域。二、个人电脑将以最高的渗透率推动先进半导体消费,PC领域会有接近2倍的增长,主要来自AI PC的驱动;三、到2030年,生成式AI将令智能手机的半导体收入增至近2倍。

芯原IP助力AI终端设备落地

AR眼镜是AIGC很好的入口。9月份,Meta发布首款AR眼镜Orion,和先前的产品相比,Meta Orion外观不厚重,集成AR功能都让大家看到AR眼镜落地的希望。AR眼镜要解决低功耗、显示和手机协同三大问题,就可以成为用户青睐使用的便携式产品。

汪洋说:“芯原极低功耗IP,让图像从摄像头进来,直接到边缘侧的编码,不需要DDR,在解码后送到显示端,也不需要DDR,被AR/VR产品广泛采用。通过利用芯原的FLEXA®技术,VIP9000还能与芯原的图像信号处理器(ISP)及视频编码器无缝集成,实现低延迟的AI-ISP和AI-Video子系统,且无需DDR内存。”

汪洋强调,AI+AR能够有效提升产品的智能属性,赋能语音助手、图像分析、智能导航等场景。为终端用户提供个性化、智能化的产品。

AR行业的发展多有起伏,跨越低谷,AR行业迈入了复苏增长期。5G技术的快速发展,元宇宙概念的落地,硬件生态内容持续完善等多重因素助推AR产业复苏。

AR产业发展潜力巨大,2023年全球和中国AR设备出货量达50万台和24万台,调研机构预估2026年到2027年实现倍数增长,2027年将分别突破1500万台和750万台。预计中国AR设备将率先达到百万级别,占全球AR设备的一半。有望成为AR单一最大市场。

除了AR设备外,芯原在德国Embedded World展示了Project Open Se Cura,谷歌的Open Se Cura是一个由设计工具和IP库组成的开源框架,目的是在加速安全、可扩展、透明和高效的AI系统的发展。芯原提供多个IP,低功耗芯片设计IP,BSP,并且负责该项目的商业化。

汪洋还透露,芯原已提前在AI Pad赛道进行布局,他最后表示,以ChatGPT为代表的大模型引领算力硬件的牛市预期将会在2026年到2027年到来。

文章来自:电子发烧友

Loading

作者 yinhua

发表回复