电子发烧友网综合报道 最近Deepseek R1大模型的爆火,吸引了众多车企、手机厂商等宣布在旗下产品中接入R1。当然作为开源大模型,Deepseek 接入门槛较低也是各大厂商积极参与的重要原因之一。

而对于智能手机上的AI大模型应用,此前三星与百度进行合作,接入了文心一言大模型;苹果最早也传出在AI能力上与百度合作,最近最新的消息称将转向使用阿里通义大模型。

三星在刚刚推出的Galsxy S25系列旗舰机型上,加入了多种AI能力,而这次选择的合作方与S24系列不同,S25系列机型采用了智谱的Agentic GLM多模态大模型,实现了AI音视频通话体验等创新体验。

智谱表示,GLM团队于2023年4月开启Agent智能体相关研究,2024年10月,我们推出首个Agent产品AutoGLM,并率先提出Phone Use理念。

首次实现!在手机上与AI进行视频通话交互

智能手机上的AI多模态交互,此前在iPhone16系列的发布会上其实也已经有演示,当时是可以调用摄像头,让AI识别画面中的物体和场景,甚至识别餐馆等信息。不过在Galsxy S25系列上,这个能力进一步升级了。

基于Agentic GLM多模态大模型,在Galsxy S25上能够同时处理文本、语音、图像和视频等多模态数据,并能够使用工具,具备自主行动能力。

其中语聊视界应用让AI视频通话第一次在手机上与用户智能互动。背后的GLM-Realtime支持图片和视频输入,能够精确识别画面中文字和细节,以及流式推理能力带来了低延时。用户可以通过手机摄像头,以通话的形式与AI进行交流,比如询要求翻译画面中的菜单、帮助用其他语音点单等功能,同时拥有多轮记忆能力,提供真正的通话体验。

语聊视界还支持以FunctionCall方式,通过语音对系统级功能进行调用。这背后源自智谱Agentic GLM的能力。同样基于智谱Agentic GLM多模态能力,三星Galaxy S25系列支持社交媒体文案帮写功能,能够基于图片素材,自动生成包括小红书、微博和朋友圈在内的社交媒体文案内容。

Galaxy S25的手机搜索功能也能够直接调用智谱清言智能体进行搜索,基于大模型能力为用户提供即时、精炼、准确的AI搜索结果。而手机中系统级的Now Brief即时简报功能作为用户的智能化个性助手,实现日程管理、交通路线规划等多种综合能力,未来还将和智谱清言智能体平台进行更多联动。

当前AI大模型在移动终端的应用已进入加速落地阶段,国内外头部厂商纷纷通过战略合作抢占技术高地。Deepseek R1的开源特性为行业注入新动能的同时,以Galaxy S25和智谱Agentic GLM为代表的多模态交互创新,正在重新定义智能手机的AI体验边界。通过智谱Agentic GLM大模型实现的实时视频通话交互、跨模态内容生成等突破性应用,不仅展示了端侧AI的实用化进展,更预示着智能终端正在从被动响应向主动服务的范式转变。

文章来自:电子发烧友

Loading

作者 yinhua

发表回复