
就在刚刚,全球首个手机通用Agent,来了!
现在,假如你正在开会,但只需要给手机打一句话,就能让它“自己动起来”,给你点外卖:
- 帮我在美团外卖上,找最近的瑞幸咖啡,点一杯大杯的冰美式。
完整视频见量子位公众号
可以看到,AI在接收到任务的一瞬间,就开始“嗖嗖”地执行起了任务。
它会直接接管你的手机,不需要在各种APP之间跳来跳去,就可以把点外卖的活儿给干完。
嗯,非常直观的感受就是:够方便,够智能。
那么这个Agent到底是什么来头?
它就是智谱刚刚发布的全球第一个手机通用Agent,就好比把Manus的能力搬到了手机一样。
划个重点:免费,人人可用!
或许这时候有小伙伴要说了,让手机自己动的Agent不是已经有了嘛?
非也非也,这次真的有点不太一样。
因为智谱的这个Agent,所有任务都是在云端执行,也就是相当于给你的设备安了个云手机或云电脑,不仅任务执行得流畅,更不影响你使用其它APP!
更重要的是,这也是全球第一个大众消费级的Agent,不只手机(安卓、iOS均可),甚至可以操控云电脑帮你干活哦~
或许,这是你真正免费接触、感受Agent的最佳时刻。
还能做什么?
我们先简单介绍一下AutoGLM的操作方式。
在进入APP之后,可以看到有两个大类别的任务可选,一个是“生活助手”,另一个是“办公助手”。
以生活助手为例,点进来后是一个正常跟AI对话的窗口,但我们需要先点击右上角的“手机”:
然后我们再点击底部的“接管手机”,就来到了之前我们提到的“云端智能手机”界面了:
在这里,我们可以像操作正常手机一样,进入到任务可能需要的APP里,登录并设置咱们自己的账号等。
设置完毕后,我们就让它auto起来了,这一次,我们来个复杂一点的任务:
- 我要买一个200块钱左右的保温杯,帮我在淘宝、京东和拼多多上比一下货。
完整视频见量子位公众号
可以看到,对于“货比三家”这样繁琐的任务,AutoGLM都可以“嗖嗖”地自主跨APP且精准地执行。
而我们所要做的,就是“发起任务→静候结果”即可。
除了这些日常生活中能用到的功能之外,AutoGLM还特别擅长把工作、学习场景中的任务给auto起来。
而且不同于现在PC网页端的Agent,AutoGLM是直接在手机里调用一台云电脑给你干活!
我们先切换到“办公助手”这个模式,界面是这样的:
可以看到,在输入栏的上方,便很方便地展示了“AI视频”、“AI PPT”、“AI 网页”等功能的入口。
这一次,我们先小试牛刀,让AutoGLM生成一份关于Agent的调研报告:
- 帮我生成一份关于Agent的调研报告。
同样的,我们无需做任何操作,就能看到AutoGLM自己用“云电脑”搜集、整理资料,在静候几分钟之后,一份基于近100份参考源、数千字的报告就水灵灵地出来了:
进一步的,我们可以要求AutoGLM把文字的结果做成一份PPT:
- 把这个报告做成一个精美的PPT。
不得不说,原先需要我们耗时起码一天的工作,到了AutoGLM这里,真的仅仅需要几分钟的时间。
怎么做到的?
以上种种实测不难看出,相比传统聊天机器人只会“告诉你怎么做”,AutoGLM已经进化到“直接帮你做”。
而且最重要的一点是,它几乎不占用本地资源。
这也是本次AutoGLM的关键升级之处——为每位用户准备了一台云手机和一台云电脑,类似于云端备用机(里面提前装好了一堆APP)。
有了这个东西,用户无需安装任何应用、无需额外连接,就能直接调动AutoGLM执行各种任务;而且,AutoGLM干活时不会影响用户正常使用自己的设备,二者互不干扰。
更妙的是,一些不常用但不得不装的应用,也可以直接放到云端备用机中,从而释放更多本地存储,让设备运行更流畅。
总而言之,AutoGLM之所以能在手机、PC等设备上流畅运行,背后实打实离不开云端执行这一底层设计。
从更广的视角来看,“云端执行”不仅精准击中了行业痛点,还顺应了当下正在兴起的一股趋势。
今年以来,Agent的火爆有目共睹,但一到落地环节大家就开始集体头疼:
第一,本地设备算力有限,普通手机电脑根本无法支撑高并发、高算力需求的Agent任务。换句话说,偶尔跑跑简单任务还行,一遇到复杂任务就容易“宕机”。
第二,即便是执行一些简单任务,Agent在运行时也会持续占用本地CPU、内存甚至操作权限,严重影响用户正常使用自己的设备,体验感差。
而“云端执行”恰好对症下药——既不占用本地资源,也不干扰用户对真实设备的操作。
正因如此,目前已经能看到有越来越多的行业玩家开始布局云端Agent。
例如互联网大厂这边,阿里云就在世界人工智能大会论坛上推出了专为智能体打造的“超级大脑”——无影AgentBay,以云端电脑形态执行各项任务。
另外,PPIO等云厂商也推出了“Agent沙箱”等产品,为Agent提供专门的云端运行环境。
这些动作都说明,行业内部已经认识到云端执行对于Agent发展的重要性,并开始积极投入资源进行布局。
而智谱此次推出的AutoGLM,正是依托这一设计,从只能跑跑简单任务的初级Agent中脱颖而出,切实融入了普通人的工作与生活中。
万物皆可AutoGLM
与此同时,AutoGLM并不局限于手机和电脑,还能被集成到更多载体中——
如智能音箱、车载系统甚至毛绒玩具里,主打一个“万物皆可AutoGLM”。
为实现其广泛应用,智谱即日起还上线了移动端API申请通道及「AutoGLM开发者生态共建计划」,通过开放API将AutoGLM的能力赋能给更多开发者的智能产品。
显而易见,智谱在AutoGLM上的布局,有着自己的节奏和长远考量。
从成立的第一天起,这家公司就将通用人工智能(AGI)作为追求目标,并在后续提出了“让机器像人一样思考”的愿景。
围绕这一目标,智谱规划了L1-L5的AGI路线图:从预训练大模型,到对齐推理、自我学习、自我认知,直至最终的意识智能,一步步循序推进。
而AutoGLM,正是智谱通往L3“自主学习智能体”的关键一步——通过将Agent能力带给更广泛的普通用户,不仅验证了当前技术的可行性,还能在真实应用中不断积累经验与反馈,推动模型自主学习。
这种自我学习能力,使机器能够突破单纯依赖历史数据获取知识的局限,在与用户和环境的持续交互中发现新知识、总结新方法,并反过来提升自身能力,形成技术与应用的正向飞轮。
一旦这个飞轮持续运转,自然也能进一步夯实智谱在Agent领域的领先位置。
而且这一次有个比较新的变化是,和GPT-5类似,AutoGLM也实现了能力“大一统”——
背靠智谱最新开源SOTA语言模型GLM-4.5与视觉推理模型GLM-4.5V(纯国产Agent),首次将推理、非推理、编码、研究、Agentic、GUI Agent等能力整合进一个模型。
这也代表着智谱对AGI的早期理解:
- 具备通用完整的多模态和思维能力的模型是通向AGI的一个重要里程碑,AutoGLM是其对AGI的又一阶段性探索成果。
另外从行业角度来看,AutoGLM更重要的意义或许在于,它用真实产品验证了“云端执行”这一路线的可行性与可靠性。
不过有一说一,AutoGLM在给行业提供新解法的同时,也为本就竞争激烈的Agent赛道再添一把火。
因为Agent发展到现在这个阶段,拼的已经不只是能否完成任务,而是能否从简单的执行者,升级为能够处理更复杂场景、更稳妥应对不确定性的“全能型选手”。
当然,抛开厂商们之间的“腥风血雨”,对普通用户而言,AutoGLM这一新工具无疑正在真实改变我们和机器之间进行交互的方式——
手中的大模型不再只是“会聊天”,而是能直接操作系统,真正帮忙完成任务。
更进一步,智谱还提出了从Agent迈向AGI应始终追求的3A原则:
- Around-the-clock(全时):24小时待命与持续执行,在用户睡觉/离开/设备黑屏时仍可运行与产出。
- Autonomy without interference(自运转、零干扰):Agent在云端设备运行,不占用用户屏幕/算力。
- Affinity(全域连接):跳出浏览器对话框,连接手机、电脑、手表、眼镜、PIN、家电等多种设备与服务,覆盖数字与物理世界。
可以预见,随着技术的持续迭代与生态的不断丰富,“问一句,剩下全交给Agent”的时代离我们真的不远了。
传送门:
开发者生态共建计划:https://autoglm.zhipuai.cn/misc/developer-apply