Scaling Law遭遇瓶颈,OpenAI被曝押注智能体“Operator”

1个月前 15观看

文章来源:量子位Cn7喜好网-记录每日喜好的科技时尚娱乐生活

图片来源:由无界AI生成图片来源:由无界AI生成

继Anthropic之后,OpenAI也要接管人类电脑了?!Cn7喜好网-记录每日喜好的科技时尚娱乐生活

就在刚刚,彭博社爆料OpenAI将在明年1月推出Agent“Operator(操作员),为用户自动执行任务。Cn7喜好网-记录每日喜好的科技时尚娱乐生活

配方我们也很熟悉,只需在电脑上简单下达指令,Agent就能自动帮我们编码开发应用、订餐,做攻略等等。Cn7喜好网-记录每日喜好的科技时尚娱乐生活

好嘛,一看大家就明白,这是要和老对手Anthropic打起来了!Cn7喜好网-记录每日喜好的科技时尚娱乐生活

这将与Anthropic的computer use API进行竞争(Anthropic之前发布了computer use功能,号称接管人类电脑)


Cn7喜好网-记录每日喜好的科技时尚娱乐生活

事实上,在前一阵Reddit举办的有问必答活动上,CEO奥特曼曾信誓旦旦表示:Cn7喜好网-记录每日喜好的科技时尚娱乐生活

Agent将成为下一个重大突破。

同时,OpenAI首席产品官Kevin Weil进一步表示,让ChatGPT自主执行任务将是明年一大重点。Cn7喜好网-记录每日喜好的科技时尚娱乐生活

不过,除了“遥遥领先”的Anthropic,OpenAI另一对手谷歌早已曝出将于12月发布自己的AI Agent版本。Cn7喜好网-记录每日喜好的科技时尚娱乐生活

国内百度智谱等模型厂商也推出了类似智能体和解决方案,甚至手机厂商荣耀、小米等还发布了自己的AI操作系统。Cn7喜好网-记录每日喜好的科技时尚娱乐生活

如此一来,压力也是来到了OpenAI这边。Cn7喜好网-记录每日喜好的科技时尚娱乐生活

虽说紧赶慢赶才有可能在明年1月推出,但还是有网友犀利吐槽太晚了!Cn7喜好网-记录每日喜好的科技时尚娱乐生活

网友:1月太晚了Cn7喜好网-记录每日喜好的科技时尚娱乐生活

据彭博社消息,OpenAI计划于明年1月推出代号为“Operator”的智能体(Agent)。Cn7喜好网-记录每日喜好的科技时尚娱乐生活

其功能和10月份Anthropic发布的computer use类似,号称解放人类双手,代替用户操控电脑。Cn7喜好网-记录每日喜好的科技时尚娱乐生活

比如让它做旅游攻略,一段命令发布后,Agent就能自动打开谷歌搜索位置、天气,并结合用户的日程表给出切实可行的规划。Cn7喜好网-记录每日喜好的科技时尚娱乐生活

另外,据OpenAI内部知情人士透露,在周三的员工会议上,有领导宣布:Cn7喜好网-记录每日喜好的科技时尚娱乐生活

届时该功能将以早期预览的形式发布(最初设计用于在网页浏览器中执行任务),且最初仅面向开发者提供API接口

甚至根据爆料,OpenAI内部其实一直在同时推进很多Agent项目,而Operator可能是最接近成功的一个。Cn7喜好网-记录每日喜好的科技时尚娱乐生活

对于上述传闻,OpenAI截至发稿前并未有所回应。Cn7喜好网-记录每日喜好的科技时尚娱乐生活

不过,一直关注OpenAI动态的光头哥还是发现了Operator的踪迹。Cn7喜好网-记录每日喜好的科技时尚娱乐生活

然而,即便消息属实,OpenAI的动作还是有点晚了~Cn7喜好网-记录每日喜好的科技时尚娱乐生活

毕竟环顾四周,一众竞争对手貌似都跑在前头Cn7喜好网-记录每日喜好的科技时尚娱乐生活

最强劲敌Anthropic自不必说,人家早在10月份就推出了相关功能,一举惊艳AI圈。Cn7喜好网-记录每日喜好的科技时尚娱乐生活

而总是暗戳戳较劲的谷歌,也很有可能在12月推出代号为“Jarvis” (贾维斯)的Agent,按照双方时间表,这波谷歌没准获胜。Cn7喜好网-记录每日喜好的科技时尚娱乐生活

更不用说目前关系尴尬的微软,人家更是早Anthropic一天,一口气发布了10个Agent。Cn7喜好网-记录每日喜好的科技时尚娱乐生活

抛开这些不谈,我们国内也有相当一部分选手开始在Agent上有所动作。Cn7喜好网-记录每日喜好的科技时尚娱乐生活

比如,百度在今年9月的百度云智大会就展示了Agent操作手机的一幕:Cn7喜好网-记录每日喜好的科技时尚娱乐生活

同样只需一段话,Agent就能帮我们制定行程,还能在不同APP间自行跳转。Cn7喜好网-记录每日喜好的科技时尚娱乐生活

制定一个国庆节去山西旅行3天的计划路线,要参考《黑神话:悟空》中涉及的山西经典,且希望住在品质好、性价比高的酒店,好评优先、500元以内,而且想要规划自驾路线。


Cn7喜好网-记录每日喜好的科技时尚娱乐生活


Cn7喜好网-记录每日喜好的科技时尚娱乐生活

另外,就在Anthropic之后,智谱也发布了AutoGLM,让AI像人一样使用手机;而且还不像Claude需要打字提需求,AutoGLM实现了光靠嘴说来执行很多操作。Cn7喜好网-记录每日喜好的科技时尚娱乐生活

甚至,在AI PC和AI手机圈子里,各大玩家也是把眼光都聚焦到了这种新范式。Cn7喜好网-记录每日喜好的科技时尚娱乐生活

10月23日,华为发布荣耀MagicOS 9.0,定位为C端用户的“类人助理”,通过大模型底座打通app正式开启AI Agent阶段,实现系统级AI操作。Cn7喜好网-记录每日喜好的科技时尚娱乐生活

而且就在昨天,荣耀官方宣布, MagicOS 9.0首批产品开始公测,覆盖了荣耀Magic Vs3、V2系列、Magic6系列、Magic5系列。Cn7喜好网-记录每日喜好的科技时尚娱乐生活

另外,小米也发布了澎湃OS 2.0系统,搭载基于AI大模型重构的操作系统,将设备转化为智能的“个人助手”。Cn7喜好网-记录每日喜好的科技时尚娱乐生活

……Cn7喜好网-记录每日喜好的科技时尚娱乐生活

以上可以看出,一直作为领先者的OpenAI,在Agent方面已经开始落后于人了。Cn7喜好网-记录每日喜好的科技时尚娱乐生活

2025年,属于AgentCn7喜好网-记录每日喜好的科技时尚娱乐生活

不过另一方面也说明,明年Agent大概率成为厮杀重点。Cn7喜好网-记录每日喜好的科技时尚娱乐生活

毕竟,大模型Scaling Law后继乏力已成热议焦点。Cn7喜好网-记录每日喜好的科技时尚娱乐生活

有消息称,OpenAI、谷歌、Anthropic都在推出更大、更强模型产品方面遭遇瓶颈Cn7喜好网-记录每日喜好的科技时尚娱乐生活

具体来说,OpenAI代号“猎户座”(Orion)的下一代旗舰模型被曝提升不如预期,它相对GPT-4的提升幅度,小于GPT-4相对GPT-3,已进入收益递减阶段。Cn7喜好网-记录每日喜好的科技时尚娱乐生活

这也侧面和奥特曼的说法相印证,他表示可能不会把新模型命名为GPT-5。Cn7喜好网-记录每日喜好的科技时尚娱乐生活

另外,谷歌Gemini 2虽然计划很快发布,但也被曝性能提升也未达到DeepMind创始人的预期。Cn7喜好网-记录每日喜好的科技时尚娱乐生活

同时,面对网友一直呼唤的大杯Claude 3.5 Opus,Anthropic也悄悄从官网删除了相关描述。Cn7喜好网-记录每日喜好的科技时尚娱乐生活

而Agent,目前很明显已经成为大家新的方向。Cn7喜好网-记录每日喜好的科技时尚娱乐生活

这盛世或将如网友所愿:2025年,属于Agent!Cn7喜好网-记录每日喜好的科技时尚娱乐生活

参考链接:
[1]https://www.bloomberg.com/news/articles/2024-11-13/openai-nears-launch-of-ai-agents-to-automate-tasks-for-users
[2]https://www.reddit.com/r/singularity/comments/1gqn099/openai_nears_launch_of_ai_agent_tool_to_automate/
[3]https://x.com/omarsar0/status/1856802883112767541
OpenAI

本文链接:http://www.xihao.site/showinfo-1-60054.htmlScaling Law遭遇瓶颈,OpenAI被曝押注智能体“Operator”

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com。天上从来不会掉馅饼,请大家时刻谨防诈骗