Sveriges mest populära poddar

张小珺Jùn|商业访谈录

88. 和吴翼技术解读OpenAI Operator:推理从抽象世界走向物理世界的开端

72 min • 24 januari 2025

2025刚开年,全球AI届就已高度共识,将2025年定义为“智能体元年”。

北京时间1月24日凌晨,OpenAI率先抢跑,发布智能体产品Operator(操作员),打响了全球智能体竞赛的第一枪。

在Operator发布前,广密在我们的节目中预言,25年核心关键词是Agent、Agent、Agent,这些AI产品最终会演变成一个任务容器,朝着“下一个Google”方向进发。

本集节目,在Operator发布后,我邀请前OpenAI研究员、清华叉院信息研究院助理教授吴翼,从技术视角解读Operator和Agent之年。

我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:)
  • 02:55 对Operator的感官感受
  • 04:19 Operator在AGI路线图上的地标:多模态、连续交互、闭环控制系统
  • 06:34 OpenAI内部还有更好的模型,智力会刷得很高,Operator带有泛化性
  • 08:17 Operator是多模态、闭环的o1,一个Agent o1的版本
  • 08:57 为什么Operator是单独入口?
  • 11:13 Operator包含的技术要点:基座模型、高质量数据集、高效大规模支持Agent的强化学习系统
  • 14:10 有关Operator底层用的新模型:Computer-Using-Agent(CUA)
  • 19:02 2025是Agent之年:多模态模型+强化学习
  • 20:49 回溯到2016年,OpenAI成立后第一个大项目就是Web Agent,但失败了
  • 22:40 OpenAI的5级分类:聊天机器人Chatbots〉推理者Reasoners〉智能主体Agents〉创新者Innovators〉组织Organizations,技术演进轨迹,人类参与越来越少
  • 31:26 Operator在与人类协作时,如何平衡自主决策和人类指令的优先级?
  • 32:30 Operator怎么整合语言、视觉和动作等不同模态的信息?
  • 34:11 Operator能否支持与其他Agent的协作?这种协作的机制是什么?
  • 38:45 广密说Chatbot不是提取智能最有效的交互方式,Operator能有效提取智能吗?
  • 42:14 OpenAI智能提升与更多产品的关系
  • 49:48 Agent这个词从博弈论进入人工智能,现在指大语言模型调用外部世界
  • 54:29 Agent中有创业公司的机会吗?
  • 58:57 Operator释放了信号:逻辑推理从抽象世界走向视觉物理世界的开端
  • 01:02:27 如果Agent在未来成为主流,人类与AI的协作方式会发生哪些变化?
  • 01:06:46 大公司全部开着重装坦克往前走,其他人怎么办?

预言单集:大模型季报年终特辑:和广密预言LLM产品超越Google之路

吴翼往期:和OpenAI前研究员吴翼解读o1:吹响了开挖第二座金矿的号角

【更多信息】

联络我们:微博@张小珺-Benita,小红书@张小珺

更多信息欢迎关注公众号:张小珺

Förekommer på
00:00 -00:00