Sveriges mest populära poddar

42章经

Agent 开发的上半场: 环境、Tools 和 Context 如何决定 Agent|对谈 Sheet0 创始人王文锋

53 min • 19 april 2025

活动预告🥳:4 月 26 日,我们会请到 sheet0.com 创始人文锋做一场线下活动,大家记得翻到 shownotes 末尾查看报名信息!

关于 Agent 这个话题,我自己有一些核心在思考的问题,相信这些也是很多人同样会有疑问的地方,这期播客中我们就这些问题展开了讨论,并基本得到了一些答案:

1)怎么定义 Agent,Agent 最重要的是什么

2)今天的 Agent 和两年前的 Agent 的区别是什么

3)如何简单快速理解 Function Call,Coding Agent,MCP,A2A,Computer Use,Browser Use 等概念

4)不同方式的区别是什么,有什么优劣之分吗

5)怎么看通用 Agent 和垂直 Agent 的区别,终局是什么

6)AI Coding 和 Agent 最终会是一件事吗,或者二者会有什么关联

7)Workflow 和 Agent 的区别和终局

8)RL 这件事在 Agent 里的重要程度是什么,一家公司(尤其是做 Agent 的创业公司)到底该如何使用 RL

9)大模型自身的 Agent 比如 OpenAI Operator 和其他应用产品的区别是什么,最终市场形态会怎样

10)如何快速判断一家 Agent 公司做得好不好

另外,在整段讨论中,本期嘉宾文锋基于长时间对 Agent 的研究和实操,还提出了很多理解和分析 Agent 的框架和关键要素,以及在接近结尾部分留下了让我非常有启发的一句话:AI Coding 是大模型的灵巧手。

人类博物馆】

导游:曲凯,42章经创始人

33 号珍藏:王文锋,Agent builder,sheet0.com Founder & CEO,连续创业者,有近十年 AI、Data Infra 产品设计和 Coding 经验。sheet0.com 已开放 waiting list 申请,即将内测。

时光机】

  • 00:47 Agent 三要素:LLM、Context、Tool Use
  • 1:17 这波 Agent 和过去两年的区别是什么?
  • 2:30 怎么理解 Agent 中的 Context?
  • 4:21 快速理解 Tool Use 的不同方案
    • 4:40 代码调用支线:Function Call、MCP、A2A 之间的区别是什么?
    • 6:35 模拟人类支线:浏览器是大模型能调用的最重要的工具
    • 7:07 两条支线各有优缺点,也可以混合起来
    • 10:27 Manus、Devin、Genspark 各用的什么方案?
    • 12:25 Browser Use 的核心价值是给用户提供「安全感」
  • 14:19 AI Coding 和 Agent 最终会殊途同归吗?
  • 16:15 Agent 的终局会走向通用还是垂直?
  • 17:17 脱离了 RL,Agent 就不成立了
    • 19:15 所以 Agent 创业公司该如何使用 RL?
  • 22:54 一个非共识理解:聊天框 + 场景推荐 UI 界面就是最好的交互形态
  • 31:54 Sheet0 是一个怎样的 Agent 产品?
    • 34:15 怎么把任务执行的准确率做到了 100%?
  • 35:39 Workflow 会被 Agent 颠覆掉吗?
  • 36:49 不同 Agent 的核心区别是什么?
  • 39:05 AI Coding 是大模型的「灵巧手」
  • 41:41 Agent 有两大「信任」命题
  • 44:22 分享一个预测 Agent 未来发展的思考框架
  • 47:33 如何快速判断一家 Agent 公司做得好不好?

【Reference】

文锋推荐大家都读一读强化学习之父 Richard Sutton 的《Reinforcement Learning:An Introduction》

【活动预告🥳】

4 月 26 日,我们会请到文锋做一场线下活动,感兴趣的朋友欢迎点击链接或扫描下面的二维码,一起来认识&交流!

The gang that made this happen】

  • 制作人:陈皮、Celia
  • 剪辑:陈皮
  • Bgm:Mondo Bongo - Joe Strummer & The Mescaleros
Kategorier
Förekommer på
00:00 -00:00