Sveriges mest populära poddar

42章经

我在 Character.ai 做 Post Training|对谈前 C.AI 模型应用算法专家 Ted

60 min • 16 november 2024

活动预告🥳:12 月 7 日,我们会请到 Ted 做一场线上活动,大家记得翻到 shownotes 末尾查看报名信息!

在我 9 月份的硅谷行程里,我见过的印象最深、让我最有收获的人之一就是 Ted。

那个时候他正要离开 Character.ai,作为第四十多号加入的员工,他对于 C.AI 的产品、模型、训练等等的熟悉程度都非常高,这次很开心能把他请来,跟大家一起分享下美国最著名的 AI 公司内部是如何运作的,Post Training 的最佳实践是怎么做的,以及硅谷一众 AI 从业者的现状和认知等。

这期播客的内容基本代表了美国最一线的 AI 从业者的实践和认知,非常有代表性,希望对大家有帮助!

最后,我们的 AI 私董会也在持续报名中,目前已经聚集了一批市场上最好的 AI 创始人,欢迎点击链接报名(里面也有目前已加入的成员名单,可点击查看)

人类博物馆】

导游:曲凯,42章经创始人

28 号珍藏:Ted,前 C.AI 模型应用算法专家

Part 1 从内部视角看 C.AI

  • 01:06 为什么商业化一直没做起来?
  • 04:40 如果 C.AI 当时往 AGI 赌把大的,或者把产品交给字节系,能改写自己的结局吗?
  • 06:51 我们很认可 Talkie,但不想学 Talkie
  • 09:36 被收购后,你还相信 C.AI 类产品的未来吗?
  • 11:35 有人说「C.AI 不是真正的 AI 陪伴」,那它到底是啥?
  • 12:19 C.AI 为什么做得比别人好?

Part 2 我在 C.AI 做 Post Training 的这一年

  • 14:56 工作状态是 996(主动的哈,passion!
  • 17:15 Post Training 的核心是设计高效的迭代路径
    • 18:42 四种迭代路径,都有很多低垂的果实可以摘
    • 21:40 怎么评估和改善「模型变蠢」的问题?
    • 22:54 迭代中一个有趣的 EQ 涌现
  • 24:19 Post Training 到底是怎么个流程?
    • 25:37 介绍 Post Training 三大件:SFT(监督微调) 、RLHF(人类反馈强化学习)、DPO (直接偏好对齐)
    • 32:07 以上天花板极高,RAG 和 Prompt Engineering 我们几乎没做
  • 32:53 帮你拉开和同行差距的 2 道数据思考题:
    • 33:18 你微调用的数据,质量真的不能更高了吗?
    • 36:00 收集来的用户偏好数据,只能是点赞点踩吗?
  • 39:32 大家现在关注的几个技术难题,C.AI 是怎么做的?
    • 39:49 怎么做好评估?
    • 41:10 怎么做好意图识别?
    • 43:22 C.AI 的语音延迟基本是业界做得最好的,是怎么做到的?

Part 3 硅谷观察

  • 46:17 一个不被公开的秘密:ChatGPT 内部也是多模型混用?
  • 47:28 硅谷整体还是很乐观,推理侧仍然大有可为
  • 50:45 硅谷现状:
    • 51:01 做产品的想靠多模态赚钱
    • 51:06 搞算法的想复制 o1
    • 51:16 两边都在期待自动交互 Agent 解锁的想象空间
  • 53:48 复盘最近的硅谷求职记
    • 53:54 Post-train 人才极其抢手
    • 54:27 印象最深的是,面 Cursor 的时候,我甚至被允许用 Cursor 现场解题
    • 56:03 最喜欢被问到「你觉得我们的 idea 有多不靠谱?」
    • 56:45 如果我是面试官,我会考察面试者的这项直觉能力
  • 57:28 我很喜欢现在硅谷的氛围!当下可能是华人扬眉吐气的最好时机

活动预告🥳】

12 月 7 日,我们会请到 Ted 做一场线上活动,感兴趣的朋友欢迎点击链接或扫描下面的二维码,一起来认识&交流!

The gang that made this happen】

  • 制作人:陈皮、Celia
  • 剪辑:陈皮
  • Bgm:Mondo Bongo - Joe Strummer & The Mescaleros
Kategorier
Förekommer på
00:00 -00:00