Start / 42章经 / %e6%88%91%e5%9c%a8 character ai %e5%81%9a post training%ef%bd%9c%e5%af%b9%e8%b0%88%e5%89%8d c ai %e6%a8%a1%e5%9e%8b%e5%ba%94%e7%94%a8%e7%ae%97%e6%b3%95%e4%b8%93%e5%ae%b6 ted
那个时候他正要离开 Character.ai,作为第四十多号加入的员工,他对于 C.AI 的产品、模型、训练等等的熟悉程度都非常高,这次很开心能把他请来,跟大家一起分享下美国最著名的 AI 公司内部是如何运作的,Post Training 的最佳实践是怎么做的,以及硅谷一众 AI 从业者的现状和认知等。
这期播客的内容基本代表了美国最一线的 AI 从业者的实践和认知,非常有代表性,希望对大家有帮助!
最后,我们的 AI 私董会也在持续报名中,目前已经聚集了一批市场上最好的 AI 创始人,欢迎点击链接报名(里面也有目前已加入的成员名单,可点击查看)
【人类博物馆】
导游:曲凯,42章经创始人
28 号珍藏:Ted,前 C.AI 模型应用算法专家
Part 1 从内部视角看 C.AI
01:06 为什么商业化一直没做起来?
04:40 如果 C.AI 当时往 AGI 赌把大的,或者把产品交给字节系,能改写自己的结局吗?
06:51 我们很认可 Talkie,但不想学 Talkie
09:36 被收购后,你还相信 C.AI 类产品的未来吗?
11:35 有人说「C.AI 不是真正的 AI 陪伴」,那它到底是啥?
12:19 C.AI 为什么做得比别人好?
Part 2 我在 C.AI 做 Post Training 的这一年
14:56 工作状态是 996(主动的哈,passion!
17:15 Post Training 的核心是设计高效的迭代路径
18:42 四种迭代路径,都有很多低垂的果实可以摘
21:40 怎么评估和改善「模型变蠢」的问题?
22:54 迭代中一个有趣的 EQ 涌现
24:19 Post Training 到底是怎么个流程?
25:37 介绍 Post Training 三大件:SFT(监督微调) 、RLHF(人类反馈强化学习)、DPO (直接偏好对齐)