据媒体报道,OpenAI、Google 和 Anthropic 等科技公司的最新大模型训练表现均不及预期。在通往 AGI 的路上, scaling law 是否已经见顶成为大家讨论的话题。在算力和数据遭遇瓶颈的当下,如何让大模型的效率更高,用最少的算力和参数实现模型的提升成为亟待解决的问题。
就在 11 月,来自国内的人工智能企业彩云科技发布了他们的他们自研的 DCFormer 架构及基于该架构的通用大模型。除了自研大模型,彩云科技还有三款自己的 AI 应用 -- 彩云天气、彩云小译和彩云小梦 -- 并且实现了商业化。
为什么一家创业公司要选择研发自己的底层大模型?人工智能时代需要怎样的应用? AI 产品的商业化要怎么做?我们今天的嘉宾是彩云科技的创始人袁行远,在虎嗅 F&M 创新节的活动现场与他一起讨论了这些大家都很好奇的问题。
本期人物
丁教 Diane,「声动活泼」联合创始人、「科技早知道」主播
袁行远, 彩云科技创始人, CEO
主要话题
[01:42] 彩云不是一家只做应用公司,还是一家做模型的公司
[04:33] 搞清 transformer 黑盒子的运行机制,实现 1.7 ~ 2 倍的模型效率提升
[09:57] 缺钱、缺数据、缺算力,创业公司靠什么做出优质的大模型?
[12:42] Scaling law 见顶? 除了卷数据和算力,还有一条路是模型优化
[17:49] 从 AI 翻译到彩云小梦,生成式 AI 非常适合故事创作
[22:39] 算力等价原理:人类大脑创作「三体」需要十年, AI 创作伟大的作品也需要同样的算力和时间
[26:44] 消费性不够,留存率不足,现阶段 AI 造梦师只能让 bubble 持续半小时
[32:07] 未来的 AI 创作:随时进入任意时空和宇宙,生命得到极大延展
幕后制作
监制:Yaxian
后期:Jack
运营:George
设计:饭团
商务合作
声动活泼商务合作咨询
加入声动活泼会员,支持我们创作好内容
2021 年我们发起了「声动胡同会员计划」,这是一个纯支持项目,支持我们不断制作可信赖的、扎实的商业信息。得益于这些支持,我们每档节目内容和形式不断突破,听友们越来越多、也常在苹果中国年度榜、CPA、喜马拉雅榜上有名。
为了感谢各位的支持,我们会在每周向付费会员们提供一封播客手记,手记中会记录我们在节目之外更多的思考和观察,你可以通过它和我们保持更深度的交流;付费会员还能免费收听所有我们旗下的付费内容,如「不止金钱」和「跳进兔子洞第三季」。新会员 365 元一年,相当于一天一块钱。欢迎点击此处成为好内容的支持者。
加入我们
加入我们:声动活泼正在寻找商业化合作经理、播客节目监制的全职伙伴,以及早咖啡内容实习生,详情点击招聘入口;
关于声动活泼
「用声音碰撞世界」,声动活泼致力于为人们提供源源不断的思考养料。
我们还有这些播客:声动早咖啡、声东击西、吃喝玩乐了不起、反潮流俱乐部、泡腾 VC、商业WHY酱、跳进兔子洞 、不止金钱
欢迎在即刻、微博等社交媒体上与我们互动,搜索 声动活泼 即可找到我们。
期待你给我们写邮件,邮箱地址是:[email protected]
欢迎扫码添加声小音,在节目之外和我们保持联系。
Special Guest: 袁行远.