4月是大模型频频迭代的一个月,也是中国大模型的集中发布期。这些模型更新迭代之后到底进化在哪儿,可能深度使用者最有发言权。本期嘉宾和他的团队也在过往的使用体验中,结合一些学术论文研究出了一套给大模型打分的标准——如果不是一个专业的技术人员,普通人也可以通过一些好玩的测试题目,区分国产大模型与GPT4到底有哪些不同。
随着越来越多的大公司与创业公司加入到国产大模型的竞争中,本期节目我们也聊了聊,除了芯片困境,国产大模型到底怎么样,以及难在哪儿?
【主播】
泓君,资深媒体人
【嘉宾】
戴雨森,真格基金管理合伙人
【你将听到】
使用体验
【03:18】大模型的使用体验:与七八年前的对话机器人很不一样
【04:51】ChatGPT 20问游戏:理解规则+二分法查找
【05:51】Midjourney:从V3到V5进化惊人,打开新的使用方式
【08:48】手工更贵,机器做的更好:原创会越来越有价值
【10:05】如何使用ChatGPT:更适合脑洞与头脑风暴
评分系统
【12:21】300个问题,如何设计出一套大模型的评分系统
【15:22】GPT4评分80分,国产模型迅速从20分追到50分
【16:43】麻辣螺丝钉与爆炒篮球,GPT的进化速度
【20:05】两个月飞速进展:从聊天机器人到GPT4到AutoGPT
【21:46】大模型也有类似于自动驾驶的五级分类
【24:10】基于大模型的创业,早创业还是晚创业谁更有优势?
国产大模型
【29:12】国产大模型格局未定,但要先造船
【32:13】大模型的终局是什么:赢家通吃?类公有云格局or百家争鸣?
【34:50】不止是A100芯片,数据、算法、架构,都需要解决
【36:59】中文互联网的数据不是问题?
【38:33】AutoGPT初印象:既震撼又忧虑
【40:43】微软可以一天训练一个GPT3,但只有它的超算才能训练GPT-4
【44:01】GPT的价值观:目前还是加州白人男性价值观
【46:38】潜在安全风险:操作选举,电话杀猪盘,垃圾信息
【49:04】OpenAI的股权结构:收益权与控制权分开
【53:00】做出OpenAI需要探索能力,第二个做更需要执行能力
【54:54】这轮AI浪潮有泡沫也有啤酒,人类最大的一轮技术革命
【57:04】未来不可预测,我所说的都是错的
【59:04】技术成熟有利于成熟创业者,新技术反而利好年轻人
【招聘】
我们团队目前正在招聘全职的播客节目监制、视频后期、商务拓展以及运营,欢迎感兴趣的小伙伴把你们的简历和代表作品发送到我们的邮箱:[email protected]。具体要求我们之后会发布在【硅谷101】的微信公众账号上,欢迎关注。
【相关资料】
真格基金的评分系统:大模型测试集Z-Bench
https://mp.weixin.qq.com/s/D9xQYIw8K2OjVLBwzNtagQ
【BGM】
Cheese and Crackers
【后期】
AMEI
【在这里找到我们】
公众账号:硅谷101
收听渠道:苹果|小宇宙|喜马拉雅|蜻蜓FM|网易云音乐|QQ音乐|荔枝播客
海外用户:Apple Podcast|Spotify|TuneIn|Google Podcast|Amazon Music
联系我们:[email protected]
Special Guest: 戴雨森.