时长:
75分钟
播放:
8,786
发布:
1天前
简介...
历史上每一次人机交互的革命,都成就了一家伟大的公司,今天我们正站在新的十字路口。当理想同学用“三模型架构”成为首个“真正可用”的语音助手,当语音输入强大到在游戏中被视为“作弊”,我们正处在一个剧烈的范式转换前夜。本期节目,我们与怒喵科技李楠一起,揭示本地模型与语音交互如何改变我们几十年来拥抱屏幕的“病态”并回归自然。
欢迎收听脑放电波和 AI谬论 的串台节目
03:37 - Part 1:理想同学的“三模型”架构,与游戏里的“语音外挂”
理想同学为何比 Siri 好用100倍?这背后是本地模型、智舱模型与云端模型协同工作的降维打击。当云端延迟还在0.8秒挣扎,理想同学已凭借端侧AI的百毫秒级响应,实现了“用了就回不去”的丝滑体验。怒喵尝试将这种能力复刻到PC上,发现语音输入在FPS游戏里竟能化身“作弊器”,手残党也能秒开爆闪、精准打药。这证明了新交互范式的巨大优势:你再也不用去记那些复杂的快捷键,更不需要翻看任何说明教程了!
27:42 - Part 2:语音输入法正在“逆袭”:从质疑TNT到爱上语音打字
2024年,一款语音输入法竟能融资3600万美元?我们从质疑老罗的TNT,到如今在工位上全天使用语音输入。无论是能自动去除口癖、智能排版的Wispr Flow,还是微信悄悄上线的“整理文字”功能,都预示着语音输入的时代已经到来。然而,今天的软件和操作系统,都还没有为模型准备好——这正是巨大的机会所在。此外,我们还分享了你身边就能用到的其他优秀工具与技巧,以及为什么端侧模型也有机会成为云端大模型一样的“行业黄金”。
58:24 - Part 3:人与模型的互动反常识:告别一键生成,拥抱“说得越多越好”
别再迷信“一键生成XX”的AI产品了,那大多是无法深入使用的“垃圾”。无论是Grok-4还是其他大模型,它们拥有强大的“Coder”能力,却缺乏“软件工程”能力。真正的价值诞生于深度交互:你给AI五万字,它能为你压缩出八千字的精华;让AI辅助整理会议纪要,它帮你强化关键细节而不是纯靠AI输出。从语音交互开始,我们正在告别过去几十年拥抱屏幕的病态,成为一个真正自然的人。
欢迎订阅脑放电波,2024/25苹果播客周度推荐节目、小宇宙累计10次编辑推荐单集、2024CPA播客中文奖年度科技数码类播客
欢迎在评论区留言发表你对 语音交互/人机交互 的感受与看法,我们将选取其中三位评论送出脑放电波定制周边:一把酷酷的金属电路板尺子
对于节目话题的更多观点,获取更多未呈现在节目中的扩展阅读,欢迎添加脑放电波小助手微信(BrainAMP01)加群参与讨论,后续会发布本期节目的文字稿
人物:
* 李楠-AI谬论主播,怒喵科技CEO,前魅族副总裁
* 托马斯白-脑放电波主播,资深科技营销人,前XR创业公司CMO,科技媒体特约作者;Nixon-脑放电波主播,硬件产品经理,前科技媒体记者.
* 剪辑制作:柒
节目中用到的音乐:来自monkeyman535的90's Rock Style,地址freesound.org;来自kjartan_abel的Berlin Town,地址freesound.org;基于 CC BY 4.0 DEED 使用。
脑放电波往期节目精选(搜索关键词可收听)
* 汽车聚变、泛科技生活:SU7营销复盘 / 男人的“发烧消费”/ 和李楠聊AI与个人觉醒
* 具身智能:宇树机器人 / 斯坦福Aloha
* 饮食健康、现代病人:控糖革命 / 信息过载 / 长寿革命 / 阿斯巴甜致癌疑云 / 结构化谈谈“健康饮食”
* 苹果特权:设计哲学 / 苹果供应链迷思 / 苹果广告底层逻辑 / iPhone 15 和它的前任们 / 苹果零售店
* AI 相关节目:会喘气的AI语音里藏着下一代交互范式 / 解构Apple Intelligence / 和李楠聊AI硬件 / 能做家务的机器人还有多远?/ GPT并非替代你 / 611款 AI 生产力工具;
脑放电波是一档关注科技前沿、品牌营销和个人成长的谈话类节目。每期带给您一个有趣有据的话题,帮您在信息严重过载的现代世界小幅自我迭代。您可以在小宇宙、苹果播客或者其他泛用型播客客户端搜索“脑放电波”找到并关注我们,如果您对本期节目有任何疑问,欢迎您给我们留言,如果您觉得这期内容对你有所帮助,欢迎您关注点赞收藏转发,这对我们非常重要。
欢迎收听脑放电波和 AI谬论 的串台节目
03:37 - Part 1:理想同学的“三模型”架构,与游戏里的“语音外挂”
理想同学为何比 Siri 好用100倍?这背后是本地模型、智舱模型与云端模型协同工作的降维打击。当云端延迟还在0.8秒挣扎,理想同学已凭借端侧AI的百毫秒级响应,实现了“用了就回不去”的丝滑体验。怒喵尝试将这种能力复刻到PC上,发现语音输入在FPS游戏里竟能化身“作弊器”,手残党也能秒开爆闪、精准打药。这证明了新交互范式的巨大优势:你再也不用去记那些复杂的快捷键,更不需要翻看任何说明教程了!
27:42 - Part 2:语音输入法正在“逆袭”:从质疑TNT到爱上语音打字
2024年,一款语音输入法竟能融资3600万美元?我们从质疑老罗的TNT,到如今在工位上全天使用语音输入。无论是能自动去除口癖、智能排版的Wispr Flow,还是微信悄悄上线的“整理文字”功能,都预示着语音输入的时代已经到来。然而,今天的软件和操作系统,都还没有为模型准备好——这正是巨大的机会所在。此外,我们还分享了你身边就能用到的其他优秀工具与技巧,以及为什么端侧模型也有机会成为云端大模型一样的“行业黄金”。
58:24 - Part 3:人与模型的互动反常识:告别一键生成,拥抱“说得越多越好”
别再迷信“一键生成XX”的AI产品了,那大多是无法深入使用的“垃圾”。无论是Grok-4还是其他大模型,它们拥有强大的“Coder”能力,却缺乏“软件工程”能力。真正的价值诞生于深度交互:你给AI五万字,它能为你压缩出八千字的精华;让AI辅助整理会议纪要,它帮你强化关键细节而不是纯靠AI输出。从语音交互开始,我们正在告别过去几十年拥抱屏幕的病态,成为一个真正自然的人。
欢迎订阅脑放电波,2024/25苹果播客周度推荐节目、小宇宙累计10次编辑推荐单集、2024CPA播客中文奖年度科技数码类播客
欢迎在评论区留言发表你对 语音交互/人机交互 的感受与看法,我们将选取其中三位评论送出脑放电波定制周边:一把酷酷的金属电路板尺子
对于节目话题的更多观点,获取更多未呈现在节目中的扩展阅读,欢迎添加脑放电波小助手微信(BrainAMP01)加群参与讨论,后续会发布本期节目的文字稿
人物:
* 李楠-AI谬论主播,怒喵科技CEO,前魅族副总裁
* 托马斯白-脑放电波主播,资深科技营销人,前XR创业公司CMO,科技媒体特约作者;Nixon-脑放电波主播,硬件产品经理,前科技媒体记者.
* 剪辑制作:柒
节目中用到的音乐:来自monkeyman535的90's Rock Style,地址freesound.org;来自kjartan_abel的Berlin Town,地址freesound.org;基于 CC BY 4.0 DEED 使用。
脑放电波往期节目精选(搜索关键词可收听)
* 汽车聚变、泛科技生活:SU7营销复盘 / 男人的“发烧消费”/ 和李楠聊AI与个人觉醒
* 具身智能:宇树机器人 / 斯坦福Aloha
* 饮食健康、现代病人:控糖革命 / 信息过载 / 长寿革命 / 阿斯巴甜致癌疑云 / 结构化谈谈“健康饮食”
* 苹果特权:设计哲学 / 苹果供应链迷思 / 苹果广告底层逻辑 / iPhone 15 和它的前任们 / 苹果零售店
* AI 相关节目:会喘气的AI语音里藏着下一代交互范式 / 解构Apple Intelligence / 和李楠聊AI硬件 / 能做家务的机器人还有多远?/ GPT并非替代你 / 611款 AI 生产力工具;
脑放电波是一档关注科技前沿、品牌营销和个人成长的谈话类节目。每期带给您一个有趣有据的话题,帮您在信息严重过载的现代世界小幅自我迭代。您可以在小宇宙、苹果播客或者其他泛用型播客客户端搜索“脑放电波”找到并关注我们,如果您对本期节目有任何疑问,欢迎您给我们留言,如果您觉得这期内容对你有所帮助,欢迎您关注点赞收藏转发,这对我们非常重要。
评价...
空空如也
小宇宙热门评论...
欢乐马_IVk3
3个月前
北京
20
亏了,听着听着才发现是软文,浪费时间!
Nixon_Hu
3个月前
北京
6
历史上每一次人机交互的革命,都成就了一家伟大的公司,今天我们正站在新的十字路口。当理想同学用“三模型架构”成为首个“真正可用”的语音助手,当语音输入强大到在游戏中被视为“作弊”,我们正处在一个剧烈的范式转换前夜。本期节目,我们与怒喵科技李楠一起,揭示本地模型与语音交互如何改变我们几十年来拥抱屏幕的“病态”并回归自然。
欢迎收听脑放电波和 AI谬论 的串台节目
Mike-Wu
3个月前
广东
5
沙发,见证人机交互革命的时代👏
HD80162x
3个月前
湖南
4
记个笔记——语音交互,小模型实时训练,情趣管理
NathanWu
3个月前
美国
4
''理想车机 好 特别好 用了就回去不的好''
听得我急死了🤣
OneTiger
3个月前
浙江
4
wispr flow 已经用上了,能否把后面提到的几个产品名字也说一下,好像有个听着是 qu 开头的
HD557266u
3个月前
中国香港
3
20:48 本地操作这些可能0.6b就够了
SUiTHiNK
2个月前
广东
3
1:14:33 没想到最后还被cue了一下 😂 我蛮认同李楠的看待方式和思路的,新的技术应该有新的范式来承载,这是一个很好的历史机会。但大公司们已经积攒的东西太多了,不可能放下旧范式里的「优势」去推倒重来干一个全新的事,所以他们会不断「修正」。这是一个大家重新站在起跑线上的机会,更灵活变通的那个阵营才有可能领先。
方可爱可爱
2个月前
上海
2
28:23 老罗:勿 cue 谢谢
DD_AZeY
3个月前
上海
2
一定要叫理想同学才能唤醒它吗
六个梦已存在
3个月前
广东
2
42:02 现在在对话框右边直接多了一个语音按钮,最神奇的是,你在语音最后说 over over 会直接发送出去😱
胡思乱想
3个月前
广东
2
很有启发性的一期节目,ai 赋能后的语音可以展现非常多的应用场景。语音交互能安装到无数的现实场景中,人天生就会,而很难想象触摸屏能装到线下任何场景,并且降低学习场景。我相信这是 iPhone 时刻。
poorest
3个月前
山东
2
但是端侧模型也有准确率的问题,加载延迟的问题,算力小的限制,语音交互而言端到端未必端侧比云侧好吧。实时性端侧模型可能更适合的是特定垂域场景、永远在内存的、有离网场景的应用吧
OneTiger
3个月前
浙江
2
李楠关于理想车机的分享太棒了,希望可以再出一集详细讲讲,我已经整理出了一系列问题准备去各家 4s 店测试对比一下,能否提供一些理想回复得比别家好的问题?
OneTiger
3个月前
浙江
2
我测试让 wispr 听着这集播客 10 s ,中间我说了一句话,结果 wispr 就准确的识别了我的话。我说话的时候还继续放着播客,这 wispr 是怎么做到的啊?
HD651708i
3个月前
北京
2
理想同学确实是可用性非常强,有车载机器人的雏形
XJMQD
3个月前
吉林
2
27:23 没有图搜的时候不会找说明书查吗?而且连故障灯都认不清楚你驾照是怎么考下来的
HD456129x
2个月前
广东
1
有启发
YSHN
1个月前
广西
1
找不到功能在哪反应过来为什么不问问语音助手被称为交互新范式给我听笑了
卜莱恩
3个月前
上海
1
应该还是传统nlp做路由吧 语言模型即使本地做fuction call时延也很高啊