Album
时长:
75分钟
播放:
8,307
发布:
1个月前
简介...
https://xiaoyuzhoufm.com
历史上每一次人机交互的革命,都成就了一家伟大的公司,今天我们正站在新的十字路口。当理想同学用“三模型架构”成为首个“真正可用”的语音助手,当语音输入强大到在游戏中被视为“作弊”,我们正处在一个剧烈的范式转换前夜。本期节目,我们与怒喵科技李楠一起,揭示本地模型与语音交互如何改变我们几十年来拥抱屏幕的“病态”并回归自然。
欢迎收听脑放电波和 AI谬论 的串台节目
03:37 - Part 1:理想同学的“三模型”架构,与游戏里的“语音外挂”
理想同学为何比 Siri 好用100倍?这背后是本地模型、智舱模型与云端模型协同工作的降维打击。当云端延迟还在0.8秒挣扎,理想同学已凭借端侧AI的百毫秒级响应,实现了“用了就回不去”的丝滑体验。怒喵尝试将这种能力复刻到PC上,发现语音输入在FPS游戏里竟能化身“作弊器”,手残党也能秒开爆闪、精准打药。这证明了新交互范式的巨大优势:你再也不用去记那些复杂的快捷键,更不需要翻看任何说明教程了!
27:42 - Part 2:语音输入法正在“逆袭”:从质疑TNT到爱上语音打字
2024年,一款语音输入法竟能融资3600万美元?我们从质疑老罗的TNT,到如今在工位上全天使用语音输入。无论是能自动去除口癖、智能排版的Wispr Flow,还是微信悄悄上线的“整理文字”功能,都预示着语音输入的时代已经到来。然而,今天的软件和操作系统,都还没有为模型准备好——这正是巨大的机会所在。此外,我们还分享了你身边就能用到的其他优秀工具与技巧,以及为什么端侧模型也有机会成为云端大模型一样的“行业黄金”。
58:24 - Part 3:人与模型的互动反常识:告别一键生成,拥抱“说得越多越好”
别再迷信“一键生成XX”的AI产品了,那大多是无法深入使用的“垃圾”。无论是Grok-4还是其他大模型,它们拥有强大的“Coder”能力,却缺乏“软件工程”能力。真正的价值诞生于深度交互:你给AI五万字,它能为你压缩出八千字的精华;让AI辅助整理会议纪要,它帮你强化关键细节而不是纯靠AI输出。从语音交互开始,我们正在告别过去几十年拥抱屏幕的病态,成为一个真正自然的人。
欢迎订阅脑放电波,2024/25苹果播客周度推荐节目、小宇宙累计10次编辑推荐单集、2024CPA播客中文奖年度科技数码类播客
欢迎在评论区留言发表你对 语音交互/人机交互 的感受与看法,我们将选取其中三位评论送出脑放电波定制周边:一把酷酷的金属电路板尺子
对于节目话题的更多观点,获取更多未呈现在节目中的扩展阅读,欢迎添加脑放电波小助手微信(BrainAMP01)加群参与讨论,后续会发布本期节目的文字稿
人物:
* 李楠-AI谬论主播,怒喵科技CEO,前魅族副总裁
* 托马斯白-脑放电波主播,资深科技营销人,前XR创业公司CMO,科技媒体特约作者;Nixon-脑放电波主播,硬件产品经理,前科技媒体记者.
* 剪辑制作:柒
节目中用到的音乐:来自monkeyman535的90's Rock Style,地址freesound.org;来自kjartan_abel的Berlin Town,地址freesound.org;基于 CC BY 4.0 DEED 使用。
脑放电波往期节目精选(搜索关键词可收听)
* 汽车聚变、泛科技生活:SU7营销复盘 / 男人的“发烧消费”/ 和李楠聊AI与个人觉醒
* 具身智能:宇树机器人 / 斯坦福Aloha
* 饮食健康、现代病人:控糖革命 / 信息过载 / 长寿革命 / 阿斯巴甜致癌疑云 / 结构化谈谈“健康饮食”
* 苹果特权:设计哲学 / 苹果供应链迷思 / 苹果广告底层逻辑 / iPhone 15 和它的前任们 / 苹果零售店
* AI 相关节目:会喘气的AI语音里藏着下一代交互范式 / 解构Apple Intelligence / 和李楠聊AI硬件 / 能做家务的机器人还有多远?/ GPT并非替代你 / 611款 AI 生产力工具;
脑放电波是一档关注科技前沿、品牌营销和个人成长的谈话类节目。每期带给您一个有趣有据的话题,帮您在信息严重过载的现代世界小幅自我迭代。您可以在小宇宙、苹果播客或者其他泛用型播客客户端搜索“脑放电波”找到并关注我们,如果您对本期节目有任何疑问,欢迎您给我们留言,如果您觉得这期内容对你有所帮助,欢迎您关注点赞收藏转发,这对我们非常重要。
评价...

空空如也

小宇宙热门评论...
欢乐马_IVk3
1个月前 北京
11
亏了,听着听着才发现是软文,浪费时间!
HD879269c
1个月前 广东
7
都散了吧,没什么干货,就是一期理想的软文
Nixon_Hu
1个月前 北京
5
历史上每一次人机交互的革命,都成就了一家伟大的公司,今天我们正站在新的十字路口。当理想同学用“三模型架构”成为首个“真正可用”的语音助手,当语音输入强大到在游戏中被视为“作弊”,我们正处在一个剧烈的范式转换前夜。本期节目,我们与怒喵科技李楠一起,揭示本地模型与语音交互如何改变我们几十年来拥抱屏幕的“病态”并回归自然。 欢迎收听脑放电波和 AI谬论 的串台节目
Mike-Wu
1个月前 广东
5
沙发,见证人机交互革命的时代👏
HD765387s
1个月前 浙江
4
收钱了的软文,大家别浪费时间了
HD80162x
1个月前 湖南
4
记个笔记——语音交互,小模型实时训练,情趣管理
NathanWu
1个月前 美国
3
''理想车机 好 特别好 用了就回去不的好'' 听得我急死了🤣
OneTiger
1个月前 浙江
3
wispr flow 已经用上了,能否把后面提到的几个产品名字也说一下,好像有个听着是 qu 开头的
HD557266u
1个月前 中国香港
3
20:48 本地操作这些可能0.6b就够了
HD651708i
1个月前 北京
2
理想同学确实是可用性非常强,有车载机器人的雏形
OneTiger
1个月前 浙江
2
李楠关于理想车机的分享太棒了,希望可以再出一集详细讲讲,我已经整理出了一系列问题准备去各家 4s 店测试对比一下,能否提供一些理想回复得比别家好的问题?
OneTiger
1个月前 浙江
2
我测试让 wispr 听着这集播客 10 s ,中间我说了一句话,结果 wispr 就准确的识别了我的话。我说话的时候还继续放着播客,这 wispr 是怎么做到的啊?
DD_AZeY
1个月前 上海
2
一定要叫理想同学才能唤醒它吗
胡思乱想
1个月前 广东
2
很有启发性的一期节目,ai 赋能后的语音可以展现非常多的应用场景。语音交互能安装到无数的现实场景中,人天生就会,而很难想象触摸屏能装到线下任何场景,并且降低学习场景。我相信这是 iPhone 时刻。
poorest
1个月前 山东
2
但是端侧模型也有准确率的问题,加载延迟的问题,算力小的限制,语音交互而言端到端未必端侧比云侧好吧。实时性端侧模型可能更适合的是特定垂域场景、永远在内存的、有离网场景的应用吧
六个梦已存在
1个月前 广东
2
42:02 现在在对话框右边直接多了一个语音按钮,最神奇的是,你在语音最后说 over over 会直接发送出去😱
Gontus46
1个月前 北京
1
谢谢主播和嘉宾分享,根据模型能力去定义产品功能确实感觉是下一代革命性产品的基石,现在很多 Infra 都不是专门为模型设计的,可能为 AI 先提供更“好”的基础设施才能更发挥出 AI 真正的能力
XJMQD
1个月前 吉林
1
27:23 没有图搜的时候不会找说明书查吗?而且连故障灯都认不清楚你驾照是怎么考下来的
Minke
1个月前 广东
1
53:36 同意 终端决定
洛圣都出租车司机
1个月前 北京
1
00:39 能不能把音乐关了,剪辑师听着不费劲吗
西瓜晒太阳
1个月前 上海
0
20:03 就这么点东西也能得出范式转换的结论吗,谁会在最大的场景手机上用语音交互。有点搞笑。难怪程序员创业做应用基本死掉,不洞察用户使用场景,在那自嗨。另外主持人提的场景,都是刚摸到新车的时候,不熟悉操作,等你开一个月试试,有多少人会愿意多费一句话来操控,直接都上手了好嘛
二月廿三
1个月前 山东
0
节目做的很好啊,订阅咋一直不温不火
HD158144p
1个月前 广东
0
省流:理想广告
i_4wQO
1个月前 河北
0
李楠没开过车吗?我想问。
EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧