Album

红衣大叔周鸿祎的播客

红衣大叔周鸿祎 红衣大叔周鸿祎
6,190 订阅 8 集 1周前
播客简介
红衣客厅
节目

机器人长得像人是陷阱?

红衣大叔周鸿祎的播客

本期对谈嘉宾 周鸿祎:360创始人 郭彦东 :智平方创始人兼CEO 智平方:是全球领先的AGI原生通用智能机器人企业,通过自研GOVLA具身大模型赋能AlphaBot系列机器人,致力于将通用智能机器人变成像智能手机和智能汽车一样的普及化智能终端。 本期节目简介 有人让机器人炫技出圈,有人靠机器人真实干活狂揽5亿订单,差距到底在哪?周鸿祎360创始人对话郭彦东智平方创始人兼CEO,这场对话,将颠覆你对机器人的所有认知。 专业词汇注释 具身智能:(Embodied AI)是指拥有物理或虚拟身体(embodied),并支持通过感知和行动与环境进行实时交互,从而完成复杂任务的智能系统。 Diffusion :扩散模型(Diffusion Models)是一种先进的生成式AI架构,与生成对抗网络(GAN)、变分自编码器(VAE)同属生成模型。核心思想是通过前向过程逐步向数据添加噪声,直至数据完全随机化,再训练神经网络学习反向过程,从噪声中一步步还原出真实数据,从而生成全新样本。 Vibe-coding:(氛围编程)诞生于 2020 年代中期的技术俚语,特指一种完全依赖人工智能(AI)辅助的编程方式,开发者主要扮演需求提出者和AI 生成代码的整合者的角色,而非传统意义上的代码手写者。 世界模型:世界模型是AI脑子里的“常识知识库”和“逻辑模拟器”,让AI能像人一样理解世界的运行规律,而不是只会机械地预测下一个字或拼凑文本。 Anthropic:一家人工智能研发公司,和OpenAI(ChatGPT的母公司)属于同赛道,主打大语言模型,最出名的产品是Claude系列对话AI。 大核卷积:(Large Kernel Convolution)是指使用尺寸较大的卷积核(Kernel Size)进行卷积操作,在卷积神经网络(CNN)中,卷积核的尺寸决定了每次操作能“看到”的输入区域大小。 Transformer: 是一种神经网络架构,核心思想是在处理数据(如一句话、一张图、一段视频)时,通过一种叫做“自注意力机制”的技术,让模型能够动态地关注输入信息中不同部分之间的相互关系,从而更好地理解整个上下文。 杨立昆:AI圈的“扫地僧”级大神,和另外两位科学家一起被称为“深度学习三巨头”,荣获2018年度(2019年颁发)计算机界最高奖“图灵奖”,相当于AI领域的诺贝尔奖得主。 李飞飞:AI领域的“拓荒者”,一手打造了让AI学会“看世界”的ImageNet数据库,被称为“计算机视觉之母”,33岁便成为斯坦福大学终身教授,是该校历史上最年轻的终身教授之一。 时间轴导航 ⏰ 00:01:40- 「5 亿 1000 台机器人真实落地工厂」 5个亿、1000台机器人,不是PPT,已经真实落地工厂干活了。 ⏰ 00:06:00- 「不做表演型机器人,专注干活生产力」 不做跳舞的表演型机器人,专注能下厂干活、解决实际问题的生产力。 ⏰ 00:17:10- 「具身智能、世界模型与端侧大模型」 拆解机器人“大脑”:具身智能、世界模型、端侧大模型,三大核心技术。 ⏰ 00:36:19- 「周鸿祎谈机器人长得像人是很大的陷阱 」 AI时代,大家觉得机器人到底要不要长得像人?长得像人,到底是进步还是陷阱? ⏰ 00:36:49- 「特斯拉机器人的零部件,也得来中国找!」 特斯拉也来中国找供应链?机器人赛道,中国的赢面藏在这两点。 ⏰ 00:38:02- 「真相曝光!特斯拉机器人摔倒瞬间摸脸」 特斯拉机器人摔倒摸脸名场面,到底是失误还是... ⏰ 00:42:35- 「 AI聊嗨了,竟要“反抗人类”?」 为啥机器人不能随便说话?背后是有这些顾虑 ⏰ 00:46:15- 「周鸿祎的梦想,藏在这个回答里」 我的AI梦:一半人创作,一半人快乐追剧,完美! ⏰ 00:47:52- 「周鸿祎说AI时代35岁程序员更值钱」 AI编程改写职场规则,35岁不再是门槛,老程序员反而更吃香。 ⏰ 00:48:20- 「AI把职场人的边界打破了」 告别螺丝钉式工作,人人都能成多面手。 ⏰ 00:51:44- 「3年内机器人价格降到3万?」 大家一起大胆预测,未来三年机器人价格能降到多少?

51分钟
99+
1周前

机器人大赛道,怎么抓落地小场景?

红衣大叔周鸿祎的播客

本期嘉宾: 王启斌 灵初智能 创始人兼首席执行官20年+商业化实战经验,多次实现机器人/消费电子产品从定义、开发、上市、全球化“0-1-N”闭环,带领百人团队作战。 陈源培 灵初智能 联合创始人00后“天才少年”,全球首次落地基于强化学习的双臂双手多技能操作,目前国内灵巧手操作领域强化学习Sim2Real方向成果最多的学者。 本期节目简介 70后为什么要和00后一起开机器人公司?为什么具身智能热潮里,这家公司选择不做双足全人形,而是用轮式底盘?AI和机器人都会替代谁的工作? 带着这些问题,我探访了灵初智能,和70后商业老将CEO王启斌和00后「AI Native」联创陈源培畅谈,在机器人的大赛道里,他们是如何抓住务实落地小场景的。 专业词汇注释 具身智能:即具身化的人工智能,能通过物理身体与现实世界环境互动学习和进化,如机器人。 遥操作:通过交互设备对远程机器或系统进行实时控制。 强化学习:AI通过不断试错来学习的方式,在执行任务时 行为达标即可得奖励,不断累积经验,从而做出更好决策。 VLA:Vision-Language-Action Model。即视觉语言动作模型 不仅理解语言指令,也能通过视觉感知环境,而后自主决策和执行动作。 VLM:Vision–Language Model。即视觉语言模型,对视觉内容可深刻理解,并可进行自然语言交互。 预训练:通过大规模通用数据集对模型进行初步训练,使其掌握语言、图像等数据的基本结构和通用特征,从而为后续的特定任务优化提供基础。 后训练:预训练完后进行专业化能力增强的阶段,通过微调与对齐技术 调整模型参数,更精准适配目标场景。 机器人大小脑(快慢脑):类似人类大脑负责决策、小脑负责协调运动,亦有快慢脑架构,慢脑‌专注于场景理解,任务规划和长期决策;快脑‌专注于实时控制与动态响应,快速执行具体动作。 长程灵巧操作:指机器人在开放环境中自主执行一系列精细动作任务。这些任务通常涉及多步骤、工具使用、物体交互,以及需要适应实时变化的环境。 人在回路:Human-in-the-Loop。人类实时参与AI决策闭环,用于修正模型偏差或处理不确定性场景。 ImageNet:机器学习中最著名的可视化数据集之一,视觉模型训练基石,超过1400万的图像URL被ImageNet手动注释,包含2万多个类别,每个类别包含数百个图像。 CoT:Chain-of-Thought。即思维链,处理复杂任务时,让AI分步展示逻辑推理步骤,方便使用者了解过程 进行针对性训练和优化。 API:Application Programming Interface。软件通信接口,不同程序交互的桥梁,可让AI连APP、连机器人,功能互通。 RLHF:Reinforcement Learning from Human Feedback。即人类反馈强化学习,AI通过人类评价、学习人类偏好,进行调优。 世界模型 World Model:类似于真正的人类大脑,理解现实世界中的物理和因果规律,具备“物理直觉” 可在内部模拟环境变化,并基于环境推演未来状态 评估自身行为的后果。 CoAT:Chain-of-Action-Thought模型。它在传统思维链(CoT)中引入元动作(meta-actions),来实现模型在推理过程中的自主控制和动态调整。 Sim-to-Real Gap:即仿真到现实的差距,指人工智能在仿真环境中表现良好,但迁移到真实物理世界时性能显著下降的现象。 Embodiment Gap:即具身鸿沟。指具身智能在模拟环境中的表现和物理世界真实交互能力存在显著差距。 eVTOL:Electric Vertical Take-Off and Landing。即电动垂直起降飞行器 无需跑道即可起降,用于城市空中交通(飞行汽车)或低空运输。 AGI:Artificial General Intelligence。即通用人工智能 能像人类一样思考并执行任意任务,是普遍认为的人工智能终极目标。 PMF:Product-Market Fit。产品与市场的最佳契合点和匹配度,被普遍认为是创业成功的核心要素之一。 ‌AI Native‌:即AI原生物种或人群,从诞生之初就在 AI 范式和环境里成长学习,并持续演进的个体和组织。 时间轴导航 ⏰ 07:28- 「比特斯拉早3年?灵巧手研发的早期布局」 团队早在2020年就开始研发灵巧手技术,比行业热潮提前多年 ⏰ 11:57- 「为什么不做全人形机器人?」 "双足机器人为了保持稳定要花费很多算力和能源,即使这样依然有摔倒危险" ⏰ 15:35- 「家庭机器人的真实难度」 "大家低估了人形机器人进家庭的难度,从操作安全到故障修复,每个问题都很复杂" ⏰ 25:57- 「智能体技术如何赋能机器人」 "大模型真正能干活一定要变成智能体,一旦加上物理的身体,智能体就能发挥巨大作用" ⏰ 35:09- 「机器人数据获取的创新方法」 嘉宾分享灵初独特的数据采集策略,结合互联网数据、仿真数据、真实数据和真机数据 ⏰ 40:39- 「人机协作的未来模式」 王启斌提出机器人发展将遵循自动驾驶的路径,大部分时间自主工作,特殊情况人工接管 ⏰ 50:49- 「中国机器人企业出海战略思考」 王启斌分享公司出海战略,计划将中国仓储场景打磨的技术解决方案推向全球市场 "中国的仓储是世界上效率最高、成本最低的,我们有信心明年年底做全球化,解决全球通用的操作问题" ⏰ 52:46- 「AI对人类工作的替代与转型」 周鸿祎提出尖锐问题,探讨机器人产业对蓝领工作的影响及未来5年岗位变化趋势 ⏰ 58:17- 「70后和00后一起创业?有代沟吗?会打起来?」 周鸿祎调侃00后陈源培与70后王启斌的年龄差距,探讨跨代创业团队的优势与挑战 ⏰ 01:04:16- 「什么是AI Native公司?AI时代的组织模式变革」 周鸿祎分析AI对企业组织结构的影响,指出传统互联网大厂的分工模式正在失效 "AI让人类分工界限模糊了,以前做产品需要产品经理、UI设计师、研发人员的严格分工,现在可能一个人借助AI就能完成" ⏰ 01:11:38- 「AI时代与互联网时代商业模式非常不同」 "AI是一种生产力,用得越多成本越高,很难免费,这会让很多互联网免费模式玩不转"

83分钟
4k+
2个月前

柳夜熙数字人爆款孵化全复盘:AI时代内容爆款公式变了吗?

红衣大叔周鸿祎的播客

本期嘉宾:梁子康 创壹科技CEO /姚顺宇 创壹科技CTO 柳夜熙 国内第一数字人IP 创壹科技 缔造爆款数字人IP"柳夜熙",全网3000w+粉丝,打造爆款短剧《柒两人生》。 本期简介:为什么数字人柳夜熙2021年刚上线就能在两周时间内狂揽300万粉丝,而大部分数字人IP却无人问津?AI技术爆发的当下,智能体能不能学会张艺谋和诺兰等大导演风格的镜头语言?爆款内容背后的设计有了AI工具加持,范式改变了吗? AI视频创作是拼模型参数?原来核心还是创意,是“情绪节拍表”! 让我们一起跟创壹科技CEO和CTO聊聊,他们是用什么秘诀把柳夜熙打造成现象级IP,怎么用AI工作流提高效率。 专业词汇注释: Nano Banana:谷歌于 2025 年 8 月推出的AI模型,进一步解决角色一致性问题,生成的图像更理解真实物理规律并符合现实逻辑,迅速成为行业焦点。 Sora2:是OpenAI于2025年10月1日发布的新一代视频生成模型,在物理模拟、真实感和可控性方面显著提升。 LoRA技术:以极低参数量实现大模型高效微调,在AI视频制作中最大价值是解决角色/风格一致性并降低训练成本,支撑实时交互式视频生成。 3D渲染引擎:实时生成高质量3D图形的核心技术,支持数字人在虚拟场景中的实时交互与直播。 动捕技术:通过传感器捕捉真人动作并转化为数字模型动作的数据,是实现数字人自然运动的关键技术。 分镜表:影视创作中的可视化脚本,包含镜头角度、角色动作等关键信息,是保证故事连贯性的核心工具。 节拍表:通常也被称为斯奈德节拍器,是布莱克·斯奈德提出的一种电影剧本结构分析方法。它将电影剧本分为15个关键的节拍,每个节拍都对应着剧本中的一个特定阶段和任务,有助于编剧检查故事的节奏和结构。 时间轴: ⏰ 00:04:17- 「柳夜熙登场:背后是真人还是AI?」 数字人柳夜熙正式登场,周鸿祎猜测其背后是大模型驱动还是真人操控。 ⏰ 00:08:35- 「数字人粉丝破3000万的流量密码」 柳夜熙分享与粉丝建立信任协作关系的秘诀,强调"辅助决策而非替代"的定位。 ⏰ 00:12:10- 「数字人核心商业价值是什么?」 梁子康透露柳夜熙众多品牌合作,解析数字人IP的商业化路径。 ⏰ 00:16:17- 「直播数字人技术瓶颈」 讨论实时直播数字人的技术挑战,解释为何当前多数数字人仍无法实现自由转身。 ⏰ 00:21:16- 「Nano Banana解决创作实际问题了吗?」 技术团队对比不同AI工具在人物一致性上的表现,分享行业实战经验。 ⏰ 00:26:46- 「为什么要做AI工具」 分享因内容制作成本过高,进而自主研发AI创作工具的历程。 ⏰ 00:37:40- 「Sora2会止步大众娱乐属性吗?」 探讨OpenAI最新视频模型的发展方向,分析其更可能走向大众娱乐还是专业创作。 ⏰ 00:57:39- 「最好的智能体由谁打造?」 最好的AI创作智能体不是由程序员而是由专业导演和内容创作者打造。 ⏰ 01:02:18- 「AI时代内容创作的范式演进」 从"人找工具"到"工具找人"的革命性变化。 ⏰ 01:10:52- 「张艺谋/诺兰等大导风格AI如何习得?」 探索AI能否学习并复制著名导演的镜头语言与叙事风格,技术可行性与实现路径。 ⏰ 01:22:58- 「AI全流程做视频前瞻:漫剧先行?」 预测AI视频技术的发展路径,或许漫剧将率先实现AI全流程生产,真人剧仍需人机协作。 ⏰ 01:25:46- 「互动短剧的新机遇」 探讨短剧与互动游戏结合的创新模式,分析其如何解决AI视频的"恐怖谷"效应。 ⏰ 01:32:32- 「0粉起号方法论」 分享从0打造现象级IP的实战经验。 ⏰ 01:38:05- 「情绪节拍表的奥秘」 揭秘创壹科技打造爆款内容的核心工具,如何通过科学方法设计观众情绪体验。 ⏰ 01:48:16- 「视频创作者与AI最佳协作方式」 分析当前AI视频创作中人类创作者的不可替代之处,以及人机协作的最佳平衡点。 ⏰ 02:03:19- 「高品质工作流能做热点时效内容吗?」 如何兼顾时效性与质量的AI辅助创作方案。 ⏰ 02:07:32- 「内容创作的黄金法则」 总结AI时代内容创作的核心要素。

130分钟
4k+
4个月前
评价

空空如也

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧