E152|对话NVIDIA和五源资本:“具身智能”能带领这波机器人热走多远?

视觉、语言理解等多模态大模型和仿真训练技术的结合像是给机器人打了鸡血,让它们变得越来越聪明,行动能力越来越强,越来越像人。 “具身智能”的出现,让机器不再仅仅是被动的计算设备,而是能够主动与物理世界互动的智能体。 从创业公司到科技巨头,从软件平台到硬件开发,这场机器人竞赛的参与者越来越多。从特斯拉的Optimus到波士顿动力的Atlas,这些类人形机器人展现了无与伦比的交互能力,实现了从视觉到动作的端到端神经网络闭环。这些进展似乎预示着“莫拉维克悖论”的终结,即机器人在感知和运动任务上的困难正逐步被克服。随着技术成本的降低和成熟度的提高,人形机器人的商业化应用是否已近在咫尺?在这场竞赛中,哪类玩家能够抢占先机? 本期《硅谷101》邀请到了NVIDIA中国区机器人业务负责人李雨倩 (Lily Li) 和五源资本董事总经理陈哲 (Peter Chen),与大家分享他们对机器人行业的见解,讨论AI加持下的机器人行业有哪些新的工具和技术,还需要经历哪些挑战,才能真正实现规模化和商业化。 【主播】 泓君Jane,硅谷101创始人,播客主理人 【嘉宾】 李雨倩 (Lily Li) ,NVIDIA中国区机器人业务负责人 陈哲 (Peter Chen),五源资本董事总经理 【你将听到】 03:32 大模型、仿真训练和巨头的入场加速了复杂形态机器人的发展 06:19 SayCan,PaLM-E,RT-2等大模型是突破的关键 08:58 NVIDIA做机器人早有积累:从训练、仿真到推理 15:52 大火的“具身智能”关键在于智能体与外界有交互 21:14 机器人一定要像人吗?有时三个手臂更实用,但“人形”是人类文明的形象承载 26:14 中国的机器人开发者最关心什么时候可以用上GR00T 31:31 物理世界 or 仿真平台:不管在哪里训练机器人,都离不开真实世界数据 37:03 泼个冷水:通用机器人尚无商业化案例 38:49 垂直品类的机器人主要在扫地、仓储搬运、无人机 45:37 现在做通用机器人,难度大于在2005年做特斯拉 46:15 十年:当通用机器人商业化时间超过一家基金的存续期 47:57 让机器人“学会拿杯子”就可以拿诺贝尔奖 51:18 各有所长:中国领先供应链和垂直落地场景、美国擅长探索通用能力 55:10 做机器人要有长期主义心态,在低谷期建立复原能力 56:37 “技术泡沫”也意味着顶级聪明人的聚集和新的商业机会 【相关音频】 E113 | 大模型来了,但机器人研究依然很难,商业化更难 【相关补充信息】 具身智能 Embodied Artificial Intelligence,是指一种基于物理身体进行感知和行动的智能系统,其通过智能体与环境的交互获取信息、理解问题、做出决策并实现行动,从而产生智能行为和适应性。1950年,图灵在其为人工智能奠基、提出图灵测试的经典论文《Computing Machinery and Intelligence》的结尾展望了人工智能可能的两条发展道路:一条路是聚焦抽象计算(比如下棋)所需的智能,另一条路则是为机器配备最好的传感器、使其可以与人类交流、像婴儿一样地进行学习。这两条道路便逐渐演变成了非具身和具身智能。 Project GR00T NVIDIA 于今年3月发布的人形机器人通用基础模型,GR00T 驱动的机器人(00代表通用机器人00技术)将能够理解自然语言,并通过观察人类行为来模仿动作——快速学习协调、灵活性和其它技能,以便导航、适应现实世界并与之互动。 PaLM-E PaLM-E是一个由谷歌和柏林工业大学在2023年共同提出的具身多模态语言模型(Embodied Multimodal Language Model)。这个模型能够将现实世界的连续传感器模式直接纳入到已经预训练好的大型语言模型中,从而在单词和感知(words and percepts)之间建立联系,其核心设计理念是将连续的、具身的观察(如图像、状态估计或其他传感器模式)注入到预先训练好的LLM的语言嵌入空间中。 PaLM-SayCan 谷歌研究团队于2022年提出的一种机器人学习算法,结合了大型语言模型与预训练的机器人行为,机器人充当语言模型的“手和眼睛”,语言模型则提供关于任务的高级语义知识。这种方法使得机器人能够根据自然语言指令执行复杂的物理任务,同时确保这些任务在特定的真实世界环境中是可行的。 Google RT-1/RT-2 由Google的机器人研究团队开发的先进机器人学习模型。RT-1(Robotics Transformer 1)是一种视觉语言行动(VLA)模型,RT-2是其进化版本,目标是训练一个端到端的模型,该模型可以直接从机器人的观测到动作,同时利用大规模预训练视觉语言模型的优势。RT-2通过对互联网级别的视觉语言任务进行预训练,然后在真实世界的机器人任务上进行微调,从而获得更好的泛化能力和涌现能力。 【监制】 杜秀 【后期】 AMEI 【Shownotes】 杜秀 【BGM】 Swerve Space - Lama House Elephanti - Osoku 【在这里找到我们】 公众号:硅谷101 收听渠道:苹果|小宇宙|喜马拉雅|蜻蜓FM|网易云音乐|QQ音乐|荔枝播客 海外用户:Apple Podcast|Spotify|TuneIn|Youtube|Amazon Music 联系我们:[email protected]

57分钟
19k+
1年前

E151|事故频发、吹哨人离奇死亡,波音怎么了?

2018年10月印尼狮航的波音737 MAX飞机坠毁,5个月后,埃塞俄比亚航空公司的波音737 MAX 8型客机发生空难,两起空难共造成346人遇难。不幸的是,这并不是故事的结束。今年,波音公司再次频繁登上头条新闻,这一次是因为多起令人震惊的事故在短时间内接连发生——包括内嵌式应急门脱落、引擎起火、轮胎掉落、冲出跑道以及机翼受损等。 今年4月,美国国会参议院举行了听证会,波音公司的安全文化受到了严格的审查。在听证会上,包括波音前工程师萨姆·萨利赫普尔在内的多名证人出庭作证,他们对波音飞机的安全性提出了严重的担忧。更令人震惊的是,正在波音接受国会和司法调查期间,两位波音的吹哨人在不到两个月时间内非自然死亡。 作为全球航空业的巨头,波音公司正面临着新一轮的信任危机。美国航空监管机构、航空公司、乘客甚至波音公司自己的员工都在纷纷发出抗议的声音。投资者也表达了自己的担忧:波音公司的股票今年下跌了 28%,成为标准普尔 500 指数中表现第二差的公司,仅次于特斯拉。 波音到底怎么了?《硅谷101》邀请到了Wintell & Co 律所高级顾问,Eding Yi,回顾最近举行的波音听证会,讨论多起事故背后的原因、以及未来的飞行安全。 【主播】 泓君Jane,硅谷101创始人,播客主理人 杜秀,硅谷101播客监制 【嘉宾】 Eding Yi, Wintell & Co 高级顾问 【你将听到】 03:16 波音事故频发不是偶然事件 04:13 设计有缺陷的MCAS是737 Max两起坠机的罪魁祸首 08:11 全链条漏洞使得波音飞机的失事无法避免 11:43 多位吹哨人将波音推进舆论漩涡 14:52 五年前的空难后,美国与波音公司达成不起诉协议 15:32 吹哨人在听证会爆料被波音公司持续无视和打压 18:54 百人遇难却无人入刑——航空灾难的诉讼流程极为冲突且复杂 24:30 听证会的底色对波音相对友好 26:36 即是裁判员又是运动员:FAA对波音问题的处理能力有限 30:45 听证会期间两位吹哨人接连死亡是巧合吗? 32:25 吹哨人:“鉴于我在波音所看到的一切,我不再敢乘坐飞机” 36:34 失去向日本学习精益制造的机会,波音是美国制造的黑暗时代 39:06 心态更放松的空中客车在订单储备上已经超越了波音公司 43:35 航空供应链并非流水线化,依然是匠人精神与以人为本 48:07 非官方建议:出行可以选航司,还可以参考ICAO官方安全报告 【相关补充信息】 MCAS系统 Maneuvering Characteristics Augmentation System(机动特性增强系统)是波音737 MAX飞机上采用的一种飞行控制律,在原始设计中MCAS依靠来自单个迎角传感器的输入数据来监控飞机在飞行中的迎角,原本是为了增强飞机在高迎角条件下的俯仰稳定性,但在实际运行中,由于对系统潜在风险的沟通不足以及传感器数据的依赖问题,导致了严重的事故。在两起涉及波音737 MAX飞机的空难之后,波音公司对MCAS系统进行了升级。 FAA 美国联邦航空管理局(Federal Aviation Administration)的缩写。它是美国政府机构,负责制定与飞机相关的规则和标准。 ICAO Safety Reports 国际民用航空组织(International Civil Aviation Organization)发布的安全报告。该年度报告提供有关全球航空安全情况的更新,包括事故统计数据、相关风险因素分析以及与全球航空安全计划(Global Aviation Safety Plan,简称 GASP)相关的指标更新。 【监制】 杜秀 【后期】 AMEI 【Shownotes】 杜秀 【BGM】 One Last Drama - Philip Ayers No Turning Back - Alan Carlson-Green Are You Alone_ - Victor Lundberg Reviving - Megan Wofford 【在这里找到我们】 公众号:硅谷101 收听渠道:苹果|小宇宙|喜马拉雅|蜻蜓FM|网易云音乐|QQ音乐|荔枝播客 海外用户:Apple Podcast|Spotify|TuneIn|Youtube|Amazon Music 联系我们:[email protected]

54分钟
19k+
1年前

E150|与侯晓迪聊聊自动驾驶与搅局的马斯克

作为全球自动驾驶第一股,图森未来经历了被做空、被美国监管机构调查以及创始人内斗等种种问题,在大国科技交锋的风口浪尖上,图森未来比Tiktok的故事更加跌宕起伏,更艰难。 在今天跟侯晓迪的对谈中,你会感受到他犀利、坦诚,一个多灾多难的公司,加上一个棱角分明的创始人,侯晓迪一直都处在舆论风暴的中心。 在我们采访到侯晓迪的时候,他已经开始了他新的一次自动驾驶卡车创业,新公司的名字叫做Bot.auto。我们与侯晓迪聊了聊大家对自动驾驶行业的错误认知,以及大模型如何帮到自动驾驶行业,还有他为何认为马斯克是自动驾驶行业的一个搅局者。 【主播】 泓君Jane,硅谷101创始人,播客主理人 陈茜,硅谷101联合创始人,视频主理人 【嘉宾】 侯晓迪,无人驾驶卡车公司Bot.auto创始人兼CEO 【你将听到】 00:07 图森未来三大挫折与退市全过程 03:46 为什么再次创业还是无人驾驶:2027年能赚钱 07:56 为了生存,无人驾驶公司能做的“副业” 08:42 自动驾驶级别的科普、不同级别商业模式不同 11:26 马斯克宣布8月推Robotaxi:他也许没有赢,但我们已经占下风了 14:56 L4挣钱之前要解决的核心问题:安全性、冗余与运营 15:21 模型越大效果越强?并不是 18:10 高速比拥堵的城市更容易实现无人驾驶:不必面临太多权责不清的交通场景 20:31 具备迁移能力的大模型,爆火出圈只是小创新累积的必然成果 24:33 大模型对自动驾驶行业的启发:低成本、高效率的冷启动 27:33 从小在互联网被骂,创业对自己的意义 29:41 创业那些事儿:招人标准、股权分配、初创公司容易踩的坑 33:38 “看十年,想三年,做一年”,公司战略不能只为了融资 35:50 做人形机器人的都是骗子?会飞的汽车、科幻和商业的矛盾 37:12 波士顿动力是长期主义的公司,探索控制论的边界 42:12 谈招人:你在火箭上不挑座位 43:45 离开图森后、再次创业前的思考斟酌,今非昔比的市场环境 49:49 “实名反对马斯克:他在伤害无人驾驶行业” 55:27 自动驾驶行业低谷——加息带来的资本寒冬 57:19 激光雷达 vs 机器视觉:能抓到耗子的就是好猫 58:28 谈谈Sora与世界模型:新瓶装旧酒 62:05 长尾问题目前不是无人驾驶卡车的主要阻碍 【相关阅读】 提到的Andy grove的两本书: Only the Paranoid Survive(1988) High output management(1983) 【后期】 Amei 【BGM】 Interruption - Craft Case LBRTY - Heyson I Am Back - Ruiqi Zhao The Deal - Ruiqi Zhao Adventurous Legend - Ruiqi Zhao 【在这里找到我们】 公众号:硅谷101 收听渠道:苹果|小宇宙|喜马拉雅|蜻蜓FM|网易云音乐|QQ音乐|荔枝播客 海外用户:Apple Podcast|Spotify|TuneIn|Youtube|Amazon Music 联系我们:[email protected] Special Guest: 侯晓迪.

64分钟
22k+
1年前

E149|科技巨头们开始抢电?聊聊AI用电荒和核聚变创业热

你知道每使用一次ChatGPT,OpenAI需要交多少电费吗?前阵子模型微调平台OpenPipe创始人Kyle Corbitt爆料称,如果在美国一个州内使用超过10万个H100芯片,就会使电网瘫痪。英国、爱尔兰等国家也已经在限制AI数据中心对电力系统的占用。 在新技术诞生和应用的历史潮流中,我们经常发现,技术本身并非是最大的障碍,往往伴随而来的是对现有基础设施建设的挑战,比如家家户户会用到的电力系统。 所以AI巨头们的竞赛,不仅仅要囤芯片,还需要屯变压器,还要抢电。未来3-5年内,AI带来的电力短缺到底有多少?如果大基建跟不上,巨头们的解决方案还有哪些?我们今天就来掀开数据中心的电表看一看。 【主播】 泓君Jane,硅谷101创始人,播客主理人 【嘉宾】 徐熠兴(Ethan),微软能源战略部资深项目经理 项江,瀚海聚能CEO 【你将听到】 「AI用电荒」 01:52 AI耗电现状:美国的AI数据中心当前耗电量堪比纽约市 03:05 未来电力需求预测,电力单位的概念解释 06:00 OpenAI导致微软电网崩溃?AI用电的特殊性和波动性,对传统电网设计的冲击 11:25 美国电力行业面临的挑战:未来三五年,AI会和居民抢电吗? 16:10 AI意外加重了能源转型的负担:电力将成为AI发展的新瓶颈 17:43 硅谷公司们怎么布局数据中心?短期靠抢电,长期选址时考虑与电力公司的合作 22:19 中国当前的电力供应结构:几种发电方式、基础设施建设能力相对好 「能源现状与解决办法」 25:45 中国先进核能的“三步走”规划:热堆、快堆、核聚变堆 27:00 科技巨头们的新难题:既要考虑气候变化又要发展AI,真贵 29:43 AI消耗的能源有可能减少吗?AI训练数据耗尽 or GPU的效率提高 35:36 核能作为未来能源解决方案的潜力:几种清洁能源的成本对比 39:28 核裂变vs核聚变,选谁? 42:57 什么时候能用上核聚变发的电?科学问题差不多了,还是巨大的成本问题 48:16 Helion Energy与微软的对赌协议 50:04 核聚变公司的几大流派 「未来对策」 53:00 美国、中国和欧洲数据中心的选址问题:数据资产、东数西算 55:42 电网负担的解决方案:能源转型、分布式储能 59:00 AI和能源行业相辅相成:AI赋能核聚变 【名词解释】 电力单位换算 电量单位:千瓦时(kWh)、度 电力单位:千瓦(KW)、兆瓦(MW)、吉瓦(GW) 1 GW(吉瓦) = 1000 MW(兆瓦) = 1000000 KW (千瓦) = 1000000000 W(瓦特) 「星际之门」计划:微软与 OpenAI开发的全新人工智能超级计算机,计划投入 1000 亿美元,配备数百万专用AI芯片,以提供前所未有的计算能力,预计于2028年完成。 东数西算工程:“数”指的是数据,“算”指的是算力。“东数西算”是通过构建数据中心、云计算、大数据一体化的新型算力网络体系,将东部算力需求有序引导到西部,优化数据中心建设布局,促进东西部协同联动,于2022年2月正式启动。 「托克马克」:托克马克(Tokamak)是一种环形容器,它通过约束电磁波驱动,创造氘、氚实现聚变的环境和超高温,并实现人类对核聚变反应的控制。托卡马克的名字来源于环形(toroidal)、真空室(kamera)、磁(magnet)和线圈(kotushka)这几个俄语单词的结合,目前是实现可控核聚变的主流方式。中国科学家设计并建成的EAST(Experimental Advanced Superconducting Tokamak,全超导托卡马克核聚变实验装置)是这一领域的一个突出成就。 「氘氘(D-D)反应」&「氘氚(D-T)反应」:是指氢的两种同位素氘(Deuterium,化学符号D)和氚(Tritium,化学符号T)之间发生的核聚变反应。氘氘反应是指两个氘原子核聚合在一起,生成一个氦原子核和一个中子,同时释放出能量。这种反应在自然界中很少见,但在实验室条件下可以被诱发。氘氚反应是将氘核与氚核碰撞而产生的核聚变反应,它是目前研究中最容易实现的核聚变方式之一。 「Helion Energy」:一家总部位于华盛顿州雷德蒙德市的核聚变公司,专注于开发磁惯约束性聚变(MIF)技术。微软是其长期合作伙伴,计划在未来五年内从Helion购买电力。 「CFS」:全称Commonwealth Fusion Systems,一家美国核聚变发电公司,从麻省理工学院分拆出来后,于 2018 年在马萨诸塞州剑桥市成立。其既定目标是建造一座基于ARC托克马克设计的小型聚变发电厂。 「BEV」:全称Breakthrough Energy Ventures,是由比尔·盖茨牵头成立的投资公司,专注于投资清洁能源创新科技,以应对气候变化所带来的挑战。该基金成立于2016年12月12日。 【后期】 Amei 【BGM】 Listen to the Forest Weep - Hanna Lindgren Morning Breaks - David Celeste 【在这里找到我们】 公众号:硅谷101 收听渠道:苹果|小宇宙|喜马拉雅|蜻蜓FM|网易云音乐|QQ音乐|荔枝播客 海外用户:Apple Podcast|Spotify|TuneIn|Youtube|Amazon Music 联系我们:[email protected] 本期节目仅代表嘉宾个人观点 Special Guests: 徐熠兴 and 项江.

62分钟
30k+
1年前

E148读书日特辑|那些改变世界的人,热爱、信仰与坚持的故事(附诺奖采访)

在今年的世界读书日,《硅谷101》编辑部与大家分享了四本书:从诺贝尔奖得主的人生旅程《Breaking Through: My Life in Science》到创作者的内心挣扎《The War of Art》,从《深度学习革命》的科学家群像故事到一个小镇女教师《奥丽芙·基特里奇》的生活写照。弗吉尼亚·吴尔夫说:”腋下夹着书的读者不需要奖赏,上帝也没有什么可以给他们,因为他们一生爱书。”我们希望和大家一起聆听这些关于热爱、信仰和坚持的故事,获得阅读的慰藉和力量。 本期节目参与小宇宙编辑部 「423 世界读书日」特别企划 —— 「春日宜尝新」,期待能陪伴你在这个春天,轻松阅读,愉快焕新。 【主播】 泓君Jane,硅谷101创始人,播客主理人 【嘉宾】 陈茜,硅谷101联合创始人,视频主理人 Jacob,硅谷101视频后期 杜秀,硅谷101播客监制 【你将听到】 《Breaking Through: My Life in Science》 作者:Katalin Karikó 推荐人:陈茜 推荐语:这本书并非仅仅讲述了一个人如何成名的打鸡血故事,而是展现了Katalin如何因热爱自己的事业而坚持,并在科研事业和家庭生活中保持爱与尊重。 03:23 作为小镇屠夫的女儿,经受了四十年的职业打压,三次被解雇,“mRNA疯女人“始终没有放弃 06:52 被欺负、打压、不受重视,但家庭给了她足够的养分和支持 10:10不为任何实验室或者老板,只为自己的信仰和热爱工作,那个东西叫科学 14:40遇到有毒的老板,即使需要离家200公里也不能停下工作 20:09 2005年就发表了mRNA修饰技术的论文,十多年无人问津 《深度学习革命》(Genius Makers) 作者: 凯德·梅茨(Cade Metz)推荐人:泓君 推荐语:整本书围绕整个深度学习的几大关键人物,一群少数派学者在长期不被主流学术圈认可的情况下,坚信深度神经网络会改变世界,最终推动了整个人工智能技术突破性进展。 23:18 被中译名耽误的深度学习发展史 25:44 百度曾经差一点得到Geoffrey Hinton和他的团队 27:42 创新源头是什么?最开始的三到五个人为什么坚信深度学习能改变世界? 30:54 看似“偏执”的科学家的共同之处:靠信念扛住打压和质疑 《The War of Art》 作者: Steven Pressfield 推荐人:Jacob 推荐语:Steven Pressfield 是著名的编剧和小说家。本书帮助了许多在创作行业挣扎的人找到了他们想要的答案,对抗阻力和拖延,成为一个专业的创作者。 39:56 Burn out(职场倦怠)是很多创作者都会遇见的常态 42:15 为什么总有一股“劝退的力量”阻挠你的创作 43:52 创意不会随机产生,“专业”首先要直面每天重复的工作 49:21 创作终究不是一次百米冲刺,而是一场马拉松 51:01 “Doing itself is what matters.” 我们在打的是一场创作的战争,而不是一场流量的战争 《奥丽芙·基特里奇》(Olive Kitteridge) 作者:伊丽莎白·斯特劳特 推荐人:杜秀 推荐语:本书曾获2009年普利策小说奖。13个独立的故事串联起一个普通美国小镇女教师的生活——当她站在不完美的人生路口,仍然需要与生活和解并继续前行。 53:02 这是一个普通的中老年妇女的日常,不是大开大合的史诗,人物描写细腻精确 56:00 不需要一气读完这13个故事,可以每天读一点,在你心里留下一点点波澜 57:14 被HBO改编成了同名限定剧,豆瓣评分9.4 58:02 是老师,是妻子,是母亲,奥丽芙的不完美人生让人无限共鸣 彩蛋时间: 01:04:15《硅谷101》独家对话2023年诺贝尔生理学或医学奖得主Katalin Karikó 【监制】 杜秀 【后期】 AMEI 【Shownotes】 杜秀 【BGM】 Serenade of Dusty Trails - River Foxcroft Solitary Surrender - Rebecca Mardal We Were Golden - Anna Landstrom 【在这里找到我们】 公众号:硅谷101 收听渠道:苹果|小宇宙|喜马拉雅|蜻蜓FM|网易云音乐|QQ音乐|荔枝播客 海外用户:Apple Podcast|Spotify|TuneIn|Youtube|Amazon Music 联系我们:[email protected] Special Guest: 陈茜.

70分钟
28k+
1年前

E147|Suno引爆音乐圈,与音乐人聊聊AI生成音乐与艺术的随机数

AIGC的风终究是吹到了音乐圈——今年3月,“音乐届的ChatGPT” Suno V3粉墨登场,用户只需要在Suno上输入一句话的提示词,即可在数秒内生成两首两分钟的完整歌曲,从作词、作曲、演奏到人声演唱一气呵成,大大降低了普通人创作音乐的门槛。 已经习惯了各类“AI歌手翻唱”的听众和用户迅速拥抱了Suno,从《宫保鸡丁咏叹调》到《让我们荡起双桨》重金属,从英语、日语、俄语到普通话甚至是粤语,网友们自发上传的作品包罗万象,网易云音乐、QQ音乐等平台也迅速上线了SunoAI音乐专区,甚至还推出了定期更新的官方推荐歌单。 本期《硅谷101》邀请到了来自音乐和AI音乐生成领域的两位嘉宾,分享他们对以Suno为代表的文生音乐模型的看法,以及AI如何影响音乐产业的未来。 【主播】 泓君Jane,硅谷101创始人,播客主理人 【嘉宾】 冯建鹏,美国哈特福德大学哈特音乐学院打击乐讲师,百老汇全职演奏家,知名音乐博主“叨叨冯”(Youtube@daodaofeng) Roger Chen,Meta Music Tech Lead 【你将听到】 02:26 为什么大家感觉是Suno是最火的呢?因为他敢最先把自己的文生音乐模型公之于众 02:43 【测评一】“找不到工作的悲伤摇滚乐”,结果并不悲伤 07:30 能听但没有态度,AI只能写出不愤怒的摇滚乐 11:02 AI写的歌可以达到业界平均水平,但无法出挑成为头部作品 14:40 速度是音乐创作最重要的指标之一,为什么AI写不出80 BPM的音乐? 18:26 AI写歌与人类作曲不是一个逻辑,只能从左到右按顺序写,没有全局观 22:07 训练素材足够全面和丰富,AI可能写出Taylor Swift水平的歌曲? 25:55 同样的音乐,水平不同的演唱者演奏出来也不一样 27:20 【测评二】英雄主题的交响乐,听感能得7分,作为乙方它不及格 33:40 Suno不能按提示词生成指定的乐器,它只追求听上去大概相似 37:48 AI生成音乐是无法抗拒的洪流,但暂时做不到像音乐家一样写歌 43:13 【测评三】挑战规则严谨的赋格,Suno会表现得更好吗? 47:05 赋格研究在AI音乐有20年历史,不过在巴赫的原曲面前还很稚嫩 52:32 音乐技术与心理学:Mp3技术是如何被发明出来的? 53:57 音乐的本质是“有组织的声音”,这是文生音乐大模型的底层逻辑 58:58 最怕无聊?艺术需要跳出人类总结 63:12 创作者的脑洞大开:在音乐里加入随机数机制 【提示词参考】 开场曲 《The future is now》 by Suno, an opening music for a podcast called Silicon Valley 101, discussing innovative technology, AI and business stories, jazz, easy, catchy. 【测评一】 05: 56 《Struggling in the shadows》by Suno, sad story of not finding a job, Classic Rock, 80 BPM, Guitar, Base, Drum, Keyboard. 【测评二】 27:46/29:42 《Hero themed symphony》by Suno, instrumental, strings, woodwinds, brass, timpani 【测评二】 30:27 《Hero themed symphony》by Suno, instrumental, strings, woodwinds, brass, timpani, Classical, 19th century. 【测评三】 46:21 赋格曲 by Suno,Toccata and Fugue in D Minor. Dark and dramatic, featuring solo organ creating a serious and powerful mood. 结束曲 《Silicon Pulse》 by Udio, closing note for the episode of AIGC music, hip pop, extended intro and outro. 【补充信息】 BPM beats per minute,度量速度的音乐单位,每分钟多少拍(BPM)表示一个指定的音符,例如四分音符,在一分钟内出现的次数,BPM的数值越大代表速度越快。 Fairly Trained: 由来自前Stability AI、Humanistic AI等科技公司高管、知名好莱坞律所和音乐界人士发起的非盈利组织,对涵盖图像、音乐和歌曲生成的人工智能模型进行认证,证明他们已申请使用受版权保护的训练数据的许可。 赋格: 为拉丁文“fuga”的译音,是盛行于巴洛克时期的一种复调音乐体裁,又称“遁走曲”,是复调音乐中最为复杂而严谨的曲体形式。赋格的结构与写法比较规范。乐曲开始时,以单声部形式贯穿全曲的主要音乐素材称为“主题”,与主题形成对位关系的称为“对题”,之后该主题及对题可以在不同声部中轮流出现,主题与主题之间也常有过渡性的乐句作音乐的对比。 掩蔽效应: 是指由于出现多个同一类别(如声音、图像等)的刺激,导致被试不能完整接受全部刺激的信息。具体分为视觉掩蔽效应和听觉掩蔽效应。其中,听觉掩蔽效应是指人的耳朵只对最明显的声音反应敏感,而对于不敏感的声音,反应则较为不敏感。例如在声音的整个频率谱中,如果某一个频率段的声音比较强,则人就对其它频率段的声音不敏感了。 卷积神经网络(Convolutional Neural Network,CNN): 卷积神经网络是一种深度学习网络,主要用于识别图像和对其进行分类,以及识别图像中的对象。在卷积神经网络 (CNN )出现之前,人们通常使用耗时的人工特征抽取方法来识别图像中的对象。现在,卷积神经网络提供更加可扩展的方法来执行图像分类和对象识别任务:卷积神经网络利用线性代数原理(特别是矩阵乘法)来识别图像内的图案。卷积神经网络从其他神经网络中脱颖而出的地方在于:卷积神经网络在图像、语音或音频信号输入方面表现出超高的性能。 【监制】 杜秀 【后期】 AMEI 【Shownotes】 杜秀 【BGM】 The future is now——Suno & 杜秀 Lazy Art - Martin Landstrom Bubble Bee - The Fly Guy Five Silicon Pulse —— Udio & 杜秀 【在这里找到我们】 公众号:硅谷101 收听渠道:苹果|小宇宙|喜马拉雅|蜻蜓FM|网易云音乐|QQ音乐|荔枝播客 海外用户:Apple Podcast|Spotify|TuneIn|Youtube|Amazon Music 联系我们:[email protected] Special Guests: Roger Chen and 冯建鹏.

68分钟
14k+
1年前

E146|对话李稻葵:Tiktok危机与跳动的博弈

历经 4 年,美国再次对 TikTok 发难,要求 TikTok 从字节跳动剥离出售,否则就在美国禁用TikTok。一家价值 1500亿美元的公司, 1.7 亿美国用户, 6 个月的时间留给 TikTok 是一条非常艰难的路。 我们的节目录制于2024年3月31日,仅录制完后的一周,Tiktok事件还在持续发酵,比如中美两国最高领导人进行了电话交谈,其中也包括了Tiktok所有权问题;复活节归来之后,美国参议院开始将Tiktok事件提上议程。不管是Tiktok的支持者还是反对者,双方都加大了宣传力度。 这一期我们邀请到了著名经济学家、清华大学中国经济思想与实践研究院院长李稻葵,聚焦TikTok事件发展的下一步法律流程与艰难博弈。 【VSP投资训练营报名】 如果大家对VSP投资训练营感兴趣,更多信息可以在这里找到,报名链接在这里。如果大家有任何问题,可以发邮件到[email protected] 咨询详情。本项目每个季度开营一次,报名链接长期有效。 【主播】 泓君Jane,硅谷101创始人,播客主理人 【嘉宾】 李稻葵,清华大学中国经济思想与实践研究院院长,著名经济学家 【你将听到】 00:03 VSP投资训练营 01:48 正片 03:40 TikTok事件的来龙去脉:四年后以一种更周密的方式进行 06:45 参议院投票通过流程:委员会讨论、全体议员辩论和投票,每个环节都可能会被延长 09:47 参议院组成分析:制衡之道,“大佬们”更加谨慎 13:01 美国参议院多数党领袖Chuck Schumer的三重压力:犹太团体、竞选资金来源与选民的压力 16:34 Tiktok的应对策略:国会游说、周受资听证会、德克萨斯计划 20:12 美国对Tiktok发难的真实目的:争夺舆论控制权? 22:03 “国家安全”的帽子背后:问题简单化,越简单约有传播力 27:32 中国的担忧:反向安全问题与敏感的算法 29:02 卖与不卖?先把全部法律流程走完 31:19 潜在买家分析:微软、苹果、英伟达、沃尔玛、甲骨文、美国前财政部长姆努钦 36:42 最高法的考量:为何牵扯1.7亿用户但受理概率不大? 38:33 特朗普态度的转变——实用主义 40:02 Tiktok的打法:拖,时间是Tiktok的朋友 41:11 Facebook曾在大选中引发重大争议,但Tiktok尚未出现负面事件 42:19 间接参考案例:英国石油公司漏油、大众汽车尾气门与肢解阿尔斯通 43:36 企业与政府打交道:不能上头、透明真诚、民众沟通 46:03 未来走势:重大国际政治事件 【相关信息拓展】 TikTok德克萨斯计划 将美国用户的数据存储在德克萨斯州的美国甲骨文公司以确保安全。该计划的总体目标是通过加强平台的数据保护系统以及权限管控措施,来帮助 TikTok 与用户和利益相关者之间建立信任关系。与此同时,该计划还会帮助 TikTok 与美国政府就保护用户数据和国家安全机密达成一致。 《美国陷阱》 2013年4月,法国阿尔斯通集团锅炉部全球负责人弗雷德里克·皮耶鲁齐被美国联邦调查局抓捕。美国司法部指控皮耶鲁齐涉嫌商业贿赂,并对阿尔斯通处以超7亿美元罚款。这项指控不仅仅是针对皮耶鲁齐个人的行为,也是美国针对法国企业的系列行动之一。2018年9月,皮耶鲁齐重获自由,随后出版《美国陷阱》一书,以亲身经历披露美国利用《反海外腐败法》打击国际竞争对手的内幕,凸显了法国人所理解的美国司法的长臂原则,选择性执法,以及司法背后可能代表的商业利益裹挟。 【后期】 AMEI 【BGM】 Cold and Blue - Roy Edwin Williams The Deal - Ruiqi Zhao Reviving - Megan Wofford 【在这里找到我们】 公众号:硅谷101 收听渠道:苹果|小宇宙|喜马拉雅|蜻蜓FM|网易云音乐|QQ音乐|荔枝播客 海外用户:Apple Podcast|Spotify|TuneIn|Youtube|Amazon Music 联系我们:[email protected] Special Guest: 李稻葵.

47分钟
52k+
1年前

E145 | 对话Meta田渊栋:被Transformer改变的世界与人类AGI的野心

2017年,谷歌一篇划时代的论文《Attention is all you need》掀开这一轮人工智能的开幕式,这篇论文就是大名鼎鼎的Transformer。7年过去了,我们看到在这篇论文的基础上加入算力、算法开启了AI时代的第三次科技浪潮。 今天我们的嘉宾是来自Meta Fair的研究员田渊栋博士,他最近也发表了两片论文都在都与端侧小模型相关,一片论文是《 MobileLLM: Optimizing Sub-billion Parameter Language Models for On-Device Use Cases》中开始卷 10 亿以下参数小模型,主打在移动设备上运行 LLM;另一片论文是《GaLore: Memory-Efficient LLM Training by Gradient Low-Rank Projection》,由于离应用更近在解决更实际的问题,他的论文被业界很多人问到,而过去五年,他所有的研究都在回答一个问题:神经网络是如何工作的? 今天我们就一起来解读田渊栋最近的两篇论文,也一起聊聊最近大火的Sora、Transformer与AGI。 【老罗直播预告】 北京时间3月31号晚上七点,罗永浩会在直播间卖云产品。之前老罗也带火过很多概念,这次我们来看一看,老罗能不能引领一场企业级IT认知的运动,把云计算这个概念推向大众。他这次的选品涵盖阿里云众多的热门产品,价格也给出了史无前例的优惠,大家感兴趣去淘宝app搜索「罗永浩」,让我们一起围观连续创业者罗永浩卖云产品,以及他如何解决创业者的核心痛点的,直播链接:https://m.tb.cn/h.5BYaoxh 【主播】 泓君,硅谷101创始人,播客主理人 【嘉宾】 田渊栋,Meta人工智能研究院(FAIR)研究员及高级经理 田渊栋博士,Meta AI人工智能研究院(FAIR)研究员及高级经理,2018年围棋开源项目(ELF OpenGo)研究及工程负责人和第一作者。曾获2021年国际机器学习大会(ICML)杰出论文奖提名(Outstanding Paper Honorable Mentions)及2013年国际计算机视觉大会(ICCV)马尔奖提名(Marr Prize Honorable Mentions)。研究方向为深度强化学习,表示学习和优化,历任机器学习国际会议ICML,NeurIPS,AAAI, AIStats领域主席。2013-2014年在Google无人驾驶团队任软件工程师。 【你将听到】 00:05 3月31号晚七点罗永浩直播间卖云 01:34 正片 【“斜杠”AI研究专家】 02:55 从自动驾驶、围棋开源项目到神经网络研究 05:52 写科幻小说:不靠谱的想法放进小说,靠谱的想法用来做科研 07:24 理解神经网络如何工作or 研究大模型,2019年为何拒绝Ilya Sutskever加入OpenAI的邀请 08:44 最新两篇论文的艰难诞生:曾被两次拒稿,三四年后才看到结果 【GaLore和MobileLLM】 11:04 GaLore的主要特点:实现在英伟达RTX 4090上进行模型的从头训练 12:56 算法上改进让4090重获新生,省内存的同时获得高性能 16:56 MobileLLM:降低神经网络参数仍然保持好的效果 【实现AGI的路径】 17:40 Scaling Law带来的增长会越来越小,我们并没有完全理解为什么Transfomer的效果更好 19:17 完全无人驾驶难点:人工干预的频率越低,有效训练数据就越少 23:41 Transformer很难做游戏式的推理:通过理解神经网络的工作原理来改进现有算法 【深度理解Transformer】 24:52 谷歌内部发现算力价格比通信便宜,所以想到要设计一个模型让算力获得更大优势 26:21 Transfomer vs CNN:没有预设立场,并行效果更好 26:44 Transformer的缺点:需要大量算力、速度较慢、延迟高 28:01 强化学习的根本性问题:Exploration(探索)和Exploitation(开采) 【Sora、合成数据与Anthropic】 30:03 Sora的最让人惊艳的地方是所生成的内容一致性非常好,在技术上有根本的创新 33:07 世界模型并不“高大上”,对未来有看法和预测都可以成为称为“世界模型” 40:46 用合成数据训练大模型是趋势,其与真实数据之间的边界会越来越模糊 43:00 合成数据相当于用算力来换数据,但缺乏人类参与的数据会导致学习瓶颈 44:30 Anthropic的长文理解和分析能力远强过GPT-4,但推理能力难以分高下 46:30 大模型缺乏竞争的话,也会出现“偷懒”的问题 48:06 一家独大 or 威慑平衡,Meta开源打破的行业格局 48:18 大模型侵蚀Google的核心业务,训练和推理很难发论文 50:20 从玄幻小说到科幻小说:记录人与人之间的关系和思维的火花 【相关信息拓展】 ELF OpenGo:由Facebook AI Research团队(FAIR)在2018年开源发布的AI围棋项目。其特点是不使用人类棋谱与累积的围棋知识,仅实做围棋规则,使用单一人工神经网络从自我对弈中学习。《ELF OpenGo: An Analysis and Open Reimplementation of AlphaZero》 MobileLLM论文:《 MobileLLM: Optimizing Sub-billion Parameter Language Models for On-Device Use Cases》 GaLore论文:《GaLore: Memory-Efficient LLM Training by Gradient Low-Rank Projection》 田渊栋之前自动驾驶的技术分析帖子 玄幻&科幻作品集 【后期】 AMEI 【BGM】 Interruption - Craft Case Stillness Within - Roots and Recognition 【在这里找到我们】 公众号:硅谷101 收听渠道:苹果|小宇宙|喜马拉雅|蜻蜓FM|网易云音乐|QQ音乐|荔枝播客 海外用户:Apple Podcast|Spotify|TuneIn|Youtube|Amazon Music 联系我们:[email protected]

54分钟
22k+
1年前

E144|与徐梧聊聊Vision Pro:十倍于移动互联网的机会爆发?

为什么空间计算带来了十倍于移动互联网的机会?今天我们邀请到了XR领域的天使投资人徐梧来讲一讲他的观点,徐梧曾经投资了VR游戏《Contractors》、《Battle talent》等。同时,在过去的一个半月的时间里,徐梧每天都会花3-5个小时在VisionPro这款设备上。今天我们会聊一聊他的使用体验与他对XR的深度思考。 本期节目参与 Tech PodFest 和 Let's visionOS 开发者大会合作的 「XR系列专题」。如果硅谷101的听众对Let‘s Vision OS的大会感兴趣,欢迎给我们留言,我们将送出一张免费门票。 【主播】 泓君,硅谷101创始人,播客主理人 【嘉宾】 徐梧,XR天使投资人,猫眼电影创始人,真格基金投资合伙人 【你将听到】 00:40 观点:空间计算时代,将是移动互联网十倍的机会 02:05 Vision Pro两次不同体验:从Vision实验室到家庭使用,更好的显示体验 05:39 从垂直设备到通用设备:每天3-5个小时,但是并不知道在Vision Pro上做了什么 07:40 为更大的屏幕付出溢价:大量平面应用空间升级之后的新体验 12:30 VisionOS的空间操作系统,人机交互的三维革命性创新 14:30 更加注重效率还是拟真?苹果对空间的三层定义 16:59 Puzzling Places拼图游戏,为何在Quest放弃使用但在 Vision Pro上拼完了? 18:14 同是VR会议软件的本质区别: Horizon workrooms vs Persona 21:19 民间智慧如何让Vision Pro减重:移除面罩、使用3D打印配件、人体工程学 24:51 手势交互:当使用手势交互之后很难再退回手柄 28:06 核心吐槽:贵、重、没有内容 28:47 空间应用部门正在快速增长,Vision Pro应用一个月从600快速增长到1200个 36:05 恐龙Demo里的开发机会:能够与现实交互的全新的设计范式 38:05 Vision Pro变成大众设备的六大临界点:三维交互、显示、操作系统、MR、重量、算力 44:17 一个大胆的预测:三年后Vision Pro应用大爆发,创业的傻瓜窗口期消失 50:32 谷歌Meta抱团,苹果与其他硅谷大厂的相爱相杀 53:50 创始人的坚持与远见:内心深处有坚持,看明白了就去做 55:55 投资方法论:投资优秀的产品经理,放下ego关注变量 59:58 行业内认知最厉害的人:苹果、Meta、以及John Carmark、Michael Abrash、前十大排行榜开发者 【后期】 AMEI 【BGM】 Polarity - Sum Wave Chasing Horizons - Victor Lundberg 【在这里找到我们】 公众号:硅谷101 收听渠道:苹果|小宇宙|喜马拉雅|蜻蜓FM|网易云音乐|QQ音乐|荔枝播客 海外用户:Apple Podcast|Spotify|TuneIn|Youtube|Amazon Music 联系我们:[email protected]

66分钟
23k+
1年前

E143|亲历者讲述:神秘的长寿乌托邦与疯狂的生物极客运动

从古至今,人类对长生不老的追求似乎从未停歇。随着近年来生物技术的进步,越来越多对于逆转衰老和永生的实践与思考开始出现在我们的真实生活中。今天,我们就来聊这样一个神秘而充满着吸引力的话题。 最近,有一群想法和理念非常超前的生物极客们,他们在世界上谋杀率最高的国家洪都拉斯“盘”下了一个岛,并在上面打造了一个“长寿快闪城市“Vitalia,宣称要将“死亡变成一种选择”,共同探究如何实现人类长寿永生的秘密。大量知名生物保健领域的企业家、投资者、学者都慕名前往Vitalia,其中也包括了以“换血疗法”闻名世界的硅谷富豪Bryan Johnson。 此次,我们也邀请到了两位刚从Vitalia活动结束回来的参与者Boyang和Shina,他们不仅在Vitalia上见到了很多神奇有趣的人和项目,甚至博洋还作为第一位亚洲人亲自接受了一种新型基因疗法。 那么,Vitalia到底是一个什么样的存在,为什么它会坐落在洪都拉斯?在这个世界第一座“长寿快闪城市”中,人们过着什么样的生活?关于逆转衰老的技术人类目前进展到哪一步了,又面临着哪些技术、伦理和哲学争议?下面,就让我们跟随着两位亲历者的见闻,一起深入到Vitalia里去一探究竟。 本期内容不构成任何营养与医疗建议,嘉宾提到的诸多做法也缺乏实验数据,请大家不要盲目效仿。 【主播】 泓君,硅谷101创始人,播客主理人 【嘉宾】 Boyang,Project Twelve 的创始人,首位接受MiniCircle基因疗法亚洲人 Shina, 艺术爱好者、设计师,清华区块链协会和College DAO核心成员 【你将听到】 【神秘城市】 03:36 Vitalia:一个以长寿和生物科技为主题的Pop-up City,信条是“让死亡变得有选择” 04:56 洪都拉斯划定了一块名为Prospera的特区,拥有更灵活的监管和更创新的法律 【转基因人、克隆人与生物极客】 06:07 转基因人:接受Follistatin创新基因疗法的亚洲人,给身体进行“升级” 10:22 Follistatin基因疗法:用Plasmid把新的基因加到人的身体里 11:32 美国监管体系遇阻,Minicircle的双国运营方式 13:54 基因疗法带火医疗旅游,目前大约有300个人到洪都拉斯接受该疗法 14:53 Plasmid技术的争议:伦理性争议占60-70%,安全性争议占30-40% 16:58 通过控制基因让“克隆”的老鼠其它方面正常生长,但大脑不发育 17:56 克隆人的作用是让人在受了严重伤害或者衰老之后,把大脑移植到年轻的身体里 22:20 一些Biohacker(生物极客)会在自己身体里做各种实验,比如将磁铁缝入手内 24:13 延缓衰老的方法主要是通过对身体指标严格监控,其中血糖和饮食结构最为重要 28:35 不同的饮食路径:一些人主张餐食要以素食为主,一些人只吃肉 【抗衰届网红Bryan Johnson】 32:40 Bryan Johnson用换血疗法和严格饮食让自己延缓衰老,但极端做法受到争议 35:38 有信仰、偏执的创业者才能生存 36:18 一场人工制造出来的帅:Bryan Johnson像下一代人类,陶瓷娃娃一般的肌肉 39:21 Bryan Johnson的宗旨是把抗衰运动作为一种信仰,从富人阶级开始再逐渐普及化 【投资项目】 41:52 替换身体、重新生长大脑、基因生发,疯狂的抗衰项目并不容易融资 45:28 FDA固有运行机制反而让医药领域创新昂贵、官僚、缓慢? 47:26 那些来到Vitalia的学术圈名人 【关于永生的哲学思考】 50:35 长寿研究的哲学思考:治愈疾病、减少医疗支出、推动生产力、提高文明发展上限等 53:38 长寿技术目前面对跟AGI类似的争议,安全、伦理层面并没有得到充分验证 56:55 当人真的获得了永生的权利、死亡变成一项选择的时候,价值的定义将变得困难 60:50 Vitalia像一个三层金字塔:底层是社区,中层是研讨会,上层是孵化器 63:19 众多硅谷大佬参与的MiniCircle投资与学术圈质疑 【相关信息拓展】 * Bryan Johnson:现年45周岁,是美国企业家、风险投资家,写作者。他是Kernel(一家可以监测和记录大脑活动的公司)和OS Fund(一家投资于早期科学和技术公司的风险投资公司)的创始人和CEO,他在2021年10月13日宣布了个性化的长寿蓝图(Blue Print)计划,形成了一套衣食住行搭配指标监测的成体系方法论,旨在最大限度地扭转每个器官的生物年龄。 * 卵泡抑素(Follistatin,FST):是近年发现的一类有广泛组织分布的抑制素相关肽,为单链糖蛋白,具有与抑制素相似的抑制垂体分泌促滤泡激素的功能。能够减少炎症、增加肌肉质量和提高骨密度 * Mini circle公司:成立于2019年,Minicircle 开发了一个人类基因增强商业化平台,旨在促进生命延长能力。Mini circle公司纪录片《Gene Therapy Trial Medical Tourism in Honduras's Semi Autonomous Zone》 * 《Network State》(《网络国家》):Coinbase的前CTO Balaji Srinivasan所著,中文版 * Vitalia的两位创始人: Laurance Iron:Vitadao 的核心成员。Vitadao 专门在去中心化的生态中投关于生命科学和长生永生一类的医学项目 Niklas ANzinger:Infinita 基金创始人 * 《麻省理工科技评论》关于Minicircle的报道 【后期】 Amei 【BGM】 BGM:Devils On The Doorstep 1 - Fredrik Ekstrom Sumerian Paradise - Dew Of Light 【Shownotes】 Daisy 【在这里找到我们】 公众号:硅谷101 收听渠道:苹果|小宇宙|喜马拉雅|蜻蜓FM|网易云音乐|QQ音乐|荔枝播客 海外用户:Apple Podcast|Spotify|TuneIn|Youtube|Amazon Music 联系我们:[email protected]

66分钟
18k+
1年前

E142|投资人视角下的脑机接口与不可忽视的xAI

在不久前的一期节目中,我们从技术的角度解读了脑机接口的最新进展,聊了聊Nurualink的首次人脑芯片植入以及能够帮助盲人恢复光明的视网膜脑机接口技术。本期节目,让我们换一个角度,用更加商业化的眼光来审视脑机接口的技术应用现状与行业投资前景。 脑机接口的技术研究由来已久,但关于脑机接口的商业化探索从最近10年来才开始逐渐火热起来。市场在早期经历了“非侵入式”还是“侵入式”的路线之争后,最近几年开始逐步向侵入式统一,并出现了类似于Neuralink这样的头部公司。那么,在Neuralink之前,还有哪些公司做过脑机接口的商业化探索?Nerualink的核心优势在哪里?人工智能与脑机接口之间又存在什么样的密切关系? 此次,我们邀请到了硅谷知名投资人、Fusion Fund的创始合伙人张璐,来揭秘其对脑机接口的早期投资经历和战略洞察。 如果你想和硅谷的AI顶尖专家们有更多面对面的交流机会,欢迎参加5月29-31号在旧金山举行的GenAI Summit SF大会。OpenAI旗下的视频生成模型Sora团队核心成员,马斯克的xAI团队创始成员、还有包括OpenAI、Mistral AI、微软、英伟达、谷歌DeepMind、Meta AI、Perplexity、Character.ai的核心成员和研究科学家,也将现场分享他们的前沿发现和见解。 可以访问genaisummit.ai ,或者在这里点击购票。我们也会硅谷101的听友们准备了一些小福利:使用优惠码SV10150购买大会三日门票,可以享受50美元购票优惠;单日门票也可使用优惠码 SV10120购票,享受20美元购票优惠。 【主播】 泓君,硅谷101创始人,播客主理人 【嘉宾】 张璐,Fusion Fund 创始主管合伙人 【你将听到】 00:03 GenAI大会报名链接 01:29 正片 【脑机接口的商业路线变迁】 02:28 2015年左右开始布局投资脑机接口领域,投资纳米医疗机器人公司Paradromics 03:29 早期脑机接口的路线之争:从非侵入式到侵入式 04:25 非侵入式的信号收集能力有限、持续性不强,路线18-19年向侵入式统一 06:30 Paradromics的早期猪实验数据要比Neuralink更好,马斯克曾经尝试收购该公司 【脑机接口的细分领域】 07:20 脑机接口材料:纳米纤维起家 09:58 验证设备封装的安全性,临床实验长达10-20年时间 12:47 投资与应用周期长,激进做法可能会拖垮行业 14:45 脑机接口的核心环节:CMOS信号翻译、芯片、信息接收处理系统 【Neuralink的优势与技术创新】 18:07 Neuralink的核心优势是有充足的资金,能够支持招募优秀人才和进行不同路线尝试 20:15 Paradromics聚焦在医疗叙事,但Neuralink有更多应用测试 【脑机接口与AI】 24:40 脑部数据的收集对于研究大脑运作和训练人工智能都具有重要意义 26:14 人类潜意识的运算能力是意识的几十万倍,但人类对于这部分的认知还很浅 27:50 人脑是效能最高、能耗最低的超级计算机器,医疗和AI的投资息息相关 30:30 当Twitter、特斯拉、Nerualink都成为xAI的数据,200亿美元的估值值不值? 33:42 脑机接口对产业带来的影响比想象的更大,但大规模落地应用仍然需要较长时间 34:55 招聘进展更新 【名词解释】 Paradromics公司 成立于2015年,是一家美国脑机接口技术研发商,公司正在开发的脑机接口技术,旨在让失明、失聪、失语以及瘫痪等全球近6亿严重连通性障碍患者与外界重新建立连接。 CMOS芯片 是一种低功耗、低噪声的集成电路技术,常见于数字电路和微处理器等电子设备中。CMOS芯片具有功耗低、噪声小、稳定性好等优点,由于CMOS功耗非常低,因此可以轻松实现便携移动的设计。 【后期】 Amei 【BGM】 Seashore - Adriel Fair Anticipating a New Day - Stationary Sign Oleka - Franz Gordon 【在这里找到我们】 公众号:硅谷101 收听渠道:苹果|小宇宙|喜马拉雅|蜻蜓FM|网易云音乐|QQ音乐|荔枝播客 海外用户:Apple Podcast|Spotify|TuneIn|Youtube|Amazon Music 联系我们:[email protected]

36分钟
15k+
1年前

E141|我们用了10款AI工具,最后又回到了版权库

在我们录制的当天,恰逢OpenAI发布其视频生成产品Sora。本期节目,我们将结合硅谷101播客与视频的日常工作流,来聊一聊那些在我们工作中会用到的各类AI工具,为何Sora会让人觉得惊艳? 我们试用了Runway、PikaLabs、Gemini、Midjourney、Adobe Premiere、Eleven Labs、OpenVoice、Music FX、ChatGPT、Claude.ai等至少十款产品,但最后的核心结论是,相比于现阶段的生成式AI产品,我们更愿意用版权库素材。具体发生了什么,来听一听我们的讨论吧。 当然,本期节目也只是我们自己在工作中的一些感受。如果大家还有哪些好玩的工具或者用法,欢迎在评论区跟我们留言。 《硅谷101》正在招聘播客监制、视频创意策划总监、视频后期以及运营,欢迎感兴趣的小伙伴来给我们投放简历,详细情况请在硅谷101公众号上查看。 【主播】 泓君,硅谷101创始人,播客主理人 【嘉宾】 陈茜,硅谷101联合创始人,视频主理人 Jacob,硅谷101视频后期 Junwu Zhang,硅谷101研究员 【你将听到】 视频生成 03:06 比较Sora、Pika Labs、Runway的视频生成效果:时间越长一致性越差 08:14 Sora解析:东京街头背景保持高度一致有多难? 09:51 硅谷101视频的三类素材:历史素材、图表、动画,AI都很难生成 12:40 仅用语言描述生成视频很难,输入也需要多模态 16:44 AI是创作者还是剪辑师的工具?很难被打败的顶级作品 23:09 算法瓶颈:天马行空式生成反而落入俗套? 平面设计 24:39 为什么说Midjourney还没有颠覆素材库? 26:17 附产品:让人惊艳的AI扩图 声音克隆 30:32 比真人替换效果更好的11Labs:音频替换与复原罗斯福总统的声音 35:06 OpenVoice精准还原普通话音调 37:39 真实录音被当作配音:AI克隆声音界限越来越难区分 AI作曲 39:02 谷歌Music FX作曲 PK 素材库音乐,三曲Demo你更喜欢谁? 45:05 创作者的最大痛点:当音乐长度可以自动调整适配片头 50:17 当小工具遇到大公司:软件学习门槛高,更倾向于做大公司的小插件 内容生成 55:05 ChatGPT如何帮助我们快速查资料:在一本400页的小说中找到代糖的初代焦虑 57:13 溯源ChatGPT的知识性硬伤——令人哭笑不得的关联 59:50 我们的内容制作步骤拆解:ChatGPT并不是一个好的提纲撰写者 68:54 写Shownotes的三个要点,GPT只进化到了第一层 【后期】 Amei 【BGM】 Sushi Master - Sight of Wonders On a Boat to China - Sight of Wonders 【在这里找到我们】 公众号:硅谷101 收听渠道:苹果|小宇宙|喜马拉雅|蜻蜓FM|网易云音乐|QQ音乐|荔枝播客 海外用户:Apple Podcast|Spotify|TuneIn|Youtube|Amazon Music 联系我们:[email protected]

74分钟
26k+
1年前
EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧