对话复旦大学类脑研究院工程师郑忍成: 解析人工智能在医疗中的实践与商业化挑战

大家好,欢迎收听《AI Odyssey》。 最近我们一直在关注AI在生命健康领域的产品,这些产品大体可以分为两个方向:一是面向消费者的健康管理产品(硬件 or App),基于穿戴设备、饮食记录App、运动记录App等收集用户摄入和消耗的数据,并通过AI教练(AI Coach)来提供健康指导;二是面向医疗机构的疾病诊断和辅助导诊的AI软件。前者理解起来相对简单,基于公网的数据进行预训练就能获得一个还不错的 Agent,无论是选择使用API,还是训练自己的小型模型, 整体用户体验上差别不会很大。但在更为专业和细分的医疗领域,无论是在数据获得,算法优化,还是算力部署上,现实场景都更为的复杂,且富有挑战。 因此,本期节目我们特别邀请到了复旦大学类脑研究所的郑忍成工程师,与我们分享AI在医学影像的应用以及在医疗领域的发展趋势。掌声欢迎👏👏。 嘉宾: 郑忍成:复旦大学博士毕业([email protected]),目前任复旦大学类脑智能科学与技术研究院算法工程师。主研方向为人工智能算法及其在医学影像分析中的应用。在《IEEE Transactions on Medical Imaging》,《Science Advances》等学术期刊上发表SCI论文20余篇,并在MICCAI,ISMRM等国际学术会议上发表会议论文和摘要10余篇。参与国家自然科学基金、上海自然科学基金等多个面上项目。 主播: Leo:硅谷大厂高级机器学习工程师,GenAI LLM发烧友 PongPong:连续创业者,AI初创公司产品负责人 Shownote: [00:31] - 嘉宾介绍 [01:22] - 医学影像AI的发展历程 [02:08] - AI在医学影像中的实际应用 [04:14] - AI与传统算法的对比 [05:52] - 医学影像算法的发展历程 [07:24] - 特定器官的AI检测与通用模型的探索 [12:08] - 医疗AI的数据获取与隐私保护 [15:07] - 数据标注的挑战 [16:30] - 医学影像AI的准确性与挑战 [19:20] - 医学影像AI产品三类证与二类证的介绍 [23:27] - AI在低风险领域的应用与商业化 [27:34] - 医疗AI的商业化路径 [30:06] - 医院联盟与数据共享 [36:58] - 医学影像AI的未来趋势 以上就是本期的全部内容啦,感谢您的收听,我们下期再见~ 欢迎大家在同名 小🍠:AI Odyssey 和 👸号:AI Odyssey 关注我们,我们将持续给大家带来更多精彩内容,敬请期待。

39分钟
99+
6个月前

对话MindOS联创Kisson:AI-Native操作系统与AI Agent的设计构想

主播的话: 认识Kisson是通过她的一篇复盘文章《创业两年,被风口拍得酸爽》,她在文章中详细记录了创业以来的各种经历和思考,这让我对她和MindOS的发展产生了浓厚的兴趣。22年是新一轮AI创业潮的一个关键时间节点,Kisson的公司MindOS在这一年成功融资,站在了起跑线的领先位置。两年多的时间过去了,这家公司经历了哪些变化呢?今天我们邀请Kisson来分享她的创业故事和对AI未来的看法,期待她的精彩分享。 嘉宾: Kisson 林宋琪,Mindverse AI (MindOS.com) 联创及COO,前TikTok商业化战略总监,前Facebook集团战略经理。关注AI agent和记忆模型。公众号:Kisson不聊广告改煲鸡汤了。推特:@KissonL 主持人: Leo 硅谷大厂高级机器学习工程师,GenAI LLM发烧友 PongPong 连续创业者,AI初创公司产品负责人 产品介绍: MindOS:一款面向海外2B的AI Agent创建引擎,商家可以创建客服机器人部署到网站上提升转化率。心识宇宙 (Mindverse)自研的大型个性化模型(LPM)解决了传统AI缺乏个性化、隐私问题和数据偏见等痛点,以及通过模型长期记忆的优势让AI可以通过自然语言持续学习,越聊越懂用户,为商家的客户提供完全个性化的体验。 * 官网:www.mindos.com Mebot:一款学习和记住用户想法和偏好的生产力工具 * 官网:www.mindos.com Shownotes: 00:44 - 嘉宾自我介绍 08:45 - 探讨AI-native操作交互系统,现有技术的局限和未来的潜在进展 09:58 - 分享从开发自有模型转向利用GPT API,MindOS 如何找到自己的定位 12:23 - 讨论个人AI助手在信息整合和管理中的角色,长期记忆和个性化模型的重要性 18:38 - 分享 Mebot 如何利用长期记忆提供更个性化的体验 19:29 - 讨论解决有效捕捉和情境化用户信息的挑战,分享了 AI+硬件更简便输入的潜在解决方案 24:44 - 讨论如何提高 Long-term memory (LTM) 在推理时的准确性 27:46 - 介绍了MindOS 团队对 on-device 模型和构建数据抽象理解层的规划 29:22 - 探讨小而美的AI初创公司的优势 35:05 - 讨论AI产品找到PMF的挑战,以及理解市场需求的重要性 40:46 - 介绍 MindOS 的商业模式 43:35 - 分享 MindOS 在迭代过程中对ToB 和ToC市场的需求分析和运营策略 48:30 - 探讨关于AI Agent的挑战和机遇 感谢收听,我们下期再见~

52分钟
1k+
9个月前

对话整数智能联创和前IDEA研究员:构建高质量数据集与智能数据工程平台

端午快乐~ 很开心,这期又可以和大家聊聊硬核的 GenAI 技术内容。最近和 AI 创业者们交流最多的话题就是 AI 数据。因此,本期节目我们特别邀请了两位在 AI 数据领域颇有建树的嘉宾:杨子敖,Brandeis CS PhD Candidate;刘明皓,整数智能信息技术(杭州)有限责任公司的算法负责人。一起聊了一下他们多年来在这方面积累的经验和认知,深入讨论了如何为大模型训练和推理构建高质量的数据集,以及如何搭建智能数据工程平台。 如果你对数据处理感兴趣,或者是一位充满好奇心的 AI 从业人员,我们希望通过这期节目为你带来关于 AI 和数据的新看法和启发。欢迎收听~ 嘉宾介绍: 杨子敖 Brandeis CS PhD Candidate,曾在奇绩创坛和IDEA研究院工作过。目前的研究兴趣是Data centric ML,特别是基于influence function和Shapley value的Data Valuation。 刘明皓,整数智能信息技术(杭州)有限责任公司算法负责人。中国人工智能产业发展联盟2022年突出贡献个人,《人工智能研发运营一体化(Model/MLOps)能力成熟度模型》核心参编专家,MAP-NEO Core Contributor。 主播介绍: Leo Zhao: 硅谷大厂高级机器学习工程师,GenAI LLM发烧友 Shownotes 00:30 - 嘉宾自我介绍 02:27 - 讨论 OpenAI 发布的 Scaling Laws 对模型性能的影响 02:59 - 探讨评估模型性能的主要指标和方法 03:48 - 模型性能衡量标准,介绍学术界常用的 Benchmark 和其他评估方法 04:49 - 分享如何评估知识型模型的效果 05:35 - 不同的 Scaling Laws 数据量的建议 07:05 - 介绍高质量数据的定义及其处理方法 08:57 - 讨论数据清洗过程中质量与多样性的平衡 09:58 - 解释数据质量如何具体影响模型训练效果 12:00 - 讨论如何评价模型的响应质量。 13:48 - 探讨处理具体应用场景数据的方法和建议 16:09 - 解释行业特定数据和 Prompt Engineering 的重要性 18:20 - 讨论在敏感领域处理数据时的隐私问题 21:22 - 介绍合成数据在模型训练中的应用和效果 23:14 -讲述如何在不同产业中扩展数据处理管道 26:48 - 解释保持数据集新鲜和相关性的周期更新策略 29:16 - 探讨验证数据集在模型评估中的关键作用 32:28 - 分享长文本数据在训练和验证中的处理方法 36:46 - 介绍自动驾驶数据的收集和处理流程 42:08 - 讨论数据壁垒的未来和数据共享的可能性 参考文献: 构建高质量数据集与智能数据工程平台 https://github.com/multimodal-art-projection/MAP-NEO https://arxiv.org/pdf/2405.19327 2077ai.com 感谢收听,我们下期再见!

47分钟
99+
10个月前

AI快讯:马斯克的 XAI 发布 Grok1.5,微软巧妙收编 Pi 团队,Stability AI 风雨飘摇

欢迎来到 AI Odyssey。以下是AI领域的最新动态,欢迎收听! 本期内容: 00:02 - XAI 公司推出大模型 Grok-1.5,特点是上下文理解和高级推理能力的提升,计划向早期测试人员和 x 平台现有用户提供; 参考内容 01:15 - OpenAI 分享了 Voice Engine 的预览,能够通过输入文本和 15 秒音频样本生成自然语言,目前只在小范围内分享; 参考内容 02:10 - OpenAI 的 GPT 4 似乎不再有严格的使用上限,官方提示“Usage limits may apply”; 03:44 - Sam Altman 在 Lex Fridman 的播客中谈论了 OpenAI 的内部风波、对 Musk 的批评看法、Sora 的局限性和 GPT 4 的不足; 播客地址 机器之心翻译版 05:24 - Business Insider 报道一些投资者对 Sam Altman 的不满; 原文地址 06:09 - 微软 CEO Nadella 就科技、企业文化、个人成长和未来趋势的讨论; 视频地址 07:46 - 微软向Inflection支付6.5亿美元以获得专利使用与人才团队; 新闻来源 09:09 - Stability AI 的 CEO 突然宣布辞职; 官方公告 10:22 - Anthropic 公司开发的 AI 语音和音乐生成工具Suno 介绍; Suno 官网 11:43 - 百度将为苹果今年发布的 iOS 和 Mac OS 提供 AI 功能; 12:17 - GTC2024 黄仁勋 和 Transformer 架构的八位提出者的对话; 极客中国原文 12:32 - 吴恩达教授在 deeplearning 最新课程:优化 LLM 推理系统; 课程地址 12:50- YC W24 AI Starup 项目分布; Google sheet 地址 13:22 - 创业邦发布的 2023 年 AIGC 产业投资报告; 文章地址 13:32 -Trustless Labs 发布的 AI + Crypto 项目介绍; 报告地址 以上就是本期节目的所有资讯,感谢您的收听,我们下期再见。

13分钟
99+
1年前

揭秘AI文生图【下】文生图模型最前沿研究——结构原理、推理加速和评估

大家好。欢迎来到 AI Odyssey。本期播客我们有幸邀请到了文生图领域内的两位专家:林之秋和李嘉琛。两位嘉宾和主播深入探讨了文生图模型的最前沿研究,涵盖了模型的结构原理、推理加速以及评估方法。此外嘉宾还分享了模型架构的细节和优化技巧,以及模型评估的挑战和解决方案。本期内容丰富,为大家提供了一次深入了解文生图模型的机会,相信本期播客能带给大家新的启发和思考。欢迎收听,期待和大家一起探索AI的奥秘。 嘉宾介绍: 林之秋:CMU机器人研究所四年级博士,关注vision-language model以及generative AI。Twitter: @ZhiqiuLin Jiachen Li (李嘉琛, 推特:@JiachenLi11) :加州大学圣塔芭芭拉分校 (UCSB)三年级PhD,主攻文生图模型,机器人控制,多模态学习。Jiachen带队参加了Amazon SimBot Challenge,获得了第二名以及10w美元的奖金。 本期主播: Leo Zhao: 硅谷大厂高级机器学习工程师,GenAI LLM发烧友 Shownotes: 00:34 嘉宾自我介绍 02:08 讨论文生图模型的分类:闭源模型和开源模型,以及它们的特点和区别 03:52 探讨闭源模型和开源模型在数据质量和模型架构上的差异 06:06 分析 Diffusion Model (扩散模型)的原理,包括其与 GAN(生成对抗网络)的比较和优化 09:33 解释 Stable Diffusion 模型的特点,包括在潜在空间的生成和文本条件的引入 11:44 详细介绍 Diffusion Process 的理论基础,包括随机微分方程和逆过程的概念 16:00 讨论LCM(一致性模型)在降低推理步骤和保持生成质量方面的作用 20:42 探讨生成模型的评估指标,包括对齐度、质量、人工评估和自动化指标的重要性 27:02 分析现有自动化指标的局限性,包括 CLIP Score 的问题和改进方向 33:29 探索奖励建模在引导生成模型方面的应用和挑战 38:47 讨论不同奖励模型策略对生成模型的影响及训练的挑战 44:06 探讨用于评估和改进生成模型的新方法,包括弱模型指导强模型的潜力 49:44 讨论提高生成模型文本理解能力的重要性及其在专业应用中的潜在应用 54:29 探索用于生成模型评估的新基准和方法,重点关注文本对齐 59:36 讨论合成数据在生成模型训练中的应用及潜在优势 感谢收听,我们下期再会~

61分钟
99+
1年前

揭秘AI文生图【上】文生图应用startup从0到1

欢迎收听本期 AI Odyssey,本期我们有幸邀请到了HuHu AI CEO 刘天强,一位经验丰富的连续创业者。在这期节目中,嘉宾不仅分享了他在 AI 领域的创业历程,还深入讨论了关于 AI 产品设计、用户增长策略、以及如何在竞争激烈的市场中找到立足点。无论你是 AI 领域的专业人士,还是对文生图应用充满好奇的听众,这期节目都将为你提供独到的见解和启发。欢迎收听,与我们一起探索 AI 文生图的奥秘! 嘉宾介绍: 刘天强:HuHu AI CEO,连续创业者。曾经创立Orbeus并被Amazon收购,后成为Amazon Rekognition的创始架构师。在创立Huhu AI前,曾经是智能家居公司Wyze的CTO (Twitter: @Tianqiang_Liu, xhs: @AI创业中的井叔) 主播介绍: Leo Zhao: 硅谷大厂高级机器学习工程师,GenAI LLM发烧友 产品介绍: Chat Designer Chat Designer 是HuHu AI 的第一款 AI 产品。支持从文本生成图片,包括肖像图和产品图。用户通过简单的聊天对话即可进行像素级编辑。支持修图工具进行精确调整,轻松创造个性化图像。 HuHU AI HuHu AI 为各种商业场景提供 AI 设计代理解决方案。 Shownotes * 00:32 嘉宾自我介绍,分享连续创业经历 * 02:10 Chat Designer 的独特之处 * 02:47 讨论选择生成图应用领域的原因和市场定位 * 03:44 探讨 AI 产品设计与传统产品设计的异同 * 05:02 讨论 AI 产品的不确定性和评估标准 * 06:35 分析 AI 产品的市场定位和宣传策略 * 07:30 讨论 AI 模型的不确定性 * 08:02 讨论关于加强AI生成图的控制 * 09:29 Chat Designer 的目标用户群和市场策略 * 10:54 用户增长的核心要素和流量获取 * 13:55 讨论 AI 生图应用的艺术风格和质量评估 * 16:22 讨论 AI 生图应用的速度、质量和多样性之间的平衡 * 21:02 分享产品定价策略和收费标准 * 25:03 分享用户增长策略和口碑效应 * 32:23 预测生图应用未来发展方向和产品重构计划 感谢收听,我们下期再见!

39分钟
99+
1年前
EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧