对话整数智能联创和前IDEA研究员:构建高质量数据集与智能数据工程平台

AI Odyssey

端午快乐~ 很开心,这期又可以和大家聊聊硬核的 GenAI 技术内容。最近和 AI 创业者们交流最多的话题就是 AI 数据。因此,本期节目我们特别邀请了两位在 AI 数据领域颇有建树的嘉宾:杨子敖,Brandeis CS PhD Candidate;刘明皓,整数智能信息技术(杭州)有限责任公司的算法负责人。一起聊了一下他们多年来在这方面积累的经验和认知,深入讨论了如何为大模型训练和推理构建高质量的数据集,以及如何搭建智能数据工程平台。 如果你对数据处理感兴趣,或者是一位充满好奇心的 AI 从业人员,我们希望通过这期节目为你带来关于 AI 和数据的新看法和启发。欢迎收听~ 嘉宾介绍: 杨子敖 Brandeis CS PhD Candidate,曾在奇绩创坛和IDEA研究院工作过。目前的研究兴趣是Data centric ML,特别是基于influence function和Shapley value的Data Valuation。 刘明皓,整数智能信息技术(杭州)有限责任公司算法负责人。中国人工智能产业发展联盟2022年突出贡献个人,《人工智能研发运营一体化(Model/MLOps)能力成熟度模型》核心参编专家,MAP-NEO Core Contributor。 主播介绍: Leo Zhao: 硅谷大厂高级机器学习工程师,GenAI LLM发烧友 Shownotes 00:30 - 嘉宾自我介绍 02:27 - 讨论 OpenAI 发布的 Scaling Laws 对模型性能的影响 02:59 - 探讨评估模型性能的主要指标和方法 03:48 - 模型性能衡量标准,介绍学术界常用的 Benchmark 和其他评估方法 04:49 - 分享如何评估知识型模型的效果 05:35 - 不同的 Scaling Laws 数据量的建议 07:05 - 介绍高质量数据的定义及其处理方法 08:57 - 讨论数据清洗过程中质量与多样性的平衡 09:58 - 解释数据质量如何具体影响模型训练效果 12:00 - 讨论如何评价模型的响应质量。 13:48 - 探讨处理具体应用场景数据的方法和建议 16:09 - 解释行业特定数据和 Prompt Engineering 的重要性 18:20 - 讨论在敏感领域处理数据时的隐私问题 21:22 - 介绍合成数据在模型训练中的应用和效果 23:14 -讲述如何在不同产业中扩展数据处理管道 26:48 - 解释保持数据集新鲜和相关性的周期更新策略 29:16 - 探讨验证数据集在模型评估中的关键作用 32:28 - 分享长文本数据在训练和验证中的处理方法 36:46 - 介绍自动驾驶数据的收集和处理流程 42:08 - 讨论数据壁垒的未来和数据共享的可能性 参考文献: 构建高质量数据集与智能数据工程平台 https://github.com/multimodal-art-projection/MAP-NEO https://arxiv.org/pdf/2405.19327 2077ai.com 感谢收听,我们下期再见!

47分钟
99+
1年前

AI快讯:马斯克的 XAI 发布 Grok1.5,微软巧妙收编 Pi 团队,Stability AI 风雨飘摇

AI Odyssey

欢迎来到 AI Odyssey。以下是AI领域的最新动态,欢迎收听! 本期内容: 00:02 - XAI 公司推出大模型 Grok-1.5,特点是上下文理解和高级推理能力的提升,计划向早期测试人员和 x 平台现有用户提供; 参考内容 01:15 - OpenAI 分享了 Voice Engine 的预览,能够通过输入文本和 15 秒音频样本生成自然语言,目前只在小范围内分享; 参考内容 02:10 - OpenAI 的 GPT 4 似乎不再有严格的使用上限,官方提示“Usage limits may apply”; 03:44 - Sam Altman 在 Lex Fridman 的播客中谈论了 OpenAI 的内部风波、对 Musk 的批评看法、Sora 的局限性和 GPT 4 的不足; 播客地址 机器之心翻译版 05:24 - Business Insider 报道一些投资者对 Sam Altman 的不满; 原文地址 06:09 - 微软 CEO Nadella 就科技、企业文化、个人成长和未来趋势的讨论; 视频地址 07:46 - 微软向Inflection支付6.5亿美元以获得专利使用与人才团队; 新闻来源 09:09 - Stability AI 的 CEO 突然宣布辞职; 官方公告 10:22 - Anthropic 公司开发的 AI 语音和音乐生成工具Suno 介绍; Suno 官网 11:43 - 百度将为苹果今年发布的 iOS 和 Mac OS 提供 AI 功能; 12:17 - GTC2024 黄仁勋 和 Transformer 架构的八位提出者的对话; 极客中国原文 12:32 - 吴恩达教授在 deeplearning 最新课程:优化 LLM 推理系统; 课程地址 12:50- YC W24 AI Starup 项目分布; Google sheet 地址 13:22 - 创业邦发布的 2023 年 AIGC 产业投资报告; 文章地址 13:32 -Trustless Labs 发布的 AI + Crypto 项目介绍; 报告地址 以上就是本期节目的所有资讯,感谢您的收听,我们下期再见。

13分钟
99+
1年前

揭秘AI文生图【下】文生图模型最前沿研究——结构原理、推理加速和评估

AI Odyssey

大家好。欢迎来到 AI Odyssey。本期播客我们有幸邀请到了文生图领域内的两位专家:林之秋和李嘉琛。两位嘉宾和主播深入探讨了文生图模型的最前沿研究,涵盖了模型的结构原理、推理加速以及评估方法。此外嘉宾还分享了模型架构的细节和优化技巧,以及模型评估的挑战和解决方案。本期内容丰富,为大家提供了一次深入了解文生图模型的机会,相信本期播客能带给大家新的启发和思考。欢迎收听,期待和大家一起探索AI的奥秘。 嘉宾介绍: 林之秋:CMU机器人研究所四年级博士,关注vision-language model以及generative AI。Twitter: @ZhiqiuLin Jiachen Li (李嘉琛, 推特:@JiachenLi11) :加州大学圣塔芭芭拉分校 (UCSB)三年级PhD,主攻文生图模型,机器人控制,多模态学习。Jiachen带队参加了Amazon SimBot Challenge,获得了第二名以及10w美元的奖金。 本期主播: Leo Zhao: 硅谷大厂高级机器学习工程师,GenAI LLM发烧友 Shownotes: 00:34 嘉宾自我介绍 02:08 讨论文生图模型的分类:闭源模型和开源模型,以及它们的特点和区别 03:52 探讨闭源模型和开源模型在数据质量和模型架构上的差异 06:06 分析 Diffusion Model (扩散模型)的原理,包括其与 GAN(生成对抗网络)的比较和优化 09:33 解释 Stable Diffusion 模型的特点,包括在潜在空间的生成和文本条件的引入 11:44 详细介绍 Diffusion Process 的理论基础,包括随机微分方程和逆过程的概念 16:00 讨论LCM(一致性模型)在降低推理步骤和保持生成质量方面的作用 20:42 探讨生成模型的评估指标,包括对齐度、质量、人工评估和自动化指标的重要性 27:02 分析现有自动化指标的局限性,包括 CLIP Score 的问题和改进方向 33:29 探索奖励建模在引导生成模型方面的应用和挑战 38:47 讨论不同奖励模型策略对生成模型的影响及训练的挑战 44:06 探讨用于评估和改进生成模型的新方法,包括弱模型指导强模型的潜力 49:44 讨论提高生成模型文本理解能力的重要性及其在专业应用中的潜在应用 54:29 探索用于生成模型评估的新基准和方法,重点关注文本对齐 59:36 讨论合成数据在生成模型训练中的应用及潜在优势 感谢收听,我们下期再会~

61分钟
99+
1年前

揭秘AI文生图【上】文生图应用startup从0到1

AI Odyssey

欢迎收听本期 AI Odyssey,本期我们有幸邀请到了HuHu AI CEO 刘天强,一位经验丰富的连续创业者。在这期节目中,嘉宾不仅分享了他在 AI 领域的创业历程,还深入讨论了关于 AI 产品设计、用户增长策略、以及如何在竞争激烈的市场中找到立足点。无论你是 AI 领域的专业人士,还是对文生图应用充满好奇的听众,这期节目都将为你提供独到的见解和启发。欢迎收听,与我们一起探索 AI 文生图的奥秘! 嘉宾介绍: 刘天强:HuHu AI CEO,连续创业者。曾经创立Orbeus并被Amazon收购,后成为Amazon Rekognition的创始架构师。在创立Huhu AI前,曾经是智能家居公司Wyze的CTO (Twitter: @Tianqiang_Liu, xhs: @AI创业中的井叔) 主播介绍: Leo Zhao: 硅谷大厂高级机器学习工程师,GenAI LLM发烧友 产品介绍: Chat Designer Chat Designer 是HuHu AI 的第一款 AI 产品。支持从文本生成图片,包括肖像图和产品图。用户通过简单的聊天对话即可进行像素级编辑。支持修图工具进行精确调整,轻松创造个性化图像。 HuHU AI HuHu AI 为各种商业场景提供 AI 设计代理解决方案。 Shownotes * 00:32 嘉宾自我介绍,分享连续创业经历 * 02:10 Chat Designer 的独特之处 * 02:47 讨论选择生成图应用领域的原因和市场定位 * 03:44 探讨 AI 产品设计与传统产品设计的异同 * 05:02 讨论 AI 产品的不确定性和评估标准 * 06:35 分析 AI 产品的市场定位和宣传策略 * 07:30 讨论 AI 模型的不确定性 * 08:02 讨论关于加强AI生成图的控制 * 09:29 Chat Designer 的目标用户群和市场策略 * 10:54 用户增长的核心要素和流量获取 * 13:55 讨论 AI 生图应用的艺术风格和质量评估 * 16:22 讨论 AI 生图应用的速度、质量和多样性之间的平衡 * 21:02 分享产品定价策略和收费标准 * 25:03 分享用户增长策略和口碑效应 * 32:23 预测生图应用未来发展方向和产品重构计划 感谢收听,我们下期再见!

39分钟
99+
1年前

对话Lepton AI产品负责人:探索AI基础设施的设计与技术哲学

AI Odyssey

【主播的话】 大家好,新年快乐! 农历新年的第一期节目,我们有幸邀请到 Lepton AI 的产品负责人鱼哲。他将与我们深入探讨 AI 基础设施领域的最新动态和未来趋势。嘉宾不仅是一位从开发者转型为产品经理的 AI 行业专家,还曾负责高性能 AI 计算架构平台的工作,对 AI 应用层开发者的需求有着深刻的理解。 在本期节目中,我们将聚焦于 AI Infra 的核心挑战,探讨如何通过产品和技术的融合提升 AI 应用的性能和效率。嘉宾还将分享他对多模态模型、结构化输出以及 AI 应用开发者需求的独到见解。 本期节目为我们探索 AI Infra 的重要一步,我们将继续带来更多深入的解析和讨论。 嘉宾和主播长期在北美工作生活,夹杂英文在所难免,不接受抱怨!Enjoy! 【本期嘉宾】 Yuze 鱼哲,毕业于美国伦斯勒理工大学。前阿里云高性能AI平台产品负责人。专注于AI在金融量化,风控,搜索推荐,自动驾驶,互联网娱乐等行业落地及应用。目前在北美明星AI架构平台Lepton AI 就任产品负责人。推特 @YuzeMa5。 【本期主播】 Leo Zhao 硅谷大厂高级机器学习工程师,GenAI LLM发烧友 【本期焦点】 01:56 AI Infra 的目标用户和需求分析 03:45 AI 应用开发者的特点和需求 06:21 AI 应用开发的路径和挑战 08:25 AI Infra 的覆盖面和优化方向 10:10 具体案例讨论:动画片分镜制作的 AI 应用 13:44 AI 模型的可扩展性和后端服务的挑战 15:28 AI 推理方向的技术探讨 18:53 AI 性能优化的具体方法和案例 22:51 AI 模型的定制化开发和技术选择 27:12 RAG 在 AI 应用中的挑战 32:30 AI 模型推理的优化方向和实践 38:01 AI 模型推理的算法和硬件优化 42:36 AI 应用开发的优化策略和业务取舍 47:20 Lepton AI 的收费模式和用户成本 51:04 AI 应用开发的未来趋势和发展方向

62分钟
2k+
1年前
EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧