Granola 是一家罕见的人工智能初创公司,它涉足了科技界最拥挤的利基市场之一——会议记录,却仍然成功成为创始人和风险投资家们热捧的产品。 在本期节目中,MAD Podcast 主持人 Matt Turck 与 Granola 联合创始人兼首席执行官 Chris Pedregal 进行了访谈,深入探讨了一支伦敦的二人团队如何将一个简单的“第二大脑”创意打造成硅谷最受欢迎的人工智能工具。 Chris 讲述了他们一年来如何悄无声息地逐一引导用户,如何将 50% 的功能削减到极致,以及如何在投资者批评他们疯狂的时候,拒绝部署会议机器人或存储音频。我们深入探讨了打造一款备受喜爱的人工智能产品的精髓:选择会议记录(而非电子邮件)作为数据楔入点,设计日历触发的习惯循环,以及如何对隐私的极致关注,最终赢得用户的信任,将记忆功能外包出去。 Chris 揭秘了 Granola 的技术栈——Deepgram 和 Assembly 的实时自动语音识别 (ASR)、设备上的回声消除以及跨 OpenAI、Anthropic 和 Google 模型的动态路由——并解释了为什么转录而非 LLM 代币是当今最大的成本驱动因素。他还揭示了内部评估工具如何让团队在一夜之间切换模型,而不会破坏“Granola 的声音”。 来源:www.youtube.com
来自 OpenAI 最新发布的论文《为什么语言模型会幻觉》(Why Language Models Hallucinate)。核心论点是,语言模型产生幻觉的根本原因是:训练和评估过程奖励猜测而非承认不确定性,且幻觉的产生源于二元分类中的错误。 摘要: * LLM 幻觉就像学生考试时“蒙题”。 大型语言模型在不确定时,常常会像面对难题的学生一样,选择**“猜测”而非承认“不知道”,从而产生看似合理却错误的回答。这种行为在最先进的 AI 系统中也普遍存在,并且损害了我们对它们的信任。 * 幻觉并非神秘,它只是 AI 的“小失误”。 研究指出,AI 的幻觉并非什么高深莫测的现象,它本质上就是其内部**“是非判断”系统(二元分类)中产生的错误。简单来说,模型在判断一个信息是真是假时出了错,然后就自信地把错的说出来了。 * 即使训练数据完美无瑕,AI 也可能“犯错”。 令人惊讶的是,即使给 AI 喂食的是完全正确、没有一点错误的数据,它在预训练阶段优化的统计目标也会导致它生成错误。 * “冷门知识”更容易让 AI“编造”。 如果某个事实在训练数据中只出现过一次(就像一本非常厚的百科全书里只提了一次的冷知识),那么模型在回答这个问题时产生幻觉的几率就会大大增加。 * AI 的“考试制度”鼓励它“撒谎”。 幻觉之所以难以消除,一个核心原因在于当前的 AI 评估方式。大多数评估基准都采用简单的“对错”二元评分,对于回答“我不知道”或留白的情况,模型会得 0 分;而即使是“蒙对”了,也能得高分。这种机制激励模型在不确定时也要大胆猜测,而非诚实地表达不确定性。 * “搜索工具”也救不了爱“蒙题”的 AI。 即使给 AI 配备了强大的搜索工具(例如检索增强生成,RAG),如果评估系统仍然奖励猜测,那么当搜索结果无法给出确信答案时,模型仍然会选择“蒙题”。所以,光有工具不够,关键在于改变“考试规则”。 来源:cdn.openai.com
背景:来听听腾讯昨天刚开源的混元翻译模型技术报告解读。 包含一个翻译模型Hunyuan-MT-7B和一个集成模型Hunyuan-MT-Chimera。翻译模型用来将待翻译的文本翻译成目标语言,集成模型用来把翻译模型的多个翻译结果集成为一个更好的翻译。重点支持33语种互译,支持5种民汉语言。 * WMT25参赛31语种之中30语种获得第一名的成绩。 * Hunyuan-MT-7B同尺寸业界效果最优 * Hunyuan-MT-Chimera-7B是业界首个开源翻译集成模型,可以将翻译效果再拉高一个档次 * 提出了一个完整的翻译模型训练范式,从Pretrain->CPT->SFT->翻译强化->集成强化,翻译效果达到同尺寸SOTA。 来源:https://github.com/Tencent-Hunyuan/Hunyuan-MT/blob/main/Hunyuan_MT_Technical_Report.pdf
原文是一份 74 页免费的模型上下文协议(MCP)学习指南。下载地址见文末。 资料深入探讨了 MCP 的核心能力,即工具(可执行操作)、资源(只读数据源)和提示(预定义模板),并通过一系列实践项目展示了 MCP 在本地客户端构建、智能代理 RAG、金融分析、语音代理、统一数据源管理、AI 共享内存、复杂文档 RAG、合成数据生成、深度研究、视频 RAG 以及音频分析等多个领域的应用。 来源:https://drive.google.com/file/d/1a0OMR6NKTY-R2ZeLJVnDimkmTauarXPB/view
这是我喜欢的独立创作者Derek Sivers写的一本书《Anything you want》,试图让你在15分钟内听到精华。 Sivers分享了他创建CD Baby的经验。CD Baby是一个帮助独立音乐家销售音乐的在线平台,以2200万美元的价格售出,并把所有收益都捐给了慈善机构。 摘要: * 从1998年到2008年,我经历了一次狂野的体验:最初只是一个小爱好,却意外地发展成一个大企业,然后以2200万美元的价格将其出售。所以现在人们想听听我的想法。 * 人们问我关于那段经历的事情,我便讲述了我的经历。其中许多是关于我做错的事情,我犯了一些可怕的错误。 * 这是我十年所学的大部分内容,浓缩在这本书里。 来源:https://sive.rs/a
谷歌刚发布的纳米香蕉(Nano banana)图像模型背后的团队访谈。 谷歌 DeepMind 团队成员介绍 Gemini 原生图像生成模型更新,展示其生成和编辑能力的巨大飞跃,如按自然语言指令生成、编辑图像,能保持场景一致性,探讨文本渲染、评估指标、与图像理解能力的关联及实际应用,还对比了与 Imagine 模型的差异,回顾从 2.0 到 2.5 版本的改进,提及未来在智能性、事实性等方面的发展方向。 来源:https://www.youtube.com/watch?v=H6ZXujE1qBA&t=65s
来自8月26日中国政府网发布的《国务院关于深入实施“人工智能+”行动的意见》。 摘要: * 到2027年,率先实现人工智能与6大重点领域广泛深度融合,新一代智能终端、智能体等应用普及率超70%,智能经济核心产业规模快速增长,人工智能在公共治理中的作用明显增强,人工智能开放合作体系不断完善。 * 到2030年,我国人工智能全面赋能高质量发展,新一代智能终端、智能体等应用普及率超90%,智能经济成为我国经济发展的重要增长极,推动技术普惠和成果共享。 * 到2035年,我国全面步入智能经济和智能社会发展新阶段,为基本实现社会主义现代化提供有力支撑。 来源:https://mp.weixin.qq.com/s/gQSIB2OGpHfbrUwA7-wKYw
吴恩达(Andrew Ng)是谷歌大脑(Google Brain)和在线教育平台Coursera的联合创始人,也是专注于人工智能的风投工作室AI Fund的创始合伙人。 Sarah Guo:知名美国华裔投资人。 摘要: * 构建能动工作流(Agentic Workflow)——例如处理发票、进行合规性检查和更新数据库——需要大量的领域知识和商业背景,而这些信息并未包含在互联网的预训练数据中。这需要产品经理或工程师深入思考业务流程的关键节点,并做出明智的权衡。目前,能够胜任这种严谨工程流程的人才仍然非常稀缺。 * 过去需要一个6人工程师团队花费3个月才能完成的工作,现在,我和我的一个朋友只用一个周末就能完成。 * 世界上在2022年所做的很多事情在2025年就行不通了。我经常问自己,我们今天所做的事情中,有没有也是在2022年所做的?如果是这样,让我们看看它今天是否仍然有意义。 来源:www.youtube.com
全球最大的语言服务供应商TransPerfect近日宣布收购AI翻译领域的先驱企业Unbabel。本文为 Unbabel联合创始人兼CEO Vasco Pedro 的访谈。 摘要: * 对于TransPerfect而言,这是一次旨在巩固其在语言AI领域领导地位的防御性与进攻性并存的举措。通过收购Unbabel,TransPerfect不仅获得了业界领先的专为翻译任务打造的大语言模型(LLM)——TowerLLM,以及行业公认的机器翻译质量评估基准——COMET,更重要的是,它以此构建了一道强大的技术护城河,以应对DeepL、Lilt等新兴AI原生竞争对手的挑战。 * 对于Unbabel而言,被收购是其在AI技术加速迭代和市场竞争加剧背景下的理性终局。尽管Unbabel自身技术卓越,并通过一系列收购初步构建了“语言运营”(LangOps)平台,但其首席执行官Vasco Pedro坦言,面对AI发展的惊人速度,公司自身的增长“不够快”,无法企及TransPerfect所拥有的庞大全球销售网络和客户基础。在融资环境趋紧、盈利压力增大的背景下,被收购成为其实现技术价值最大化和为投资者提供退出的最佳路径。 * Unbabel的核心资产——TowerLLM和COMET——代表了专业化AI相对于通用型AI的独特价值。TowerLLM基于Unbabel多年积累的高质量、经人工优化的专有翻译数据进行训练,其在翻译任务上的精准度和适应性超越了如GPT-4o等通用模型。COMET则为AI翻译的质量评估提供了行业标准。这些资产的整合,将极大提升TransPerfect GlobalLink技术栈的复杂性和竞争力。 来源:https://www.prnewswire.com/news-releases/transperfect-solidifies-leadership-position-in-language-ai-by-acquiring-unbabel-302536792.html
Simon Squibb在过去30年里,他创立了19家公司,并投资了78家初创企业。他的早期公司Fluid曾发展成为亚洲最大的代理机构之一,并最终成功出售给普华永道(PwC)。 Simon将他35年的商业智慧分享出来,涵盖了从零开始创业、如何取胜、如何面对失败、绘制思维导图(而非商业计划书)、寻找使命与联合创始人、销售、营销、公关、融资、构建品牌,到人员管理、全球化扩张,乃至最终出售业务等方方面面。原视频长146分钟。 大纲: • 如何不花钱创业 • 如何赢 • 如何应对失败 • 如何制作思维导图(商业计划) • 如何寻找使命 • 如何找到联合创始人 • 如何销售 • 如何营销 • 如何公关 • 如何获得投资者 • 如何获得赞助商 • 如何打造品牌 • 如何招聘 • 如何解雇 • 如何走向全球 • 如何寻找导师 • 股权如何运作 • 如何出售你的业务 来源:www.youtube.com
OpenAI 联合创始人Greg Brockman 分享了个人经历:从小时候热爱数学转向编程,在 Stripe担任 CTO积累创业经验后,接触深度学习并参与 OpenAI 创立。 摘要: * Ilya Sutskever 和 Alex Krizhevsky 的合作关系,正是这种“研究-工程”伙伴关系的缩影,而这也成为了后来 OpenAI 的理念。 * 互联网一个是“游牧民族”的世界:信奉第一性原理,蔑视陈规。为了一个客户,可以在 24 小时内攻克银行需要 9 个月的技术对接。这是 Stripe 崛起的秘密,也是硅谷精神的原始图腾——相信凭借超凡的意志和智力,个体的创造力可以战胜任何系统性的僵化。 * OpenAI是一个“农耕文明”的世界:在这里,你需要耕耘十万块 GPU 的庞大集群,需要建立“检查点”与“可靠性”的秩序,需要调和“研究”与“工程”两种截然不同的文化。最大的敌人不再是外部规则,而是系统自身的复杂性。 * 来源:https://www.youtube.com/watch?v=avWhreBUYF0
硅谷增长专家Brian Balfour研究过所有主要平台变革——从 Facebook 到 Apple 再到 Google,他发现了一个即将在 ChatGPT 中重复的模式。他预测:一个新的、强大的分发渠道即将出现——最有可能基于ChatGPT展开,预计在未来6个月内。上一次新的增长渠道出现还是很多年前。 摘要: • “构建优秀产品是必要的,但并非充分条件;真正的区别在于那些构建了卓越分销能力的公司。” • “我的预测是,新的分销平台将是 ChatGPT。他们即将推出开放平台有大量信号,这是一个巨大的机遇” • “最终这变成了一个囚徒困境,你别欺骗自己以为可以不玩这个游戏。你的竞争对手肯定会转向新平台,并且客户的期望也会随之改变。” • “最重要的是要理解这个周期,并评估如何决定在哪里下注以及如何下注。……周期似乎越来越短。所以你实际上有更短的时间来玩这个游戏。” 来源:https://www.youtube.com/watch?v=cX4cL6B-_aU
与播客爱好者一起交流
添加微信好友,获取更多播客资讯
播放列表还是空的
去找些喜欢的节目添加进来吧