谷歌刚发布的纳米香蕉(Nano banana)图像模型背后的团队访谈。 谷歌 DeepMind 团队成员介绍 Gemini 原生图像生成模型更新,展示其生成和编辑能力的巨大飞跃,如按自然语言指令生成、编辑图像,能保持场景一致性,探讨文本渲染、评估指标、与图像理解能力的关联及实际应用,还对比了与 Imagine 模型的差异,回顾从 2.0 到 2.5 版本的改进,提及未来在智能性、事实性等方面的发展方向。 来源:https://www.youtube.com/watch?v=H6ZXujE1qBA&t=65s
来自8月26日中国政府网发布的《国务院关于深入实施“人工智能+”行动的意见》。 摘要: * 到2027年,率先实现人工智能与6大重点领域广泛深度融合,新一代智能终端、智能体等应用普及率超70%,智能经济核心产业规模快速增长,人工智能在公共治理中的作用明显增强,人工智能开放合作体系不断完善。 * 到2030年,我国人工智能全面赋能高质量发展,新一代智能终端、智能体等应用普及率超90%,智能经济成为我国经济发展的重要增长极,推动技术普惠和成果共享。 * 到2035年,我国全面步入智能经济和智能社会发展新阶段,为基本实现社会主义现代化提供有力支撑。 来源:https://mp.weixin.qq.com/s/gQSIB2OGpHfbrUwA7-wKYw
吴恩达(Andrew Ng)是谷歌大脑(Google Brain)和在线教育平台Coursera的联合创始人,也是专注于人工智能的风投工作室AI Fund的创始合伙人。 Sarah Guo:知名美国华裔投资人。 摘要: * 构建能动工作流(Agentic Workflow)——例如处理发票、进行合规性检查和更新数据库——需要大量的领域知识和商业背景,而这些信息并未包含在互联网的预训练数据中。这需要产品经理或工程师深入思考业务流程的关键节点,并做出明智的权衡。目前,能够胜任这种严谨工程流程的人才仍然非常稀缺。 * 过去需要一个6人工程师团队花费3个月才能完成的工作,现在,我和我的一个朋友只用一个周末就能完成。 * 世界上在2022年所做的很多事情在2025年就行不通了。我经常问自己,我们今天所做的事情中,有没有也是在2022年所做的?如果是这样,让我们看看它今天是否仍然有意义。 来源:www.youtube.com
全球最大的语言服务供应商TransPerfect近日宣布收购AI翻译领域的先驱企业Unbabel。本文为 Unbabel联合创始人兼CEO Vasco Pedro 的访谈。 摘要: * 对于TransPerfect而言,这是一次旨在巩固其在语言AI领域领导地位的防御性与进攻性并存的举措。通过收购Unbabel,TransPerfect不仅获得了业界领先的专为翻译任务打造的大语言模型(LLM)——TowerLLM,以及行业公认的机器翻译质量评估基准——COMET,更重要的是,它以此构建了一道强大的技术护城河,以应对DeepL、Lilt等新兴AI原生竞争对手的挑战。 * 对于Unbabel而言,被收购是其在AI技术加速迭代和市场竞争加剧背景下的理性终局。尽管Unbabel自身技术卓越,并通过一系列收购初步构建了“语言运营”(LangOps)平台,但其首席执行官Vasco Pedro坦言,面对AI发展的惊人速度,公司自身的增长“不够快”,无法企及TransPerfect所拥有的庞大全球销售网络和客户基础。在融资环境趋紧、盈利压力增大的背景下,被收购成为其实现技术价值最大化和为投资者提供退出的最佳路径。 * Unbabel的核心资产——TowerLLM和COMET——代表了专业化AI相对于通用型AI的独特价值。TowerLLM基于Unbabel多年积累的高质量、经人工优化的专有翻译数据进行训练,其在翻译任务上的精准度和适应性超越了如GPT-4o等通用模型。COMET则为AI翻译的质量评估提供了行业标准。这些资产的整合,将极大提升TransPerfect GlobalLink技术栈的复杂性和竞争力。 来源:https://www.prnewswire.com/news-releases/transperfect-solidifies-leadership-position-in-language-ai-by-acquiring-unbabel-302536792.html
Simon Squibb在过去30年里,他创立了19家公司,并投资了78家初创企业。他的早期公司Fluid曾发展成为亚洲最大的代理机构之一,并最终成功出售给普华永道(PwC)。 Simon将他35年的商业智慧分享出来,涵盖了从零开始创业、如何取胜、如何面对失败、绘制思维导图(而非商业计划书)、寻找使命与联合创始人、销售、营销、公关、融资、构建品牌,到人员管理、全球化扩张,乃至最终出售业务等方方面面。原视频长146分钟。 大纲: • 如何不花钱创业 • 如何赢 • 如何应对失败 • 如何制作思维导图(商业计划) • 如何寻找使命 • 如何找到联合创始人 • 如何销售 • 如何营销 • 如何公关 • 如何获得投资者 • 如何获得赞助商 • 如何打造品牌 • 如何招聘 • 如何解雇 • 如何走向全球 • 如何寻找导师 • 股权如何运作 • 如何出售你的业务 来源:www.youtube.com
OpenAI 联合创始人Greg Brockman 分享了个人经历:从小时候热爱数学转向编程,在 Stripe担任 CTO积累创业经验后,接触深度学习并参与 OpenAI 创立。 摘要: * Ilya Sutskever 和 Alex Krizhevsky 的合作关系,正是这种“研究-工程”伙伴关系的缩影,而这也成为了后来 OpenAI 的理念。 * 互联网一个是“游牧民族”的世界:信奉第一性原理,蔑视陈规。为了一个客户,可以在 24 小时内攻克银行需要 9 个月的技术对接。这是 Stripe 崛起的秘密,也是硅谷精神的原始图腾——相信凭借超凡的意志和智力,个体的创造力可以战胜任何系统性的僵化。 * OpenAI是一个“农耕文明”的世界:在这里,你需要耕耘十万块 GPU 的庞大集群,需要建立“检查点”与“可靠性”的秩序,需要调和“研究”与“工程”两种截然不同的文化。最大的敌人不再是外部规则,而是系统自身的复杂性。 * 来源:https://www.youtube.com/watch?v=avWhreBUYF0
硅谷增长专家Brian Balfour研究过所有主要平台变革——从 Facebook 到 Apple 再到 Google,他发现了一个即将在 ChatGPT 中重复的模式。他预测:一个新的、强大的分发渠道即将出现——最有可能基于ChatGPT展开,预计在未来6个月内。上一次新的增长渠道出现还是很多年前。 摘要: • “构建优秀产品是必要的,但并非充分条件;真正的区别在于那些构建了卓越分销能力的公司。” • “我的预测是,新的分销平台将是 ChatGPT。他们即将推出开放平台有大量信号,这是一个巨大的机遇” • “最终这变成了一个囚徒困境,你别欺骗自己以为可以不玩这个游戏。你的竞争对手肯定会转向新平台,并且客户的期望也会随之改变。” • “最重要的是要理解这个周期,并评估如何决定在哪里下注以及如何下注。……周期似乎越来越短。所以你实际上有更短的时间来玩这个游戏。” 来源:https://www.youtube.com/watch?v=cX4cL6B-_aU
提出收购Chrome邀约,想“蛇吞象”的Perplexity在想啥? Semafor科技编辑对 Perplexity 联合创始人兼首席执行官 Aravind Srinivas 的采访,原视频 81 分钟。 * Comet 浏览器旨在成为 AI 的操作系统,能够处理重复和异步任务,通过连接电脑上的其他应用程序,让浏览器感觉就像一台迷你电脑,并且是用户日常工作和生活中所有操作的终极语境来源。 * Perplexity 的开发策略是 立即构建 Comet 等产品,即使当前模型存在局限性,因为他们假设 AI 模型最终会变得更强大且更经济实惠;他们的目标是创建一个 “智能体浏览器”的新产品类别,而非与传统市场竞争。 * 订阅市场被大大低估了,预计未来将有数千万人每月支付 20 美元,甚至数百万人每月支付 200 美元,这足以支撑一家数百亿美元收入的公司,而无需依赖广告。 来源:https://www.youtube.com/watch?v=sM9xd8kkes0&t=1075s
来自多邻国联创和CTO Severin Hacker的访谈全视频精华,原视频长1小时54分。 * Duolingo 起初只是卡内基梅隆大学的一个研究项目。外界普遍认为,这只是一个教授和他的博士生做出来的产品,不可能赚钱。创立的前五年,公司是零收入。 * Duolingo 的使命:让最优质的教育惠及所有人。如果能将成本降低 10 倍甚至 100 倍,就能让所有用户享受到同等服务,让每个人都受益。 * 提出AI first前后,过去,开发最初的 100 门课程耗时约 12 年;如今,仅用一年,就新增了 148 门。 * Duolingo 内部有个概念叫「绿色机器」(Green Machine),指不断做实验,在找到有效策略后加大投入。它的成功不能归因于某个单一功能。比如连胜打卡(Streak),虽然诞生于一次实验,但用户的长期喜爱来自后续超过 300 次的优化迭代。Duolingo 的增长背后,是成千上万次的 A/B 测试。 来源:www.youtube.com
作为一个 I 人,主动约网友聊天是有点难。不过,这是一个神秘大佬给我的建议。 今年 5 月,我在高铁上遇到一个魁梧的中年男子。当时他来晚了,在找座位,我提示了他一下,他正好是邻座,感谢了我的小小善意。他似乎观察了我一阵子,然后问了什么问题(忘了),就开始聊起来。我才发现这是一位神秘大佬,我把自己的一些困惑坦诚提出来,结果我们的话题很快进入“付费级”咨询环节,他慷慨地给我了很多工作和人生建议。 其中有一个就是——不要总和同行交流,要和跨行业的人交流。 对,这就是我利己的想法。不过最好也能顺带利他,和你交换一些认知和信息——因为你也在和跨行业的人交流。 我熟悉的领域和能提供的信息: * AI翻译、多语言本地化:这是我做了大约 10 年的事情,这几年在做专业级AI 翻译languagex.com,可以提供脱敏的一手的信息和思考。 * 通用AI的一些观察:你可以在公众号/小宇宙/苹果podcast@David的AI 全景图看到我关心过的内容。最近关注 Vibe coding和 AI+内容多一些,也可以聊聊 GPT5啊。 * 产品相关的经验: B 端和 C 端产品、设计、管理、出海、Producthunt打榜… * 外语生/文科生转 AI/技术:算是免费咨询,因为我曾经是一个本科学外语的学生,你或许会少走些弯路。 * 一些爱好:读书、书法、足球 名额可能不多,我会先按照兴趣匹配来约,所以弄了一个简单的表单。不过,我能承诺,只要填了表单,我都会加个微信,交个朋友。 表单:https://lvbjv6o2rsw.feishu.cn/share/base/form/shrcnBZELlDEtWKHw8luBzEyWXe
来听听GPT5技术报告精华。 原文PDF下载链接:cdn.openai.com
Anthropic CEO Dario Amodei 在播客Big Technology 中和主播 Alex Kantrowitz的对话。原视频70分钟。 * 我们从 2023 年的 0 增长到了 1 亿美元,2024 年从 1 亿增长到了 10 亿。而今年,上半年我们就从 10 亿增长到了……我想到今天为止,已经远超 40 亿,可能是 45 亿。 * 我认为唯一真实的东西,就是那条指数曲线——每隔几个月,我们就会得到一个比上一个更强的 AI 模型。 * 我到普林斯顿的时候,是想成为一名理论物理学家,我最早的几个月也确实在做宇宙学的研究。那段时间,我父亲去世了。那件事对我影响很大,也是说服我转向生物学的原因之一,我想去解决人类的疾病和生物问题……在他去世后大概三四年,他得的那种病的治愈率从 50% 提高到了大概 95%。 来源:www.youtube.com
与播客爱好者一起交流
添加微信好友,获取更多播客资讯
播放列表还是空的
去找些喜欢的节目添加进来吧