播客: StellaxAmy·自定义 - EarsOnMe - 精选播客，一听即合

播客简介

原《数据女孩的中年危机》播客改名升级！各大播客平台同步更新。每期邀请一位朋友，讲述中文世界故事、华人故事。和我们一起倾听自定义人生。 [email protected]

创作者

StellaxAmy 1 档播客

节目

EP94 从30年前的硅谷说起：Google、职业选择、育儿、退休

StellaxAmy·自定义

30年前来到美国、20年前进入 Google，从硅谷退休，Grace 的经历让我们看到：硅谷华人的职业路径变了，焦虑的内容变了，但女性在工作、家庭和自我之间要做的取舍，直到今天也没有变得更轻松。 Grace在美国生活了 30 多年，在科技行业工作近 30 年，也经历过 Google 刚上市的时代。和今天相比，早一代硅谷华人的路更少也更直接：先留下来，先站稳脚跟，再谈发展；而今天的华人选择更多，却也更早面对职业、家庭、育儿和 AI 带来的不确定。这集我们从 Grace 的经历聊起，也借她的故事去看两代硅谷华人的差别：从早年的移民与大厂机会，到今天的职业选择、育儿压力，以及女性在职业上升期与家庭责任之间反复做出的取舍。当工作不再是唯一答案，退休也未必意味着真正轻松。技术在变，行业在变，但关于工作、家庭和自我价值的拉扯，似乎从来没有真正变少。 00:01:37 Grace 登场：90年代来美，科技行业近30年 00:02:24 为什么出国：从大学老师到赴美读书 00:06:11 第一份工作与身份压力 00:07:26 从中部到湾区：90年代硅谷机会 00:09:44 2004年加入 Google 00:13:48 早期 Google 的工作氛围 00:18:42 为什么离开 Google：burn out、身体与家庭 00:21:36 做技术还是做管理 00:26:35 退休之后，人还想留下什么 00:32:20 AI时代，孩子该学什么 00:37:51 湾区华人父母的育儿压力 00:42:09 成功父母会不会给孩子更多压力 00:44:08 AI时代，怎么培养孩子的学习能力

48分钟

99+

4周前

EP93 新手 vs. 妈龄五年：做妈妈，到底是轻松，还是辛苦？

StellaxAmy·自定义

同样是做妈妈，有人觉得轻松、甚至比想象中顺利；也有人深刻感受到，这是一份长期、高强度、高难度的工作。这期母亲节特辑，我们把三个处在不同阶段的妈妈放进了同一场对话里。刚成为新手妈妈的 Amy 和 Paloma，还沉浸在出乎意料的幸福感里：家人陪在身边，生活被一个小宝宝重新组织，连原本担心的问题，好像都暂时没那么重要了。但已经做了五年妈妈的 Stella，感受到的是另一面。对她来说，妈妈是一份会长期占用时间、注意力、职业空间和情绪容量的工作。它很具体，也很消耗精力。这期录完之后，Stella 和 Amy 复盘时差点聊到“友尽”。这期最有意思的，不是谁更对，而是这些感受为什么能同时成立。新手妈妈觉得轻松，是真的；做了几年以后觉得辛苦，也是真的。阶段不同、支持系统不同、宝宝状态不同，最后长出来的 motherhood 体验，本来就不会一样。很多看起来像“个人态度”的差异，背后其实都是很现实的条件差异。所以这期借母亲节想聊的，不只是感恩和赞美，而是更复杂也更真实的一层：做妈妈这件事，没有统一答案。快乐是真的，辛苦也是真的。而那些分歧本身，也许就是理解母职最好的入口。 00:00:00 新手妈妈 Paloma 登场 00:02:14 产假前的想象，和产后的现实落差 00:03:19 家里多人协作带娃 00:04:43 时间和注意力被切碎的妈妈们 00:07:55 什么是基础育儿，什么又算“上强度” 00:16:36 不同妈妈面对的是不同难题 00:25:21 跨文化家庭和语言问题 00:44:07 母职与职业选择 00:46:24 家庭比职涯更重要？ 00:50:24 成为妈妈，更有自信了？ 00:54:18 把生活主导权拿回来

62分钟

99+

1个月前

EP92 从 Google 到 Stability AI: 软件工程师的一线观察

StellaxAmy·自定义

当生成代码越来越容易，工程师要靠什么证明自己不可替代？这一期我们邀请到在 Stability AI 担任软件工程师的思思 Yisi Lu，聊她从 Bloomberg、Google 到 AI 创业公司的职业转向，也聊她身处 AI 行业一线，看到的真实变化。 Sisi 加入 Stability AI 时，这家公司刚经历管理层震荡，外界最常问的是：它还行不行？但身在其中，思思看到的却是另一个更现实的问题：在今天的 AI 行业里，光有模型已经不够了，真正难的是，怎么活下来，怎么商业化，怎么把技术变成有人买单的产品。这一期里，她分享了 Stability AI 如何从 research-driven lab 转向更重产品和商业的方向，也解释了为什么今天的小公司，已经很难再靠“做一个更强的通用模型”赢下比赛。后半段，我们把话题转到每个工程师都会关心的问题：AI coding 已经把软件工程师的工作改成什么样了？在 AI-assisted coding interview 里，真正被考察的到底是什么？一个“很会用 AI”的候选人，为什么反而可能拿不到 offer？当生成代码越来越容易，真正稀缺的，也许不是执行力，而是判断力、ownership，以及对结果负责的能力。这一期里我们一直在讨论的一个问题是：AI 和人类，到底谁在做真正的创意工作？当 AI 可以快速生成图片、视频、代码，甚至第一版草稿，人类到底是在创造，还是慢慢退回到审核、筛选和把关的位置？如果创意工作的入口正在变化，那什么才是人类最后不能放手的部分？也许不是产出本身，而是提出问题、做判断、承担责任，以及决定什么值得被做出来。如果你正在做软件、关注 AI、考虑转向 AI 行业，或者只是隐约感觉到这套职业规则已经开始变化，这一期会很有共鸣。本期提到的 Chase 的AI生成网站图片： [Major AI fail on the Chase Sapphire Preferred but no one ...] 时间线 00:02:07 嘉宾介绍：从 Bloomberg、Google 到 Stability AI 00:03:39 Stability AI 是一家什么样的公司：开源模型、平台和商业化转型 00:06:24 为什么在公司动荡之后，仍然选择加入 Stability AI 00:09:42 在 AI 公司做 applied engineering，具体是在做什么 00:13:01 小公司做通用模型为什么越来越难，image model 赛道现在怎么竞争 00:18:01 从大厂到 AI 创业公司，一年半后回看这个职业选择 00:20:08 AI 行业变化太快，公司和个人要怎么应对这种不确定性 00:24:29 Image generation、图片编辑、视频与影视特效，哪些方向更接近真实落地 00:30:47 谁来做“第一稿”：AI 负责生成，人负责判断，还是反过来？ 00:38:53 AI 已经如何进入软件工程师的日常工作流 00:44:23 AI coding 时代，工程师不能放弃的能力：ownership、review 和判断力 00:51:49 AI-assisted coding interview：什么样的候选人会脱颖而出 01:03:00 给 junior engineer 的建议：这是更难的一代，也是被 AI 赋能的一代 01:20:50 当效率越来越高之后，人怎么继续寻找意义感与快乐

90分钟

99+

1个月前

[全英播客] Next Level AI Evals for 2026

StellaxAmy·自定义

最近 Stella 和 Google Staff Data Scientist, Eddie Landesberg,在 Vanishing Gradients Podcast 上的一次对话，围绕当下真实产品环境中的 AI evals（AI评估）展开。在这期节目中，我们从实践出发，分享了为什么 AI evals 在产品中如此关键：一方面，它是开发阶段的“指南针”，帮助团队不断迭代、建立有效的反馈闭环；另一方面，它又是发布前的“关卡”，支持团队做出系统是否可以上线或进入实验阶段的决策。我们讨论了： 1. 团队协同的 AI 评估（Team-Centric AI Evals）如何让产品经理、数据科学家以及领域专家（SMEs）协同参与评估过程，在“统一决策者”（benevolent dictator）或去中心化模式之间找到平衡，从而构建更全面、更有效的评估体系。 2. 定制化评估指标（Custom Evaluation Metrics）为什么不能只依赖工具厂商提供的通用指标，而需要回到原始数据，识别具体的失败模式（failure modes），避免用“看起来不错”的指标掩盖真实问题。 3. AI评估作为“策略评估”（AI as Policy Evaluation）将评估问题转化为因果推断问题：评估不同“策略”（如prompt、模型）的反事实表现（counterfactual performance），并预测线上A/B实验的结果。 4. 明确产品边界与约束（Clear Product Constraints）定义AI产品“不能做什么”往往比“能做什么”更重要：通过严格的guardrails防止滥用、控制成本，并保护品牌。 5. 校准后的 LLM 评估器（Calibrated LLM Judges）如何通过统计方法和因果推断，将 LLM-as-a-judge 与人类专家对齐，确保评估结果能够真实反映用户价值和业务目标。 6. 数据直觉与好奇心（Essential Data Curiosity）在依赖自动化分析或agent之前，先通过人工查看数据建立直觉，这是设计有效评估系统的基础能力。 7. 统计视角下的 AI 评估（Statistical AI Evaluation）从“单元测试思维”转向“分布思维”：利用置信区间（confidence intervals）和统计功效分析（power analysis），区分真实改进与统计噪声。 8. 前瞻性的合规设计（Proactive Regulatory Compliance）在监管尚不明确的阶段，提前建立严谨、可解释的内部评估标准，为未来合规要求做好准备，并形成竞争优势。 9. 以人为中心的评估基准（Human-Centric Benchmarking）将AI系统建立在人类判断与用户价值之上，不仅仅依赖自动化分数，而是构建真正有韧性、差异化的AI产品。

53分钟

99+

1个月前