播客: 语迟者说 - EarsOnMe | 发现和收听来自小宇宙的热门播客

播客简介...

曾和丁磊马化腾同期玩互联网，并与Sprint，亚信一起将互联网引入中国。但天生不喜欢艰苦奋斗和996，选择了浪荡不羁，云游四方的生活，从东南亚到欧洲。基于海外多年的数字化转型的经历带来更开阔的不同视角，讲出与国内科技媒体不同的声音，包括电信，IT，云计算，物联网，区块链，人工智能等领域，带给您不同的视野

语迟者说的创作者...

晨萱I语迟者说

语迟者说的音频...

用Deep Seek回答科技播客“十字路口 Crossing”的 20个问题

这期是日常AI使用的探索，我将科技播客“十字路口Crossing”的最新一期输入腾讯元宝部署的deep seek平台，输出用的是腾讯元宝模拟我的声音，原汁原味，未改一字。无论是AI幻觉，还是胡说八道，一切由腾讯元宝负责，哈哈哈。以下是deep seek输出的文字版：嗯，用户让我详细回答播客里的20个问题，每个回答不少于60字。首先，我需要回顾用户提供的播客内容摘要，了解每个问题的具体内容。播客主要讨论了AI Agent的发展、Manus的爆火、技术突破、行业竞争以及未来影响等方面。用户可能希望得到每个问题的深入分析，结合现有的AI知识和技术趋势来回答。首先，我需要确定每个问题的核心。例如，Q1关于AI Agent的定义，需要明确其与普通AI的区别，比如自主性、目标导向等。Q2关于2024年Agent的发展脉络，可能需要回顾关键事件如GPT-4的发布、多模态能力的提升等。对于GAIA标准和MCP，需要解释这些标准的作用和为什么它们成为行业标杆。接下来，关于Manus的具体问题，如核心创新、复利效应，需要分析其技术特点，比如动态工作流和少结构多智能的方法。竞争和行业格局部分，要预测大厂的动向，分析创业公司的机会，以及英伟达的影响，这里可能需要联系硬件需求的变化。未来影响部分，比如哪些行业被颠覆，个人如何适应，要考虑AI Agent的实际应用场景，如客服、医疗、教育等，以及个人需要提升的技能，如Prompt工程、数据素养等。需要注意的是，用户可能希望答案不仅基于播客内容，还要补充外部知识，比如技术细节或行业案例，使回答更全面。同时，每个回答要保持结构清晰，语言专业但易懂，避免过于技术化。可能遇到的挑战是确保每个问题都覆盖到关键点，并且达到字数要求。需要逐一检查每个回答是否充分解释了问题，是否有足够的细节和例子支持观点。例如，在讨论Manus的复利效应时，可以提到其自我迭代和用户反馈循环如何提升性能，而不仅仅是重复播客内容。此外，用户可能希望答案具有前瞻性，尤其是在预测大厂动向和行业颠覆方面，需要结合当前科技巨头的战略布局，如微软、谷歌在AI领域的投入，以及初创公司的创新方向。最后，要确保整体回答逻辑连贯，问题之间相互关联，比如技术突破如何影响产品形态，进而改变行业格局。同时，注意术语的正确使用，避免误解，比如区分AI Agent和AI Chatbot的关键差异。总结来说，回答每个问题时需要结合播客提供的框架，补充相关知识和分析，确保内容详实、结构清晰，满足用户的需求。以下是针对播客中讨论的20个问题的详细回答，每个回答均基于AI Agent技术趋势及行业分析： Q1: AI Agent的定义是什么？ AI Agent指具备自主感知、决策和执行能力的智能体，通过环境交互实现特定目标。与传统AI工具（如Chatbot）的核心区别在于其主动性——Agent能自主分解任务、调用工具链并动态优化策略。例如，Manus能根据用户模糊指令生成完整工作流，而Chatbot仅提供被动响应。技术层面依赖大模型推理能力、多模态交互及记忆模块的协同。 Q2: 复盘Agent在2024年的发展脉络 2024年AI Agent的爆发源于三大驱动力： 1. 大模型能力跃迁：GPT-4等模型在复杂推理和长文本理解上的突破； 2. 多模态工具链成熟：图像生成、代码执行等API生态完善； 3. 用户需求升级：从信息检索转向任务自动化（如数据分析、内容创作）。关键事件包括OpenAI推出GPTs商店、Meta开源Agent框架及Manus的“零结构工作流”创新。 Q3: GAIA是什么标准？为何选择它衡量AI Agent？ GAIA（General AI Assistant Benchmark）是由Meta提出的评测体系，通过模拟真实场景（如订机票、撰写报告）评估Agent的任务完成度、工具调用准确性和容错能力。其优势在于： • 场景复杂性：涵盖跨平台操作和多步骤决策； • 可扩展性：支持动态添加新工具和评测维度； • 弱监督学习：允许Agent通过少量示例自主迭代策略，贴近实际应用需求。 Q4: MCP是什么？为何成为行业标准？ MCP（Modular Cognitive Pipeline）是由斯坦福团队提出的Agent架构，通过分层模块（感知→规划→执行→反思）实现任务分解与优化。其成功源于： • 灵活性：模块可插拔，适配不同场景（如客服、编程）； • 可解释性：各阶段输出透明，便于调试； • 资源效率：通过动态分配算力降低推理成本。对比端到端模型（如GPT-4），MCP在长周期任务中的稳定性更优。 Q5: AI Agent vs AI Chatbot的关键突破核心差异在于主动性与工具链集成： • Chatbot：被动响应、依赖明确指令，局限于单轮对话； • Agent：主动拆解模糊需求（如“帮我策划旅行”），调用航班API、酒店比价工具并生成行程表。技术突破包括：长上下文记忆、工具调用API标准化（如OpenAI Function Calling）、基于人类反馈的强化学习（RLHF）优化决策链。 Q6: Manus最让人惊艳的地方 Manus的颠覆性在于零结构交互：用户无需预设流程，仅需输入目标（如“开发一款小游戏”），Agent即可自主拆解需求（设计→编码→测试→部署），并通过动态工作流协调多工具（如GitHub Copilot、Unity）。其Demo视频中，从零到可运行游戏的端到端完成度高达90%，远超同类产品。 Q7: Manus的核心创新技术亮点包括： 1. 动态工作流引擎：基于强化学习实时调整任务优先级； 2. 工具链自适应：自动匹配API并处理异常（如API版本不兼容）； 3. 用户意图模糊匹配：通过多轮对话澄清需求（如“游戏类型是2D还是3D？”）。产品层面，其“Less Structure”理念降低了用户学习成本，实现“所想即所得”。 Q8: Manus如何体现AI Agent的「复利」效应？复利效应体现在： • 数据飞轮：用户使用产生的反馈数据持续优化工作流； • 工具生态正循环：更多开发者接入API→Agent能力扩展→吸引更多用户； • 边际成本递减：完成100个任务的成本远低于100倍单任务成本。例如，Manus在游戏开发场景中，复用代码模块使后续任务效率提升40%。 Q9: 为何Monica团队能做出Manus？ Monica（浏览器插件起家）的积累在于： • 用户场景洞察：长期服务内容创作者，理解自动化痛点； • 工程化经验：处理海量API调用（如GPT-3.5、MidJourney）； • 快速迭代文化：通过A/B测试验证功能优先级。此外，其“套壳”阶段积累的流量为Manus提供了早期种子用户。 Q10: "Less Structure, More Intelligence"的意义该方法论颠覆传统流程引擎（如Zapier需预设IFTTT规则），通过大模型直接解析用户意图并生成动态工作流。例如，用户说“分析Q2销售数据”，Agent自动选择SQL查询→Tableau可视化→PPT生成工具链，减少人工配置。技术关键在于模型对工具语义的理解（如“分析”对应数据分析API）。 Q11: 中美大厂谁将率先发布类Manus产品？ • 硅谷：微软（Copilot Studio）、Google（Project Astra）凭借云+工具链优势； • 中国：字节（豆包）、阿里（通义）可能从垂类切入（如电商运营Agent）。但大厂受限于组织惯性，初创公司（如Replit、Cognition）在场景创新上更灵活。 Q12: AI Agent创业方向主要赛道包括： • 垂类自动化：法律合同审核、医疗诊断辅助； • 开发工具：低代码平台集成Agent（如Vercel+GPT）； • 个人助理：Calendar调度、邮件智能回复。难点在于平衡通用性与垂直场景的深度。 Q13: Agentic AI的核心竞争点长期竞争力取决于： • 工具生态壁垒：独家接入高频API（如Salesforce、Figma）； • 工作流可迁移性：跨场景复用能力（如从写邮件扩展到项目管理）； • 用户习惯绑定：通过个性化记忆（如偏好、历史数据）提升替换成本。 Q14: 创业公司如何抓住机会？策略建议： • 聚焦高价值场景：如财务审计、代码审查，替代人工耗时环节； • 构建数据护城河：通过私有化部署积累行业知识库； • 差异化定价：按任务复杂度而非Token计费，贴合企业预算逻辑。 Q15: 对英伟达的影响？短期利好（训练算力需求增长），但长期隐忧： • 边缘计算崛起：Agent本地化部署（如手机端）降低对云端GPU依赖； • 推理优化需求：专用芯片（如Groq LPU）可能分流市场。英伟达需强化CUDA生态与推理框架（如Triton）的整合。 Q16: Agent时代到来了吗？已进入早期爆发期，但全面普及需突破： • 可靠性瓶颈：复杂任务容错率需达99%以上； • 法规合规：自动化决策的权责界定（如医疗误诊责任）； • 用户信任建立：通过透明化决策过程（如显示工作流步骤）降低使用门槛。 Q17: ChatBot到Agent的产品形态变化本质变化包括： • 交互范式：从问答式对话转向目标导向协作； • 价值定位：从“信息提供者”变为“任务执行者”； • 技术架构：单一模型→模型+工具链+记忆库的协同系统。 Q18: 技术与产品的边界 “模型即产品”仍适用于基础层（如GPT-4 API），但Agent赛道需更强调： • 场景适配：同一模型在不同工作流中表现差异显著； • 用户体验：交互设计（如自然语言引导）影响完成率。未来趋势是“模型+工作流引擎+UI”三位一体。 Q19: 受益与被颠覆的行业受益行业： • 客服：自动化处理80%常见问题； • 教育：个性化学习路径规划；颠覆风险： • 基础白领工作：报告撰写、数据分析岗位； • 传统软件：部分SaaS功能被Agent替代（如HubSpot营销自动化）。 Q20: 个体如何适应？建议行动： • 掌握Prompt工程：精准表达需求提升协作效率； • 人机协作思维：将Agent视为“数字同事”，分工处理机械性任务； • 数据素养升级：理解Agent决策逻辑，避免过度依赖。例如，律师可专注策略制定，由Agent处理法条检索。以上回答结合技术逻辑、行业案例及趋势预判，力求系统覆盖播客讨论的核心议题。

13分钟

36

1个月前

月之暗面仲裁案从令人心动的 offer6聊起

主播太懒，以下 show notes 依然是由豆包听音频总结的播客主要内容： 1. 月之暗面仲裁案情况：朱啸虎起诉月之暗面，涉及职务作品问题，事件全貌未公开，需观察。 2. 观点引出：借电影《好东西》中“给年轻人机会”台词，主播认为朱啸虎应在大模型投资案上给年轻人机会，而非抓细节挽回面子。 3. 结合综艺案例 • 综艺详情：《令人心动的offer》第六季中，C1、C2、C3创立R3公司，后因技术分歧离开，R1、R2重组R3并转移资产债务至子公司使其上市，C1、C2、C3因股份兑现问题提出仲裁，体现商业行为复杂及仲裁难度。 • 关联分析：月之暗面仲裁案与之相反，在香港普通法系下，面临漫长仲裁与巨额律师费，难以分清对错，主播认为若月之暗面有错朱啸虎会直接诉讼，现仲裁说明情况复杂，其创始团队已做合法流程。 4. 职务作品理解：以牛顿为例，说明员工离司后创企不能简单认定为职务作品，要考虑员工自身能力和新公司独立性。 5. 月之暗面技术看法：主播认为靠风投训练大模型的创业公司有价值洇灭问题，只有公有云大厂能低成本训练，月之暗面做大模型未来或面临危机。主播再次呼吁给年轻人机会。

30分钟

52

4个月前

听了一万六千小时播客后，我的强迫症被 AI 救赎了

以下 show notes 就是豆包替我“听”了本播客输出的，我就保持原汁原味，不改动，也不加时间戳了。播客“天天大模型，夜夜聊AI”第X期：AI如何改变播客生态及个人听播体验一、开场 1. 主题引入 • 分享近期对AI行业的观察，从八股文到数理化新学认知思维提升阶段。 • 发现AI新功能，欲探讨其对播客相关影响。 2. 个人播客收听背景 • 十几年前海外工作时开始听播客，早期形式多样，近期集中于新平台，累计收听超一万六千小时（近两年多）。 • 播客信息密度低，可与看书等并行，每天听约8小时，养成习惯后像强迫症一样，新内容必听，甚至追听感兴趣的。二、AI功能介绍（一）分享链接至AI平台生成Show Notes 1. 功能实现方式 • 可将播客链接分享给字节跳动的豆包或腾讯的混元大模型。 • 平台抓取音频，几秒内转换识别成文字，基于大语言模型通读理解后输出类似Show Notes的内容总结，包含各时间戳对应内容。 2. 功能优势及初期问题 • 优势：总结有时比主播写得准确、更好。 • 初期问题：部分主播反馈不好，但如同汽车刚出现时，新生事物需时间演进完善。（二）AI辅助播客生成（未来趋势） 1. 实现逻辑 • 主播提供大纲、重要观点及例子，结合语音输入，利用AI多模态功能（文字、图像、视频、声音一体），平台根据这些信息合成播客内容，且能模仿主播声音。 2. 现有案例及问题 • 美国已有尝试，虽观点表达连贯，但缺乏真人思想，前言后语连接生硬，不过技术在进步。三、AI对播客生态影响（一）对播客创作的影响 1. 改变创作方式 • 主播可能从自己录音转变为提供大纲等信息由AI生成播客，且生成内容可能更精炼。（二）对播客平台的冲击 1. 平台现有价值及AI搜索优势 • 现有平台价值在于集中播客入口链接，提供基于关键字搜索及推荐功能。 • AI搜索基于理解，如根据用户描述心情、需求等精准定位推荐播客，更智能地排除无关内容，提升搜索效率。四、个人听播体验改变 1. 缓解听播强迫症 • 过去靠加速听播仍觉信息冲击大，新功能可在听播前由AI生成内容总结，提供内心支撑，便于选择感兴趣部分，减少听播压力，改变强迫症式听播方式。五、总结与展望 1. 总结AI新功能对个人及播客行业的影响，鼓励初期听播客者多尝试不同播客，享受播客乐趣，同时期待AI在播客领域进一步发展带来更多改变。查看音频文稿 1. AI新功能对播客收听及创作影响的分享（新录音救赎.m4a）

23分钟

99+

4个月前

AI 时代的机会就是从八股文到民国新学数理化

1:30 从八股文到新学的数理化是认知的全新思维体系， 5:12 2022 年 11 月是人工智能新时代的分水岭，真人工智能“涌现”了， 15:00 拿开源大模型来做应用层就好比给身体穿花衣服，而不能给身体整容来增强身体能力 16:35 大模型训练是价值湮灭，至今国内也就剩十余家还在做预训练。新版本练出来，旧的几千万就清零了， 21:36 目前的 AI 处于八股秀才到新学大家的时期，范式变了，但其实还没有人做对，未来还是未知与全新的技术与商业， 35:56 AI的未来是改变社会整体的信息传递，创造新的信息流动方式。

41分钟

43

4个月前

> 全部音频

喜欢听语迟者说的人也喜欢的播客...