UV相对论 - S23:谁都能听懂的AI基础课②AI怎么造出来的？能做什么？未来会怎么发展？ - EarsOnMe

主播

Firemo 1 档播客

AlexXu许怡然 1 档播客

节目简介

来源：小宇宙

本期核心话题

从零解析AI训练全流程：揭秘数据集制备、监督学习与人类标注师的幕后工作

突破性发现：程序代码训练如何意外赋予AI逻辑思维链能力（5700亿语料中代码占比＞电子书）

AI演进三大方向：通用大模型vs垂直小模型分化、多模态融合技术瓶颈、文化属性植入必要性

算力革命进行时：专用AI芯片崛起与个人算力中心的未来想象（穿戴设备本地化部署案例）

应用层突围路径：RAG技术实现企业知识库瞬时调取、语音交互重构OS系统交互逻辑

关键概念解读

▸ 过拟合陷阱：30张照片训练如何导致AI产生"衣领刻板印象"

▸ 蒸馏原理：用小模型高效继承大模型能力的"技术捷径"

▸ 开源悖论：Meta斥资50亿收购标注公司的商业逻辑 vs 大厂开源战略

▸ 训练集质量真相：维基百科仅占GPT-3语料3%，专业语库C4占比60%

前沿洞察

• 医疗AI跨界启示：核磁采样器如何优化图像生成算法

• Rewind技术革命：十兆/日的记忆压缩比实现数字分身

• 致命缺陷：AI生成内容作为训练数据导致的代际劣化

• 硬件新战场：亚马逊AI穿戴设备与离线算力解决方案

工具指南

→ FastGPT/Dify本地化部署方案

→ 企业级RAG系统搭建实录（游戏公司培训案例）

→ 警惕SaaS化陷阱：私有化部署的成本临界点测算

时间戳

00:00 本期续讲AI训练内容与近期发展动向点评

00:04 监督学习过程：人类纠正AI判断错误示例

00:08 AI数据清洗正确率超人类达90%里程碑

00:13 开源精神提升效率避免重复造轮子

00:20 训练LORA模型示例：30张照片防过拟合

00:28 AI生成内容作为训练导致代际劣化问题

00:33 GPT-3语料来源：C4占60%维基百科仅3%

00:44 程序代码训练赋予AI逻辑思维链能力

00:48 AI演进三方向：大模型、专业模型、算法

01:06 Rewind技术实现个人记忆压缩与数字分身

01:23 企业RAG系统案例缩短新员工培训时间

01:27 工具推荐：FastGPT和Dify本地部署方案

01:33 AI应用未来需细分本地化与个性化

01:36 下期探讨AI具体应用与普通人接触方式

S23:谁都能听懂的AI基础课②AI怎么造出来的？能做什么？未来会怎么发展？

加入我们的 Discord

扫描微信二维码

播放列表