主播
节目简介
来源:小宇宙
我们这期聊到了一件很具体的事:一个人,一间不让猫进去的房间,里面堆着几十块从拼多多淘来的二手硬盘。这是语丝做大模型多模态数据的日常现场。
从这个细节往外看,你会发现这个行业比你以为的更"物理"——TB级的视频数据,最快的传输方案是"拿着硬盘走过去";文本模型的预训练已经基本收尾,卡点转移到了人类专家才能回答的那些极限难题上;而模型训练最稀缺的资源,已经不是算力,是认知。
但这期真正想聊的,不只是数据工程。语丝做大模型数据已经五年,从来没有"决定"过要创业——是客户一个一个推着她走到今天。一人公司,不是她想清楚了才做的选择,是生活逼出来的形状。
周均80小时、单休、身体亮红灯、请假要"胆战心惊"……她离开的原因说起来平静,但听着很重。她现在在全球飞,用公司给自己报销差旅——公司是她的。这个感觉,她说"很不一样"。
技术的进步,终究是为了让人活得更像人。
欢迎收听新一期 AI Odyssey。
嘉宾
语丝:5年LLM data cooker,一人公司在跑,经手数据订单百万美元以上。欢迎来小红书找我玩~
主播:
PongPong:连续创业者,AI初创公司产品负责人
时间轴 (Timeline)
00:32 嘉宾介绍
01:17 数据准备全流程:从线索收集、爬取下载、格式清洗到人工标注的完整链路
01:46 预训练阶段数据核心:通过全量、多样化数据构建模型常识与世界理解
02:48 SFT与RL阶段数据核心:跨越认知差,向模型蒸馏专家级的高认知内容
05:10 数据采购市场现状:文本预训练告一段落,高认知垂域专家数据成核心采购目标
07:07 OPC业务方向选择:聚焦高认知HLE数据项目管理与多模态视频工程
08:22 多模态数据工程挑战:突破网速带宽、本地存储与物理快递交付的限制
10:36 实习生误删数据后的紧急补救:双倍算力、双倍带宽,代价是时间和成本同时翻倍
14:12 OPC隐形资产管理:“硬盘定投”策略与拼多多二手硬盘的通电筛查逻辑
18:30 OPC商业模式起源:打工职级受限,被客户真实交付需求反推注册成立一人公司
21:49 OPC营销与市场杠杆:利用小红书精准筛选受众、合伙人与客户资源
26:51 AI接管执行后,如何从"强迫症J人"解放出来:按季度定节点,其余放手去活
30:26 OPC与模型厂上班压力对比:拥抱高不确定性,规避“不认同目标却需全情投入”的组织内耗
33:35 逃离模型厂上班动因:周均超80小时高压单休导致健康危机,促使转向OPC模式寻找生活平衡
39:01 找到自己的热爱:当执行不再是卡点,驾驭AI的人靠什么定义自己的价值
以上就是本期的全部内容了,欢迎您的收听,我们下期再见~
PS:AI Odyssey 听友群正式开通了,添加 vx:aiodysseyai 带你一起看 AI。
从这个细节往外看,你会发现这个行业比你以为的更"物理"——TB级的视频数据,最快的传输方案是"拿着硬盘走过去";文本模型的预训练已经基本收尾,卡点转移到了人类专家才能回答的那些极限难题上;而模型训练最稀缺的资源,已经不是算力,是认知。
但这期真正想聊的,不只是数据工程。语丝做大模型数据已经五年,从来没有"决定"过要创业——是客户一个一个推着她走到今天。一人公司,不是她想清楚了才做的选择,是生活逼出来的形状。
周均80小时、单休、身体亮红灯、请假要"胆战心惊"……她离开的原因说起来平静,但听着很重。她现在在全球飞,用公司给自己报销差旅——公司是她的。这个感觉,她说"很不一样"。
技术的进步,终究是为了让人活得更像人。
欢迎收听新一期 AI Odyssey。
嘉宾
语丝:5年LLM data cooker,一人公司在跑,经手数据订单百万美元以上。欢迎来小红书找我玩~
主播:
PongPong:连续创业者,AI初创公司产品负责人
时间轴 (Timeline)
00:32 嘉宾介绍
01:17 数据准备全流程:从线索收集、爬取下载、格式清洗到人工标注的完整链路
01:46 预训练阶段数据核心:通过全量、多样化数据构建模型常识与世界理解
02:48 SFT与RL阶段数据核心:跨越认知差,向模型蒸馏专家级的高认知内容
05:10 数据采购市场现状:文本预训练告一段落,高认知垂域专家数据成核心采购目标
07:07 OPC业务方向选择:聚焦高认知HLE数据项目管理与多模态视频工程
08:22 多模态数据工程挑战:突破网速带宽、本地存储与物理快递交付的限制
10:36 实习生误删数据后的紧急补救:双倍算力、双倍带宽,代价是时间和成本同时翻倍
14:12 OPC隐形资产管理:“硬盘定投”策略与拼多多二手硬盘的通电筛查逻辑
18:30 OPC商业模式起源:打工职级受限,被客户真实交付需求反推注册成立一人公司
21:49 OPC营销与市场杠杆:利用小红书精准筛选受众、合伙人与客户资源
26:51 AI接管执行后,如何从"强迫症J人"解放出来:按季度定节点,其余放手去活
30:26 OPC与模型厂上班压力对比:拥抱高不确定性,规避“不认同目标却需全情投入”的组织内耗
33:35 逃离模型厂上班动因:周均超80小时高压单休导致健康危机,促使转向OPC模式寻找生活平衡
39:01 找到自己的热爱:当执行不再是卡点,驾驭AI的人靠什么定义自己的价值
以上就是本期的全部内容了,欢迎您的收听,我们下期再见~
PS:AI Odyssey 听友群正式开通了,添加 vx:aiodysseyai 带你一起看 AI。