【AI日报】EP.80 1月15 1秒出图!英伟达开源文生图模型Sana;

Aishaobing的个人播客

【AI模型发布】 🚀 NVIDIA开源Sana图像生成模型 * 仅0.6亿参数实现4K图像生成 * 1秒内完成生成过程 * 支持中英文和emoji提示 源链接:https://nv-sana.mit.edu/ 【AI政策与规划】 📋 OpenAI发布经济蓝图 * 呼吁美国加强AI监管与发展 * 建议增加政府投资力度 * 强调知识产权灵活性重要性 【编程工具】 💻 Mistral发布Codestral25.01 * 代码生成速度提升两倍 * Python测试达86.6%准确率 * 专注低延迟高频操作 源链接:https://mistral.ai/news/codestral-2501/ 【AI框架】 🔧 清华复旦斯坦福联合发布Eko框架 * 支持快速构建生产级Agent * 实现电脑自动化操作 * 提供简单代码与自然语言接口 源链接:https://eko.fellou.ai/ 【设计工具】 🎨 Adobe推出Bulk Create批量编辑工具 * 支持万张图片批量处理 * 无需Photoshop许可 * Web端即可完成操作 【图像处理】 ✨ 微软画图新增AI擦除功能 * 一键删除图片任意元素 * 40-80秒完成处理 * 无需专用硬件支持 【产业合作】 🤝 阶跃星辰与茶百道深度合作 * 引入智能巡检系统 * 提升奶茶制作效率 * 每天服务百万杯饮品 【创业投资】 💰 Hitems获数千万美元Pre-A轮融资 * 由美团龙珠领投 * 估值约1.5亿美元 * 专注AI创意商品化 源链接:https://mbzuai-oryx.github.io/LlamaV-o1/ 【电商工具】 🎥 阿里妈妈推出淘宝星辰 * 支持图片生成视频功能 * 结合电商数据与设计语言 * 降低内容制作成本 体验入口:https://agi.taobao.com/ 20251 月 15 日直播课程报名链接 加入飞书日程: https://www.feishu.cn/calendar/share?token=ac10227ed86c824fe813100860214e08 日程主题: AI工具实操演示-AI视频案例制作拆解 时间: 2025年1月15日(周三) 20:00 - 21:00 (GMT+8) 组织者: 添锦(AI 共学会)

5分钟
57
11个月前

【AI日报】EP.79 1月14 国产之光!DeepSeek APP正式上线;

Aishaobing的个人播客

【国产AI应用】🚀 DeepSeek APP重磅发布 * iOS与安卓双平台支持 * 深度思考链分析能力 * 联网搜索+实时对话功能 * 智能写作与编程辅助 体验入口:已上线各大应用商店 【视频生成突破】🎬 潞晨Video Ocean V2.0发布 * 20秒生成高清视频 * 完全免费使用 * 高真实感画质与动作表现 * 多种创作风格支持 体验入口:video.luchentech.com/zh-CN 【AI巨头动态】🤖 OpenAI拓展机器人研发 * 组建专业机器人团队 * 年薪34-44万美元招募工程师 * 研发定制传感器与类人机器人 * 重点发展自适应技术 【内容变现新趋势】💰 AI公司收购创作者视频 * OpenAI、谷歌每分钟1-4美元收购 * 高质量4K、无人机视频优先 * 设有创作者权益保护条款 【企业创新】🌟 LG进军人形机器人 * CES2025发布AI智能体Q9 * 与微软达成战略合作 * 布局家庭、汽车、酒店场景 【行业政策】📋 数据标注产业新规 * 制定AI训练相关职业标准 * 推动产业专业化发展 * 目标2027年增长率超20% 【技术创新】🎨 NeuralSVG文本生成矢量图 * 支持动态调整设计元素 * 多层次结构SVG生成 * 适合设计师与艺术工作者 项目链接:https://sagipolaczek.github.io/NeuralSVG/ 【开源项目】📊 ViTPose姿态识别更新 * 采用视觉Transformer架构 * 简化模型提升效率 * 多场景适配能力强 项目链接:https://huggingface.co/spaces/hysts/ViTPose-transformers 【安全警示】⚠️ AI爬虫导致网站瘫痪事件 * Trilegangers遭GPTBot频繁抓取 * 突显robots.txt设置重要性 * 建议加强网站访问控制

5分钟
73
11个月前

【AI日报】EP.78 1月11 海螺AI推主体参考功能;商汤科技发布 “日日新” 融合大模型;

Aishaobing的个人播客

【AI工具】 🦑 海螺AI重磅更新主体参考功能 * 一张图片实现角色跨场景自由活动 * 生成速度提升至秒级响应 * 预计2028年市场规模将达1075亿美元 详情链接:https://hailuoai.com/video/create 【大模型】 🧠 商汤科技发布"日日新"融合大模型 * 多项权威评测获第一 * 文科全球第一,理科国内第一 * 在自动驾驶、金融等多领域展现潜力 产品链接:https://chat.sensetime.com/ 【AI应用】 🤖 xAI首款独立应用Grok上架App Store * 免费下载体验 * 仅限美国市场测试 * 支持访问最新Grok2模型 【AI安全】 🛡️ OpenAI延迟推出AI代理系统 * 担忧"提示注入"攻击风险 * 其他公司如微软和Anthropic已推出AI代理 * 持续加强产品安全性 【版权保护】 ⚖️ Meta面临版权侵权诉讼 * 被指使用LibGen数据集训练Llama * 涉嫌删除版权信息 * 通过torrenting下载盗版内容 【产品创新】 ✨ ChatGPT推出个性化性格设置 * 支持自定义昵称和职业 * 可选择AI助手性格特征 * 提供更个性化的对话体验 【技术突破】 📐 微软联合清北推出rStar-Math * 小型模型性能超越OpenAI o1-preview * 计划在Github开源代码 技术论文:https://arxiv.org/pdf/2501.04519 【企业服务】 🏢 Cohere发布安全AI平台"North" * 直接竞争微软Copilot和谷歌Vertex AI * 加拿大皇家银行成为早期用户 * 专注金融和医疗等受监管行业 产品链接:https://cohere.com/north 【搜索服务】 🏨 Perplexity与Tripadvisor达成合作 * 提供更详细的酒店信息 * 支持多维度搜索结果 * 网页版已上线,移动应用版即将推出

4分钟
65
11个月前

【AI日报】EP.77 1月10 “即创”正式版上线;2024胡润中国AI企业50强榜单;通义万相推2.1视频模型;

Aishaobing的个人播客

【AIGC工具】 🎨 巨量引擎"即创"正式版发布 * 支持AI脚本生成、智能成片和数字人 * 新增爆款裂变和一键过审功能 * 深度学习驱动的高效创作平台 详情链接:https://top.aibase.com/tool/douyinjichuang 【视频模型】 🎬 通义万相2.1版本重磅升级 * 推出极速版与专业版双选择 * 大幅提升复杂运动处理能力 * 显著改善电影质感和指令遵循 详情链接:https://tongyi.aliyun.com/wanxiang/videoCreation 【模型开源】 🤖 微软开源Phi-4小型语言模型 * 140亿参数规模创新高 * AMC数学竞赛获91.8高分 * 支持16k上下文长度 详情链接:https://huggingface.co/microsoft/phi-4 【视频技术】 📹 SeedVR创新视频修复技术发布 * 移动窗口注意力机制 * 支持任意长度视频处理 * 优化AI生成视频质量 详情链接:https://iceclear.github.io/projects/seedvr/ 【特效技术】 ✨ Adobe TransPixar突破性进展 * 优化透明元素处理效果 * 提升Alpha通道生成效率 * 降低特效制作成本 详情链接:https://stability.ai/news/stable-point-aware-3d 【视频增强】 🎥 STAR模型助力视频超分辨率 * 基于文本到视频模型架构 * 开源预训练模型与代码 * 显著提升低分辨率视频质量 详情链接:https://github.com/NJU-PCALab/STAR 【3D建模】 🎮 Stability AI发布SPAR3D技术 * 秒级单图生成3D模型 * 支持实时编辑与调整 * 开放商业使用授权 详情链接:https://stability.ai/news/stable-point-aware-3d 【行业监管】 📋 AI服务备案持续推进 * 2024年新增238款服务 * 累计完成302款备案 * 加强舆论属性服务管理 【产品调整】 🔄 Bing图像生成器回归DALL-E * 响应用户反馈意见 * 改善细节处理效果 * 预计数周完成调整

3分钟
47
11个月前

【AI日报】EP.75 1月8 零一万物否认被阿里收购;ChatGPT Pro订阅仍亏钱;

Aishaobing的个人播客

【企业动态】 🏢 零一万物辟谣阿里收购传闻 * 与阿里云为深度合作伙伴关系 * 双方共同推进"产业大模型实验室" * 2025年将专注应用落地与业务增长 【AI服务】 💰 ChatGPT Pro月费200美元仍亏损 * 用户使用量超出预期致成本上升 * "思维链"方法增加硬件资源消耗 * OpenAI计划转型公众利益公司吸引投资 【技术突破】 🚀 VITA-1.5实现多模态交互升级 * 交互延迟降至1.5秒 * 支持中英双语交互 * ASR错误率降至7.5 项目链接:https://github.com/VITA-MLLM/VITA?tab=readme-ov-file 【硬件创新】 🌍 NVIDIA发布Cosmos世界基础模型 * 加速物理AI系统开发 * 整合视频标记和安全机制 * 降低真实数据依赖 产品链接:https://nvidianews.nvidia.com/news/nvidia-launches-cosmos-world-foundation-model-platform-to-accelerate-physical-ai-development 【搜索引擎】 🔍 MiniPerplx开源搜索引擎亮相 * 支持Twitter和YouTube内容搜索 * 实时热点话题更新 * 基于Gork技术驱动 项目链接:https://mplx.run/ 【智能家电】 📺 TCL电视将整合谷歌Gemini AI * 2025年推出首款Gemini AI智能电视 * 提供智能语音交互 * 实现个性化内容推荐 【移动科技】 📱 高通发布Snapdragon X系列芯片 * 显著提升PC性能与续航 * 支持AI驱动车内体验 * 助力智能家居发展 【AI训练】 ⚡ 谷歌SALT方法提升训练效率 * 训练时间缩短28% * 采用小模型辅助训练 * 显著提升任务准确率 【系统优化】 🍎 苹果更新AI新闻摘要功能 * 提高新闻摘要准确性 * 优化用户识别AI生成内容 * 保留用户选择权 【机器人技术】 🤖 三星Ballie机器人即将发布 * 2025年正式上市 * 具备视觉识别和投影功能 * 支持智能家居设备控制

5分钟
49
11个月前

【AI日报】EP.74 1月7 昆仑万维天工版o1、4o同时上线;罗永浩新项目发布AI助理 “J1 Assistant”

Aishaobing的个人播客

【大模型升级】 🤖 昆仑万维天工4.0双版本发布 * o1版首创中文逻辑推理能力 * 4o版支持多模态和情感表达 * 多语言交互提升用户体验 详情链接:https://www.tiangong.cn/ 【AI助手】 🎤 罗永浩推出J1 Assistant * 优化语音交互体验 * 集成备忘录功能 * 目前仅支持海外安卓版本 【法律纠纷】 ⚖️ 爱奇艺起诉MiniMax * 涉嫌侵犯版权训练模型 * 要求赔偿10万元 * 等待双方进一步回应 【技术创新】 🎨 阿里达摩院SHMT模型突破 * 实现精准妆容迁移 * 已被NeurIPS 2024收录 * 开源代码支持二次开发 项目链接:https://github.com/Snowfallingplum/SHMT 【视频技术】 🎬 字节跳动开源LatentSync * 端到端唇形同步技术 * 支持精确音视频匹配 * 引入TREPA提升准确性 项目链接:https://github.com/bytedance/LatentSync 【行业动态】 🌟 OpenAI转向超级智能研发 * 宣布掌握AGI核心技术 * 关注科技创新应用 * 持续优化运行成本 【基建投资】 💰 微软800亿建设AI数据中心 * 主要投资美国本土 * 提升AI训练算力 * 应对电力需求挑战 【安全技术】 🔋 NIST研发电池火灾预警 * AI识别率达94% * 提前2分钟预警 * 应对新能源安全隐患 【模型升级】 💻 Grok3即将发布 * 性能提升10倍 * 使用10万块H100芯片 * 完成预训练阶段

5分钟
42
11个月前

【AI日报】EP.72 1月4 阿里入局AI眼镜;套壳AI产品TypingMind赚百万美元

Aishaobing的个人播客

【AI眼镜】 🌟 阿里云与雷驰创新达成战略合作 * 共同推进AI眼镜技术发展 * 雷驰将于1月7日发布V3AI拍摄眼镜 * 结合通义系列大模型与硬件能力 【AI人物】 💔 DeepMind科学家Felix Hill去世 * 享年41岁,因精神疾病不幸离世 * 在与抑郁症斗争中取得显著学术成就 * 引发对AI从业者心理健康的关注 【创业故事】 💰 TypingMind创始人20个月赚百万美元 * ChatGPT第三方工具获得成功 * 通过订阅业务模式实现盈利 * 积极开展B2B业务拓展 项目链接:https://news.tonydinh.com/p/nov-2024-my-first-million 【AI创新】 🎨 DiffSensei:AI自动将文字转漫画 * 北大等机构联合开发的创新系统 * 结合扩散模型与大语言模型 * 创建包含43000多页漫画的数据集 项目入口:https://top.aibase.com/tool/diffsensei 【芯片突破】 🚀 国产AI芯片新进展 * 通义千问成功部署黑芝麻车规级芯片 * 支持离线多轮对话功能 * 推进智能汽车领域技术发展 【AI系统】 ⚡ 微软LAM模型重大突破 * 自主执行Windows程序能力 * 测试成功率达71%,超越GPT-4 * 展现AI助手新发展方向 【技术融合】 🔧 NVIDIA发布ChipAlign * 解决LLM在芯片设计领域挑战 * 性能提升显著(最高26.6%) * 展现专业领域应用潜力 【学术进展】 📚 斯坦福开源STORM写作系统 * 一键生成高质量长文 * 整合多源信息能力 * 提升科研写作效率 论文:https://www.arxiv.org/pdf/2408.15232 【硬件创新】 💻 微软迷你AI PC即将发布 * 支持Copilot Plus等AI功能 * 华硕和Geekom率先推出产品 * CES展会将展示更多细节

4分钟
60
11个月前

【AI日报】EP.71 1月3 百度Web端首页上线“AI搜”入口;字节跳动否认开发AI手机传闻;

Aishaobing的个人播客

📱 百度搜索升级 * Web端首页正式上线"AI搜"入口 * 基于文心大模型,整合多平台内容 * 支持话题探索和智能问答功能 📲 字节跳动辟谣AI手机研发 * 否认与努比亚合作开发AI手机传闻 * 声明未有相关开发计划 * 将继续专注现有产品AI技术应用 🎨 VMix技术突破 * 字节跳动与中国科大联合开发 * 提升扩散模型美学表现 * 支持即插即用,兼容多种社区模型 项目链接:https://vmix-diffusion.github.io/VMix/ 🎵 TangoFlux音频新技术 * 3秒内生成30秒高质量音频 * 引入CRPO优化框架 * 代码已开源,推动音频生成研究 项目链接:https://tangoflux.github.io/ 🤖 HuggingFace发布smolagents * 简化智能代理构建流程 * 提供多种工具支持 * 支持安全沙盒环境 详情链接:https://huggingface.co/blog/smolagents 📊 AI审稿问题研究 * 上海交通大学最新研究成果 * 揭示LLM审稿存在操控风险 * 建议完善安全措施 论文链接:https://arxiv.org/pdf/2412.01708 💡 OpenAI模型参数曝光 * o1-preview约300B参数 * GPT-4o为200B,GPT-4o-mini为8B * Claude3.5 Sonnet医疗测试表现突出 论文链接:https://arxiv.org/pdf/2412.19260 💰 英伟达大手笔投资 * 2024年投资10亿美元支持AI初创企业 * 覆盖医疗、金融、教育等领域 * 推动多行业创新解决方案 🌟 百度25周年展望 * 李彦宏发布全员信 * 预测2025年AI应用井喷 * 承诺超20%资金投入研发

4分钟
49
11个月前

【AI日报】EP.70 1月2 可灵AI API对口型能力全面开放;豆包大模型宣称追平GPT-4;

Aishaobing的个人播客

【模型升级】 🚀 可灵AI API重大更新 * V1.5版本支持组合服装试穿 * 对口型能力全面开放 * 优化电商应用体验 【技术突破】 💡 豆包大模型追平GPT-4 * 首次展示300万长文本处理能力 * 处理延迟控制在15秒内 * 在复杂场景超越GPT-4表现 【开发工具】 ⚙️ GLM-Zero预览版上线 * 基于扩展强化学习技术 * 专注数理逻辑和代码编写 * 支持免费体验和API调用 项目链接:https://chatglm.cn/main/gdetail/676411c38945bbc58a905d31?lang=zh 【产品创新】 🤖 智元机器人发布AgiBot World * 全球首个百万真机数据集 * 覆盖五大核心场景 * 包含3000+种物品和80+种技能 项目链接:https://github.com/OpenDriveLab/agibot-world 【开发框架】 🛠️ Hugging Face推出SmolAgents * 三行代码构建智能代理 * 支持多种AI开发功能 * 降低开发门槛 项目链接:https://github.com/huggingface/smolagents 【价格调整】 💰 阿里云Qwen-VL大幅降价 * 降价幅度超80% * 1元处理600张720P图片 * 新增KV Cache计费模式 【行业动态】 📊 通义发布年轻人AI使用报告 * 95后关注度最高 * 80%受访者高度关注AI * 近半数用户每天使用 【监管政策】 📋 上海新增9款AI服务登记 * 总登记数达63款 * 强制标明上线编号 * 提升服务透明度 【企业并购】 🤝 Nvidia收购Run:ai * 交易估值7亿美元 * 承诺开源GPU管理软件 * 推动AI生态发展 【产品规划】 🌟 OpenAI公布2025年产品线 * 将推出AGI和智能体功能 * 计划推出"成人模式" * 优化现有服务体验

7分钟
49
11个月前

【AI日报】EP.69 12月31 5秒一个视频!PixVerse V3.5上线;雷军千万年薪挖角AI天才少女;

Aishaobing的个人播客

1. 【AI视频生成】💻 爱诗科技PixVerse V3.5版上线 * 最快5秒生成视频,动漫效果大幅提升 * 支持1080p高清画质和多种风格切换 * A+轮融资助力技术研发,推动AI视频生成技术发展 2. 【AI人才】💰 雷军千万年薪挖角AI天才少女罗福莉 * 95后AI天才,曾在顶级会议发表多篇论文 * 小米加大AI投入,成立AI实验室大模型团队 * 预计2024/2025年研发费用将达240亿/300亿元 3. 【AI应用】🌿 支付宝推出新一代AI视觉搜索产品“探一下” * 利用多模态大模型技术,用AI之眼探索万物 * 可识别花草宠物,提供旅游讲解、商品药品信息等服务 * “探灵感”、“探文本”功能,提供趣味解读和外文翻译 4. 【AI工具】🎦 开箱即用!一键式AI数字人系统AigcPanel * 简化环境配置,实现视频合成、声音合成与声音克隆 * 支持多种操作系统,中英文界面,完全开源 * 用户可自由定制和管理AI模型 详情链接:aigcpanel.com 5. 【AI伦理】💼 OpenAI宣布营利化重组计划,或将面临法律挑战 * 重新注册为特拉华州的公益公司,继续推动通用人工智能的使命 * 联合创始人埃隆·马斯克已提起诉讼,指责其将利润置于公共利益之上 * Meta公司也对这一转型表示关切 6. 【AI视频】🎥 腾讯出品! StereoCrafter: 输入2D视频转3D视频 * 将普通的2D 视频转换为高保真的立体3D 视频 * 通过深度视频重构和立体视频修复两个步骤,提升生成效果 * 构建高质量数据集,支持算法训练,确保输出质量 详情链接:stereocrafter.github.io 7. 【AI争议】🕵️♂️ OpenAI举报者之死引发父母要求FBI调查 * 前OpenAI研究员巴拉吉被发现死亡,警方初步判断为自杀 * 父母质疑调查结果,认为其没有心理疾病,也未留下遗书 * 巴拉吉曾公开指责OpenAI侵犯版权,致力于创作人权益 8. 【AI产业】🤝 迅雷在杭州建立全球AI总部,携手推动数字经济发展 * 与杭州未来科技城管委会签署合作协议 * 未来总部将依托余杭区优势,推进人工智能创新战略 * 预计将促进当地经济增长和技术进步 9. 【AI研究】🔍 人工生命搜索模型,用来发现新的人工生命形式 * 首次提出的“人工生命自动搜索”(ASAL)方法 * 利用视觉语言基础模型,减轻人工生命领域依赖手动设计和试错的负担 * 成功发现新的生命形式,并量化以往定性现象 详情链接:github.com 10. 【AI战略】🚀 谷歌CEO称: AI模型Gemini将是2025年公司的“重中之重” * 2025年将是谷歌发展的关键一年,尤其是在人工智能领域 * Gemini应用已取得强劲的势头,但仍需加快步伐 * 明年将重点关注Gemini在消费端的扩展,增强市场竞争力

7分钟
41
11个月前
EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧