节目列表: Aishaobing的个人播客 - EarsOnMe

【AI日报】EP.16 11月5日腾讯重磅开源398B参数新模型、xAI与Anthropic掀API价格战

【重磅开源】 🚀 腾讯开源Hunyuan-large大模型 * 总参数量398B，激活参数52B * 支持256K文本序列长度 * 9大维度超越Llama3.1等开源模型 * 即将开源企鹅卷轴评测集【API竞赛】 ⚡ xAI与Anthropic同日发力API市场 * xAI Grok API免费公测，每月赠送25美元额度 * API完全兼容OpenAI和Anthropic * Claude 3.5 Haiku开放API访问 * Haiku价格上调4倍，引发开发者热议【系统集成】 📱 苹果iOS 18.2将集成ChatGPT * 可选升级ChatGPT Plus服务 * 每月订阅费20美元 * 苹果与OpenAI展开深度合作【技术创新】 🎯 Moonshine语音识别模型发布 * 处理速度比Whisper快5倍 * 支持离线运行 * 特别适合短音频处理【学术突破】 🔬 上海AI Lab发布LLaMA版o1 * 复刻OpenAI奥数解题神器 * 采用蒙特卡洛树搜索技术 * 开源预训练数据集与模型【行业应用】 🍽️ 全球首家AI服务餐厅开业 * 提供270万种餐饮搭配建议 * 支持多语言服务 * 智能处理过敏与特殊饮食需求【效率工具】 🔄 跨平台内容同步工具推荐 * 支持一键多平台同步 * 覆盖主流自媒体平台 * 免费用户每日3次同步额度 * 每月9.5元，年付5折优惠爱贝壳内容同步助手 https://mr2urt42at.feishu.cn/docx/SykrdgSSaoPwBEx78IKch8dvnUd

5分钟

18

1年前

【AI日报】EP.15 11月4日ChatNio被数百万收购、Claude 3.5 Sonnet新增PDF处理

Aishaobing的个人播客

【开源项目】 👨‍💻 15岁少年开发ChatNio被数百万收购 * ChatNio接入35款主流AI模型 * 月活10万+，月收入5万 * 开发者有7年项目经验，精通全栈开发【开源商业】 💼 LobeChat云服务公测成果显著 * 月收入突破3万元 * 付费用户达60+ * 面临转化率挑战，将优化产品功能【模型技术】 🎨 阿里通义实验室发布IC-LoRA * 支持生成多张相关联图像 * 具备上下文学习能力 * 大幅降低AI训练成本【功能更新】 📄 Claude 3.5 Sonnet新增PDF处理 * 支持文本和视觉元素分析 * 包含三步处理流程 * 费用随文档长度变化【视频工具】 🎬 ComfyUI-MochiEdit支持视频转视频 * 基于噪声重采样技术 * 实现视频局部编辑 * 提供全新编辑思路【创作工具】 🎥 Runway推出高级摄像机控制 * 支持专业镜头移动控制 * 实现多种拍摄效果 * 打造3D虚拟场景【编程趋势】 🐍 Python成GitHub最受欢迎语言 * 超越JavaScript位居第一 * AI促进开源项目质量提升 * Ollama成最受关注AI项目【音频技术】 🎙️ Hertz-Dev开源音频模型发布 * 拥有8.5亿参数 * 实际延迟仅120毫秒 * 降低AI对话技术门槛【学习资源】 📚 少数派发布AI外语学习教程 * 详解四种AI学习方法 * 提供实用学习建议 * 深入分析AI教育产品

6分钟

24

1年前

【AI日报】EP.14 11月3日全球首款无引擎AI游戏诞生、 Pixverse视频特效引爆社交平台

Aishaobing的个人播客

【AI日报新闻提要 2024.11.03】【重磅新闻】 🎮 全球首款无引擎AI游戏诞生！ - Decart和Etched联合发布Oasis - 纯视频模型生成，支持实时交互 - 已获红杉资本2100万美元投资 - 在专用芯片上可实现4K渲染【技术创新】 🎬 Pixverse视频特效引爆社交平台 - 毒液特效成为爆款，多个作品获数十万赞 - 已开放API接口，开发者机遇显现 - 二手市场炒至每次10元，官方渠道仍免费【行业争议】 🤖 小红书AI内容审核遇挫 - 新推出的AI识别功能频现误判 - 大量真人内容被错误标记 - 引发创作者强烈不满与投诉【医疗突破】 🏥 "华西黉医"医学大模型发布 - 720亿参数级别 - 整合110万医患对话等海量数据 - 病历生成效率提升90% 【效率工具】 💻 豆包Mac版迎重大更新 - 新增语音通话功能 - 支持实时联网信息获取 - 跨语言交互+界面悬浮功能【教育创新】 📚 AI自习室市场蓬勃发展 - 结合AI设备与人工督导 - 在"双减"背景下开创新模式 - 强调教育本质重于技术【行业数据】 📊 B站AIGC内容年度播放量 - 突破300亿次播放 - 科普类内容季度增长29% - 日均观看量超1亿 - AI创作音乐跻身最受欢迎内容【关注趋势】 🔍 AI技术正在重塑多个领域 - 游戏开发模式变革 - 视频创作门槛降低 - 医疗效率大幅提升 - 教育模式持续创新收听完整播报，请锁定AI日报，我们明天再会！ #AI快讯 #技术创新 #数字化转型 #AIGrammar

5分钟

28

1年前

【AI日报】EP.13 11月2日：谷歌LearnAbout重塑学习体验、英伟达入选道指、Meta发布AI触觉传感器

Aishaobing的个人播客

【新闻提要1】 ✨ 谷歌推出新一代AI学习工具LearnAbout 🎯 通过互动时间轴、配图和相关视频构建知识框架 🔍 支持持续追问并智能推荐高质量问题 🌐 目前仅支持美区IP访问【新闻提要2】 📊 B站AIGC内容年度播放量突破300亿 📈 科普类内容季度增长29%，日均观看破1亿 🏆 AI创作音乐成为最受欢迎内容之一【新闻提要3】 🤖 西安交大发布VisionTasker移动设备自动化方案 🎯 基于视觉的UI理解和任务规划两阶段框架 💡 在147个实际任务中展现超越人类的完成能力 🌟 无需大量数据训练即可使用【新闻提要4】 💹 保险业大模型市场规模达5.1万亿元 📈 同比增长5.72%，多家保险公司加速布局 🎯 理赔准确率达98%以上，实现秒级赔付【新闻提要5】 📈 英伟达将被纳入道琼斯工业指数 🔄 取代英特尔成为新的芯片业代表 💡 标志AI和高性能计算重要性提升【新闻提要6】 🤖 Meta发布新一代AI触觉传感器Digit360 🔍 可识别振动、热量甚至气味 🤝 与GelSight和Wonik Robotics合作开发 ⏰ 预计明年正式上市【新闻提要7】 🏷️ 双11期间AI相关软件推出优惠 💡 沉浸式翻译等工具提供半价促销 🔧 支持多种AI模型集成使用

8分钟

19

1年前

【AI日报】EP.012 11月1日：AI搜索领域风起云涌

Aishaobing的个人播客

【新闻提要1：ChatGPT推出网页搜索】 ✨ OpenAI正式为ChatGPT推出网页搜索功能，用户可通过自然对话获取实时信息 🔍 基于GPT-4微调版本，集成多家权威媒体资源 💫 目前仅对Plus会员和Team用户开放，未来将逐步扩展至所有用户详情链接：chat.openai.com 【新闻提要2：Claude推出桌面客户端】 🖥️ Anthropic发布Claude AI桌面应用程序，提升用户交互体验 🎤 移动端新增语音输入功能，扩展使用场景 🚀 跟进竞品，保持市场竞争力详情链接：claude.ai/download 【新闻提要3：谷歌Gemini API搜索升级】 🌐 推出"与谷歌搜索的实时连接"功能 💰 每1000个查询收费35美元，支持灵活的数据检索 🔄 提升AI模型响应准确性，减少虚假信息详情链接：ai.google.dev 【新闻提要4：Blendbox Alpha发布】 🎨 引入图层概念的AI图像生成软件 🔧 支持实时调整纹理、光影、颜色方案 🖼️ 突破提示词限制，让艺术家重获创作自由详情链接：blendbox.ai 【新闻提要5：阿里EcomID支持ComfyUI】 🚀 完美继承InstantID和PuLID优势的人像生成项目 💡 优化架构设计，提升生成效果 ⚙️ 原生支持ComfyUI，降低使用门槛详情链接：github.com/alimama-creative/SDXL_EcomID_ComfyUI 【新闻提要6：Suno推出AI歌手克隆】 🎵 新增Personas功能，支持音乐风格复制 🎼 可提取保存歌曲核心元素，包括人声特点和风格 🔗 支持公开或私密设置，增加社交价值详情链接：suno.ai 【新闻提要7：夸克升级"灵知"学习大模型】 📚 全面升级"AI搜题"产品功能 🧠 支持各类题目搜寻与专业解答 💡 大幅提升搜题与解题效率详情链接：quark.cn 【新闻提要8：字节开源HybridFlow】 ⚡ 大模型训练速度提升20倍，显著降低成本 🛠️ 支持多种RLHF算法，提供模块化API 🔧 创新结合单多控制器模式，优化训练效率详情链接：https://arxiv.org/pdf/2409.19256 【新闻提要9：谷歌地图整合Gemini】 🗺️ 提供智能导航和场所发现体验 🚗 优化导航显示，支持实景导航模式 🌍 扩展至全球150个城市，提升用户体验详情链接：maps.google.com

6分钟

19

1年前

【AI日报】EP.011 10月31日：亲身经历离奇播客制作经历

Aishaobing的个人播客

【新闻提要1:】 🚀 炉米Lumi是字节跳动最新推出的AI模型分享社区平台，提供模型上传分享和训练功能 💡 与LiblibAI功能定位相似，炉米Lumi展示了字节跳动在AI领域的全面布局策略 💥 字节跳动在AI领域已有广泛布局，包括大模型、ChatBot、AI社交、AI虚拟陪伴等多个领域详情链接:https://top.aibase.com/tool/lumilumi 【新闻提要2:】 🔍 RecraftV3实为英国AI初创公司RecraftAI推出的最新图像生成模型，以red_panda身份引发关注 💡 RecraftV3在ArtificialAnalysis排行榜上以1172的ELO评分领先其他模型，收获超过10万次投票 🚀 RecraftV3具备强大的长文本图像生成能力，增强的文本布局和样式控制功能，特别适用于品牌推广、营销和复杂图形设计领域详情链接:https://www.recraft.ai/ 【新闻提要3:】 🔊 ChatGPT的高级语音模式（AVM）正式登陆Windows和Mac平台，提供更自然的实时对话交互体验 🌐 系统新增五种语音选项，支持打断和停顿，满足用户更接近人际交流的需求 💬 用户反馈良好，AI回答准确率高，用户满意度达96%，ChatGPT还推出网页版聊天历史搜索功能【新闻提要4:】 🚀 M4系列芯片采用第二代3纳米制程工艺，提升性能和能效 💻 M4Pro和M4Max芯片支持雷雳5和统一内存带宽提升，为Mac带来更强大的功能和速度 🧠 M4、M4Pro和M4Max芯片搭载神经网络引擎和机器学习加速器，为用户带来全新的智能化体验【新闻提要5:】 🌟 新增五种自然语音，提升语音应用体验 💰 实时API通过缓存降低输入费用，开发者更划算 ⚡ 实时音频处理受网络条件影响，可靠性需关注【新闻提要6:】 ✨ 创作者可使用任何相机、在任何场地拍摄，通过AI转换为3D动画场景 🎬 强大的场景重建能力，精确还原摄像机与角色、环境的位置关系和运动轨迹 🚀 让艺术家保持创作控制权，更容易制作全动画电影详情链接:https://top.aibase.com/tool/wonder-dynamics 【新闻提要7:】 ✨ 高效语音编解码器，每秒600比特低比特率下压缩音频，保持高质量输出 🔍 专门的Transformer架构，处理信息层次结构，预训练并微调在高质量对话数据集上 🌐 SynthID技术整合，为AI生成的音频内容添加水印，确保技术负责任使用详情链接:https://deepmind.google/discover/blog/pushing-the-frontiers-of-audio-generation/ 【新闻提要8:】 🤝 合作共同开发大模型端云协同解决方案，提升模型效果、降低成本、提高响应速度 🚀 发布MiniCPM3.0，4B模型参数规模赶超GPT-3.5，在多领域脱颖而出 💡 发布MiniCPM-V2.6，全面对标GPT-4V级水平，实现实时视频、多图联合理解，引发国内外关注【新闻提要9:】 🌟 Reddit首次实现盈利，第三季度净收入2990万美元 📈 用户增长显著，日活跃用户数达9700万，多次突破1亿 🤖 人工智能助力翻译功能扩展，预计到2025年将覆盖30个国家【新闻提要10:】 🤖 波士顿动力展示了全电动Atlas机器人，能够独立完成复杂的分拣任务 🔧 Atlas利用机器学习和升级传感器，实现了实时的环境反馈与调整 💡 视频中显示"完全自主"的水印，强调了其在最少人类干预下的工作能力【新闻提要11:】 🔊 SonicSim平台基于Habitat-sim构建，模拟真实声学环境 🎙 SonicSet数据集使用多场景移动音源数据，确保数据真实性和多样性 🚀 在SonicSet数据集上训练的模型取得更优异性能，证明SonicSim有效模拟真实声学环境详情链接:https://arxiv.org/pdf/2410.01481 【新闻提要12:】 🔑 高达96%的多场景可用率，领先行业 🚀 Baichuan4-Turbo在核心能力上有显著提升，部署成本低 💡 Baichuan4-Air采用MoE模型，推理成本极低，降低企业运营成本详情链接:https://platform.baichuan-ai.com/homePage

8分钟

38

1年前

【AI日报】EP.010 10月30日：GitHub Copilot多模型支持、苹果M4芯片Mac Mini发布

Aishaobing的个人播客

【AI日报提要:】 1. GitHub Copilot多模型支持 🚀 GitHub Copilot引入多模型选择，整合Claude3.5 Sonnet、Gemini1.5Pro和OpenAI模型 💡 新增GitHub Spark工具，支持自然语言构建应用程序 🔑 多模型支持将覆盖代码审查、安全自动修复等多个功能详情链接：https://github.blog/news-insights/product-news/bringing-developer-choice-to-copilot/ 2. 苹果M4芯片Mac Mini发布【AI共学会提要:】 🚀 搭载M4芯片，支持AI功能，尺寸更小巧 💡 10核CPU/GPU，Pro版本最高20核，性能提升显著 🔑 起步16GB RAM，最高支持64GB，起售价4499元预购链接：通过苹果官方渠道 3. 小米15系列发布【AI共学会提要:】 🚀 发布小米15系列和澎湃OS2系统，推出"超级小爱"AI功能 💡 1.38mm极致窄边框，5400mAh大电池，超声波指纹 🔑 首发星辰通信技术，通话体验优于竞品详情链接：小米官方渠道 4. 教育科技投资数据【AI共学会提要:】 🚀 2018-2022年全球教育科技投资超622亿美元 💡 AI技术推动教育领域创新，多家初创公司涌现 🔑 儿童陪伴、语言学习等细分领域发展迅速来源：创始人论坛教育科技未来报告 5. MaskGCT语音模型发布【AI共学会提要:】 🚀 港中大深圳与趣丸科技联合推出新一代TTS模型 💡 10万小时多语言数据训练，支持跨语言生成 🔑 应用于短剧出海、智能助手等多个领域详情链接：https://arxiv.org/abs/2409.00750 6. StableDiffusion3.5 Medium发布【AI共学会提要:】 🚀 高性能与普及性完美平衡，免费开放商用，人人可用的AI绘画工具 💡 MMDiT-X架构，解决普通用户硬件门槛问题，25亿参数设计，9.9GB显存流畅运行 🔑 技术创新整合三种预训练文本编码器，引入QK标准化技术，双重注意力模块设计显著提升图像质量和排版效果详情链接：https://huggingface.co/stabilityai/stable-diffusion-3.5-medium 7. 微信AI问答功能测试【AI共学会提要:】 🔍 AI问答功能灰度测试中，用户可通过微信搜索触发，生成约400字回答和5个参考资料 🔧 测试旨在优化用户搜索体验，提升搜索效率，整合腾讯内部技术资源 💡 腾讯混元大模型基于Transformer神经网络，拥有万亿参数规模，具备强大的中文创作能力和逻辑推理能力 8. ComfyUI-Detail-Daemon插件发布【AI共学会提要:】 ⚙ 强大的细节增强能力，精确调控sigma参数提升图像细节，智能去除散景和背景模糊，特别适用于Flux模型作品 🔍 配备四个功能各异的核心节点，简化参数调节流程，提高用户效率 🚀 简化工作流程，减少技术门槛，提高创作效率详情链接：https://github.com/Jonseed/ComfyUI-Detail-Daemon 9. ChatGPT聊天记录搜索功能【AI共学会提要:】 🌟 Plus和Team用户将在一天内体验聊天记录搜索功能 📅 Enterprise和Edu用户一周内获得访问权限，免费用户下月开启 💻 AI优先的拉取请求审阅者为开发者提供更智能的支持详情链接：OpenAI官方渠道

9分钟

35

1年前

【AI日报】EP.009 10月29日：开源AI定义的1.0正式版、MiniMax的年营收超过7000万美元

Aishaobing的个人播客

【AI共学会提要 - 开源标准新规】 🔥 OSI发布开源AI定义1.0版本，设立严格标准要求公开训练数据、代码和参数 🌟 知名开源模型Llama因未提供训练数据访问而不符合新标准 💡 Meta表示不同意单一开源定义，强调AI模型的复杂性【AI共学会提要 - MiniMax成功案例】 🚀 预计年营收超7000万美元，主要来自海外应用Talkie 💫 Talkie成功关键在于产品定位和用户体验，而非纯技术 ⚠️ 面临地缘政治风险，正积极开拓东南亚等新市场【AI共学会提要 - AI厨电革新】 ✨ 方太推出全球首个AI健康烹饪系统HealthyCookingGPT 🔑 老板电器发布食神大模型，实现烹饪过程数字化 🌟 万得厨布局商用市场，计划覆盖1万个核心点位【AI共学会提要 - 字节AI耳机】 🎯 推出OlaFriend，主打轻量化设计和豆包模型集成 💡 产品定位回归基础，注重用户实际体验 🔥 瞄准AI交互新入口，为豆包开拓使用场景【AI共学会提要 - AI创业现状】 📊 今年上半年新增23.7万家AI企业，同时8万家企业倒闭 💰 高投入难变现成主要挑战，基础成本投入巨大 🌟 创新租赁模式可有效降低运营成本【AI共学会提要 - GTC2024大会】 🌐 11月20-21日在上海举办，展览面积8500平方米 🎯 设置四大主题论坛，聚焦游戏、AI+等热门领域 🏆 设立"鲸鸣奖"表彰优秀出海企业，九大奖项评选【AI共学会提要 - 中国企业出海趋势】 📈 85%企业对海外业务充满信心，63%将扩展海外业务 🌍 出海范围从欧美东南亚扩展至中东非洲等新兴市场 🚀 企业加速从"爆款打造"向"品牌延伸"转型

10分钟

15

1年前

【AI日报】EP.008 10月28日：通义代码模式、苹果AI即将正式上线

Aishaobing的个人播客

【通义代码模式】 🔥 阿里通义推出"代码模式"，首批测试优先考虑非程序员用户 💻 基于Qwen2.5模型，支持40多种编程语言，代码实时预览 🌟 提供一站式应用开发体验，支持小游戏、网页、数据图表等应用生成【AI招聘新趋势】 🤖 xAI联合创始人发现候选人使用AI作弊，一亩三分地成为全球技术面试题库 📈 求职者在简历中加入特定Prompt，面试邀约增长4倍 💼 AIHawk工具助力批量投递，单用户申请职位数达2843个【抖音AI监管】 ⚠️ 抖音严打利用AI生成虚假内容骗取老年人互动行为 🔒 要求AI生成内容必须显著标识，虚拟人需平台注册 📋 发布《AI生成内容平台规范暨行业倡议》规范AI使用详情链接: https://www.aibase.com/zh/news/12756 【英特尔AI布局】 💪 首家实现消费级AIPC全平台全生态构建的芯片厂商 🔧 OpenVINO框架支持多种处理器协同工作 🚗 布局智能汽车、医疗等多个专业领域【AppleIntelligence发布】 📱 随iOS18.1正式上线，提供多项AI增强功能 🤝 iOS18.2将融合Siri和ChatGPT 📊 分析师预计短期难推动iPhone销量提升【字节跳动PersonaTalk】 🎭 实现视频精准配音，保持声音与嘴型完美同步 🎯 保留人物原有特点，提供自然的视觉效果 🔐 计划限制核心模型访问权限防止滥用详情链接: https://grisoon.github.io/PersonaTalk/ 【Meta LongVU项目】 📽 新型时空自适应压缩机制提升长视频理解能力 🔍 利用DINOv2特征剔除冗余帧 📈 在长视频理解任务中性能领先详情链接: https://vision-cair.github.io/LongVU/ 【小米15硬件升级】 💾 取消8GB内存版本，12GB内存成为标准配置 📱 终端AI发展推动硬件规格升级 🔋 续航能力分别提升23%和38% 【GPT-4金融应用突破】 📊 财务预测准确率达60%，超越人类分析师 💡 采用"思维链"提示方式指导趋势识别 💰 基于GPT-4的交易策略显示显著市场超额收益

11分钟

9

1年前

【AI日报】EP.007 10月27日：黄仁勋：AI取代不了人、20年的AI预言

Aishaobing的个人播客

# AI日报新闻速览 (2024年10月27日) 1. **英伟达CEO谈AI未来** 黄仁勋表示"AI取代不了人，但不用AI的人将被用AI的人取代"。他预测未来英伟达将拥有5万员工配备1亿AI助手，强调AI是人类助手而非替代者。 🔗https://www.chinaz.com/2024/1027/1649705.shtml 2. **谷歌推出无限游戏世界** 谷歌发布Unbounded无限人生模拟游戏，采用大语言模型和视觉生成模型，实现无限制的开放世界体验，突破传统游戏限制。 🔗 https://www.jiqizhixin.com/articles/2024-10-26-6 3. **中国智能客服市场增长预测** 2023年中国智能客服市场规模达39.4亿元，预计2027年增至90.7亿元，年复合增长率22.6%，应用领域从电商、金融扩展至医疗等更广泛行业。 🔗 https://www.aixinzhijie.com/article/6847044 4. **AI医疗助手发展** HippocraticAI开发的医疗健康智能体，包含1.7万亿参数，由20个模型组成，用于解决预计2030年医疗行业1000万人员缺口问题。 🔗 [原文未提供] 5. **手机用户AI需求调查** CNET调查显示，仅18%用户因AI功能升级手机，61%用户更注重电池续航，46%关注存储空间，38%重视相机功能。45%用户不愿为AI功能付费。 🔗 https://news.mydrivers.com/1/1010/1010469.htm 6. **OpenAI高管离职** MilesBrundage离职OpenAI，发表5000词长文，指出行业外研究可能产生更大影响，直言OpenAI等前沿实验室都未准备好迎接AGI。 🔗 https://hub.baai.ac.cn/view/40570 7. **AI控制计算机技术突破** 多家公司发布控制计算机的AI能力，包括Anthropic的Claude3.5Sonnet、荣耀MagicOS9.0、智谱AI的AutoGLM、华为的LiMAC等。 🔗 https://www.jiqizhixin.com/articles/2024-10-26-4 8. **微软发布企业级AI Agents** 微软在Dynamics365引入十个新自主Agent，覆盖销售、服务、财务等领域，紧随谷歌云六大领域AI Agent发布。 🔗 https://www.53ai.com/news/zhinengyingxiao/2024102786329.html 9. **雷库兹韦尔未来预言** 被誉为"AI领域最牛的人"的雷库兹韦尔预测2029年实现"长寿逃逸速度"，2040-50年代人类可重建身体和大脑，突破生物限制。 🔗 https://www.aixinzhijie.com/article/6847054 关键趋势总结： - AI企业应用加速落地 - 人机协作模式逐渐明确 - 技术创新持续突破 - 用户需求与产品发展存在差距 - 未来科技发展充满想象空间提醒：以上新闻均基于2024年10月27日的报道，具体实施和发展情况请以后续官方发布为准。

9分钟

15

1年前

【AI日报】EP.234 10月26日：智谱AI开源语音模型、字节AI赛马再启！

Aishaobing的个人播客

## 1. 智谱AI发布情感语音通话功能并开源GLM4Voice模型 - GLM4Voice采用离散Token表示音频,实现端到端语音建模 - 支持多语言多方言,可进行实时对话 - 同步发布AutoGLM,让AI自动操作电脑和手机详情链接：https://www.chinaz.com/2024/1026/16... ## 2. 微信110揭露AI合成视频新型诈骗手法 - 诈骗分子通过网络平台寻找目标并诱导视频聊天 - 利用AI技术合成不雅内容进行敲诈 - 提醒用户警惕视频聊天陷阱,遇到敲诈及时报警详情链接：https://www.chinaz.com/2024/1025/16... ## 3. OpenAI新模型Orion引发关注 - 传闻性能或超GPT4百倍,计划12月发布 - 阿尔特曼发文辟谣 - 揭示OpenAI与微软复杂的合作竞争关系详情链接：https://www.36kr.com/p/300794654514... ## 4. 字节跳动重启"APP工厂"模式布局AI - 推出20余款AI应用,覆盖多个领域 - 采用内部赛马机制促进创新 - "豆包"品牌统一,底层模型仍在竞争详情链接：https://www.chinaz.com/2024/1025/16... ## 5. 字节布局AI视频和音乐生成赛道 - 发布PixelDance、Seaweed两款视频生成模型 - 即梦APP表现优异,海绵音乐面临版权挑战 - 内部多团队竞争存在资源分散风险详情链接：https://www.chinaz.com/2024/1026/16...

5分钟

25

1年前

【AI日报】EP.233 10月25日：智谱AI发布AutoGLM、Midjourney重大更新！

Aishaobing的个人播客

# AI日报新闻汇总（2024年10月25日） ## 1. Claude上线数据分析功能 - 用户可上传CSV文件并自动生成代码 - 新功能支持数据清理和可视化，提升分析结果的准确性 - 适用于多个行业团队，助力市场营销和财务决策等场景 ## 2. KREAAI推出视频延展功能 - Video Extend功能融合真实视频与AI生成内容 - 独特的视频尾帧利用机制可延伸生成5秒连贯视频内容 - 支持全模型兼容，操作简便，适合视频制作新手 ## 3. Midjourney重大更新 - 推出全新外部图像编辑器和图像重纹理模式 - 用户可在平台上直接编辑图像，无需外部软件 - V2AI审核系统全面检查内容安全，确保生成合规内容 ## 4. 谷歌DeepMind发布MusicFXDJ更新版 - 即时生成全新音乐，支持多种输入提示 - 实现实时流式音乐创作，用户可调整编制和节奏 - 支持生成48kHz立体声音频，可分享60秒音轨 ## 5. 苹果将推私有AI云服务 - 悬赏高达100万美元寻找AI云服务安全漏洞 - Bug Bounty计划鼓励私下报告安全问题 - 推出研究人员专用iPhone进行安全测试 ## 6. 美图奇想大模型升级 - 图像生成能力再次升级，提升综合实力 - 推出AI短片创作工具MOKI - 升级强化图像生成能力，融入多元美学理念 ## 7. OpenAI macOS应用更新 - 语音界面支持图片上传功能 - 支持笔记本摄像头直接拍照分享 - Canvas编辑器即将推出 ## 8. 小鹏AI天玑5.4.0发布 - P7+及后续车型全系标配AI高阶智驾，无需付费 - 采用与OpenAI相同路线构建云端大模型 - AI天玑5.4.0带来多项升级，包括AI鹰眼视觉方案等 ## 9. MetaAI新量化版本Llama3.2 - 体积减小56%，计算资源需求降低 - 推理速度提升2-4倍，适用于消费级硬件 - 自然语言处理性能与原版相当详情链接：https://www.llama.com/ ## 10. 北大研发FakeShield框架 - 可解释的IFDL任务和FakeShield框架解决传统方法不足 - 利用多模态大型语言模型评估图像真实性 - 适用于各种现实应用，提升网络环境可靠性详情链接：https://zhipeixu.github.io/projects/FakeShield/ ## 11. OpenAI高管离职 - 安全政策顾问兼AGI团队负责人布伦达奇宣布离职 - 反映出与公司在研究限制上的分歧 - AGI准备团队将解散 ## 12. GooglePhotos标注争议 - AI编辑标识仅在详细信息中显示 - 公司承诺继续改进透明度 - 计划在搜索结果中标识AI图像 ## 13. Cohere发布AyaExpanse模型 - 支持23种语言性能提升，超越同规模竞品 - 采用数据套利方法避免低质量内容 - 致力于提升非英语语言的研究表现详情链接：https://cohere.com/blog/aya-expanse-connecting-our-world --- 欢迎关注AI日报，获取更多AI领域第一手资讯！

8分钟

30

1年前

【AI日报】EP.16 11月5日腾讯重磅开源398B参数新模型、xAI与Anthropic掀API价格战

【AI日报】EP.15 11月4日ChatNio被数百万收购、Claude 3.5 Sonnet新增PDF处理

【AI日报】EP.14 11月3日全球首款无引擎AI游戏诞生、 Pixverse视频特效引爆社交平台

【AI日报】EP.13 11月2日：谷歌LearnAbout重塑学习体验、英伟达入选道指、Meta发布AI触觉传感器

【AI日报】EP.012 11月1日：AI搜索领域风起云涌

【AI日报】EP.011 10月31日：亲身经历离奇播客制作经历

【AI日报】EP.010 10月30日：GitHub Copilot多模型支持、苹果M4芯片Mac Mini发布

【AI日报】EP.009 10月29日：开源AI定义的1.0正式版、MiniMax的年营收超过7000万美元

【AI日报】EP.008 10月28日：通义代码模式、苹果AI即将正式上线

【AI日报】EP.007 10月27日：黄仁勋：AI取代不了人、20年的AI预言

【AI日报】EP.234 10月26日：智谱AI开源语音模型、字节AI赛马再启！

【AI日报】EP.233 10月25日：智谱AI发布AutoGLM、Midjourney重大更新！

加入我们的 Discord

扫描微信二维码

播放列表

Aishaobing的个人播客 - 节目列表

【AI日报】EP.16 11月5日 腾讯重磅开源398B参数新模型、xAI与Anthropic掀API价格战

【AI日报】EP.15 11月4日ChatNio被数百万收购、Claude 3.5 Sonnet新增PDF处理

【AI日报】EP.14 11月3日全球首款无引擎AI游戏诞生、 Pixverse视频特效引爆社交平台

【AI日报】EP.13 11月2日：谷歌LearnAbout重塑学习体验、英伟达入选道指、Meta发布AI触觉传感器

【AI日报】EP.012 11月1日：AI搜索领域风起云涌

【AI日报】EP.011 10月31日：亲身经历离奇播客制作经历

【AI日报】EP.010 10月30日：GitHub Copilot多模型支持、苹果M4芯片Mac Mini发布

【AI日报】EP.009 10月29日：开源AI定义的1.0正式版、MiniMax的年营收超过7000万美元

【AI日报】EP.008 10月28日：通义代码模式、苹果AI即将正式上线

【AI日报】EP.007 10月27日：黄仁勋：AI取代不了人、20年的AI预言

【AI日报】EP.234 10月26日：智谱AI开源语音模型、字节AI赛马再启！

【AI日报】EP.233 10月25日：智谱AI发布AutoGLM、Midjourney重大更新！

加入我们的 Discord

扫描微信二维码

播放列表

【AI日报】EP.16 11月5日腾讯重磅开源398B参数新模型、xAI与Anthropic掀API价格战