【AI日报】EP.15 11月4日ChatNio被数百万收购、Claude 3.5 Sonnet新增PDF处理

Aishaobing的个人播客

【开源项目】 👨‍💻 15岁少年开发ChatNio被数百万收购 * ChatNio接入35款主流AI模型 * 月活10万+,月收入5万 * 开发者有7年项目经验,精通全栈开发 【开源商业】 💼 LobeChat云服务公测成果显著 * 月收入突破3万元 * 付费用户达60+ * 面临转化率挑战,将优化产品功能 【模型技术】 🎨 阿里通义实验室发布IC-LoRA * 支持生成多张相关联图像 * 具备上下文学习能力 * 大幅降低AI训练成本 【功能更新】 📄 Claude 3.5 Sonnet新增PDF处理 * 支持文本和视觉元素分析 * 包含三步处理流程 * 费用随文档长度变化 【视频工具】 🎬 ComfyUI-MochiEdit支持视频转视频 * 基于噪声重采样技术 * 实现视频局部编辑 * 提供全新编辑思路 【创作工具】 🎥 Runway推出高级摄像机控制 * 支持专业镜头移动控制 * 实现多种拍摄效果 * 打造3D虚拟场景 【编程趋势】 🐍 Python成GitHub最受欢迎语言 * 超越JavaScript位居第一 * AI促进开源项目质量提升 * Ollama成最受关注AI项目 【音频技术】 🎙️ Hertz-Dev开源音频模型发布 * 拥有8.5亿参数 * 实际延迟仅120毫秒 * 降低AI对话技术门槛 【学习资源】 📚 少数派发布AI外语学习教程 * 详解四种AI学习方法 * 提供实用学习建议 * 深入分析AI教育产品

6分钟
24
1年前

【AI日报】EP.14 11月3日全球首款无引擎AI游戏诞生、 Pixverse视频特效引爆社交平台

Aishaobing的个人播客

【AI日报新闻提要 2024.11.03】 【重磅新闻】 🎮 全球首款无引擎AI游戏诞生! - Decart和Etched联合发布Oasis - 纯视频模型生成,支持实时交互 - 已获红杉资本2100万美元投资 - 在专用芯片上可实现4K渲染 【技术创新】 🎬 Pixverse视频特效引爆社交平台 - 毒液特效成为爆款,多个作品获数十万赞 - 已开放API接口,开发者机遇显现 - 二手市场炒至每次10元,官方渠道仍免费 【行业争议】 🤖 小红书AI内容审核遇挫 - 新推出的AI识别功能频现误判 - 大量真人内容被错误标记 - 引发创作者强烈不满与投诉 【医疗突破】 🏥 "华西黉医"医学大模型发布 - 720亿参数级别 - 整合110万医患对话等海量数据 - 病历生成效率提升90% 【效率工具】 💻 豆包Mac版迎重大更新 - 新增语音通话功能 - 支持实时联网信息获取 - 跨语言交互+界面悬浮功能 【教育创新】 📚 AI自习室市场蓬勃发展 - 结合AI设备与人工督导 - 在"双减"背景下开创新模式 - 强调教育本质重于技术 【行业数据】 📊 B站AIGC内容年度播放量 - 突破300亿次播放 - 科普类内容季度增长29% - 日均观看量超1亿 - AI创作音乐跻身最受欢迎内容 【关注趋势】 🔍 AI技术正在重塑多个领域 - 游戏开发模式变革 - 视频创作门槛降低 - 医疗效率大幅提升 - 教育模式持续创新 收听完整播报,请锁定AI日报,我们明天再会! #AI快讯 #技术创新 #数字化转型 #AIGrammar

5分钟
28
1年前

【AI日报】EP.012 11月1日:AI搜索领域风起云涌

Aishaobing的个人播客

【新闻提要1:ChatGPT推出网页搜索】 ✨ OpenAI正式为ChatGPT推出网页搜索功能,用户可通过自然对话获取实时信息 🔍 基于GPT-4微调版本,集成多家权威媒体资源 💫 目前仅对Plus会员和Team用户开放,未来将逐步扩展至所有用户 详情链接:chat.openai.com 【新闻提要2:Claude推出桌面客户端】 🖥️ Anthropic发布Claude AI桌面应用程序,提升用户交互体验 🎤 移动端新增语音输入功能,扩展使用场景 🚀 跟进竞品,保持市场竞争力 详情链接:claude.ai/download 【新闻提要3:谷歌Gemini API搜索升级】 🌐 推出"与谷歌搜索的实时连接"功能 💰 每1000个查询收费35美元,支持灵活的数据检索 🔄 提升AI模型响应准确性,减少虚假信息 详情链接:ai.google.dev 【新闻提要4:Blendbox Alpha发布】 🎨 引入图层概念的AI图像生成软件 🔧 支持实时调整纹理、光影、颜色方案 🖼️ 突破提示词限制,让艺术家重获创作自由 详情链接:blendbox.ai 【新闻提要5:阿里EcomID支持ComfyUI】 🚀 完美继承InstantID和PuLID优势的人像生成项目 💡 优化架构设计,提升生成效果 ⚙️ 原生支持ComfyUI,降低使用门槛 详情链接:github.com/alimama-creative/SDXL_EcomID_ComfyUI 【新闻提要6:Suno推出AI歌手克隆】 🎵 新增Personas功能,支持音乐风格复制 🎼 可提取保存歌曲核心元素,包括人声特点和风格 🔗 支持公开或私密设置,增加社交价值 详情链接:suno.ai 【新闻提要7:夸克升级"灵知"学习大模型】 📚 全面升级"AI搜题"产品功能 🧠 支持各类题目搜寻与专业解答 💡 大幅提升搜题与解题效率 详情链接:quark.cn 【新闻提要8:字节开源HybridFlow】 ⚡ 大模型训练速度提升20倍,显著降低成本 🛠️ 支持多种RLHF算法,提供模块化API 🔧 创新结合单多控制器模式,优化训练效率 详情链接:https://arxiv.org/pdf/2409.19256 【新闻提要9:谷歌地图整合Gemini】 🗺️ 提供智能导航和场所发现体验 🚗 优化导航显示,支持实景导航模式 🌍 扩展至全球150个城市,提升用户体验 详情链接:maps.google.com

6分钟
19
1年前

【AI日报】EP.011 10月31日:亲身经历离奇播客制作经历

Aishaobing的个人播客

【新闻提要1:】 🚀 炉米Lumi是字节跳动最新推出的AI模型分享社区平台,提供模型上传分享和训练功能 💡 与LiblibAI功能定位相似,炉米Lumi展示了字节跳动在AI领域的全面布局策略 💥 字节跳动在AI领域已有广泛布局,包括大模型、ChatBot、AI社交、AI虚拟陪伴等多个领域 详情链接:https://top.aibase.com/tool/lumilumi 【新闻提要2:】 🔍 RecraftV3实为英国AI初创公司RecraftAI推出的最新图像生成模型,以red_panda身份引发关注 💡 RecraftV3在ArtificialAnalysis排行榜上以1172的ELO评分领先其他模型,收获超过10万次投票 🚀 RecraftV3具备强大的长文本图像生成能力,增强的文本布局和样式控制功能,特别适用于品牌推广、营销和复杂图形设计领域 详情链接:https://www.recraft.ai/ 【新闻提要3:】 🔊 ChatGPT的高级语音模式(AVM)正式登陆Windows和Mac平台,提供更自然的实时对话交互体验 🌐 系统新增五种语音选项,支持打断和停顿,满足用户更接近人际交流的需求 💬 用户反馈良好,AI回答准确率高,用户满意度达96%,ChatGPT还推出网页版聊天历史搜索功能 【新闻提要4:】 🚀 M4系列芯片采用第二代3纳米制程工艺,提升性能和能效 💻 M4Pro和M4Max芯片支持雷雳5和统一内存带宽提升,为Mac带来更强大的功能和速度 🧠 M4、M4Pro和M4Max芯片搭载神经网络引擎和机器学习加速器,为用户带来全新的智能化体验 【新闻提要5:】 🌟 新增五种自然语音,提升语音应用体验 💰 实时API通过缓存降低输入费用,开发者更划算 ⚡ 实时音频处理受网络条件影响,可靠性需关注 【新闻提要6:】 ✨ 创作者可使用任何相机、在任何场地拍摄,通过AI转换为3D动画场景 🎬 强大的场景重建能力,精确还原摄像机与角色、环境的位置关系和运动轨迹 🚀 让艺术家保持创作控制权,更容易制作全动画电影 详情链接:https://top.aibase.com/tool/wonder-dynamics 【新闻提要7:】 ✨ 高效语音编解码器,每秒600比特低比特率下压缩音频,保持高质量输出 🔍 专门的Transformer架构,处理信息层次结构,预训练并微调在高质量对话数据集上 🌐 SynthID技术整合,为AI生成的音频内容添加水印,确保技术负责任使用 详情链接:https://deepmind.google/discover/blog/pushing-the-frontiers-of-audio-generation/ 【新闻提要8:】 🤝 合作共同开发大模型端云协同解决方案,提升模型效果、降低成本、提高响应速度 🚀 发布MiniCPM3.0,4B模型参数规模赶超GPT-3.5,在多领域脱颖而出 💡 发布MiniCPM-V2.6,全面对标GPT-4V级水平,实现实时视频、多图联合理解,引发国内外关注 【新闻提要9:】 🌟 Reddit首次实现盈利,第三季度净收入2990万美元 📈 用户增长显著,日活跃用户数达9700万,多次突破1亿 🤖 人工智能助力翻译功能扩展,预计到2025年将覆盖30个国家 【新闻提要10:】 🤖 波士顿动力展示了全电动Atlas机器人,能够独立完成复杂的分拣任务 🔧 Atlas利用机器学习和升级传感器,实现了实时的环境反馈与调整 💡 视频中显示"完全自主"的水印,强调了其在最少人类干预下的工作能力 【新闻提要11:】 🔊 SonicSim平台基于Habitat-sim构建,模拟真实声学环境 🎙 SonicSet数据集使用多场景移动音源数据,确保数据真实性和多样性 🚀 在SonicSet数据集上训练的模型取得更优异性能,证明SonicSim有效模拟真实声学环境 详情链接:https://arxiv.org/pdf/2410.01481 【新闻提要12:】 🔑 高达96%的多场景可用率,领先行业 🚀 Baichuan4-Turbo在核心能力上有显著提升,部署成本低 💡 Baichuan4-Air采用MoE模型,推理成本极低,降低企业运营成本 详情链接:https://platform.baichuan-ai.com/homePage

8分钟
38
1年前

【AI日报】EP.010 10月30日:GitHub Copilot多模型支持、苹果M4芯片Mac Mini发布

Aishaobing的个人播客

【AI日报提要:】 1. GitHub Copilot多模型支持 🚀 GitHub Copilot引入多模型选择,整合Claude3.5 Sonnet、Gemini1.5Pro和OpenAI模型 💡 新增GitHub Spark工具,支持自然语言构建应用程序 🔑 多模型支持将覆盖代码审查、安全自动修复等多个功能 详情链接:https://github.blog/news-insights/product-news/bringing-developer-choice-to-copilot/ 2. 苹果M4芯片Mac Mini发布 【AI共学会提要:】 🚀 搭载M4芯片,支持AI功能,尺寸更小巧 💡 10核CPU/GPU,Pro版本最高20核,性能提升显著 🔑 起步16GB RAM,最高支持64GB,起售价4499元 预购链接:通过苹果官方渠道 3. 小米15系列发布 【AI共学会提要:】 🚀 发布小米15系列和澎湃OS2系统,推出"超级小爱"AI功能 💡 1.38mm极致窄边框,5400mAh大电池,超声波指纹 🔑 首发星辰通信技术,通话体验优于竞品 详情链接:小米官方渠道 4. 教育科技投资数据 【AI共学会提要:】 🚀 2018-2022年全球教育科技投资超622亿美元 💡 AI技术推动教育领域创新,多家初创公司涌现 🔑 儿童陪伴、语言学习等细分领域发展迅速 来源:创始人论坛教育科技未来报告 5. MaskGCT语音模型发布 【AI共学会提要:】 🚀 港中大深圳与趣丸科技联合推出新一代TTS模型 💡 10万小时多语言数据训练,支持跨语言生成 🔑 应用于短剧出海、智能助手等多个领域 详情链接:https://arxiv.org/abs/2409.00750 6. StableDiffusion3.5 Medium发布 【AI共学会提要:】 🚀 高性能与普及性完美平衡,免费开放商用,人人可用的AI绘画工具 💡 MMDiT-X架构,解决普通用户硬件门槛问题,25亿参数设计,9.9GB显存流畅运行 🔑 技术创新整合三种预训练文本编码器,引入QK标准化技术,双重注意力模块设计显著提升图像质量和排版效果 详情链接:https://huggingface.co/stabilityai/stable-diffusion-3.5-medium 7. 微信AI问答功能测试 【AI共学会提要:】 🔍 AI问答功能灰度测试中,用户可通过微信搜索触发,生成约400字回答和5个参考资料 🔧 测试旨在优化用户搜索体验,提升搜索效率,整合腾讯内部技术资源 💡 腾讯混元大模型基于Transformer神经网络,拥有万亿参数规模,具备强大的中文创作能力和逻辑推理能力 8. ComfyUI-Detail-Daemon插件发布 【AI共学会提要:】 ⚙ 强大的细节增强能力,精确调控sigma参数提升图像细节,智能去除散景和背景模糊,特别适用于Flux模型作品 🔍 配备四个功能各异的核心节点,简化参数调节流程,提高用户效率 🚀 简化工作流程,减少技术门槛,提高创作效率 详情链接:https://github.com/Jonseed/ComfyUI-Detail-Daemon 9. ChatGPT聊天记录搜索功能 【AI共学会提要:】 🌟 Plus和Team用户将在一天内体验聊天记录搜索功能 📅 Enterprise和Edu用户一周内获得访问权限,免费用户下月开启 💻 AI优先的拉取请求审阅者为开发者提供更智能的支持 详情链接:OpenAI官方渠道

9分钟
35
1年前

【AI日报】EP.009 10月29日:开源AI定义的1.0正式版、MiniMax的年营收超过7000万美元

Aishaobing的个人播客

【AI共学会提要 - 开源标准新规】 🔥 OSI发布开源AI定义1.0版本,设立严格标准要求公开训练数据、代码和参数 🌟 知名开源模型Llama因未提供训练数据访问而不符合新标准 💡 Meta表示不同意单一开源定义,强调AI模型的复杂性 【AI共学会提要 - MiniMax成功案例】 🚀 预计年营收超7000万美元,主要来自海外应用Talkie 💫 Talkie成功关键在于产品定位和用户体验,而非纯技术 ⚠️ 面临地缘政治风险,正积极开拓东南亚等新市场 【AI共学会提要 - AI厨电革新】 ✨ 方太推出全球首个AI健康烹饪系统HealthyCookingGPT 🔑 老板电器发布食神大模型,实现烹饪过程数字化 🌟 万得厨布局商用市场,计划覆盖1万个核心点位 【AI共学会提要 - 字节AI耳机】 🎯 推出OlaFriend,主打轻量化设计和豆包模型集成 💡 产品定位回归基础,注重用户实际体验 🔥 瞄准AI交互新入口,为豆包开拓使用场景 【AI共学会提要 - AI创业现状】 📊 今年上半年新增23.7万家AI企业,同时8万家企业倒闭 💰 高投入难变现成主要挑战,基础成本投入巨大 🌟 创新租赁模式可有效降低运营成本 【AI共学会提要 - GTC2024大会】 🌐 11月20-21日在上海举办,展览面积8500平方米 🎯 设置四大主题论坛,聚焦游戏、AI+等热门领域 🏆 设立"鲸鸣奖"表彰优秀出海企业,九大奖项评选 【AI共学会提要 - 中国企业出海趋势】 📈 85%企业对海外业务充满信心,63%将扩展海外业务 🌍 出海范围从欧美东南亚扩展至中东非洲等新兴市场 🚀 企业加速从"爆款打造"向"品牌延伸"转型

10分钟
15
1年前

【AI日报】EP.008 10月28日:通义代码模式、苹果AI即将正式上线

Aishaobing的个人播客

【通义代码模式】 🔥 阿里通义推出"代码模式",首批测试优先考虑非程序员用户 💻 基于Qwen2.5模型,支持40多种编程语言,代码实时预览 🌟 提供一站式应用开发体验,支持小游戏、网页、数据图表等应用生成 【AI招聘新趋势】 🤖 xAI联合创始人发现候选人使用AI作弊,一亩三分地成为全球技术面试题库 📈 求职者在简历中加入特定Prompt,面试邀约增长4倍 💼 AIHawk工具助力批量投递,单用户申请职位数达2843个 【抖音AI监管】 ⚠️ 抖音严打利用AI生成虚假内容骗取老年人互动行为 🔒 要求AI生成内容必须显著标识,虚拟人需平台注册 📋 发布《AI生成内容平台规范暨行业倡议》规范AI使用 详情链接: https://www.aibase.com/zh/news/12756 【英特尔AI布局】 💪 首家实现消费级AIPC全平台全生态构建的芯片厂商 🔧 OpenVINO框架支持多种处理器协同工作 🚗 布局智能汽车、医疗等多个专业领域 【AppleIntelligence发布】 📱 随iOS18.1正式上线,提供多项AI增强功能 🤝 iOS18.2将融合Siri和ChatGPT 📊 分析师预计短期难推动iPhone销量提升 【字节跳动PersonaTalk】 🎭 实现视频精准配音,保持声音与嘴型完美同步 🎯 保留人物原有特点,提供自然的视觉效果 🔐 计划限制核心模型访问权限防止滥用 详情链接: https://grisoon.github.io/PersonaTalk/ 【Meta LongVU项目】 📽 新型时空自适应压缩机制提升长视频理解能力 🔍 利用DINOv2特征剔除冗余帧 📈 在长视频理解任务中性能领先 详情链接: https://vision-cair.github.io/LongVU/ 【小米15硬件升级】 💾 取消8GB内存版本,12GB内存成为标准配置 📱 终端AI发展推动硬件规格升级 🔋 续航能力分别提升23%和38% 【GPT-4金融应用突破】 📊 财务预测准确率达60%,超越人类分析师 💡 采用"思维链"提示方式指导趋势识别 💰 基于GPT-4的交易策略显示显著市场超额收益

11分钟
9
1年前

【AI日报】EP.007 10月27日:黄仁勋:AI取代不了人、20年的AI预言

Aishaobing的个人播客

# AI日报新闻速览 (2024年10月27日) 1. **英伟达CEO谈AI未来** 黄仁勋表示"AI取代不了人,但不用AI的人将被用AI的人取代"。他预测未来英伟达将拥有5万员工配备1亿AI助手,强调AI是人类助手而非替代者。 🔗https://www.chinaz.com/2024/1027/1649705.shtml 2. **谷歌推出无限游戏世界** 谷歌发布Unbounded无限人生模拟游戏,采用大语言模型和视觉生成模型,实现无限制的开放世界体验,突破传统游戏限制。 🔗 https://www.jiqizhixin.com/articles/2024-10-26-6 3. **中国智能客服市场增长预测** 2023年中国智能客服市场规模达39.4亿元,预计2027年增至90.7亿元,年复合增长率22.6%,应用领域从电商、金融扩展至医疗等更广泛行业。 🔗 https://www.aixinzhijie.com/article/6847044 4. **AI医疗助手发展** HippocraticAI开发的医疗健康智能体,包含1.7万亿参数,由20个模型组成,用于解决预计2030年医疗行业1000万人员缺口问题。 🔗 [原文未提供] 5. **手机用户AI需求调查** CNET调查显示,仅18%用户因AI功能升级手机,61%用户更注重电池续航,46%关注存储空间,38%重视相机功能。45%用户不愿为AI功能付费。 🔗 https://news.mydrivers.com/1/1010/1010469.htm 6. **OpenAI高管离职** MilesBrundage离职OpenAI,发表5000词长文,指出行业外研究可能产生更大影响,直言OpenAI等前沿实验室都未准备好迎接AGI。 🔗 https://hub.baai.ac.cn/view/40570 7. **AI控制计算机技术突破** 多家公司发布控制计算机的AI能力,包括Anthropic的Claude3.5Sonnet、荣耀MagicOS9.0、智谱AI的AutoGLM、华为的LiMAC等。 🔗 https://www.jiqizhixin.com/articles/2024-10-26-4 8. **微软发布企业级AI Agents** 微软在Dynamics365引入十个新自主Agent,覆盖销售、服务、财务等领域,紧随谷歌云六大领域AI Agent发布。 🔗 https://www.53ai.com/news/zhinengyingxiao/2024102786329.html 9. **雷库兹韦尔未来预言** 被誉为"AI领域最牛的人"的雷库兹韦尔预测2029年实现"长寿逃逸速度",2040-50年代人类可重建身体和大脑,突破生物限制。 🔗 https://www.aixinzhijie.com/article/6847054 关键趋势总结: - AI企业应用加速落地 - 人机协作模式逐渐明确 - 技术创新持续突破 - 用户需求与产品发展存在差距 - 未来科技发展充满想象空间 提醒:以上新闻均基于2024年10月27日的报道,具体实施和发展情况请以后续官方发布为准。

9分钟
15
1年前

【AI日报】EP.233 10月25日:智谱AI发布AutoGLM、Midjourney重大更新!

Aishaobing的个人播客

# AI日报新闻汇总(2024年10月25日) ## 1. Claude上线数据分析功能 - 用户可上传CSV文件并自动生成代码 - 新功能支持数据清理和可视化,提升分析结果的准确性 - 适用于多个行业团队,助力市场营销和财务决策等场景 ## 2. KREAAI推出视频延展功能 - Video Extend功能融合真实视频与AI生成内容 - 独特的视频尾帧利用机制可延伸生成5秒连贯视频内容 - 支持全模型兼容,操作简便,适合视频制作新手 ## 3. Midjourney重大更新 - 推出全新外部图像编辑器和图像重纹理模式 - 用户可在平台上直接编辑图像,无需外部软件 - V2AI审核系统全面检查内容安全,确保生成合规内容 ## 4. 谷歌DeepMind发布MusicFXDJ更新版 - 即时生成全新音乐,支持多种输入提示 - 实现实时流式音乐创作,用户可调整编制和节奏 - 支持生成48kHz立体声音频,可分享60秒音轨 ## 5. 苹果将推私有AI云服务 - 悬赏高达100万美元寻找AI云服务安全漏洞 - Bug Bounty计划鼓励私下报告安全问题 - 推出研究人员专用iPhone进行安全测试 ## 6. 美图奇想大模型升级 - 图像生成能力再次升级,提升综合实力 - 推出AI短片创作工具MOKI - 升级强化图像生成能力,融入多元美学理念 ## 7. OpenAI macOS应用更新 - 语音界面支持图片上传功能 - 支持笔记本摄像头直接拍照分享 - Canvas编辑器即将推出 ## 8. 小鹏AI天玑5.4.0发布 - P7+及后续车型全系标配AI高阶智驾,无需付费 - 采用与OpenAI相同路线构建云端大模型 - AI天玑5.4.0带来多项升级,包括AI鹰眼视觉方案等 ## 9. MetaAI新量化版本Llama3.2 - 体积减小56%,计算资源需求降低 - 推理速度提升2-4倍,适用于消费级硬件 - 自然语言处理性能与原版相当 详情链接:https://www.llama.com/ ## 10. 北大研发FakeShield框架 - 可解释的IFDL任务和FakeShield框架解决传统方法不足 - 利用多模态大型语言模型评估图像真实性 - 适用于各种现实应用,提升网络环境可靠性 详情链接:https://zhipeixu.github.io/projects/FakeShield/ ## 11. OpenAI高管离职 - 安全政策顾问兼AGI团队负责人布伦达奇宣布离职 - 反映出与公司在研究限制上的分歧 - AGI准备团队将解散 ## 12. GooglePhotos标注争议 - AI编辑标识仅在详细信息中显示 - 公司承诺继续改进透明度 - 计划在搜索结果中标识AI图像 ## 13. Cohere发布AyaExpanse模型 - 支持23种语言性能提升,超越同规模竞品 - 采用数据套利方法避免低质量内容 - 致力于提升非英语语言的研究表现 详情链接:https://cohere.com/blog/aya-expanse-connecting-our-world --- 欢迎关注AI日报,获取更多AI领域第一手资讯!

8分钟
30
1年前
EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧