【AI日报】EP.53 12月14日 OpenAI全量开放视频聊天功能 Anthropic 最快模型

Aishaobing的个人播客

【新功能发布】 🎥 OpenAI全量开放视频聊天功能 * ChatGPT支持视频聊天和屏幕共享 * 仅向Teams、Plus和Pro用户开放 * 预计明年1月扩展至企业版和教育版用户 【模型升级】 🚀 Anthropic发布Claude 3.5 Haiku * 全面开放使用,适合实时任务 * 支持图片和文件分析功能 * 免费版有消息限额,Pro版20美元解锁更多权限 【技术突破】 🔍 上海AI实验室发布REEF模型指纹识别技术 * 可有效识别"套壳"模型 * 具有较强的鲁棒性 * 提供理论保证和实验验证 详情链接: https://arxiv.org/pdf/2410.14273 【硬件升级】 ⚡ 谷歌Trillium TPU正式开放使用 * 训练性能提升4倍 * 推理吞吐量提升3倍 * 能源效率提升67% 详情链接: https://cloud.google.com/blog/products/compute/trillium-tpu-is-ga 【安全工具】 🛡️ Meta推出Video Seal水印工具 * 为AI生成视频添加不可见水印 * 开源且可与现有软件无缝集成 * 将推出公开排行榜比较不同水印方法 【行业动态】 💼 人才争夺战升级 * xAI与OpenAI薪资差距显著 * OpenAI薪资超出行业标准87% * 马斯克指控OpenAI反竞争行为 【创业新动向】 🤖 OpenAI前算法负责人创立亮源新创 * 专注具身智能陪伴机器人研发 * 在深圳和新加坡设立办公室 * GPT-4重要贡献者领衔 【游戏领域】 🎮 巨人网络发布千影QianYing游戏大模型 * 包含YingGame和YingSound两个核心模型 * 支持有声可交互游戏视频生成 * 启动"千影共创计划"推动行业合作 【硬件创新】 🥽 谷歌、三星联手发布新品 * 推出新一代混合现实头显 * 发布智能AI眼镜 * 基于Android XR操作系统 详情链接: https://android-developers.googleblog.com/2024/12/introducing-android-xr-sdk-developer-preview.html

5分钟
40
1年前

【AI日报】EP.52 12月13日 苹果Siri接入ChatGPT、谷歌Gemini 2.0版来袭

Aishaobing的个人播客

【系统升级】📱 苹果iOS 18.2正式版发布 * Siri接入ChatGPT智能助手 * 支持iPhone15Pro和iPhone16系列 * 无账户免费使用AI服务 * 未来将支持中文等多语言详情链接:无官方链接 【AI模型】🚀 谷歌Gemini 2.0 Flash发布 * 处理速度比1.5 Pro快2倍 * 支持实时音视频流处理 * 代码生成准确率达92.9% * 多模态能力全面提升官方链接:blog.google 【效率工具】📊 百度文库推出AI专业PPT生成 * 一键生成高质量PPT * 适合职场演示和汇报 * 支持多种主题风格定制详情链接:无官方链接 【创作工具】🎨 Midjourney推出Patchwork协作平台 * 支持100人同时创作 * 提供无限画布空间 * 需连接Discord和Google账号项目链接:patchwork.midjourney.com 【服务器】💻 苹果与博通合作研发AI处理器 * 项目代号"Baltra" * 预计2026年投产 * 基于Arm架构设计详情链接:无官方链接 【开发工具】⚙️ 谷歌发布AI编码助手Jules * 基于Gemini 2.0平台 * 自动修复软件漏洞 * GitHub无缝集成详情链接:labs.google.com 【硬件升级】🔧 谷歌发布Trillium AI芯片 * 性能提升4倍 * 已部署10万颗 * 每美元性能提升2.5倍官方链接:cloud.google.com 【创意工具】🎬 Adobe Firefly平台更新 * 内容生成量破160亿 * 即将推出视频生成功能 * 计划培训3000万学习者详情链接:无官方链接 【法律风险】⚖️ OpenAI Sora版权争议 * 涉嫌未授权使用游戏视频 * 可模仿主播角色 * 面临侵权风险详情链接:无官方链接 【网络安全】🚨 AI造谣新型犯罪案件 * 6人批量发布50万篇假信息 * 利用AI工具获取流量 * 造成严重网络污染详情链接:无官方链接 【服务中断】⚠️ ChatGPT全球宕机事件 * 可能与iOS更新有关 * 持续超过3小时 * 影响数百万用户详情链接:无官方链接

6分钟
32
1年前

【AI日报】EP.51 12月12日 OpenAI全面开放Canvas功能、豆包电脑版视频生成功能内测

Aishaobing的个人播客

AI工具更新】🎨 OpenAI Canvas功能全面开放 * 支持网页版及Windows应用 * 提供Python代码执行环境 * 支持快捷键和GPT定制功能链接:app.openai.com/canvas 【视频生成】🎬 豆包电脑版视频生成功能内测 * 每日免费生成10支视频 * 支持图片上传和提示词生成 * 可自定义运镜和分镜效果链接:doubao.com 【AI编程助手】💻 全球首个AI程序员Devin上线 * 月费500美元 * 支持自动化编码 * 提供团队协作功能体验地址:app.devin.ai 【AI视频技术】🎥 Adobe与MIT联合推出CausVid * 每秒9.4帧实时生成 * 首帧延迟仅1.3秒 * 创新因果生成技术项目链接:causvid.github.io 【模型升级】🚀 DeepSeek-V2.5-1210发布 * 数学任务完成率提升至82.8% * 实时编码得分达34.38% * 优化写作和推理能力详情链接:huggingface.co 【安全警告】⚠️ Claude AI设备控制功能漏洞 * 发现提示词注入漏洞 * 可能导致恶意软件下载 * 漏洞影响多个AI聊天机器人 【AI视频服务】🌐 YouTube扩展AI自动配音 * 面向数十万创作者开放 * 专注知识和信息类内容 * 支持多语言自动配音 【产业合作】🤝 视觉中国与生数科技Vidu合作 * 共同开发AI视频生产方案 * 整合版权资源与模型技术 * 探索产业智能化升级 【AI配件】👓 Solos发布AirGo Vision智能眼镜 * 集成ChatGPT功能 * 支持语音指令交互 * 搭载高清摄像头 【企业融资】💰 面壁智能获新一轮融资 * 投资金额达数亿元 * 加速端侧AI模型商业化 * MiniCPM下载量超300万

5分钟
35
1年前

【AI日报】EP.49 12月10日 广电总局整治AI魔改视频、OpenAI即将发布全新Sora

Aishaobing的个人播客

【监管动态】🚫 广电总局整治AI"魔改"视频 * 发布管理提示,加强视频内容监管 * 要求平台严格审核生成式AI内容 * 保护经典文化,防止恶意改编 【AI产品】🎤 海螺AI上线超强语音克隆 * 10-60秒样本即可复刻声音 * 支持12种语言切换 * 提供多种情绪选择详情链接:www.hailuo.ai 【视频技术】🎬 RunwayActOne重大更新 * 支持表演和声音无缝迁移 * 可用手机随时进行试镜 * 支持与Midjourney等工具联动详情链接:top.aibase.com 【OpenAI动态】🎥 Sora视频生成器即将发布 * 支持文字、图像和视频多种生成方式 * 效率和速度显著提升 * 预计12月冬季推广活动发布 * 或同步发布GPT-4.5 【视频处理】🔍 VISIONXL超高清视频修复 * 支持4倍超分辨率提升 * 13GB显存可处理25帧视频 * 处理时间不超过2.5分钟详情链接:vision-xl.github.io 【社交平台】🖼️ X平台推出Aurora图像生成器 * 支持生成版权人物图像 * 开放GrokAI免费使用 * 每日限制3张图片生成 * 两小时内限10条消息 【模型竞争】🏆 谷歌Gemini-Exp-1206创新高 * LMArena得分1379,超越ChatGPT-4.0 * ChatGPT-4.0获21,929票支持 * Gemini仍处测试阶段详情链接:ai.google.dev 【功能更新】📸 Google Photos年度回顾 * AI智能生成照片标注 * 提供个性化数据统计 * 支持分享个人时刻 【行业动态】⚔️ OpenAI与军方合作引争议 * 与安杜瑞尔达成合作 * 员工要求提高透明度 * 管理层强调仅限防御系统

5分钟
25
1年前

【AI日报】EP.47 12月7日 OpenAI推出每月200美元ChatGPT Pro、京东发布10大AI营销工具

Aishaobing的个人播客

【重磅发布】 🚀 OpenAI推出ChatGPT Pro订阅 * 每月200美元(约1500元人民币) * o1模型完整版逐步开放 * 支持更复杂的推理和自我纠错能力 * Pro模式在数据科学和编程领域表现优异 【AI营销】 💡 京东云发布言犀智能营销平台 * 推出10大AI营销工具 * 最大模型规模达810亿参数 * 服务超80万商家 * AIGC内容使用率80%,转化提升30% 【安全警告】 ⚠️ ComfyUI插件发现严重安全漏洞 * Impact-Pack插件被植入挖矿病毒 * 影响Ultralytics包 * 建议立即卸载受影响插件并安全扫描 详情链接:https://comfyui-wiki.com/zh/news/2024-12-05-comfyui-impact-pack-virus-alert 【技术创新】 🔬 谷歌发布PaLiGemma 2 * 新增情绪识别功能 * 专家质疑科学性和伦理风险 * 警告就业和教育领域潜在风险 【语音技术】 🎤 阿里通义实验室开源ClearerVoice-Studio * 提供多种语音处理功能 * 支持在线降噪处理 * 开源代码可直接使用 项目链接:https://github.com/modelscope/ClearerVoice-Studio 【系统更新】 📱 苹果iOS 18.2 RC版更新 * 新增Visual Intelligence视觉智能 * Siri整合ChatGPT技术 * 计划推出多语言版本支持 【企业融资】 💰 xAI获60亿美元融资 * 估值超400亿美元 * 77位投资者参与 * 年收入达1亿美元 * 计划12月推出独立应用 【产品创新】 📝 昆仑万维推出天工AI彩页 * 提供6大功能模块 * 500+文本样式 * 支持一键生成和主题调整 主要消息来源: 1. ComfyUI Wiki:https://comfyui-wiki.com/zh/news/2024-12-05-comfyui-impact-pack-virus-alert 2. ClearerVoice-Studio:https://github.com/modelscope/ClearerVoice-Studio

6分钟
33
1年前

【AI日报】EP.46 12月6日 iPhone国行版或接入文心4.0、ChatGPT周活跃用户破3亿

Aishaobing的个人播客

【AI研发】 🚀 Google DeepMind发布Genie 2 * 支持实时生成3D虚拟世界 * 可通过自然语言指令控制 * 支持长达1分钟的AI智能体互动 参考链接:https://deepmind.google/discover/blog/genie-2-a-large-scale-foundation-world-model/ 【语音技术】 🎤 Fish Speech 1.5重磅升级 * 新增5种语言支持 * 仅需10-30秒样本生成高质量语音 * 错误率低至2% 参考链接:https://fish.audio/zh-CN/ 【产品合作】 📱 iPhone国行版AI升级 * 将接入百度文心4.0模型 * 苹果承诺AI功能免费 * Apple Intelligence即将上线 详情链接:文章中未提供具体链接 【用户数据】 📈 ChatGPT最新数据 * 周活跃用户突破3亿 * 日消息量超10亿条 * 自2022年发布以来持续增长 来源:纽约时报DealBook峰会报告 【企业动态】 💻 xAI超算扩张计划 * Colossus AI计算能力将扩大10倍 * 整合超100万块GPU * 位于田纳西州孟菲斯 详情链接:文章中未提供具体链接 【行业报告】 📊 CISAC创意产业研究 * 预计2028年前创作者损失350亿澳元 * 音乐创作者收入或降24% * 影视创作者收入或降21% 来源:国际作家和作曲家协会研究报告 【国内动态】 🔍 文心一言最新数据 * 用户使用率达11.5%居首 * 日均调用量15亿次 * Token处理量超1.7万亿 统计截止:2024年6月 【产品升级】 🎨 字节跳动豆包升级 * 支持一键生成文字图片 * 优化中文数据学习能力 * 增强汉字生成能力 详情链接:文章中未提供具体链接

4分钟
34
1年前

【AI日报】EP.45 12月5日:字节AI助手豆包上线图片理解功能、亚马逊推Nova系列AI生成模型

Aishaobing的个人播客

📱 百度文心一言上线"深度写作"专业版 * 提升AI写作能力,主动搜索引用参考资料 * 支持个性化文字创作 * 专为总结汇报等场景优化 🎨 Hailuo AI推出I2V-01-Live模型 * 能将静态插画转为动态影像 * 保持原创作者的艺术风格 * 为数字艺术创作带来新可能 🤖 字节跳动AI助手豆包升级 * 新增图片理解功能 * 支持文字识别和内容解析 * 正在内测视频生成功能 ☁️ AWS发布Nova系列生成AI模型 * 包含Micro、Lite、Pro和Premier四种文本生成模型 * 推出Nova Canvas和Nova Reel图像视频生成工具 * 承诺在版权问题上提供赔偿政策 参考链接:https://aws.amazon.com/cn/ai/generative-ai/nova/ 🎥 前微软员工推出Lica视频制作工具 * 支持屏幕录制转化为教程视频 * AI自动添加过渡效果 * 提供免费和付费版本 ⚡ AI数据中心能耗预警 * 预计2026年耗电量将达到40吉瓦 * 相当于八个纽约市的用电量 * Lightmatter开发新型光学芯片应对挑战 🌐 斯坦福发布全球AI排名报告 * 美国位居首位,在私营投资领域领先 * 分析36个国家42个AI指标 * 中国在专利方面表现突出 💻 Cognition AI推出Devin编码助手 * 6个月内估值达20亿美元 * 声称可提升编程效率8倍 * 仍在持续提升能力 👥 OpenAI挖角DeepMind工程师 * 引入三位计算机视觉专家 * 专注多模态AI项目 * 加强研发实力 ⚖️ 实习生获奖又被诉 * 因恶意攻击被字节起诉赔偿800万 * 同时获得NeurIPS2024最佳论文奖 * 引发安全管理讨论

5分钟
56
1年前

【AI日报】EP.44 12月4日 阶跃星辰内测视频大模型Step-Video、即梦AI图片2.1模型支持生成中文字体

Aishaobing的个人播客

【视频生成】 🎬 阶跃星辰Step-Video模型开启内测 * 支持1080P高清视频生成 * 最长支持10秒视频生成 * 优化中国风题材生成效果 链接:https://top.aibase.com/tool/yuewenshipin 【图像生成】 🖼️ Luma Photon模型重磅发布 * 生成速度是现有模型的10倍 * 成本低至0.2美分/张1080p图片 * 支持多轮优化生成内容 链接:https://lumalabs.ai/photon 【内容创作】 🎥 快手可灵AI导演共创计划 * 中国首个AIGC导演共创计划 * 联合9位知名导演 * 已服务500万用户,生成5100万视频 * 12月6日正式上线 【多媒体工具】 📝 字节即梦AI图片2.1模型更新 * 突破中文字体生成难题 * 支持快速生成个性化海报 * 适用于多种设计场景 链接:https://top.aibase.com/tool/jimeng 【学术搜索】 📚 秘塔AI搜索重大升级 * 数据量增加7倍 * 覆盖数千万篇Open Access论文 * 新增"解释"功能助理解 【生产工具】 🎙️ WPS Office新增AI语音速记 * 支持实时录音转文字 * 多语言互译功能 * 云文档深度整合 【商业动态】 💼 OpenAI暂不考虑广告模式 * CFO Sarah Friar公开表态 * 专注现有商业模式发展 * 已招募广告营销领域专家 【开源项目】 🚀 腾讯混元视频生成大模型发布 * 130亿参数全面开源 * 支持高清真实感视频生成 * 可通过腾讯元宝APP试用 官网:https://aivideo.hunyuan.tencent.com 模型:https://huggingface.co/tencent/HunyuanVideo 【技术研究】 🤖 ChatGPT对特定词汇异常响应 * "David Mayer"触发强制结束对话 * 可能涉及GDPR被遗忘权 * 凸显AI模型复杂性

4分钟
58
1年前
EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧