Album
时长:
3分钟
播放:
5
发布:
1年前
主播...
简介...
https://xiaoyuzhoufm.com

关注《田丰说》,每天3分钟,掌握全球AI大事件!本视频由商汤“如影”数字人APP生成。


田老师认为,声音是最具感染力的表现形式,超级拟真的人类声音AI助手将走入各行各业、千家万户。能感受谈话对方情绪变化、环境变化的AI语音交流,正在成为所有智能终端、服务窗口的“必杀技”,美国有OpenAI的GPT-4o,正在融入近十亿苹果手机终端,而中国也有多模态感知、语音交流的商汤日日新5o,成为每个青少年、成年人的生活小助手、工作好帮手。


全球AI要闻,2024年秋季,OpenAI全面放开高级语音模式。


7月31日,OpenAI在X官方账号宣布,将在ChatGPT中向一小部分Plus付费用户推出高级语音模式,秋季将向所有Plus用户推出。所谓的高级语音模式将提供更自然、实时的对话模式,允许用户随时打断,并能感知和回应情绪。OpenAI用100多名外部红队人员测试了 GPT-4o的语音功能,涉及全球45种语言。为了保护个人隐私,对模型预设了四种声音说话,还引入了新的过滤器来实施防护,阻止对暴力或受版权保护内容的请求。OpenAI称:“从这次阿尔法测试中汲取的经验将有助于我们为每个人提供更安全、更丝滑的高级语音体验。”OpenAI计划在8月初分享有关GPT-4o功能、局限性和安全评估的详细报告。


本周一,OpenAI签署了一份致立法者的信函,与微软、Meta、Palantir、Cohere、亚马逊等公司一起支持美国人工智能安全研究所。美国《未来人工智能创新法案》正式授权美国人工智能安全研究所,作为制定人工智能模型标准和指导方针的联邦机构,该研究所会与私营组织、公共组织合作,“最大限度地降低人工智能这项新技术带来的潜在风险”。


本周,OpenAI GPT-4o开始测试64K“长输出模式”。Alpha版测试用户能使用“GPT-4o-64k-output-alpha”API端点访问。从推理角度来看,长输出的成本更高,因此该模型的定价会相应提高,以匹配成本开支,每百万输入token定价为6美元,每百万输出token定价是18美元。


每天3分钟,掌握全球AI大事件!《田丰说》全网发布,请点赞、收藏加关注!

评价...

空空如也

小宇宙热门评论...

暂无小宇宙热门评论

EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧