​ChatGPT 语音功能升级,实时翻译对话更自然流畅

最近, 对其 的语音功能进行了全面升级,特别是针对订阅用户,旨在提升 的语音表达的自然性和情感丰富度。根据 OpenAI 的说法,更新后的 「高级语音模式」 现在可以实现更流畅、情感更细腻的语音输出,包括对语调、停顿以及表达同理心或讽刺等情感的改进。

图源备注: 图片由 AI 生成,图片授权服务商

值得注意的是,此次更新还新增了实时翻译功能。用户现在可以选择特定的语言对,要求 ChatGPT 进行翻译。AI 将会不断地对话双方的内容进行翻译,直到用户指示停止。这一功能非常适用于餐馆点餐或多语言的工作场景。

付费用户只需在聊天界面的语言图标上点击,即可在所有平台上体验这些语音改进。然而,OpenAI 也指出仍存在一些已知问题。用户可能会遇到偶尔的音频质量下降,比如音调或音量的突变,这在某些语音中可能更为明显。此外,所谓的 「幻觉」 现象仍然存在,ChatGPT 有时会无缘无故地产生奇怪的声音,例如片段、随机噪音,甚至是背景音乐。最近有用户反映,ChatGPT 在对话中突然播放了一段广告,尽管 OpenAI 并未投放广告。

OpenAI 在 年 5 月首次推出了 「高级语音模式」,并于 2024 年 10 月扩大了在欧盟的可用性。该功能的目标是实现与 AI 的自然实时互动,包括在对话中打断和表达情感。如果用户打开摄像头,ChatGPT 还可以对周围的物体或环境进行实时评论。类似的功能也出现在 应用中。

划重点:

🌟OpenAI 对 ChatGPT 进行了语音功能升级,使其语音更加自然流畅,情感表达更丰富。

🌍新增实时翻译功能,用户可选择语言对进行连续翻译,适用于多语言场景。

⚠️仍存在一些问题,包括音频质量波动和无故生成的奇怪声音。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

给 TA 打赏
共 {{data.count}} 人
人已打赏
AI 资讯

​谷歌 Gemini 应用月下载量超越 ChatGPT,用户活跃度仍显不足

2025-6-10 1:23:11

AI 资讯

突破传统!FUDOKI 模型让多模态生成与理解更灵活、更高效

2025-6-11 1:20:29

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索