音频创作门槛被彻底击穿。国内 AI 独角兽阶跃星辰 (StepStepFunAI) 于 11 月 9 日正式发布全球领先的 LLM 级音频编辑模型——Step-Audio-EditX,
30 亿参数,性能不减反升
Step-Audio-EditX 的核心突破在于其
方言与情感,拿捏得死死的
该模型对中文语境的理解尤为惊艳,流畅支持普通话、英语、四川话、粤语,方言表达中的地域情绪与语用习惯自然真实。在盲测中,评测员一致认为其 「川渝段子的市井感」「粤语语气词的细腻度」 远超同类产品。
硬刚闭源商用模型,三项指标全面领先
AIbase 获取的对比数据显示,Step-Audio-EditX 在三大核心维度碾压 Minimax 与字节跳动 Doubao 等闭源方案:
自然度评分:4.72/5(Minimax4.51,Doubao4.38)
情感准确率:93.7%(领先第二名 6.2 个百分点)
音色保持度:98.1%,几乎无损还原
应用场景爆发: 从短视频到无障碍服务
这一技术正催生全新内容形态:
短视频博主可一键切换 「元气少女」「毒舌导师」 等人设声音;
有声书创作者单人完成多角色情感对白;
四川话搞笑视频经 AI 重制,秒变美式脱口秀风格出海;
听障用户的语音合成系统
AIbase 认为,Step-Audio-EditX 的意义远超工具升级——它正在重构音频内容的生产逻辑。当语音不再是 「录制即定型」 的线性媒介,而成为可反复雕琢的 「活文本」,亿万创作者将获得前所未有的表达自由。下一步,若阶跃星辰开放 API 或集成至手机系统,这把 「AI 魔法剪刀手」 或将真正进入每个人的口袋,让每一次发声,都可被重新想象。
产品入口:https://stepaudiollm.github.io/step-audio-editx/










