​苹果推出全新 FS-DFM 模型,AI 长文本写作效率提升 128 倍!

苹果公司与俄亥俄州立大学研究团队联合发布的 FS-DFM(Few-StepDiscreteFlow-Matching) 模型。这一创新的语言模型在长文本生成方面表现出色,仅需 8 轮快速迭代,便可生成与传统模型上千轮迭代相媲美的文本质量。同时,它的写入速度可提高最多 128 倍,打破了以往长文本生成的效率瓶颈。

FS-DFM 模型的设计理念与主流的语言模型有所不同。以 为代表的自回归模型是逐字生成文本,每个字的生成都依赖于前面的内容。而则采用并行策略,一次性生成多个字,通过多轮迭代逐步优化最终结果。FS-DFM 在扩散模型的基础上进行了进一步简化,目标是用更少的步骤实现高质量文本的生成。

为了实现这一突破,苹果研究团队提出了一套精妙的三步法。首先,模型经过专门训练,可以灵活适应不同的精炼迭代次数。其次,他们引入了一个 「教师」 模型进行引导,确保每轮迭代中的更新既大幅又精准,从而避免过度调整的问题。最后,团队优化了迭代机制,使得模型能够以更少且更加稳健的步骤生成最终文本。

在性能评估中,FS-DFM 还对比了参数量为 70 亿的 Dream 模型和 80 亿的 LLaDA 模型。测试结果显示,即使 FS-DFM 的参数量仅为 1.7 亿至 17 亿,其在文本生成的困惑度 (越低越好,衡量文本的准确与流畅性) 和熵 (衡量模型选词信心的指标) 上,表现出更低的困惑度和更稳定的熵。这一成绩证明了 FS-DFM 模型在 长文本写作领域的潜力。

项目:https://machinelearning.apple.com/research/fs-dfm

**划重点:**

📝**FS-DFM 模型仅需 8 轮迭代,生成质量与传统模型千轮相当。**

🚀**写入速度提升最多 128 倍,极大提高长文本生成效率。**

🔍**性能测试显示,FS-DFM 在困惑度和熵的关键指标上均优于其他大型模型。**

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

给 TA 打赏
共 {{data.count}} 人
人已打赏
AI 资讯

​软银加码与 OpenAI 合作,Arm 将开发定制 CPU

2025-10-15 1:22:13

AI 资讯

腾讯聚焦 AI 人才培养: 青云奖学金首期资助 15 位硕博精英,提供稀缺算力资源

2025-10-15 1:22:30

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索