研究团队采用了一套名为 「分布式 LLM 量化框架 (DistributionalLLMQuantificationFramework)」 的统计模型,通过分析语料整体的语言特征分布,估算出特定时间段内具备 AI 生成特征的文本比例。需要注意的是,该方法目前仅适用于英文语料,因此其结果反映的仅是英文文本中具备 AI 特征的比例,并不意味着整篇文章 「完全由 AI 撰写」。
报告数据显示,研究团队分析了去年共计 68.7 万条消费者投诉、53.7 万篇企业新闻稿、3.04 亿份招聘信息以及 1.6 万篇联合国新闻稿,结果令人关注:
-
企业新闻稿: 约 24% 的文稿带有 AI 痕迹。
-
消费者投诉: 约 18% 的投诉文本具备 AI 特征。
-
联合国新闻稿: 约 14% 的内容被认定为 「几乎由 AI 大模型直接生成,或经过大幅改写」。
-
招聘信息: 接近 10% 的招聘内容带有 AI 痕迹。
研究人员指出,LLM 已深入渗透社会各领域的正式文本写作,并逐渐成为人们日常书面表达的重要辅助工具。在细分领域,研究发现教育程度较低的地区使用 AI 撰写投诉的比例高达 19.9%,明显高于教育程度较高地区的 17.4%。在招聘信息方面,中小型企业或初创公司更倾向于使用大模型生成内容,其中约有 10% 至 15% 的招聘公告包含明显的 AI 痕迹。
研究人员同时强调,随着生成式 AI 技术的不断进步,其文风正日益接近人类。因此,未来要精确识别 AI 在文本创作中的参与程度将变得愈发困难。








