
近日,中国 AI 公司 DeepSeek 发布的最新模型 DeepSeek V3 在测试中出现异常:它自称是 OpenAI 的 ChatGPT,并能提供 OpenAI 的 API 使用说明。专家认为,这可能是由于训练数据中混入了大量 ChatGPT 生成的内容,导致模型 「身份混淆」。
随着 AI 生成内容在网络上激增,训练数据污染问题日益严重。DeepSeek 表示正在优化数据清洗流程,以提升模型的独立性和准确性。
未来 AI 开发中数据纯净性已经变得很重要,如何有效过滤 AI 生成内容将成为行业的关键。

