5000 万美元种子轮融资!斯坦福教授创立 Inception,用 「扩散式大模型」 挑战 GPT-5,代码生成速度超 1000 token/秒

当全球 竞赛仍围绕自回归(如 -5、Gemini) 激烈缠斗时,一家新锐初创公司正以颠覆性架构悄然突围。由斯坦福大学教授 StefanoErmon 领衔的 AI 公司 Inception 近日宣布完成 5000 万美元种子轮融资,由 MenloVentures 领投,微软 M12、英伟达 NVentures、SnowflakeVentures、DatabricksInvestment 及 Mayfield 跟投,吴恩达 (AndrewNg) 与 AndrejKarpathy 亦以天使人身份加入,阵容堪称豪华。

Inception 的核心押注,是将原本用于(DiffusionModels) 全面引入文本与代码领域,挑战当前主流的自回归范式。Ermon 指出,GPT、Gemini 等模型采用 「逐词预测」 方式,必须串行处理,限制了速度与效率; 而扩散模型通过并行迭代优化整体输出,在处理大规模代码库或长文本时展现出显著优势。

这一理念已落地为产品: 公司同步发布其最新模型 Mercury,专为软件开发场景设计,目前已集成至 ProxyAI、Buildglare、KiloCode 等多款开发者工具。实测显示,Mercury 在代码补全、重构与跨文件理解任务中,推理速度突破 1000token/秒,远超现有自回归模型。「我们的架构天生为并行而生,」Ermon 强调,「它更快、更高效,且对算力成本极度友好。」

为何扩散模型适合代码?

代码不同于自然语言——它结构严谨、依赖全局上下文,且常需跨文件关联。自回归模型在处理此类任务时,易因 「逐字生成」 而忽略整体逻辑一致性。而扩散模型从 「噪声」 出发,通过多轮全局调整逼近目标输出,天然适合高结构化数据。此外,其并行计算特性可充分利用 GPU/TPU 集群,显著降低延迟与能耗,直击当前 AI 基础设施高成本痛点。

巨头为何押注?

在 AI 训练与推理成本飙升的背景下,效率成为新战场。微软、、Databricks 等投资方均在构建 AI 开发栈,亟需高性能、低开销的模型底座。Inception 的路径,或为大模型商业化提供一条 「省算力、高吞吐」 的新出路。

认为,Inception 的崛起标志着 AI 架构探索进入深水区——当参数竞赛边际效益递减,底层范式创新将成为破局关键。如果扩散式 能在代码、科研、金融等高价值场景持续验证其优势,这场由斯坦福实验室发起的技术革命,或将重塑 的未来版图。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

给 TA 打赏
共 {{data.count}} 人
人已打赏
AI 资讯

Step-Audio-EditX 发布:30 亿参数音频 LLM 打开语音 「可编辑时代」

2025-11-11 1:23:10

AI 资讯

Inception 重返 AI 赛道,50 百万美元融资助推新模型崛起

2025-11-11 1:23:28

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索