近日,上海的 AI 独角兽公司 MiniMax 正式推出了全球首个开源大规模混合架构推理模型——MiniMax-M1。该模型一经推出,便迅速跻身
MiniMax-M1 的亮相不仅令人瞩目,其在技术细节上的表现更是出色。该模型在长文本处理和工具调用等方面显示出强大的优势,支持高达 100 万 token 的上下文输入能力,足以一次性处理整部 《三体》 英文原著。这一性能是 DeepSeek 同类模型的八倍,甚至可以与谷歌
更令人惊叹的是,MiniMax 在强化学习阶段的研发投入仅为 53.5 万美元,远低于业内普遍的千万级研发成本,展现了其卓越的研发效率和产品化能力。在 M1 发布后的短短四个工作日内,MiniMax 便接连推出了多款创新产品,包括视频生成模型 Hailuo02、通用智能体 MiniMaxAgent、视频创作智能体 HailuoVideoAgent 及音色设计工具 VoiceDesign,保持着令人瞩目的 「日更」 节奏。
作为一家扎根于上海徐汇的 AI 企业,MiniMax 自 2022 年底 ChatGPT 引发全球热潮之前,就已开始布局通用人工智能(AGI) 领域,并果断摒弃了当时流行的大模型稠密架构和传统注意力机制。面对全球大模型研发企业的普遍收缩,MiniMax 坚决坚持基础模型研发的战略选择,最终实现了这一技术突破。
可以说,MiniMax-M1 的发布不仅是技术上的一大步,也是对行业未来的一次有力推动,或许将重新定义开源 AI 模型的发展方向。









