美团全新推理大模型 LongCat-Flash-Thinking 发布

近日,美团宣布推出一款基于混合专家架构的大型推理模型——LongCat-Flash-Thinking。这个新模型的参数量高达 5600 亿,令人瞩目! 但最令人惊喜的是,它能够根据上下文需求动态激活 186 亿至 313 亿个参数,平均激活约 270 亿个参数。这种灵活的设计使得模型在多种任务上表现出色,特别是在逻辑推理、数学运算和编程等领域。

根据美团的官方数据显示,LongCat-Flash-Thinking 在一系列基准测试中与其他主流模型进行了深入比较。在数学推理方面,例如 MATH500 和 AIME25 的测试中,该模型表现不凡,甚至声称使用原生工具可以减少 64.5% 的 token 消耗,依然能够达到顶级准确率。此外,在通用推理 (GPQA-Diamond)、代码生成 (LiveCodeBench,OJBench) 和形式化定理证明 (MiniF2F-Test) 等领域,它的表现也接近行业领先水平。

LongCat-Flash-Thinking 的模型权重已按照 MIT 许可证,开发者们现在可以自由使用和研究这个强大的工具。官方也提供了详细的聊天模板,并已上线专属聊天网站,方便用户进行互动与实践。

LongCat-Flash-Thinking 不仅仅是一款大规模的 模型,更是美团在研究领域的一次重要尝试。其出色的性能和灵活的架构将为后续的应用开发和研究提供新的可能性。

官网地址:https://longcat.chat/

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

给 TA 打赏
共 {{data.count}} 人
人已打赏
AI 资讯

xAI 发布 Grok4Fast:计算量降低 40%,单任务成本竟然降至 98%!

2025-9-23 1:22:26

AI 资讯

企业级 MaaS 来袭!硅基流动如何助力大模型产业化?

2025-9-23 1:22:44

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索