​Cursor 升级 Tab 模型,实时强化学习提升开发者建议精准度

Cursor 是一款基于的编程平台,最近宣布对其 Tab 模型进行了升级。Tab 模型是为开发者提供自动补全建议的系统。此次升级显著减少了低质量建议的数量,提高了建议的准确性。具体来说,新的 Tab 模型相比于之前的版本,建议数量减少了 21%,而接受率提高了 28%。

Cursor 在其博客中表示,实现高接受率不仅仅是让模型变得更智能,还需要懂得何时提供建议、何时不提供。为了应对这一挑战,Cursor 考虑了训练一个单独的模型,用于预测某个建议是否会被接受。该公司引用了一项 2022 年的研究,指出这种方法在 GitHubCopilot 中取得了成功。研究中采用了逻辑回归过滤器,分析编程语言、最近的接受历史和训练字符等特征,将那些得分较低的建议隐藏起来。

然而,Cursor 认为这种解决方案虽然可以预测用户接受建议的概率,但希望有一个更通用的机制,能够重用 Tab 模型学到的强大代码表示。Cursor 希望通过改变 Tab 模型的结构,避免在最初就产生低质量建议,而不是后续再进行过滤。

因此,Cursor 采用了策略梯度方法,这是一种强化学习的方法。当用户接受建议时,模型会得到奖励; 当建议被拒绝时,模型会受到惩罚; 而在选择保持沉默时则不会得到任何反馈。此方法需要 「在线」 数据,即从当前使用的模型收集的反馈。Cursor 通过每天多次向用户部署新的检查点,并迅速基于新交互对模型进行再训练,来解决这一问题。

Cursor 表示,当前从部署检查点到收集数据的过程仅需 1.5 到 2 小时,这在 行业中已经算是较快,但仍有进一步加速的空间。该公司的 Tab 模型每天处理超过 4 亿个请求,Cursor 希望这一改进能够提升开发者的编码体验,并计划在未来进一步开发这些方法。

在线强化学习是该领域最令人兴奋的方向之一,一位在 从事后训练的工程师在社交媒体上对此表示赞赏,称 Cursor 似乎是第一个成功在大规模上实施该技术的公司。

不久前,Cursor 的母公司 Anysphere 宣布融资 9 亿美元,估值达 99 亿美元,并推出了一项月费 200 美元的 「超值」 计划,承诺提供 20 倍于 20 美元月费 「专业版」 的使用量。此外,Cursor 还在同月进行了平台更新,新增了自动代码审查、记忆功能和一键设置模型上下文协议服务器的功能。

划重点:

🌟Cursor 的 Tab 模型升级后,建议数量减少 21%,接受率提升 28%。

🤖采用实时强化学习方法,模型可根据用户反馈自我调整。

💰Cursor 母公司 Anysphere 融资 9 亿美元,推出新计划与功能提升。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

给 TA 打赏
共 {{data.count}} 人
人已打赏
AI 资讯

OpenAI 董事会主席 Bret Taylor 谈人工智能泡沫:机遇与挑战并存

2025-9-16 1:22:02

AI 资讯

DeepMCPAgent 开源炸场:MCP+LangChain 一键建神级 AI 代理,生产力暴增 10 倍?

2025-9-16 1:22:19

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索