百度 PaddleOCR-VL 模型登顶全球 OCR 榜,连续五日领跑 Huggingface 趋势榜

10 月 16 日,百度飞桨 (PaddlePaddle) 团队正式发布了最新视觉语言模型 PaddleOCR-VL,一经上线便引发全球 OCR(光学字符识别) 领域轰动。该模型以 0.9B 参数规模权威评测 OmniDocBenchV1.5 中取得 92.56 分的成绩,超越包括-OCR 在内的所有主流模型,成功登顶全球 OCR 榜单。

截至 10 月 21 日, 全球模型趋势榜 (TrendingModels) 前 3 名均被 OCR 模型包揽:

  • 🥇PaddleOCR-VL(百度飞桨)

  • 🥈DeepSeek-OCR

  • 🥉NanonetOCR

其中,百度的 PaddleOCR-VL 已连续 5 天位居榜首,成为当前最受关注的开源 OCR 模型。

PaddleOCR-VL 支持 109 种语言识别,可精准解析文本、表格、公式与图表,并具备文档语义结构重建能力。这意味着它不仅能 「识字」,还能 「读懂」 复杂文档内容,在科研论文、发票识别、知识抽取等领域展现出极高实用价值。

值得一提的是,DeepSeek 团队在其论文中也特别致谢 PaddleOCR,并透露其训练数据部分使用了 PaddleOCR 进行标注。这一细节揭示了当前业界 OCR 模型繁荣背后的真实逻辑: 百度、DeepSeek 与上海 AILab 等机构几乎在同时开源 OCR 模型,目的并非仅是比拼识别性能,而是为训练清洗、标注数据提供基础能力。

换句话说,这场 「OCR 军备竞赛」 的核心,不只是识别谁更准,而是谁能更快地让 看懂世界的文字与图像

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

给 TA 打赏
共 {{data.count}} 人
人已打赏
AI 资讯

蚂蚁集团发布多模态应用 「灵光」,内置 AGI 相机,已开启内测

2025-10-25 1:21:22

AI 资讯

松延动力人形机器人 「小布米 Bumi」 京东开售 售价 9998 元

2025-10-25 1:21:46

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索