百度击败谷歌!PaddleOCR成GitHub最受欢迎OCR项目:中国开源首度登顶
创始人
2026-03-31 13:37:55
0

快科技3月31日消息,近日,百度文心衍生模型PaddleOCR在GitHub上的Star数突破73.3K,首次超越谷歌旗下开源OCR标杆产品Tesseract OCR(73.2K),成为全球Star数最高的OCR项目。

Tesseract OCR诞生于1985年,最初由惠普实验室研发,2005年开源后由Google接手维护并持续迭代,是OCR领域延续近四十年的技术标杆,长期位居GitHub OCR项目Star数榜首。

此次被PaddleOCR超越,标志着这一标杆正在被新一代技术体系改写,也是大模型驱动下中国开源项目首次在OCR领域超越谷歌主导的标杆产品。

PaddleOCR基于文心大模型训练而来,是文心大模型多模态能力的重要部分,支持超100种语言识别,用户覆盖160个国家和地区。1月29日,新一代文档解析模型PaddleOCR-VL-1.5在 OmniDocBench V1.5 榜单中取得了全球SOTA成绩。

近年来,大模型成为OCR赛道增长的重要动力。Star History数据显示,PaddleOCR在GitHub上的Star自2024年起呈现爆发式增长。2025年以来,OCR更成为大模型厂商布局的重点方向,DeepseekOCR、HunyuanOCR、GLM OCR等产品相继发布。

此外,PaddleOCR同步升级服务能力:官网免费每日解析页数由1万提升至2万,用户还可通过OpenClaw直接调用PaddleOCR Skill,免费获取高精度PDF解析能力。

与此同时,PaddleOCR OCEAN生态联盟正式成立,面向核心开源贡献者、深度企业用户及全球平台伙伴开放,首批成员包括Hugging Face、Dify、RAGFlow、Cherry Studio、Milvus等全球平台伙伴,将共同推动OCR技术在更广泛场景中的应用落地。

ps.OCR(Optical Character Recognition,光学字符识别)是指通过光学设备(如扫描仪、摄像头)获取图像中的文本信息,再通过计算机算法将其转化为可编辑、可检索、可分析的数字文本的技术。简单来说,就是让计算机看见并读懂图像中的文字,实现 "图像文本→数字文本" 的精准转化。

相关内容

最新资讯

特朗普:各国应自行去霍尔木兹海... 新华社华盛顿3月31日电 美国总统特朗普3月31日在社交媒体上发文说,所有因霍尔木兹海峡被关闭而无法...
【研小生】西南财经大学802经... 西南财经大学802经济学考研专业课复习资料,针对27考生复习整理。资料共4本,一本真题及答案解析,三...
教育部发布20条严禁清单 3月27日,教育部发布《关于开展基础教育规范管理巩固年行动的通知》,将围绕教育公平、日常管理、办学治...
人教PEP版六年级下册英语小升... 这是人教PEP版六年级下册英语小升初阅读理解真题每日一练(含答案),精选 真题阅读,涵盖不同题型和话...
《冬去春来》四对情侣的命运翻牌... 谁能想到,一部讲述90年代北漂追梦的电视剧,最终把最圆满的结局给了那个最不起眼的旅馆伙计?回到那条满...
官方回应鞠婧祎涉税事项:未发现... 3月30日,我局收到关于鞠某某涉税事项的实名举报。自2025年9月起,我局多次收到类似举报线索,经认...
大中小学教师同上一堂“践行科技... 中国教育报-中国教育新闻网讯(通讯员 杨亮 金恩华)3月26日,一场以“星海映初心 攻坚向苍穹”为主...
河北省2026年上半年教师资格... 3月30日 河北省教师发展与资格认定事务中心发布 河北省2026年上半年 中小学教师资格考试(面试)...
伊朗高层爆发“内讧”,总统指责... 在美伊冲突的阴霾中,伊朗高层目前正经历一场深刻的权力斗争。总统佩泽希齐扬与革命卫队总司令瓦希迪之间的...
教师资格、教师招聘每日一练(3... 点击获取 「0.1抢福利」 ✊ 16学科面试稿获取 本文收藏+转发价值 ☆☆☆☆ 教师资格每日一练笔...