百度擊敗谷歌!PaddleOCR成GitHub最受歡迎OCR專案:中國開源首度登頂

近日,百度文心衍生模型PaddleOCR在GitHub上的Star數突破73.3K,首次超越谷歌旗下開源OCR標杆產品Tesseract OCR(73.2K),成為全球Star數最高的OCR項目。

Tesseract OCR誕生於1985年,最初由惠普實驗室研發,2005年開源後由Google接手維護並持續迭代,是OCR領域延續近四十年的技術標杆,長期位居GitHub OCR項目Star數榜首。

此次被PaddleOCR超越,標誌著這一標杆正在被新一代技術體系改寫,也是大模型驅動下中國開源項目首次在OCR領域超越谷歌主導的標杆產品。

遊民星空

PaddleOCR基於文心大模型訓練而來,是文心大模型多模態能力的重要部分,支持超100種語言識別,用戶覆蓋160個國家和地區。1月29日,新一代文檔解析模型PaddleOCR-VL-1.5在 OmniDocBench V1.5 榜單中取得了全球SOTA成績。

近年來,大模型成為OCR賽道增長的重要動力。Star History數據顯示,PaddleOCR在GitHub上的Star自2024年起呈現爆發式增長。2025年以來,OCR更成為大模型廠商佈局的重點方向,DeepseekOCR、HunyuanOCR、GLM OCR等產品相繼發佈。

此外,PaddleOCR同步升級服務能力:官網免費每日解析頁數由1萬提升至2萬,用戶還可通過OpenClaw直接調用PaddleOCR Skill,免費獲取高精度PDF解析能力。

與此同時,PaddleOCR OCEAN生態聯盟正式成立,面向核心開源貢獻者、深度企業用戶及全球平臺夥伴開放,首批成員包括Hugging Face、Dify、RAGFlow、Cherry Studio、Milvus等全球平臺夥伴,將共同推動OCR技術在更廣泛場景中的應用落地。

ps.OCR(Optical Character Recognition,光學字符識別)是指通過光學設備(如掃描儀、攝像頭)獲取圖像中的文本信息,再通過計算機算法將其轉化為可編輯、可檢索、可分析的數字文本的技術。簡單來說,就是讓計算機看見並讀懂圖像中的文字,實現 "圖像文本→數字文本" 的精準轉化。

遊民星空