百度擊敗谷歌！PaddleOCR成GitHub最受歡迎OCR專案：中國開源首度登頂

近日，百度文心衍生模型PaddleOCR在GitHub上的Star數突破73.3K，首次超越谷歌旗下開源OCR標杆產品Tesseract OCR（73.2K），成為全球Star數最高的OCR項目。

Tesseract OCR誕生於1985年，最初由惠普實驗室研發，2005年開源後由Google接手維護並持續迭代，是OCR領域延續近四十年的技術標杆，長期位居GitHub OCR項目Star數榜首。

此次被PaddleOCR超越，標誌著這一標杆正在被新一代技術體系改寫，也是大模型驅動下中國開源項目首次在OCR領域超越谷歌主導的標杆產品。

遊民星空

PaddleOCR基於文心大模型訓練而來，是文心大模型多模態能力的重要部分，支持超100種語言識別，用戶覆蓋160個國家和地區。1月29日，新一代文檔解析模型PaddleOCR-VL-1.5在 OmniDocBench V1.5 榜單中取得了全球SOTA成績。

近年來，大模型成為OCR賽道增長的重要動力。Star History數據顯示，PaddleOCR在GitHub上的Star自2024年起呈現爆發式增長。2025年以來，OCR更成為大模型廠商佈局的重點方向，DeepseekOCR、HunyuanOCR、GLM OCR等產品相繼發佈。

此外，PaddleOCR同步升級服務能力：官網免費每日解析頁數由1萬提升至2萬，用戶還可通過OpenClaw直接調用PaddleOCR Skill，免費獲取高精度PDF解析能力。

與此同時，PaddleOCR OCEAN生態聯盟正式成立，面向核心開源貢獻者、深度企業用戶及全球平臺夥伴開放，首批成員包括Hugging Face、Dify、RAGFlow、Cherry Studio、Milvus等全球平臺夥伴，將共同推動OCR技術在更廣泛場景中的應用落地。

ps.OCR（Optical Character Recognition，光學字符識別）是指通過光學設備（如掃描儀、攝像頭）獲取圖像中的文本信息，再通過計算機算法將其轉化為可編輯、可檢索、可分析的數字文本的技術。簡單來說，就是讓計算機看見並讀懂圖像中的文字，實現 "圖像文本→數字文本" 的精準轉化。

遊民星空