中文名確定!Token正式被譯名為“詞元”:我國日均呼叫量突破140萬億

國家數據局在官方公告中首次使用“詞元”作為Token的標準譯名,標誌著這一術語在中文人工智能領域的正式確立。

國家數據局局長劉烈宏24日在國新辦舉行的新聞發佈會上表示,到今年3月,我國日均詞元(Token)調用量已超過140萬億,相比2024年初的1000億增長了1000多倍,相比2025年底的100萬億,三個月時間又增長了40%多。

遊民星空

“日均詞元調用量的大量增加,充分表明中國的人工智能發展進入了快速增長階段。”劉烈宏表示,人工智能應用場景在不斷深化,從能對話到能決策執行的智能體,中國人工智能產業的競爭力在顯著增強,現在備受關注的Token出海,就是產業競爭力增強的一個標誌。

《人民日報》在2026年1月發佈《漫談詞元》科普文章,將Token定義為“處理文本的最小數據單元”,蘋果中國官網、央視新聞、中國計算機學會(CCF)等技術文檔也統一使用“詞元”。

怎麼理解詞元?簡單來說,詞元是人工智能大模型為了高效處理數據,把數據進行拆分後的“最小信息載體”,可以理解為“字/詞片段/符號”等。

比如“我愛中國!”,可拆分成“我”“愛”“中國”“!”4個詞元。

如果說互聯網時代信息傳輸的核心度量是流量,那麼人工智能時代,這一關鍵指標正變為詞元。用戶輸入的每一個字,模型生成的每一段話、識別的每一幅圖像,都在消耗詞元。