3月25日,央視新聞發(fā)布“詞元”相關(guān)專家解答。
指出,“詞元”是人工智能大模型為了高效處理數(shù)據(jù),把數(shù)據(jù)進行拆分后的最小信息單元,可以理解為一個字,或是一個詞,或是一個符號。
在人工智能時代,用戶輸入的每一個字,大模型生成的每一段話、識別的每一幅圖像,都在消耗詞元。
國家數(shù)據(jù)局相關(guān)負責(zé)人介紹,到今年3月,我國日均Token(詞元)的調(diào)用量已經(jīng)超過了140萬億。
國家數(shù)據(jù)局專家咨詢委員會委員張向宏:
日均超140萬億的詞元調(diào)用量,相當(dāng)于1000萬億個中文詞匯,也相當(dāng)于250個中國國家圖書館的資源量。
國家發(fā)展改革委國家信息中心人工智能處工程師 蔡馳宇:
詞元日均調(diào)用量大幅增長,充分表明人工智能正加速從實驗室走向千行百業(yè)和千家萬戶,變成了實實在在的生產(chǎn)力工具,像水、電、網(wǎng)絡(luò)一樣,成為智能社會運轉(zhuǎn)的基礎(chǔ)資源。詞元的消耗量是人工智能產(chǎn)業(yè)發(fā)展的重要指標(biāo)和“晴雨表”。
作為新生事物的詞元,也在催生新的機遇。
國家數(shù)據(jù)局負責(zé)人表示,以詞元計費為基礎(chǔ)的新型商業(yè)邏輯正在加速演進。
據(jù)了解,圍繞詞元的調(diào)用、分發(fā)與結(jié)算,一套新的價值體系正在加速演進形成,并成為人工智能產(chǎn)業(yè)可能變現(xiàn)的重要路徑。
蔡馳宇:過去,一家企業(yè)使用信息服務(wù),就得購買信息軟件,那是一次性購買軟件的價格;現(xiàn)在一家企業(yè)同樣是使用信息服務(wù),它可能直接調(diào)用的是大模型的接口,用多少詞元,就付多少費用,以詞元消耗量的多少作為計費的依據(jù)。
與此同時,專家表示,詞元消耗量增長也對電力資源提出了更高需求。今年的政府工作報告中提出,實施算電協(xié)同等新基建工程。
張向宏:算電協(xié)同的本質(zhì)含義,就是要使用我們國家具有超前優(yōu)勢的綠電來發(fā)展我們的算力產(chǎn)業(yè)和人工智能產(chǎn)業(yè)。

