記者從國家數據局獲悉:中文數據在國內大模型的訓練性能提升方面發(fā)揮著重要作用。國內多數模型訓練使用的中文數據占比已經超過60%,有的模型達到80%。中文高質量數據的開發(fā)和供給能力持續(xù)增強,推動我國人工智能模型性能快速提升。
在人工智能時代,Token(通常所說的詞元)是處理文本的最小數據單元。國家數據局局長劉烈宏介紹,2024年初,我國日均Token的消耗量為1000億,截至今年6月底,日均Token消耗量已經突破30萬億,1年半時間增長了300多倍,反映了我國人工智能應用規(guī)模的快速增長。(記者 王云杉)
北疆新聞 | 內蒙古自治區(qū)重點新媒體平臺,內蒙古出版集團?內蒙古新華報業(yè)中心主管主辦的國家互聯網新聞信息采編發(fā)布服務一類資質平臺。
北疆新聞版權與免責聲明:
一、凡本站中注明“來源:北疆新聞”的所有文字、圖片和音視頻,版權均屬北疆新聞所有,轉載時必須注明“來源:北疆新聞”,并附上原文鏈接。
二、凡來源非北疆新聞的新聞(作品)只代表本網傳播該消息,并不代表贊同其觀點。
如因作品內容、版權和其它問題需要同本網聯系的,請在見網后30日內進行,聯系郵箱:bjwmaster@163.com。
版權聲明:北疆新聞版權所有,未經書面授權,不得轉載或建立鏡像,違者依法必究。 本站違法和不良信息舉報電話:15648148811蒙ICP備16001043號-1
Copyright © 2016- 北疆新聞 All Rights Reserved互聯網新聞信息服務許可證:15120200009-1廣播電視節(jié)目制作經營許可證:(蒙)字第631號蒙公網安備:15010502001245