讀書改變生活,精品有聲讀物,免費領取 領取
2023年合肥高新區管委會招聘筆試題庫下載
《申論考前必背手冊》完整版下載
全國各省市地區輔警招聘面試題庫下載
2023年上海公檢法院及出入境輔助崗位招聘筆試題庫下載
中文互聯網語料AI資源平臺發布:27個數據集、總量2.7T
2025-01-11 11:43:18閱讀()中國網絡空間安全協會中國網絡空間安全協會于1月9日發布公告,面向社會發布中文互聯網語料資源平臺,支持行業領域、內容模態、體量規模等多種標簽分類,便于用戶下載與使用。
該協會表示在中央網信辦指導下,會同國家互聯網應急中心,在前期發布中文互聯網基礎語料 1.0的基礎上,依托專委會建立的語料共建共享機制,匯聚一批新的高質量可信數據,經過信源篩選、內容過濾、數據去重等一系列嚴格細致的數據加工處理措施,形成并對社會發布中文互聯網基礎語料2.0,規模120GB,數據3800萬條。

注:目前平臺共入駐27個語料數據集,數據總量約2.7T,主要分三類:
一是中國網絡空間安全協會會同國家互聯網應急中心等建設的中文互聯網基礎語料;
二是人民網、北京智源研究院、上海人工智能實驗室等單位共享的互聯網語料;
三是中國網絡空間研究院、中國國家版本館、中國大百科全書出版社、中國社會科學院圖書館等單位貢獻的優質中文基礎語料樣本。
用戶登錄中國網絡空間安全協會網站(https://www.cybersac.cn/newhome),點擊“中文互聯網語料資源平臺”鏈接,通過注冊、認證等程序,即可下載相關語料。
網安協會人工智能安全治理專委會負責人表示,數據是發展人工智能的基礎關鍵資源,中文互聯網基礎語料2.0是各界協同共建高質量中文語料的又一重要成果,專委會將持續加強中文互聯網基礎語料建設,為人工智能技術創新和產業發展提供有力支撐和保障。
掃一掃,手機繼續看
部分數據為彩果考試網(www.jcz9c.cn)收集整理,轉載或復制請注明出處!-彩果考試網-