1月9日,在我国网络空间安全协会人工智能安全管理专委会作业年会上,中文互联网语料资源渠道正式面向社会发布。
在中心网信办指导下,我国网络空间安全协会会同国家互联网应急中心,协同人工智能产、学、研、用单位,一起建造中文互联网语料资源渠道,面向社会供给中文互联网根底语料展现下载服务。渠道支撑职业范畴、内容模态、体量规划等多种标签分类,便于用户来下载与运用。
现在渠道共入驻27个语料数据集,数据总量约2.7T,首要分三类:一是我国网络空间安全协会会同国家互联网应急中心等建造的中文互联网根底语料;二是人民网、北京智源研究院、上海人工智能实验室等单位同享的互联网语料;三是我国网络空间研究院、我国国家版本馆、我国大百科全书出版社、我国社会科学院图书馆等单位奉献的优质中文根底语料样本。登录我国网络空间安全协会官网,即可在主页注册运用渠道。
下一步,渠道将依托我国网络空间安全协会人工智能安全管理专委会树立的语料共建同享机制,继续吸纳优质中文互联网语料进驻,探究展开数据来历合规点评、质量点评、安全检测等服务,构建健康可继续的中文互联网语料开发利用生态,促进和支撑大模型工业高质量开展。
新闻推荐
【2025-03-12】
【2025-03-12】
【2025-03-11】
【2025-03-11】
【2025-03-11】
【2025-03-11】
【2025-03-09】
【2025-03-09】
【2025-03-09】
【2025-03-08】
【2025-03-06】
【2025-03-06】