(资料图片仅供参考)
北京商报讯(记者 杨月涵)5月16日,据北京市科委官网,北京出台《北京市促进通用人工智能创新发展的若干措施(2023-2025年)(征求意见稿)》,针对目前大模型训练高质量中文语料占比过少,不利于中文语境表达及产业应用的问题,征求意见稿提到,整合现有开源中文预训练数据集和高质量互联网中文数据并进行合规清洗。同时持续扩展高质量多模态数据来源,建设合规安全的中文、图文对、音频、视频等大模型预训练语料库,通过北京国际大数据交易所社会数据专区进行定向有条件开放。
关键词:
“拉姆案”一审宣判 被告人唐路犯故意杀人罪被判死刑
以房养老、低价旅游、情感陪伴……这些诈骗专盯老年人!
即时看!北京拟整合现有开源中文预训练数据集和高质量互联网中文数据
哈登、杜兰特重聚!火箭、篮网酝酿四方交易,艾顿搭档杰伦格林?
车快速去除甲醛的方法_去除车内甲醛有什么技巧|环球热讯
轻微伤等于轻伤二级吗|全球快看
山西新绛灾后重建:清淤消杀房屋鉴定全面启动
安徽合肥发现一例新冠核酸检测疑似阳性病例
山西左权:太行山下“红色小镇”走出“国际范儿”
浙江举行“文旅+”发展对话:以产业融合助长三角一体化
打卡郑州黄河滩地公园 感受黄河的壮美奇观