我国多数模型使用的中文数据占比超60%
发布日期:2025-08-14
来源:IT之家
8月14日消息,今日国务院新闻办公室举行“高质量完成‘十四五’规划”系列主题新闻发布会,国家数据局介绍“十四五”时期数字中国建设发展成就。
国家发展改革委党组成员、国家数据局局长刘烈宏介绍,经过多年持续攻坚,我国在数字领域突破了一批关键核心技术,展示出我国显著的发展成绩。集成电路加快布局,形成覆盖设计、制造、封装测试、装备材料的完整产业链;国产操作系统加速崛起,鸿蒙系统生态设备总量突破11.9亿台,为手机、汽车、家电等1200多类产品装上“智能中枢”;我国人工智能综合实力实现整体性、系统性跃升,人工智能专利数量占全球总量的60%。
刘烈宏还在新闻发布会上表示,大家非常关心中文数据占训练数据的比重问题,经过一段时间的努力,国内多数模型使用的中文数据占比已超过60%,有的模型已达到80%。中文高质量数据的开发和供给能力持续增强,使得我国模型性能快速提升。
