我国多数模型使用的中文数据占比超60%
部分已达80%
2025-08-14
来源:IT之家
8月14日消息,今日国务院新闻办公室举行“高质量完成‘十四五’规划”系列主题新闻发布会,国家数据局介绍“十四五”时期数字中国建设发展成就。
国家发展改革委党组成员、国家数据局局长刘烈宏介绍,经过多年持续攻坚,我国在数字领域突破了一批关键核心技术,展示出我国显著的发展成绩。集成电路加快布局,形成覆盖设计、制造、封装测试、装备材料的完整产业链;国产操作系统加速崛起,鸿蒙系统生态设备总量突破11.9亿台,为手机、汽车、家电等1200多类产品装上“智能中枢”;我国人工智能综合实力实现整体性、系统性跃升,人工智能专利数量占全球总量的60%。
刘烈宏还在新闻发布会上表示,大家非常关心中文数据占训练数据的比重问题,经过一段时间的努力,国内多数模型使用的中文数据占比已超过60%,有的模型已达到80%。中文高质量数据的开发和供给能力持续增强,使得我国模型性能快速提升。
本站内容除特别声明的原创文章之外,转载内容只为传递更多信息,并不代表本网站赞同其观点。转载的所有的文章、图片、音/视频文件等资料的版权归版权所有权人所有。本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如涉及作品内容、版权和其它问题,请及时通过电子邮件或电话通知我们,以便迅速采取适当措施,避免给双方造成不必要的经济损失。联系电话:010-82306118;邮箱:aet@chinaaet.com。