春节后上班后,省委书记、省委全面深化改革委员会主任娄勤俭主持召开省委全面深化改革委员会第五次会议。会议审议省委深改委2018年工作总结、2019年工作要点和3个改革方案。其中,有一条信息值得关注,那就是“加快推进省科学数据中心建设”。这是江苏省委、省政府首次公开提出建设省一级的科学数据中心。
什么是科学数据中心?
首先要弄明白什么是科学数据。用学术语言来说,科学数据是指在科技活动(实验、观测、探测、调查等)或通过其他方式所获取的反映客观世界的本质、特征、变化规律等的原始基本数据,以及根据不同科技活动需要进行系统加工整理的各类数据集。简单来说,科学数据就是与科学活动紧密相关,并服务于科学研究的数据。
在大数据时代,科技创新越来越依赖大量、系统、高信度的科学数据。科学数据已成为国家的战略资源,成为整个科研活动的基石和保障。这就意味着,加强和规范科学数据管理,推动科学数据开放共享,必然成为提升我国科技创新能力建和保障国家安全的重要方式和手段。科学数据中心是科学数据管理的重要载体之一,是促进科学数据资源管理与共享水平持续提高的专门机构。文献梳理发现,科学数据中心主要有三方面的重要作用,一是对科学数据进行收集整理;二是加强对科学数据的保护运用;三是促成科学数据的开放共享。形象一点来说,科学数据中心就是把各类躺在抽屉里的科学数据集中起来,供有需要的人检索、使用。
国内已有哪些科学数据中心?
从中央层面看,自2004年起,科技部、财政部先后在基础科学、农业、林业、海洋、气象、地震、地球系统科学、人口与健康9个领域支持建成了国家科技资源共享服务平台,初步形成了一批资源优势明显的科学数据中心。这些科学数据中心都是网络平台,强调学科性、开放性和服务性,数据检索大多是免费的。
2018年1月,中央全面深化改革领导小组第二次会议审议通过《科学数据管理办法》,其中明确指出,要加强统筹布局,在条件好、资源优势明显的科学数据中心基础上,优化整合形成国家科学数据中心。2018年4月,在科技部召开的《科学数据管理办法》新闻通气会上,国家科技基础条件平台中心副主任王瑞丹也明确表示,我国将建设一批有重要影响的国家科学数据中心。
从省一级来看,目前尚未有建好的省一级科学数据中心。据公开报道,除江苏以外,重庆也明确提出建设科学数据中心。1月28日重庆日报报道,重庆市科技局相关负责人表示,“我们将建设科学数据中心平台门户系统,用于科学数据信息发布和网络管理。”可见,重庆市科学数据中心也将是网络平台的形式。
相较之下,贵州无疑是科学数据建设布局最早的省份,不仅把科学数据中心建设写入2018年省政府工作报告,而且将其作为本届政府的九方面工作之一。更重要的是,贵州省科学数据中心不只是一个网络平台,还有线下的实体。据有关报道,贵州省科学数据中心建设已进入规划设计讨论阶段,该项目由贵州省科技信息中心、省规划设计院建筑一所负责,或设有超算中心、生物医学大数据中心、SKA数据中心、遥感数据中心、科技文献数据中心等五个中心。目前具体的投资金额和建设周期尚未找到公开资料。
美国科学数据中心建设的经验
总体而言,我国在科学数据中心建设上尚处于起步阶段,尤其需要了解和借鉴发达国家的科学数据中心建设方面的先进理念和做法。美国是世界上科学数据拥有量最多的国家,目前已形成了一系列上至国家级下至各行业部门的科学数据中心,并在科研过程中发挥了重要作用。
一是国家层面推动大数据战略,把科学数据的持续积累和开放利用能力提高到了国家科技战略的高度进行部署。二是市场化竞争是主流,规模化效应是核心。美国数据中心运营商大多通过并购重组,形成规模较大的行业巨头,利用规模效应降低成本,提高竞争力。三是科学数据共享实行两种不同运行机制,政府拥有、产生和政府投资产生的数据纳入到“完全与开放”共享管理机制;私营公司投资产生的数据纳入到“平等竞争”市场化共享管理机制。四是建立了国有科学数据“完全与开放”共享管理机制的保障体系,包括建立和健全科学数据共享政策法规体系,强化科学数据质量和标准,为数据的应用提供技术服务等。
江苏建设科学数据中心的优势
江苏科教资源丰富,连续7年创新能力居全国省区首位,全省拥有普通高校141所,各具优势与特色。在大数据产业方面,江苏信息技术产业领跑全国,发展大数据产业也是先人一步。省政府公布的《大数据发展行动计划》明确:到2020年,建成10个省级大数据产业园,引进培养100名大数据领军人才,60%的软件企业实现服务化转型,培育5家业务收入超100亿元、50家业务收入超10亿元的大数据龙头企业。
对科学数据中心建设的几点担忧
一是警惕科学数据中心建设出现过热、盲目和重复建设等现象,比如省一级建了,各个市又要建。
二是避免重建轻管,数据维护、更新不及时,数据反哺和回报机制不完善等。
三是数据中心建设缺乏用户思维,使用效能偏低,沦为面子工程,等等。