ca88登录页面最新专刊“国家科学数据中心”联合专刊上线

  数据引领创新,科技永续发展。信息时代,数字经济正成为全球经济增长和提质增效的新引擎,重视和发掘大数据价值,已经成为世界各国的共识和战略抉择,科学大数据的建设、管理与共享工作日益引起世界各国的高度重视。科学大数据作为我国战略性资源,是推动数字经济和实体经济融合发展的基石。在国家大力开展大数据战略的进程中,系统推进科学大数据建设,对推动科技进步、促进经济社会发展、维护作用巨大。

  欲茂其末,必深其根。长期以来,科学大数据作为我国大数据战略的有机组成,在国家层面密集战略部署和全面落实的基础上得以迅猛发展。而在国家政策同步指导下,2019年科技部会同有关部门更组建完成了首批二十个国家级科学数据中心。这些代表性的战略性新兴产业项目,不仅为我国科学数据管理和开放共享方面提供重要的基础设施和载体,同时在当前世纪疫情和百年变局交织叠加的背景下,对提升国家战略科技实力、增强产业链条韧性、加快生态文明建设等领域意义重大。2021年12月21日,国务院办公厅印发《要素市场化配置综合改革试点总体方案》,在历年政策基础上进一步明确了未来数据要素的制度改革方向。该方案的出台标示着相关领域内制度改革正不断向深水区挺进。相信“十四五”期间,随着我国推动要素市场化配置改革加速向纵深发展,以及战略性新基建的不断推进,科学大数据产业共享管理和改革发展必然会得到进一步的飞跃。

  孤举者难起,众行者易趋。为进一步明晰科学大数据战略,推动我国各领域科学数据流动融合、促进科学大数据产业发展,倡导以大数据驱动的科学研究模式,《大数据》期刊、《数据与计算发展前沿》期刊、《中国科学数据(中英文网络版)》、《中国科技资源导刊》联合首批二十个国家科学数据中心出版联合专刊,共同组织和邀请多领域专家聚焦于产业政策、技术发展、数据汇集管理、数据开放共享等领域,围绕国家战略安全和经济社会发展需求,从不同角度进行深入研究和分析。联合专刊期待能够以此为契机与读者一道探寻国家科学大数据发展路径,为建设新时代数字强国贡献力量。

  在数字经济成为重塑全球经济结构、改变全球竞争格局的关键力量的当下,数据正在成为关键生产要素。大数据时代,科技创新越来越依赖于对科学数据的分析挖掘和综合利用,以海量科学数据分析应用为代表的数据密集型科研范式应运而生,成为支撑科技创新和推动国家进步的重要力量。党和国家始终高度重视科学数据建设发展。2018年3月,国务院办公厅印发《科学数据管理办法》,对科学数据建设和发展进行战略部署,为我国科学数据工作指明了方向,为科学数据研究提供了坚实的政策基础。

  2019年,科技部、财政部深入贯彻落实《科学数据管理办法》相关要求,在原有国家科技资源共享服务平台基础上优化调整形成20个国家科学数据中心,成为我国科学数据管理、应用和支撑关联学科发展的重要载体。国家科学数据中心组建以来,在若干重要领域持续开展科学数据汇聚,整合重要科学数据资源建成了一批较为规范和系统的科学数据库。持续加强科学数据的分析挖掘与应用,数据服务能力不断增强,积极探索跨数据中心数据联合分析与服务,初步形成了规范安全和交互协同的科学数据应用生态。国家科技计划项目形成的科学数据源源不断汇入相关领域国家科学数据中心,科学数据资源标识体系初步建成,科学数据开放共享的能效逐步显现,国家科学数据中心的影响力稳步提高。

  站在“两个一百年”的历史交汇点,面对百年变局和世纪疫情,科学数据作为国家战略科技资源,在支撑创新驱动发展战略实施,推动经济体系优化升级和促进产业融合,抗击疫情保障民生和推进生态文明建设等方面作用更加凸显。为系统呈现我国科学数据研究进展和应用成果,促进科学数据资源的有效管理、共享共用和分析挖掘,提高科学数据应用服务能力,《大数据》期刊、《数据与计算发展前沿》期刊、《中国科学数据(中英文网络版)》、《中国科技资源导刊》联合国家科学数据中心,合作出版“国家科学数据中心”联合专刊,分别从政策、技术、数据、开放共享最佳实践等不同层面进行深入研讨。

  联合专刊从2021年6月开始正式征稿,各国家科学数据中心积极组稿撰稿,联合专刊委员会与四本期刊编辑部积极推进征稿工作,顺利完成专刊出版,共收录了48篇文章。期待能以此为契机,共同推进科学数据领域的知识传播和学术交流,并为合理配置和有效运用国家资源、促进国家综合国力发展、维护贡献联合力量。

  中国科学院国家天文台研究员,博士,国家天文科学数据中心常务副主任,虚拟天文台研究团队首席科学家。兼任国际天文合会数据与文献委员会主席,中国天文学会信息化工作委员会主任,外语中文译写规范部际联席会议专家委员会(国家语委)、全国名词委科技新词工作委员会委员,《IVOA NEWSLETTER》(国际虚拟天文台联盟简报)《天文研究与技术》《大数据》编委,国际虚拟天文台联盟执行委员,美国天文学会万维望远镜(WWT)顾问委员会委员。研究领域包括虚拟天文台、天文信息学、基于科学数据的教育科普、网格技术、天文数据库系统、银河系结构与演化等。

  尽管数据科学已经可以处理大量的数据并解决了很多问题,正在改变着科研、企业运作和社会治理模式,但数据科学成果存在难以工程化的局限性,要将数据资产及其隐含价值有效转化为服务、决策、产品,形成数字经济,还需要建立数据工程学来支持对数据实施工程活动,实现数据驱动的数据价值转化,服务日常工作,形成数字经济。

  本文引入工程学思想,将伴随数据科学诞生的狭义数据工程推广为广义数据工程,论述了数据工程学建立的必要性,参考土木工程学科建设及工程学科应具备的特征,分析了基于数据物质基础的数据工程学知识特征,给出了数据工程学的概念、理论基础、研究内容、研究框架和主要技术体系,并通过两个数据工程应用案例说明建立数据工程这一新方的必要性。

  数据工程学具备了数据物质基础的独特知识体系,具备了综合数学、电子与信息、计算机、数据科学以及各领域学科的特殊研究方法,数据工程学建设的物质、理论、技术、需求等基础已经具备,建立数据工程学支持将数据资产转化为工程应用并形成数字经济非常迫切。

  韩军1,2*,樊东卫1,2,陶一寒1,2,许允飞1,2,李珊珊1,2,米琳莹1,2,李长华1,2,崔辰州1,2

  500米口径球面射电望远镜(FAST)是国家“十一五”重大科技基础设施建设项目。随着FAST的落成,如何对外提供观测服务,成为FAST必须要解决的关键需求。

  文章首先介绍了FAST对外开放的技术需求和面临的挑战,然后介绍信息系统的框架结构及功能模块,主要包括用户管理、内容管理、观测申请评审、项目管理、数据中心五个核心模块及辅助模块。

  经过用户实际使用,FAST科学观测项目管理信息系统的应用效果符合预期,有效满足了FAST对外开放的功能需要,提升了观测运行效率。

  高能物理科学数据中心运维环境复杂,监控工具种类繁多,功能相对重叠且监控数据无法互通,日常运维面临巨大的挑战。为高效运用监控数据,提高数据中心运维能力,本文实现了高能物理科学数据中心智能运维系统。

  本文结合工业大数据技术、机器学习技术和数据中心运维需求,设计了通用的数据中心运维技术架构。介绍监控数据采集、分析、存储、共享、可视化等系统核心功能及其实现方式,以及依托该系统在数据中心数据存储、计算服务、网络安全等日常运维的具体应用效果。

  本文设计的运维框架,在高能物理科学数据中心日常运维中得到了成熟的应用和实践,提升了数据中心运维管理能力。

  智能运维系统在高能物理科学数据中心的应用,加速了运维监控从数据持久化、统一化到数据业务化、生态化的价值演进,实现了基于数据驱动的数据中心智能化运维生态。

  作物组学研究是农业作物科学发展的未来研究趋势,在数据密集型科学研究背景下,作物组学数据存在数据量大、来源多、结构复杂的特点,对多源异构作物组学数据的融合有利于优质作物种质资源的挖掘,助力农业科技发展。

  运用文献调查和网络数据收集法,对当前作物组学数据的分布和数据组织结构进行了分析,得出了多组学数据资源的主要特征;以高粱为例通过语义分析和文献查询方法,优化设计得到新的高粱多组学数据标准元数据,并开发脚本实现了不同数据库元数据到标准元数据的映射和转换,基于元数据实现了对多源数据的融合;通过整合mapping、变异分析、DEG计算等多种生物信息学方法,实现了对异构组学数据的融合。

  形成了高粱多源异构组学数据融合方法,能够实现对NCBI、EMBL、PlantGDB、国家农业科学数据中心等数据库中基因组、转录组、代谢组、表型组数据的融合。

  本文基于元数据和生物信息学方法,开发得到了作物多源异构组学数据的融合方法,具有普适性,可在作物品种中推广应用。

  唐新斋1,5,陈昕2,何洪林1,3,5,郭学兵1,5,苏文1,5,谢传节4,沈志宏2,张黎1,3,5,任小丽1,3,5,侯艳飞1,5,刘峰2

  结合生态大数据的演变、国家科学数据政策的影响,按照科学数据全生命周期管理过程,分析了国家生态科学数据中心现有信息化平台面临的问题和挑战,尝试采用领域驱动设计方法,开展生态科学数据汇聚微服务拆分。

  基于“开放汇聚、协同管理、智慧服务”理念,提出了新一代“生态网络云”大数据平台(Eco-Cloud)的总体架构设计,结合当前需求从多源数据汇交、统一存储管理、数据加工与挖掘分析、服务与展现四个层次给出了主要系统组成及其应用场景。

  新平台有助于推动生态科学数据多源开放汇聚、资产化管理,提升生态科学数据分析能力与共享服务水平。

  为了满足学科交叉融合对科学数据互操作的需求,解决科学数据中心资源重复存储问题,促进跨学科数据资源的有效利用。

  本文调研了现有的科学数据互操作技术与模式、国内外科学数据中心间互操作的现状,分析了各种互操作模式与技术适用的条件以及我国科学数据中心的特点。

  最终,提出了两大类共7种科学数据中心间互操作的模式,即基于元数据收割的转接板模式、基于元数据框架的元数据信息交换站模式、基于多领域本体映射的关联数据模式、元数据映射模式、本体模式、现有系统再整合模式和统一信息化系统模式,同时提供了我国科学数据中心互操作模式的实施建议。

  本研究提出的科学数据中心互操作模式具有可落地性和可实施性,能大大促进交叉学科科学数据资源的共享与利用,具有非常重要的推广意义和价值。

  对地观测领域仅共享科学数据还不能为用户直接提供解决问题的方案,还需要实现面向问题或者应用提供知识共享支持,对地观测知识枢纽的建立能有效支持共享对地观测领域的知识要素,促进对地观测知识(特别是模型、算法表达的隐性知识)的重用,提升应用对地观测知识解决重大问题的能力。【文献范围】本文通过文献调查,获取了知识枢纽以及对地观测领域知识枢纽的主要文献。

  结果】总结了对地观测知识枢纽的概念内涵、主要内容、特点和功能,归纳了对地观测知识枢纽的实现方法,展望了对对地观测知识枢纽的应用。

  对地观测知识枢纽是对地观测数据共享的发展新趋势,能有效促进对地观测知识重用,将成为未来对地观测领域广泛应用的知识共享基础设施。

  本文对国家高能物理科学数据中心分布式数据平台进行系统全面介绍,为高能物理及相关领域大科学实验的数据处理提供参考。

  文章介绍了国家高能物理科学数据中心分布式数据处理平台的总体构成、运行模式和智能运维等方面的关键技术。通过分析高能物理实验数据处理的计算特点与实际需求,介绍了数据中心“一平台多中心”的数据处理平台建设思想,阐述了平台为高能物理实验提供的跨地域资源共享、高性能海量数据访问以及用户实时交互服务等技术方案设计与实现。

  国家高能物理科学数据中心分布式数据处理平台已经成为高能物理学科的重要基础设施和组成,是学科融合、开展新研究方法的主要场所,满足了粒子物理、理论物理、空间天文、射线学科、加速器设计等科研领域的数据处理需求。

  全球跟踪站网主要完成原始观测数据采集,包括:导航卫星码伪距、载波相位、多普勒等,并发送到数据中心。数据中心收集跟踪站网的标准格式观测数据,对原始数据进行质量检查,并分类存储和备份,同时接收分析中心和产品综合中心数据处理后生成的轨道、钟差、大气等精密产品,并通过FTP、WEB等多种手段以标准数据格式提供GNSS数据和产品的服务。

  中国虚拟天文台(China-VO)是以国家天文台为代表的中国天文界及合作伙伴共同打造的一个网络化科学研究和科普教育平台。它架构在国家天文科学数据中心雄厚的数据资源基础之上,得到中科院、科技部、国家基金委、北京科委等机构的资助,以及中国科技云、阿里云、微软研究院、浪潮集团、中科曙光、锐捷网络等合作伙伴的大力支持。


>ca88登录页面 上一篇:《电力大数据》期刊在中国数谷诞生 下一篇:知道对方真实姓名或是照片利用大数据找人的方法很简单