科学大数据的概念

在科学研究数据与日俱增的今天,我们把与科学相关的大数据称之为科学大数据,科学大数据一般来自于物理世界,内容为科学实验数据或传感数据,特点是有一定的科学规律可循,采集的代价比较高。科学大数据集复杂性、综合性、全球性和信息与通信技术高度集成性等诸多特点融于一身,其研究方法也正在从单一学科向多学科、跨学科方向转变,科学大数据正在使科学世界发生变化,科学研究已经进入一个全新的范式一一数据密集型科学范式。

随着大数据时代的来临以及大数据在各领域的广泛应用,科学发现的模式将发生重大变化。继实验科学、理论科学、计算科学之后出现了被称为“数据密集型科学”的第四种科学发现新模式,采集、存储、管理、分析和可视化数据成为科学研究的新手段和新流程。这一科学发现新模式强调数据作为科学发现的基础,并以数据为中心和驱动、基于对海量数据的处理和分析去发现新知识为基本特征。如中科院生物所破解埃博拉病毒入侵机制;海量DNA数据认识生命,在1万亿个事例中发现上帝粒子-希格斯粒子,全球碳监测网络,ARIGO海洋浮标,科研众筹(FOLDIT、GALAXYZOO、POLYMATH)等。

超算不止是算,曙光补齐中国超算另一短板

“天河1号、天河2号、太湖之光”这些名字在最近几年频繁的出现在公众视野中,以往并不太受公众注意的超级计算机亦成为人们的兴趣点。而这些名字背后,是最近几年中国在超级 ...[详细]

中国高性能计算机TOP100排名出炉,曙光八连冠

10月28日,新一期中国高性能计算机TOP100排行榜单如期在“2016年全国高性能计算学术年会”(HPC China 2016)上发布。中科曙光以34%的市场份额再次占得榜首;同时,在TOP10榜单中 ...[详细]

“科学大数据”发展历程
科学大数据一体化解决方案

科学大数据一体化解决方案

科学实验是科技人员设计的,如何采集数据、处理数据事先都已想好了,不管是检索还是模式识别,都有一定的科学规律可循。科学实验是科技人员设计的,如何采集数据、处理数据事先都已想好了。

行业视点
张云泉
中国科学院计算 技术研究所 研究员

随着人类不断探索,科学数据呈指数级增长,如何从数据中快速获得有价值信息是大数据技术的关键,作为实现大数据价值的工具,高性能计算和大数据正逐步走向融合。

郭华东
中国科学院院士、中科院遥感与数字地球所

大数据是财富,是资源,是科研的战略高地。它能改变科研方式、取得科学发现,尤其是大科学工程,以及需要跨学科合作的科研项目,“大数据+大科学=大发现”。

“科学大数据新引擎”应用案例
  • 地球数值模拟装置
  • FAST
  • 人工智能
  • 空天大数据
  • 雾霾监测

“地球数值模拟装置”项目集高性能计算机、软件工具、支撑技术、地球数值模拟应用软件等于一体,具有对海量数据进行快速处理,实现数据到信息快速转化的能力,能够为人类可持续发展面临的环境灾害和生态等问题提供第一时间的信息服务支持。

作为由中国科学院重点部署的国家级项目,曙光与中科院大气物理所、计算所、网络信息中心等单位共同研发的“地球数值模拟装置”原型机系统,不仅是地球科学系统研究的“专用机”,还是可用于各行各业大数据计算和分析的“通用机”。借助该原型机为“探测地球”所配备强大的计算能力和出色的大数据服务性能,该系统可以轻松地为各行业研发创新和应用发展提供计算服务和支撑。

通过该装置,科学家可以实现对大气、洋流、地壳、生态等的仿真研究,用于还原或预测地球自然变化过程的应用,用于应对地球变化、防治大气污染、防灾减灾和环境治理等面临的问题,并将帮助人类更深刻地认识地球。

FAST口径达到500米,突破了射电望远镜的百米极限,是目前世界上口径最大、最具威力的单天线射电望远镜。利用独特的喀斯特地貌和极端安静的电波环境,能将深空通讯能力延伸至太阳系外缘行星,将卫星数据接收能力提高100倍,誉称中国“天眼”,有望在未来20年至30年保持世界一流设备的地位。

曙光为“天眼一号”提供了集数据处理、软件管理、计算环境支撑、安全防护等功能于一身的综合解决方案。具有高密度、低PUE、模块化设计的特点。曙光提供一站式的专业服务,融合多年来的经验,能够有力的支持FAST对数据接收、数据处理的计算需求。

项目建成后将形成具有国际先进水平的天文观测与研究平台,为我国开展暗物质和暗能量本质、宇宙的起源与演化、太空生命起源研究等科学研究活动提供必要的设施条件,对于提升我国自主创新能力,增强科技竞争力,具有重要意义。

人工智能里的深度学习对于计算的需求量非常高,并且在体系上有别于传统算法,曙光作为高性能计算领域的领军者,利用自身计算优势布局人工智能领域,联手中科院计算所与NVIDIA,共同建立深度学习联合实验室,布局和开拓中国深度学习市场。

曙光在人工智能领域的布局不止如此,曙光还与北京中科寒武纪科技有限公司签署了战略合作协议,双方展开深度合作。寒武纪面向深度学习等人工智能关键技术进行专用芯片的研发,可用于云服务器和智能终端上的图像识别、语音识别、人脸识别等应用。在深度学习领域,寒武纪处理器在性能、功耗和芯片面积方面均有较大优势,具有高性能和低功耗的优势。曙光正致力于打造数据中国,携手寒武纪不仅有利于打通数据中国中的技术闭环、完善产业生态,还将为曙光在未来智能时代中的布局奠定基础。

为践行“数据中国加速计划”曙光重点发展四个大数据,在科学大数据方面曙光携手中科院电子学研究所成立中科星图公司,布局空天大数据。空天领域是数据密集型科学的代表,科学计算是数据处理的主要手段,中科星图依靠曙光在高性能计算上的实力,定位于军民高分卫星的空天大数据处理与应用,目标是成为全球领先的空天数据处理系统与服务供应商。

中科星图拥有领先的空天大数据处理、图像深度学习与智能识别分析时空可视化等核心技术与产品。为国防、交通、国土、住建等几十个重大领域提供解决方案、技术产品以及大数据增值服务。

环境问题伴随着人类的发展层出不穷,我国大部分地区都在遭受着雾霾的严重侵扰,加强雾霾预报预警成为了大气污染防治中的重要环节。众所周知,空气质量预报过程涉及大量的数值计算和数据交换,对高性能计算机的性能、稳定性要求极高。

在环境问题上,曙光坚持以“天蓝、水清、土净(三清)”为使命,致力于大气、水、土壤污染的预报预警、治理评估和应急。在充分考虑成熟稳定和性能先进等要求的条件下,曙光为中国环境总站提供的高性能计算机计算模块由300片曙光TC4600H计算刀片和2台8路的高性能综合处理服务器组成,总计算能力超过百万亿次,可以轻松应对数值预报对于大规模浮点并行计算的需求;存储模块同样采用曙光Parastor200并行存储系统,总存储容量超过3PB,可满足环保数据长期存放、数值模式大规模并行IO的需求。

HPCChina现场直击
关于我们 | About us | 网站律师 | 天极服务 | 热点新闻 | 电子杂志 | RSS订阅 | 加入我们 | 天极动态 | 网站地图| 网友上传