为粤港澳大湾区科研事业提供数据支撑
本报讯(记者 刘雷 通讯员 黄博纯 孙金龙)在中科院广州健康院一间机房里,隐藏着雷霆万钧的“大家伙”,这些宝贝被精心呵护。科学家通过它们,读取生命科学、新材料、新能源等领域不可或缺的重要密码。
超算中心机房内景。
成立于2014年的中科院超算环境广州分中心凭其计算能力,在干细胞与再生医学、创新药物设计、公共健康、海洋气象、地球科学、环保能源新能源等领域都有广泛的应用。
超级计算重在“算”不在“超”
中科院超算环境广州分中心目前集群拥有:60台普通刀片计算节点,1000个CPU计算核心,全系统内存容量6TB,存储总容量达到3PB,整体聚合计算能力理论峰值每秒100万亿次。
超级计算重在“算”不在“超”,成立时间虽短,超算中心已向全院师生开展常用分析语言和方法的培训。这个“计算”实力够硬核吗?中心主任陈朝明回答:“从超算资源量来讲,如果把天河二号比喻为大海,那我们就是一个湖泊。”
为什么研究生命科学需要超级计算机呢?生物岛实验室副研究员何江平举了个例子,解析新冠病毒感染细胞类型、鉴定新冠病毒致病分子靶点对抗新冠病毒治疗具有重要的作用,然而人体中有约40万亿个细胞,每个细胞中有超过3万种不同的分子(基因),如果没有超算,犹如大海捞针。细胞一旦被感染,病毒的DNA序列我们是能检测到的,我们再通过计算比较被感染细胞与正常细胞的分子差异,从而可找到新冠病毒感染致病的关键靶点。
受广州分院委托,面向广州两院地区及相关单位用户服务。健康院负责机房装修、超算设备采购及安装、软件应用部署、系统的日常运维。广州分院负责组织协调需求调研、用户应用培训、协调项目推广、推动统一服务。中心建设采取分期建设、逐步完善、重视应用。
中心于2014年正式获得中科院批准、依托广州健康院建设和管理,面向广州两院地区及相关单位用户服务,覆盖干细胞与再生医学、疾病健康、药物设计、感染与免疫、冷冻电镜、植物生态等高性能计算领域的应用。通过分期建设,超算广州分中心目前计算聚合能力达100万亿次,并行高通量存储达3PB,提供100M专线高速科技网络带宽,集中部署了面向生物医药与健康等多学科领域的超算应用软件及集成工具,可支撑大规模科学计算、数据模拟和实验验证。
中科院计算机网络中心研究员金钟评价,广州健康院长期以来重视超算对科研创新的驱动,多年在超算发展指数中位于中科院前列,基于该超算分中心支撑了一大批重大科研项目及重大成果的产出,培养了一大批具有生物医药计算交叉学科人才。应加大高性能计算重大设施的投入,重视超算应用交叉学科高级人才培养,以加快促进生物医药与健康领域的科研创新。
小平台撬动大科研
陈朝明认为,用超算很重要的一点是,它来了,是不是马上能用上。对每一台仪器、每一个课题组、每一位用户的每一次科研实验的结果,实时同步汇交到超算中心的平台,进行管理共享,实现大数据与高性能计算就近原则的高效数据分析及利用。
小平台撬动大科研,超算中心的高效运作,对广州健康院在干细胞与再生医学、疾病健康、疫苗研发、抗癌药物筛选及蛋白质结构解析等方向的数据分析挖掘及可视化,提供了重要支撑,提高了科研创新效率。2019年的指数排名中,该中心在中科院各超算分中心中位列第一名。超级计算发展指数依据17个指标评价,从环境建设、环境使用、用户直接科研产出、人才培养、支持用户科研项目、收入分指数6个方向衡量超级计算环境的发展。报告显示,超算广州分中心在数据计算驱动科研创新、交叉学科人才培养、跨学科跨地域科研合作、支撑重大项目创新研究、以及服务地方科技发展发挥了重要作用。
三剑客的故事
三剑客:陈朝明(中)、刘劲松(右)、许永(左)。
不同的学科背景,为了共同的目标,广州健康院的研究员刘劲松、许永,与陈朝明成为了同事口中的“三剑客”。中心建立之初,由于经费紧张和大家对超算认识的不足,三剑客采取“化缘”的方式,号召院领导及PI,“有钱出钱,有力出力,没钱没力出吆喝”。同时,三剑客花费大量时间和精力,深入多家单位进行调研、学习,对超算的发展进行详细规划。终于在中科院、广州健康院的大力支持下,采取“经费支持+服务先租后购+课题组支持”的方式,超算中心才得以建成。
中心建成后,“三剑客”仍然对其日常运维和未来发展倾注了大量精力,像对待自己的孩子一样,呵护有加。有一次,院内突然停电,三剑客不约而同,第一时间到达超算机房,检查服务器、存储系统,确保设备安然无恙。中心建成后,在数据与计算方面发挥了重要的推动作用,随着广州健康院科研实力和人才队伍的不断壮大,超算资源的面临挑战。三剑客继续不遗余力,四处奔走,筹措资金,进行超算资源的扩展和应用的推广。
如今三剑客有了新伙伴。
未来,中心将不再满足提供单一方向的设备和技术支持,而是将联合各个子平台的特长和优势,依靠平台的自主创新,提供全面的技术解决方案,支持PI们去挑战生命科学领域影响深远的课题。研究员刘劲松说,“依靠平台的专业技术支持,在small labs(实验室),也可以做big science(大科学)。我们相信,未来重大的科研发现和创新,都将从这里开始孕育、诞生。”这是三剑客对超算中心的定位,也是他们的笃信。
新基建背景下,为粤港澳大湾区提供数据支撑
数据与计算是科技创新的巨大驱动力。数据资源已成为世界各国争夺的新战略资源,计算则成为了衡量一个国家综合国力和国际竞争力的重要标志。数据与计算在科技领域的整体能力和应用,将集中体现一个国家的科技综合实力。世界各国正加快建设以数据与计算为主要特征的信息化基础设施,这必将深刻影响世界科技格局。数据与计算将驱动现代科学研究“加速”发展,有力提升国家科技创新能力和竞争力。
广州健康院院长陈新文说,数据计算逐渐成为世界各国争夺的新战略资源,是中美贸易战背景下“卡脖子”的关键一环,超算中心将以参与新一代超级计算机研制、承担人类细胞谱系大科学设施建设、粤港澳科创中心建设等重大任务为契机,充分发挥超算中心作用,为研究院提升承担大项目能力,申建重大科研基地、产出大成果提供更强力的基础支撑。