E级超算全面自主可控 应用生态建设成焦点

  本报记者 陈宝亮 北京报道

  国产超算产业的相关新闻在2018年10月之后开始持续发酵。

  首先是三个E级超算的原型机系统——神威E级原型机、天河三号E级原型机和曙光E级原型机系统在10月中全部完成交付。其后,中国高性能计算100强全面实现国产化。

  而进入11月,中国部署超算数量达到美国两倍又开始引发国内外关注。近几日,清华大学超算竞赛实现第二次大满贯、清华博士后成为获得高性能专委会杰出新人奖首位中国人的新闻也开始不断刷屏。

  创新的技术架构、领先的算力、高速增长的市场、持续积累的人才都正在成为中国超算产业的闪光点。

  E级超算自主可控

  2015年初,美国商务部决定对中国四家国家超级计算机中心禁售Intel至强处理器,采用了至强处理器的天河二号不得不走上自主研发路线。

  2016年,高性能计算重点专项正式立项,明确要“依托自主可控技术”,研制满足应用需求的E级(百亿亿次级)高性能计算机系统,使我国高性能计算机的性能在“十三五”末保持世界领先水平。

  根据目前公开信息,三台E级原型机均从芯片、网络、操作系统层面实现自主可控。

  之前因至强处理器禁售遭受打击的天河超算,在天河三号E级原型机中采用了自主的飞腾FT2000+处理器、迈创MAtrix 2000+加速器、天河高速互联通信以及基于Linux开发的麒麟操作系统。事实上,早在2006年,飞腾团队就开发过两代国产CPU,飞腾第一款兼容ARM指令集的FT 1500A在2014年问世。除了超算领域,飞腾系列CPU目前已经扩展到服务器、PC等领域。

  曙光E级原型机的核心芯片、加速器则是使用了海光公司的X86 CPU、DCU。2016年,AMD与曙光子公司海光成立合资公司,向后者授权X86处理器架构。目前,经过两年的研发周期,其X86芯片产品已经投入量产。

  神威系列超算则是国内最早实现全部采用国产CPU的超算系统,其申威系列产品在2006年就推出了第一代处理器SW-1,现在已经进入到第四代SW26010处理器。2011年,国家超级计算济南中心就采用申威第三代产品SW1600搭建了国内首个全部采用国产CPU的千万亿次超算。此次安装在济南超算中心的神威E级原型机,在处理器、高速网络系统、存储等核心器件全部采用了申威系列芯片构建,全面实现了国产化,而且使用了基于Linux开发的睿思操作系统,目前已经拥有20多款自主开发的应用软件,覆盖了大部分应用场景。

  不过,需要指出的是,虽然三大超算体系都实现了自主可控,但中国高性能处理器的工艺、性能,高速互联、存储器件、大规模并行系统软件、并行算法等基础性研究领域,与美日国家依然存在较大差距。

  中国需要依托庞大的超算市场推动自主超算产业链逐步成熟,但横在市场与自主产业之间的,是中国超算包括应用软件、人才、长效发展机制等诸多生态系统层面的短板。

  应用软件生态建设

  “中国现在拥有全世界规模最大渲染农场,除了美国之外,印度、俄罗斯、非洲、东南亚等国家的影视、广告渲染业务基本都是中国企业承接的。”蓝海创意云总经理高鹏东告诉21世纪经济报道记者,“视频渲染,是目前超算领域增速最快的市场。”

  目前,几乎所有的影视、广告等视频内容都需要经过渲染给虚拟场景实现更真实的观赏体验,真实度与使用的渲染资源基本成正比,渲染农场是指为视频渲染提供高性能计算资源的云平台。高鹏东告诉记者,“渲染农场,就相当于影视工业的生产线。”相比于美国已经成熟的影视工业,中国影视行业目前仍停留在影视作坊阶段,高鹏东认为,成熟的渲染农场,是中国影视实现工业化转型的切入点。

  目前,国内视频渲染市场规模约几十亿元,总计约需要10万个超算节点,且仍在持续高速增长。但需要指出的是,看似高价值含量的超算并没有给国内的渲染农场带来太多收益。

  一个超算节点成本基本在3万元左右,但目前国内渲染农场每个节点的使用费大多低于1.5元/小时,每个节点的年收入低于1万元。考虑到电费、维护费支出,需要较长的投资回报周期。除此之外,国内渲染农场均需要从3ds Max、Maya高价进口渲染管理软件。

  事实上,国内整个商业超算行业几乎都处于微利状态。“有一年阿里采购了130亿元的高性能计算服务器,全部是浪潮中标。但互联网公司采购超算的时候,设备价格已经打成了白菜价。”知情人士向记者介绍,“超算这块的利润,基本都流到了Intel、英伟达手里。”

  而且,部署超算的企业还需要把大量的预算留给进口软件。目前,国内的石油石化、制造业的CAE/CAD等商业软件,几乎完全依赖进口,售价都在百万、千万元级,且每年需要交纳高昂的许可费。

  此外,上述知情人士介绍,“国外的超算已经广泛在金融、工业制造、社会安全等领域应用,而中国在这些领域基本才刚刚起步。”目前,全球TOP 500超算系统中,有超过30%系统用于金融、工业制造领域。但在中国,云计算、深度学习等行业占据了绝大多数份额,用于金融、工业领域的超算只有个位数。

  虽然中国在超算的硬件、系统、核心器件领域与发达国家的差距在迅速缩小,甚至实现反超,相比于高性能计算的应用却不尽如人意。除了商业软件几乎完全依赖进口之外,国内科研院所使用的科研、仿真等应用,也主要来自国外开源软件,开源软件占比超过75%,国产高性能软件任重道远。

  此前,中国对超算的投入主要集中在硬件系统上,通过机器性能提升带动整体科研实力进步。但现在,中国正在转向市场需求驱动的发展模式,这也就需要中国加大对应用软件的生态环境建设,并且扩大在金融、工业领域的超算应用,而这需要政府部门制定比此前更长期的规划、更持久稳定的投入。

  (编辑:张伟贤)

特色专栏

热门推荐