前沿 | 东数西算工程落地的关键问题分析与对策建议

admin 2023年4月3日22:23:52评论41 views字数 6138阅读20分27秒阅读模式
前沿 | 东数西算工程落地的关键问题分析与对策建议
前沿 | 东数西算工程落地的关键问题分析与对策建议
前沿 | 东数西算工程落地的关键问题分析与对策建议
前沿 | 东数西算工程落地的关键问题分析与对策建议
前沿 | 东数西算工程落地的关键问题分析与对策建议

扫码订阅《中国信息安全》

邮发代号 2-786

征订热线:010-82341063


文 | 贵阳市大数据产业有限公司 范灵俊 郑卫城 彭亚松 张舒帆 刘睿雅
“东数西算”是当前我国正在推进的重大战略工程,对于我国实现东西协同联动、东西资源互补具有重要意义。根据国家整体布局,相关省市已启动建设工作。但是,“东数西算”是一项系统工程,尚有诸多技术、机制以及安全等方面的问题亟待解决,例如:算力资源的跨域调度和匹配是否精准、算力成本是否更加集约可控、数据的传输和安全是否能够得到保障等。解决这些问题和挑战将有助于“东数西算”工程的有效落地。


一、“东数西算”工程背景

数据中心是耗能“大户”,根据中国信息通信研究院数据显示,2021 年全国数据中心耗电量高达 2166 亿度,约占全国总耗电量的 2.6%,到 2030 年全国数据中心耗电量预计将超过 3800 亿度。目前,我国数据中心大多分布在东部地区,而东部地区土地、电力能源等资源较为紧张,难以大规模发展数据中心。相反,我国西部地区资源充裕,特别是可再生能源丰富,具备发展数据中心、承接东部算力需求的潜力。“东数西算”是指通过构建数据中心、云计算、大数据一体化的新型算力网络体系,将东部算力需求有序引导到西部,优化数据中心建设布局,促进东西部协同联动。简单来说,“东数西算”将通过西部的算力资源更充分地支撑东部数据的运算,更好为数字经济产业发展赋能。

2021 年 5 月 26 日,国家发展改革委、中央网信办、工业和信息化部、国家能源局联合印发了《全国一体化大数据中心协同创新体系算力枢纽实施方案》(发改高技〔2021〕709 号)。文件提出,统筹围绕国家重大区域发展战略,根据能源结构、产业布局、市场发展、气候环境等,在京津冀、长三角、粤港澳大湾区、成渝,以及贵州、内蒙古、甘肃、宁夏等地布局建设全国一体化算力网络国家枢纽节点,发展数据中心集群,引导数据中心集约化、规模化、绿色化发展。国家枢纽节点之间要进一步打通网络传输通道,加快实施“东数西算”工程,提升跨区域算力调度水平。2021 年 12 月 20 日,国家发改委等四部委正式批复同意在贵州、甘肃、内蒙古、宁夏四地启动建设全国一体化算力网络国家枢纽节点。批复指出,西部四地要发挥在气候、能源、环境等方面的优势,发展低成本、零碳、高安全的数据中心集群,通过云网协同、多云管理等技术构建低成本的一体化算力供给体系,重点提升算力服务品质和利用效率。
当前,我国已规划 8 个国家算力枢纽节点以及 10 个国家数据中心集群。自“东数西算”工程全面启动以来,各地密集发布政策文件,火热推进项目合作签约和施工。截至 2022 年 8 月,8 个国家算力枢纽均进入深化实施阶段,新开工数据中心项目达 60 余个,新建数据中心规模超 110 万标准机架,项目总投资超 4000 亿元。
根据表 1,从各个算力枢纽节点的建设情况可以看出,各枢纽节点均在借助“东数西算”的东风,扬起高质量发展的旗帜,挖掘各自地区特色和优势,围绕规划、网络、用能等方面开展建设工作,全力带动当地大数据产业发展。
表 1 全国各算力枢纽节点建设情况一览表
前沿 | 东数西算工程落地的关键问题分析与对策建议
数据来源:国家发改委官网、ICPA 智算联盟《八大国家枢纽节点建设进展》
然而,“东数西算”作为国家重要战略工程,在为我国数字经济发展带来新机遇的同时,也面临着如何统筹调度算力资源、降低算力运营成本、建立可行的调度和利益分配机制、保障数字空间安全等方面的问题和挑战。


二、“东数西算”工程落地面临的网络安全问题与挑战

“东数西算”工程是优化全国数据中心建设布局的重要举措,通过将东部的算力需求引导到西部,充分利用西部地区资源丰富、土地广阔和气候适宜的优势建设枢纽节点和数据中心集群,来缓解东部地区土地、能源等资源日趋紧张的瓶颈,助力我国数据中心供需平衡,实现优势互补、东西联动。但是,“东数西算”落地也面临着不容忽视的问题和困难。

(一)算力资源池化与调度
异构算力是指采用不同技术实现的计算能力,为差异化、定制化的计算需求场景提供算力服务。异构计算是“东数西算”的底层支撑,“东数西算”所需的数据中心内部,CPU、GPU、FPGA、DPU、专用加速器等对处理不同种类的数据各有优势与劣势,也有运营成本高低之分。例如,EDA 仿真主要通过高性能 CPU 进行处理,AI 训练主要依靠 GPU 完成,视频流数据则需要 DPU 处理才效率最高。这就需要异构算力资源的统一构建、统一管理、统筹调度与协同,使得异构算力可以匹配实际的差异化计算需求。但是目前,在异构算力层面仍然缺乏整体有效布局,面对各种东部城市的不同的算力需求场景时,难以合理精准地匹配算力资源,无法满足各种不同类型的算力需求,很多场景就会面临“算不了”的窘境。因此,在异构算力资源池的统筹建设上,需要尽早地合理规划、研究和布局。
(二)网络传输时延与价格
“东数西算”的各类场景会产生很大体量的数据,也需要大量的网络传输服务进行支撑。然而,偏高的网络通信价格目前是实现“东数西算”的最大阻碍之一。
“东数西算”的成本可大致分为如下 3 个部分:一是算力设施的建设或租赁费用,二是算力设施的运营维护费用,三是传输网络的租赁费用。据测算,其中运营商传输网络费用较为高昂,带宽为 1G 的网络传输专线费用约为 16 万元/月,超过某些计算场景总成本的 75%,若提升带宽至 2.5G 或10G,其费用将大幅增长,远远高于东部企业可以承受的网络费用成本。因此,在高昂的网络传输成本费用下,“算不起”成为了很多应用场景的突出问题,“东数西算”也难以形成可持续性的运营模式。
同时,西部数据中心向东部提供算力,因距离原因存在网络时延问题。根据《全国一体化大数据中心协同创新体系算力枢纽实施方案》的指导性意见,数据中心端到端单向网络时延原则上在 20 毫秒以内;车联网、联网无人机、智慧电力、智能工厂、智能安防等实时性要求高的业务需求,时延原则上在 10 毫秒以内。
以贵阳到上海为例,两城市距离约为 1800 千米,以每秒 20 万千米的速度计算,光的传输需要 9 毫秒。然而网络传输环节较多,所需时间必然远大于 9 毫秒,这表明将东部实时性计算需求放到西部,从网络时延角度并不乐观。经测试,贵阳到东部某城市的时延最低为 36 毫秒,通过网络加速等技术手段,最低可降至 28 毫秒,但距离承接东部时延敏感算力需求还有较大差距。因此,网络传输时延如果不能进一步优化和提升,绝大部分西部数据中心只能承接后台加工、离线分析、数据存储备份等对时延不敏感的网络应用。
(三)市场供需对接机制与优化
近年来,中国数据中心机柜数量保持稳定增长。中国信息通信研究院《数据中心白皮书2022》显示,按照标准机架 2.5kW 统计,截至 2021 年年底,我国在用数据中心机架规模达到 520 万架,近五年年均复合增速超过 30%。其中,大型以上数据中心机架规模增长更为迅速,机架规模达到 420 万架,占比达到 80%。然而,在数据中心建设如火如荼的背景下,其上架率和使用率也成为了需要关注的焦点。
当前,数据中心建设规模迅速扩大,但国内整体布局尚不均衡,存在“重建轻用”现象。正是由于数据中心运营水平不高,导致资源无法充分发挥价值,造成了数据中心资源的浪费。《2021 年中国数据中心市场报告》有关研究显示,截至 2021 年 10 月 31 日,全国数据中心的平均上架率仅为50.07%,其中我国华中、东北、西北、西南四个地区的数据中心上架率低于平均值。究其原因,是因为部分数据中心建设方在建设过程中一味试图通过扩大规模来增强自身优势,导致机柜资源与客户资源、销售模式不匹配,大幅度拉高了该地区数据中心的平均空置率。而且,数据中心属于重资产,具有技术迭代快、折旧年限短等特点,且通过改建或创新商业模式解决闲置问题难度较大。
(四)软硬件的国产化替代与适配
目前,信息技术领域的“卡脖子”技术问题依然非常突出,在高端芯片、操作系统、基础工业软件等领域,关键核心技术大部分受制于人。根据海关总署数据,2021 年芯片成为我国第一大进口商品,进口额近 4400 亿美元,进口额占我国GDP 比例接近 2.45%。2022 年 8 月 31 日,美国政府下令英伟达、AMD 等停止向中国销售部分高性能 GPU。GPU 芯片可被用于加速人工智能任务,是 AI 系统训练的关键,是“东数西算”诸多场景的基础。对算力所需的高端芯片进行国产化替代,解决“东数西算”中“算不好”的难题,也将成为形势所需。
同时,“东数西算”工程也对国产化基础软件服务能力提出更高要求。算力的调度和整合是需要通过软件来实现的,操作系统、数据库、中间件等在内的软件将贯穿在“东数西算”工程全生命周期各个环节之中。各种规模的算力基础设施在节能降碳、可再生能源供电、异构算力融合、云网融合、多云调度、数据安全流通均需要进行创新突破,而目前各类应用均缺少相应的国产化软件适配、灵活部署以及服务能力,难以针对各类场景形成针对性的解决方案。
(五)网络与数据安全
《全国一体化大数据中心协同创新体系算力枢纽实施方案》中,“安全可靠”是 4 大基本原则之一。同时,“确保网络数据安全”也是国家算力枢纽节点的 9 大重点任务之一,方案要求,要“同步规划、同步建设、同步使用安全技术措施,保障业务稳定和数据安全。”
“东数西算”工程八大枢纽节点协同联动,工程体系庞大、结构复杂,存在大体量的终端设备和平台的连接,算力网络中的海量数据、多种类算力资源与网络基础设施对网络和数据安全带来了全新挑战和更高的要求。同时,“东数西算”所存在的算力资源的开放申请、使用以及结算清退等机制,会涉及使用方和供给方的安全管理机制和流程,这也为算力网络带来了新的安全问题。一是更容易遭受攻击暴露面扩大,在“东数西算”背景下原本独立运行的业务系统和网络需要向外界开放,这会造成系统应用和数据暴露面增加,催生更多的安全风险;二是数据泄露风险增加,数据在算力网络中将进一步进行开放共享和流通,这将加剧信息数据的泄露风险。数据实时的交换共享会造成更大的吞吐量,这不仅增加了攻击面和暴露面,还更容易被篡改和窃取;三是对算力产业链供应安全的需求进一步提高,算力网络应用产业链长,涉及面广,生态圈大,安全应用技术及产业创新发展能力将对算力网络的安全保障产生巨大作用,任一技术环节的缺失或短板都会催生对算力网络安全的负面影响。
根据《2021 开源安全风险与分析报告》中的数据,包含漏洞的开源代码库比例已达到 84%,60% 的已审核开源代码库存在高风险漏洞,这说明数据、基础设施以及网络环境方面的安全防护能力还存在缺失。因此,在数据开放共享、算力开放应用、算网协同运营的场景下,通过技术突破和政策支撑等多方面的支持,提升安全防护能力,也将成为“东数西算”工程取得突破的重要挑战之一。


三、对策建议

(一)以问题为导向,积极开展小规模测试验证

“东数西算”工程的启动和建设可以提升我国整体算力水平,推动东西部区域间的协调发展。但是,“东数西算”在推进过程中也将面临多方面的挑战,不仅涉及算力调度、网络传输、基础设施等关键环节,也牵涉东西部的资源对接、机制协同等领域。因此,西部地区应该积极与东部的算力需求单位对接,例如围绕影视渲染、AI 训练、EDA仿真等时延要求较低的应用场景,开展“东数西算”“东数西渲”“东数西训”等领域的测试验证,在此过程中发现技术瓶颈、探明机制缺陷、寻找落地痛点。这样不仅有助于打造“东数西算”的典型应用场景,让西部提升算力网络基础能力,也能更大程度地促进区域间算力网络应用繁荣、壮大我国算力网络产业生态。
(二)支持试点示范项目,形成容错机制
“东数西算”是国家级战略工程,前期应加强在示范项目和试点机制上的探索,在政策、资金等方面给予“东数西算”试点示范项目更多支持。通过示范项目的申报和评选,为政府间、企业间的资源共享、互利合作搭建平台,促成优势互补。同时,通过建立完善可行的评估机制和容错机制,检查检验示范项目执行效果,促进“东数西算”示范项目的经验交流和推广,为国家层面围绕“东数西算”在算力运营机制创新、国产化自主可控、技术转型升级换代等领域积累宝贵经验。
(三)加强生态合作,促成合力攻关
“东数西算”现阶段在网络时延、数据传输、算力调度与适配方面存在很多技术瓶颈,各地信息化主管部门、头部企业等单位应重视生态合作,加强与科研单位、高校等具备较强研究能力的机构合作,聚焦高性能计算、大数据处理、网络存储系统、网络传输、处理器体系结构、异构算力资源池等关键领域技术进行联合攻关,实现关键技术自主可控,使东西部算力资源的高效灵活调度成为现实。
(四)重视信息保护,筑牢安全防线
筑牢安全底座,是实施“东数西算”工程的必要条件。《全国一体化大数据中心协同创新体系算力枢纽实施方案》强调,要完善海量数据汇聚融合的风险识别与防护技术、数据脱敏技术、数据安全合规性评估认证、数据加密保护机制及相关技术监测手段,同步规划、同步建设、同步使用安全技术措施,保障业务稳定和数据安全。因此,一是要进行政策引导。各地应结合“东数西算”工程的实施路径和规划,在网络安全等级保护、关键信息基础设施安全防护、数据安全防护等相关领域进一步建立合理可行的地方性法规和标准,规范各环节管理机制。二是要加强技术攻关,实现关键技术自主可控和快速迭代,特别是针对关键基础设施、软件等领域,软硬件企业应加大研发投入支持力度,不断探索和演进关键安全防护技术。三是构建安全生态体系。“东数西算”的安全防护将涉及多个领域,应由多方共同参与,例如网络安全厂商,设备商、网络运营商、平台开发商、系统集成商以及企业用户等。政府主管部门应统筹协调,构建区域性的安全生态体系,统一安全防护理念和实施路径,明确权责划分,提升协同合作效率,共同应对“东数西算”中的安全技术难关。


四、结束语

当前,实现“东数西算”在数据高效传输和安全、网络传输成本与时延、算力资源精准匹配、算力协同调度、芯片和平台软件自主可控与适配等方面存在较大挑战。“东数西算”不仅仅是要将东部的算力需求吸引到西部地区,而且还要形成完善可行的商业运营模式,对此还有一些挑战亟待突破:一是解决“算不起”的问题。要聚焦“算网协同”研究,通过“算调网”努力找到最优解,降低网络成本,让东部企业用得起;二是改变“算不了”的现状。吃透算力应用场景,开展测试验证,合理匹配算力资源,打造弹性异构算力资源池,满足各种不同类型的算力需求;三是攻克“算不好”的难关。科研院所、软硬件企业应加大创新力度,优化计算环境,有效利用联邦学习、多方安全计算、加密等安全领域的技术,从网络传输、数据存储和利用、数据清除等环节,提升“东数西算”中数据安全的保障力度。同时,带动算力上下游产业发展,推动各项关键技术及设备国产化替代进程;四是要消除“用不尽”的困扰。探索算力运营机制、调度管理以及利益分配机制,提升数据中心闲置算力使用效率。若能解决好上述问题,“东数西算”势必将为我国数字经济带来新的活力。

(本文刊登于《中国信息安全》杂志2023年第2期





《中国安全信息》杂志倾力推荐

“企业成长计划”

点击下图 了解详情


前沿 | 东数西算工程落地的关键问题分析与对策建议

原文始发于微信公众号(中国信息安全):前沿 | “东数西算”工程落地的关键问题分析与对策建议

  • 左青龙
  • 微信扫一扫
  • weinxin
  • 右白虎
  • 微信扫一扫
  • weinxin
admin
  • 本文由 发表于 2023年4月3日22:23:52
  • 转载请保留本文链接(CN-SEC中文网:感谢原作者辛苦付出):
                   前沿 | 东数西算工程落地的关键问题分析与对策建议https://cn-sec.com/archives/1650809.html

发表评论

匿名网友 填写信息