中广核新能源生产运维系统整合及流程优化项目
中电科金仓(北京)科技股份有限公司
陈浩 张立 张俊峰 赵吉超
一、项目背景
中国广核新能源控股有限公司(以下简称“公司”)是中广核集团的二级公司,主要负责风电、光伏、水电、综合能源、储能等新能源发电业务的建设与运维。公司总部下属区域分公司,各分公司管理所属新能源场站的建设和运维业务,公司总部运维事业部作为专业管理部门,负责对全部分公司、场站的生产、运维、设备、检修、备件、技术、运营、信息化规划建设等工作的管理。
二、项目现状
中广核新能源公司先后建成了检修管理与智能报表、设备档案管理、移动巡检、智能运维、检修质量管理、海上风电智慧运行、无人机巡检等生产管理类信息系统,以及集控管理、故障预警、功率预测等设备监控类信息系统。由于历史原因,各业务系统单独开发、部署、运行,缺乏统一的规划、设计与管理,技术架构和部署方式也存在较大差别,导致系统之间对接复杂,业务数据难以统一与有效共享,端到端流程难以贯通。目前的应用现状已越来越难以满足生产运维管理的实际需求。
为应对中广核新能源公司更新更高的生产运维要求,支撑其服务安全生产和检修管理业务,电科金仓作为数据库领域国家队,近期完成了其新能源生产运维系统整合及流程优化项目,该项目旨在通过统一技术平台,为安全生产与检修管理业务赋能,实现提质增效。
三、项目目标
中广核新能源生产运维系统上线后,需要支撑中广核新能源公司及下属各分公司管理所属600多个新能源场站6000多人员的使用,通过深度融合各业务应用、整合应用入口,系统实现了办公与业务场景的无缝衔接,打破了各服务间的界限。实现企业范围内信息的无缝访问和系统的无缝应用集成,对数据库系统的性能、稳定性、高可用性和安全性都提出较高要求。
四、需求痛点
中广核新能源生产运维系统的国产化替换项目,从启动之初就面临着一场与时间的赛跑。电科金仓项目团队必须在短短一个月内,完成应用迁移、数据迁移、高可用部署验证、性能压测、分步替换验证、上线等国产化工作,需要跨越以下四大核心挑战:
1.基于其它国产数据库开发的新能源运维系统应用迁移难度大、成本高,历史系统的MySQL、PostgreSQL、MongoDB和ES数据库数据迁移复杂,工作量大,劳心劳力。
2.高峰期时,需要满足600多个新能源场站的6000+多人员并发使用的性能要求。
3.重要核心系统-新能源生产运维系统,需要满足“灾难恢复能力5级”的异地灾备(横跨上千公里)要求,实现 99.999%的可用性。
4.需要验证新能源生产运维系统准在线、低侵扰、全数据、高效平滑的分步替换方案(验证局部信创到整体信创)可行性。
五、金仓方案
(一)迁移“零修改”,打破国产化焦虑
五月底,电科金仓中标中广核新能源公司国产数据库采购项目,并被指定为统一数据库。其中,需在六月底完成上线的新能源生产运维系统原基于其他国产数据库开发,其应用迁移和数据迁移可行性令用户与ISV深感担忧。为此,电科金仓技术团队现场制定了完整迁移方案,实施顾问在两天内即完成该系统应用迁移和数据迁移,配合ISV实现“零代码修改”,并验证了利用KDTS工具可将原有MySQL、PostgreSQL、MongoDB及ES等六个历史系统数据快速、自动迁移至金仓数据库,高效消除了各方顾虑。

(二)无感自治优化,高效支撑全员应用
新能源生产运维系统上线后,需要支撑中广核新能源公司及下属各分公司管理所属600多个新能源场站的6000+多人员的使用,支撑生产运维各业务应用高效运行,这对数据库性能提出了极高要求。为保障整个系统的高效运转,性能调优工作至关重要。金仓数据库通过将人工调优过程内化为数据库内核,成功实现了自治调优。这种创新的调优方案为性能压测优化提供了更高效且准确的性能调优途径,电科金仓项目团队仅用3天就完成了新能源运维系统的性能压测优化工作。系统成功满足6000+使用人员2秒响应的要求。

在中广核新能源生产运维系统的性能压测优化过程中,金仓数据库提供了自适应逻辑优化规则、自适应基数估计、优化建议等三种优化机制:
1.逻辑优化是一种基于规则的优化方法,它按照一定顺序应用一系列优化规则来对输入的逻辑执行计划进行改进,使其变得更加高效。金仓数据库已经内置了一百五十多条常用的逻辑优化规则,能够满足大部分复杂业务需求。
2.对于 SQL调优中常见的基数估计错误问题,金仓数据库可以利用执行结果自动修正,对于基数估计偏差较大的情况,经过一轮或多轮的迭代执行,可以给出更优的执行计划。
3.基于采集到的问题SQL,调优建议器可以做进一步分析,最后基于规则, 给出优化建议,如索引建议、统计信息建议、改写建议等。
对于内存不足、IO问题、锁问题等实例问题,金仓数据库直接调用KDDM即可给出建议。
(三)多级别高可用,保障系统稳定运行
新能源生产运维系统是中广核新能源公司的重要核心系统,需要提供完善的容灾机制,保障各种灾难/故障场景下业务的7*24无中断持续运行。
电科金仓围绕新能源生产运维系统业务连续性目标,基于该系统的业务特征和“异地容灾、数据同步、快速切换、数据可靠、持续运行、服务可用”等关键需求,构建了一个安全、稳定、低成本、高可用的异地双中心高可用部署方案。

异地容灾双中心架构。
1.生产中心采用1套一主两备读写分离集群,通过物理日志流复制技术,主节点与备节点间保证数据实时一致,应对本地多种故障场景,例如:断电、断网、存储故障、服务器故障等,实现RTO秒级,RPO=0。
2.主中心与异地灾备中心横跨上千公里,通过物理日志异步复制方式提供数据准实时同步能力。电科金仓提前帮助该发电集团客户规划好异地的带宽配置情况,以满足当前业务系统评估日志每天的生成量,制定合理的带宽值。同时利用日志压缩功能,为用户节省昂贵的异地专用带宽。在合理的满足业务流量需求上,RPO达到秒级。RTO推荐用户手动执行,配合业务(提供手动切换脚本)自动切换异地灾备,实现RTO在数分钟内完成。
基于以上电科金仓提供的满足“灾难恢复能力5级”要求的异地灾备解决方案,确保7x24小时不间断数据库服务,实现 99.999%的新能源运维系统可用性,保障生产运维的持续运行。
(四)分步替换,准在线、低侵扰、全数据、高效平滑
中广核新能源公司要求新能源生产运维系统采用分步替换的方式,满足局部信创到整体信创的要求。
电科金仓围绕新能源生产运维系统分步替换的目标,提供了一个准在线、低侵扰、全数据、高效平滑的分步替换方案。

1.准在线–新能源生产运维原生产区(局部信创)业务仅在系统切换时发生闪断。
2.低侵扰–除停服时间外,新生产区(整体信创)数据库及应用的迁移与上线测试等工作对原生产区(局部信创)端无侵扰。
3.全数据–在迁移过程中原生产区(局部信创)新产生的数据变化(增、删、改)均可捕获,通过物理日志流复制技术,达到原生产区(局部信创)和新生产区(整体信创)两端数据同步,有效保障数据一致性。
六、实施成果
在电科金仓、中广核新能源公司运维团队和软件开发商的紧密配合下,项目团队历经一个月,完成了新能源生产运维系统平台和应用迁移、历史系统数据库数据迁移整合、性能测试优化、异地灾备高可用架构部署和高可用性验证测试、分步替换验证,最终确保新能源生产运维系统成功上线,充分验证了金仓数据库高效、安全、可靠、经济的支撑能力,凸显了电科金仓的技术与行业优势。
金仓助力新能源运维系统价值提升:
支持风电、光伏、储能、光热、抽蓄等不同发电形式的运维管理需求;
实现关键业务贯通、履历数据回写、价值管理拉通;
实现设备可评价、故障可分析、物资可衡量、绩效可追溯;
满足业务流程化、管理精益化的发展需要;
为安全生产和检修管理业务提供有效赋能,助力安全生产和检修管理工作提质增效。

