基于K-means++与 ELM的短期风电功率预测模型研究

admin

140350
文章

117
评论

2022年10月18日23:34:50评论69 views字数 2947阅读9分49秒阅读模式

原文作者：陈天阳、钱政、荆博、韩妙荃

原文标题：基于K-means++与ELM的短期风电功率预测模型研究

原文链接：

https://kns.cnki.net/kcms/detail/detail.aspx?dbcode=CAPJ&dbname=CAPJLAST&filename=DCYQ20220513002&uniplatform=NZKPT&v=6yquLHy_oGbLaF1eAwAhrryt4Rbtm94uvVdZ8AAKy3VgDudCpPYyQHJ8GPQZQKhI

原文来源：知网、《电测与仪表》，2022

笔记作者：志高无尚

1. What

提出了一种基于K-means++聚类分析和极限学习机（ELM）的短期风电功率预测方法，同时使用数值天气预报（NWP）数据与 SCADA 系统的历史监测数据，实现了对未来72 h 的短期风电功率预测。

2. Why

风能的波动性对风电产业的迅速发展带来了巨大挑战，准确可靠的短期风电功率预测对满足电网调度以及降低度电成本具有重要意义。

3. How

3.1数学方法

（1）互信息

互信息（MI）是衡量变量间相关性的量度，互信息越大，代表变量间的相关性越强。对于离散随机变量X，Y，其互信息I(X,Y)表示为：

式中p(x)和p(y)分别是X和Y的边缘概率分布函数；p(x,y)为X和Y的联合概率分布函数。

（2）K-means++聚类

本文选用K-means++算法对数据进行聚类，主要步骤如下：

a.在数据集中随机选出一个聚类中心点C1，依次计算其他数据样本X_i与C1之间的距离，记为L(x)，则样本点被选中为下一聚类中心点的概率为：

使用轮盘法选出下一个聚类中心，重复此步，直至选出K个聚类中心点；

b.计算剩余的数据样本与K个聚类中心点的距离，按距离大小，将剩余的数据样本分入距离最小的中心点Ck所在的子集中；

c.重新计算各数据子集中数据点的中心点；

d.重复步骤b~步骤c，直至聚类中心点不再发生移动。

（3）极限学习机

极限学习机是一种基于单隐层前馈神经网络的新型算法，其结构如图1所示：

基于K-means++与 ELM的短期风电功率预测模型研究

图1 ELM结构图

对于给定 N 个任意样本(X_j,t_j)，其中，X_j=[X_j₁,X_j₂,…,X_jn]^T∈Rⁿ，t_j=[t_j₁,t_j₂,…,t_jm]^T∈R^m，具有L个隐藏层的ELM网络可以表示为：

式中j=1,...,N，G(x)为激活函数，W_i=[W_i1,W_i2,…,W_in]^T为第i个隐藏层与输入层之间的权重矩阵，ρ_i=[ρ_i1,ρ_i2,…,ρ_im]^T为第i个隐藏层与输出层之间的权重矩阵，b_i为第i个隐层单元的偏置。式（3）可表示为：

其中，

式中H代表ELM的隐藏层输出矩阵。ELM的系数ρ可以通过搜索线性系统Hρ= T的最小二乘解基于K-means++与 ELM的短期风电功率预测模型研究

来确定：

其中，H⁺是隐含层输出矩阵H的Moore-Penrose广义逆。

ELM模型训练时其输入层的权值与阈值为随机产生，算法执行过程中只需要对隐含层神经元的个数进行调整，无需调整参数。

3.2短期功率预测模型

本文提出的风电功率预测模型的结构框图如图2所示：

图2 系统结构框图

（1）数据预处理

风电场的SCADA系统采集频率为60 s，将数据集进行平均处理，分辨率为 15 min。由于输入向量量纲不一致，使用Z-score标准化方法对数据进行归一化，根据各输入特征与风电功率之间的互信息值选择输入特征，其结果如表1所示。根据J1、J2数据集的互信息值，J1、J2均选择风向、温度、相对湿度、风速、表面压强作为输入特征。

表1 互信息值

（2）数据聚类

针对上一步所选取的输入特征及前一天的实测风速数据，将数据划分为K个子集，并计算误差平方和（SSE），使用手肘法选取最合适的K值。根据手肘法的原理，SSE 值在接近真实聚类数时会骤然变化，当分类的个数大于4后，其SSE值变化趋于平缓，因此令数据集J1、J2的K值为4。

（3）功率预测

针对上一步划分的数据子集，分别构建ELM预测模型。通过计算NWP数据与聚类中心点的距离选择合适的模型实现预测。

3.3算例分析

（1）实验数据

选用江苏如东海上风场提供的风电数据，对文中提出的功率预测模型进行验证。其中J1为该风场2020年11月13日~2021年2月3日提供的NWP信息，J2为2020年12月09日~2021年3月3日提供的NWP信息。选用其后20天的数据作为测试集，其他数据作为训练集，预测时长均为3天。

（2）评价标准

文中使用NRMSE（Normalized Root Mean Square Error ，归一化均方根误差）、NMAPE（Normalized Mean Absolute Percentage Error，归一化平均绝对百分比误差）作为功率预测评价指标。其公式如下所示：

式中y_t为原始风速值；基于K-means++与 ELM的短期风电功率预测模型研究

为风速预测值；C为风机的额定功率。

（3）实验结果

为了验证该模型的性能，文中比较了未经聚类的持续法、BP神经网络、ELM 模型，与使用K-means聚类的K-ELM模型作为对比模型，每个模型训练50次取平均值，预测时长每隔24 h（即96个预测点）取平均值，从预测精度来评价该模型。其预测结果如表2~表5所示。

表2 J1数据集与经典方法的对比结果

表3 J1数据集与聚类方法的对比结果

表4 J2数据集与经典方法的对比结果

表5 J2数据集与聚类方法的对比结果

分析表2、表4的预测结果可以看出，与经典风电功率预测方法相比，文中提出的 K++ELM方法的NRMSE、NMAPE分别平均降低了15.2%、17%。从表3、表5的预测结果可以看出，将数据聚类后更能准确地实现预测。

4. Conclusion

实验结果表明，本文提出的基于K-means++聚类与ELM的短期风电功率预测方法与其他4种预测模型相比，具有较高的概率预测精度。

5. Review

（1）本文先介绍了所采用的数学方法：互信息法、K-means++算法、极限学习机算法；随后提出短期功率预测模型，将实验样本带入，详细地描述了数据预处理、聚类分析、功率预测的步骤；最后再进行算例分析验证算法的有效性。思路清晰，结构严谨，无论是“机器学习”领域还是“功率预测”领域，都是一篇范文。

（2）笔者之前在学习《基于K均值聚类算法的电源运行状态数据分析》论文时，曾考虑到K-means聚类“需要人为给定K的个数”以及“聚类结果受初始聚类中心选取影响大”的缺陷，而本文使用的K-means++聚类算法完美解决了这两个问题。笔者总结该算法的核心思想是：所选初始聚类中心之间的相互距离要尽可能的远，假如已经选取了n个聚类中心，则在选取第n+1个聚类中心时，距离当前n个聚类中心越远的点越容易被选中。

（3）本文所用实验数据均为江苏风电数据，又集中在11月-3月之间，样本容量较小，且在地域和时间上均存在一定的局限性，还需要进一步研究不同地貌、不同季节对风电功率预测的影响。

（4）在实验结果的展示方面，原文只展现出数据集被分为4类，如果能提供每个类别的预测曲线图，是否会更加直观形象？

（5）待学习：神经网络。笔者对神经网络理论有些遗忘，导致对本文预测算法理解不深入，需要复习相关知识，为后续学习更多功率预测算法打下基础。

原文始发于微信公众号（CTS纵横安全实验室）：基于K-means++与 ELM的短期风电功率预测模型研究

免责声明:文章中涉及的程序(方法)可能带有攻击性，仅供安全研究与教学之用，读者将其信息做其他用途，由读者承担全部法律及连带责任，本站不承担任何法律及连带责任；如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截，联系方式见首页)，望知悉。

左青龙
微信扫一扫

右白虎
微信扫一扫

基于K-means++与 ELM的短期风电功率预测模型研究

开源情报技巧：解构环境犯罪背后的金融网络

美国议员批评英国对苹果的后门命令，并警告网络犯罪风险

TransparentTribe针对阿富汗监狱管理局的鱼叉式钓鱼邮件攻击

关于MCP最值得看的一篇：MCP创造者聊MCP的起源、架构优势和未来

G.O.S.S.I.P 阅读推荐 2025-05-08 IPvSeeYou

以色列NSO集团因攻击WhatsApp用户被判赔偿逾1.67亿美元

打穿系统是风险，那打垮人呢？——年年演练零误报，年年有人没能等到尾款和复盘

美国警告：黑客瞄准油气行业工业控制系统与监控数据采集系统

【戏说我在甲方做安全】聊蜜罐合作，结果甲方被乙方骂了

Panabit VLAN这样玩才高效：从透明网桥到网关模式的实战踩坑指南

发表评论

在线咨询

微信