原文作者:陈天阳、钱政、荆博、韩妙荃
原文标题:基于K-means++与ELM的短期风电功率预测模型研究
https://kns.cnki.net/kcms/detail/detail.aspx?dbcode=CAPJ&dbname=CAPJLAST&filename=DCYQ20220513002&uniplatform=NZKPT&v=6yquLHy_oGbLaF1eAwAhrryt4Rbtm94uvVdZ8AAKy3VgDudCpPYyQHJ8GPQZQKhI
原文来源:知网、《电测与仪表》,2022
笔记作者:志高无尚
1. What
提出了一种基于K-means++聚类分析和极限学习机(ELM)的短期风电功率预测方法,同时使用数值天气预报(NWP)数据与 SCADA 系统的历史监测数据,实现了对未来72 h 的短期风电功率预测。
风能的波动性对风电产业的迅速发展带来了巨大挑战,准确可靠的短期风电功率预测对满足电网调度以及降低度电成本具有重要意义。
3. How
(1)互信息
式中p(x)和p(y)分别是X和Y的边缘概率分布函数;p(x,y)为X和Y的联合概率分布函数。
(2)K-means++聚类
本文选用K-means++算法对数据进行聚类,主要步骤如下:
a.在数据集中随机选出一个聚类中心点C1,依次计算其他数据样本Xi与C1之间的距离,记为L(x),则样本点被选中为下一聚类中心点的概率为:
使用轮盘法选出下一个聚类中心,重复此步,直至选出K个聚类中心点;
b.计算剩余的数据样本与K个聚类中心点的距离,按距离大小,将剩余的数据样本分入距离最小的中心点Ck所在的子集中;
c.重新计算各数据子集中数据点的中心点;
d.重复步骤b~步骤c,直至聚类中心点不再发生移动。
(3)极限学习机
极限学习机是一种基于单隐层前馈神经网络的新型算法,其结构如图1所示:
图1 ELM结构图
其中,
其中,H+是隐含层输出矩阵H的Moore-Penrose广义逆。
ELM模型训练时其输入层的权值与阈值为随机产生,算法执行过程中只需要对隐含层神经元的个数进行调整,无需调整参数。
3.2短期功率预测模型
本文提出的风电功率预测模型的结构框图如图2所示:
图2 系统结构框图
(1)数据预处理
风电场的SCADA系统采集频率为60 s,将数据集进行平均处理,分辨率为 15 min。由于输入向量量纲不一致,使用Z-score标准化方法对数据进行归一化,根据各输入特征与风电功率之间的互信息值选择输入特征,其结果如表1所示。根据J1、J2数据集的互信息值,J1、J2均选择风向、温度、相对湿度、风速、表面压强作为输入特征。
表1 互信息值
(2)数据聚类
针对上一步所选取的输入特征及前一天的实测风速数据,将数据划分为K个子集,并计算误差平方和(SSE),使用手肘法选取最合适的K值。根据手肘法的原理,SSE 值在接近真实聚类数时会骤然变化,当分类的个数大于4后,其SSE值变化趋于平缓,因此令数据集J1、J2的K值为4。
(3)功率预测
针对上一步划分的数据子集,分别构建ELM预测模型。通过计算NWP数据与聚类中心点的距离选择合适的模型实现预测。
(1)实验数据
选用江苏如东海上风场提供的风电数据,对文中提出的功率预测模型进行验证。其中J1为该风场2020年11月13日~2021年2月3日提供的NWP信息,J2为2020年12月09日~2021年3月3日提供的NWP信息。选用其后20天的数据作为测试集,其他数据作为训练集,预测时长均为3天。
(2)评价标准
(3)实验结果
为了验证该模型的性能,文中比较了未经聚类的持续法、BP神经网络、ELM 模型,与使用K-means聚类的K-ELM模型作为对比模型,每个模型训练50次取平均值,预测时长每隔24 h(即96个预测点)取平均值,从预测精度来评价该模型。其预测结果如表2~表5所示。
表2 J1数据集与经典方法的对比结果
表3 J1数据集与聚类方法的对比结果
表4 J2数据集与经典方法的对比结果
实验结果表明,本文提出的基于K-means++聚类与ELM的短期风电功率预测方法与其他4种预测模型相比,具有较高的概率预测精度。
(1)本文先介绍了所采用的数学方法:互信息法、K-means++算法、极限学习机算法;随后提出短期功率预测模型,将实验样本带入,详细地描述了数据预处理、聚类分析、功率预测的步骤;最后再进行算例分析验证算法的有效性。思路清晰,结构严谨,无论是“机器学习”领域还是“功率预测”领域,都是一篇范文。
(2)笔者之前在学习《基于K均值聚类算法的电源运行状态数据分析》论文时,曾考虑到K-means聚类“需要人为给定K的个数”以及“聚类结果受初始聚类中心选取影响大”的缺陷,而本文使用的K-means++聚类算法完美解决了这两个问题。笔者总结该算法的核心思想是:所选初始聚类中心之间的相互距离要尽可能的远,假如已经选取了n个聚类中心,则在选取第n+1个聚类中心时,距离当前n个聚类中心越远的点越容易被选中。
(3)本文所用实验数据均为江苏风电数据,又集中在11月-3月之间,样本容量较小,且在地域和时间上均存在一定的局限性,还需要进一步研究不同地貌、不同季节对风电功率预测的影响。
(4)在实验结果的展示方面,原文只展现出数据集被分为4类,如果能提供每个类别的预测曲线图,是否会更加直观形象?
(5)待学习:神经网络。笔者对神经网络理论有些遗忘,导致对本文预测算法理解不深入,需要复习相关知识,为后续学习更多功率预测算法打下基础。
原文始发于微信公众号(CTS纵横安全实验室):基于K-means++与 ELM的短期风电功率预测模型研究
- 左青龙
- 微信扫一扫
-
- 右白虎
- 微信扫一扫
-
评论