国内或国外 期刊或论文

您当前的位置: 发表学术论文网文史论文》 基于机器学习的调度操作行为挖掘与推荐技术研究及应用> 正文

基于机器学习的调度操作行为挖掘与推荐技术研究及应用

所属分类:文史论文 阅读次 时间:2021-12-20 11:06

本文摘要:摘要:受互联网用户推荐技术的启发,基于调度系统中运行人员的历史操作记录,结合数据分析与机器学习算法提出了一种有效的调度员操作行为模式挖掘与推荐技术。首先,该技术采集记录调度员日常操作数据,并通过页面类型划分、会话识别、事务识别等过程实现数据预处理。

  摘要:受互联网用户推荐技术的启发,基于调度系统中运行人员的历史操作记录,结合数据分析与机器学习算法提出了一种有效的调度员操作行为模式挖掘与推荐技术。首先,该技术采集记录调度员日常操作数据,并通过页面类型划分、会话识别、事务识别等过程实现数据预处理。然后,利用模式分析和聚类分析完成调度员行为模式挖掘,并结合关联规则将模式数据压缩至频繁模式树(FP-tree)。最后,利用基于模式树结构的实时推荐系统为调度员提供操作推荐服务。通过在实际调度系统上进行应用和验证,结果表明所提技术能有效识别出调度员的操作行为模式并为调度员提供较为精准的操作推荐,进而提高调度员与调度系统的交互效率,减少调度员的工作量。

  关键词:电网调度;行为模式;操作日志;聚类挖掘;操作推荐

机器学习

  0引言

  调度系统作为现代电网平稳运行的基石,涵盖了输、配电等调度业务和对电网整体运行状态的监测、控制、管理等任务。而调度员作为调度系统的核心要素,通过调度系统来监控电网运行状况,分析电网故障信息,保障电网的安全与稳定。

  但随着电网规模的不断扩大,调度系统的迭代升级,操作程序的日趋复杂,调度员的工作量和工作负担也逐渐加重,尤其是调度员在调控系统上进行断面监视、负荷控制、方式调整及故障分析等工作时,往往需要花费大量精力在多个系统页面之间进行反复跳转、查找,以获取某个业务场景所需要指标,或在特定页面上实施重复繁琐的操作流程,严重影响了调度员的工作效率[1-4]。为此,如何优化调度员的操作流程、简化调度员操作任务,对于减少调度员工作负担、提高调度工作效率具有重要意义,值得深入研究[5]。

  随着大数据的普及和发展,近年来基于用户日志的数据挖掘和推荐技术日趋成熟,并在许多领域取得了成功应用。文献[6-7]通过分析用户在网站上的浏览路径,对网站的页面结构进行优化,方便用户快速到达他们感兴趣的页面。文献[8-9]通过对用户的浏览记录进行聚类分类,实现对不同类型用户推荐不同内容的功能。

  文献[10]根据期刊的推荐业务需求,设计了数字期刊推荐系统的框架,实现期刊内容资源与用户需求的有效匹配。在电网调度领域,目前鲜有对调度操作行为模式挖掘和推荐的技术研究,更多的是基于调度规程和人工经验的操作辅助决策。文献[11]指出了当前电网调度的一些业务模式及相应规范准则,但不涉及调度员操作模式挖掘及效率提升。文献[12]采用自然语言处理技术对线路跳闸的处理规程进行知识抽取,形成流程化的知识,用于协助调控人员完成故障处理。

  文献[13-14]提出通过构建调控领域的知识图谱,支撑调度员在故障处置、倒闸操作、对话问答等业务场景的辅助决策,有效地降低人工处置风险。因此,受互联网用户个性化推荐思路的启发,本文基于调度员的历史操作行为数据,采用机器学习技术与数据挖掘算法对调度员操作行为模式挖掘进行了深入研究,并在此基础上实现了基于操作模式挖掘结果的调度智能推荐,有效简化调度员的操作步骤,节省了操作时间,提升了工作效率。1整体框架基于机器学习的调度操作行为模式挖掘与操作推荐总体框架,主要包括:数据采集、模式挖掘、实时推荐、交互界面4个模块。

  1)数据采集模块对不同用户在系统界面中的操作动作进行记录和管理。该模块以内部埋点的方式跟踪调度员的操作动作,并生成相应结构化操作日志。操作日志通过预设标签标识用户名、操作时间、图形名称、操作内容等信息。2)模式挖掘模块负责对历史操作记录中的调度员浏览和操作模式进行挖掘。

  其中,数据预处理用以将原始的调度员操作记录处理成后续模型需要的用户会话;聚类挖掘对用户会话进行挖掘分析获得相应的操作行为模式;关联规则模块以聚类分析出的模式为基础,构造该模式FP-tree并挖掘出频繁模式项作为后续推荐数据源。

  3)实时推荐模块通过实时跟踪用户页面操作序列,在线匹配识别用户所处操作行为模式,完成对后续操作的关联推荐、统计推荐等智能操作推荐服务。4)交互界面负责操作推荐结果的实时展示与操作交互。提供即时推荐、热点排行、定时任务等多种操作推荐方式,并可通过快捷操作的交互方式实现对推荐内容的一键操作。

  2关键技术

  行为模式挖掘与操作实时推荐是整个技术框架的核心内容,下面将介绍其涉及的关键技术。

  2.1数据预处理

  2.1.1页面类型划分

  在电网调度系统中,有的类型页面可以展示不同场站、设备的内容。例如所有的“XX变电站.fac”表示的是各具体厂站图,而它们都是厂站类型的页面。在操作模式挖掘中需将这样的页面进行归一化处理,避免将具体场站、设备信息混杂在操作模式中,影响后续模式聚类效果。通常系统页面可分为应用系统图、厂站图、曲线图等不同类型。页面类型划分时,对于逻辑上具有唯一性的应用系统图,采用不同页面编号来划分定义;而对于具有不同页面实例的厂站图(如XX变电站厂站图)、曲线图(如XX设备有功今日曲线)等页面类型,按照其所属页面类型定义为相同的页面编号。

  2.1.2会话识别

  调度员的操作行为记录是时间上连续的一串页面浏览序列,所谓会话就是按照不同调度业务从整串页面浏览序列中截取出的子序列,调度员通过浏览子序列中的页面完成某个任务。会话中的单个页面及其停留时长构成相应的一个页面实例。

  本文采用时间窗口法进行会话识别[15]。时间窗口法认为两个连续页面之间的时间间隔大于某个阈值时,原会话截止,新的会话产生。在调度系统上,调度员连续操作页面进行跳转时,若某一页面与其下一页面的间隔时间大于设定阈值,则认为该页面与其下一页面分属不同的会话,通常会话识别默认阈值为300s[16]。在电网调度系统中,调控人员为了监视某些指标,经常在一些页面长时间停留,远超过300s,会话并未就此断开。针对该特点,本文提出对于不同页面通过分析其页面实例停留时长的分布区间给出不同的会话识别阈值。具体地,定义页面实例停留时长的中位数为页面参考时长,当页面的参考时长超过300s时,则其会话识别阈值调整为默认阀值的两倍,即600s。

  2.1.3事务识别

  在页面浏览序列中,根据用户浏览性质可将页面分为事务页和导航页。事务页是具有访问目的的、调控人员感兴趣的页面,如:电网负荷监视页,而导航页是调控人员在浏览过程中跳转性质的页面,如:厂站目录页。所谓事务识别就是区分出页面浏览序列中的事务页。

  页面实例的停留时长超过设定阈值时,该页面实例是事务页;反之该页面实例是导航页[17]。其中,阈值的设定通过分析典型事务页和导航页的页面停留时长分布状况给出。其设定过程同会话识别类似,根据二八原则,定义80%页面实例不超过的停留时长为事务参考值。

  2.2聚类挖掘

  经过上文数据预处理后,调度员的操作日志被分段逐条整理成经过编号的浏览序列,然后通过聚类算法将相似的浏览序列划分为一类,从而识别出调度员的浏览行为模式。本文采用近邻传播(AP)聚类算法进行模式挖掘[18]。该算法无需预先指定聚类的簇数,输入参数为两两会话之间的相似度,以解决多个会话向量维度无法统一的问题。

  2.3关联规则

  实时推荐时需要对用户操作序列和挖掘出的行为模式在线逐个匹配并计算置信度,因此,选取一种合适的数据结构缓存行为模式的相关信息对于提升匹配和推荐效率至关重要。

  本文采用频繁模式增长(FP-Growth)算法来建立FP-tree数据缓存结构并挖掘关联规则[22]。FP-Growth算法通过对源数据进行两次扫描,将数据信息存储到FP-tree中,从而避免了产生候选项集的步骤,减少了数据匹配开销。该算法由构建FP-tree和频繁项集挖掘两个步骤组成:FP-tree是一种扩展的前缀树结构,由频繁项头指针表和项前缀树构成,存储关于频繁模式次数的信息;频繁项集挖掘是通过头指针表生成条件模式基后,根据计数值判定该路径集合是否为频繁项,最后迭代重复上述步骤,递归地发现频繁项、发现条件模式基,以及发现另外的条件树。

  其中,挖掘出的频繁项集是用户日常工作中的页面关联规则。在电网调控领域,用户的页面浏览顺序和业务背景有密切关系,但该频繁项集无法反应页面的浏览顺序。因此,本文参考历史会话中的页面浏览顺序对关联规则中的页面进行重排序,筛选出包含关联规则中所有页面的最新历史会话,以最新历史会话中的页面浏览顺序作为该关联规则的 页面顺序。

  2.4实时推荐

  实时推荐以挖掘出的调度员行为模式为基础,结合调度员最近的操作行为序列推荐出后续操作,包括模式识别、关联推荐等。

  2.4.1模式识别

  模式识别用于判断当前用户所处操作模式。首先通过在线跟踪捕获用户在系统页面上的操作,形成实时操作序列;然后通过在线预处理获得调度员当前正在进行的会话事务序列;最后遍历各行为模式的频繁项集,进行模式匹配。若实时会话序列和判定行为模式的频繁项存在交集,则该行为模式可能为当前实时会话序列的匹配模式,选取其中匹配度最高的若干行为模式作为模式识别的结果。

  2.4.2关联推荐

  关联推荐以模式识别生成的当下模式和FPtree为基础进行,分析出当前用户行为序列置信度最高的操作事务。首先通过比对模式识别结果,生成备选事务;然后对备选事务进行置信评估,获得发生概率最高的若干备选事务。具体地,搜索FP-tree逐个计算备选推荐事务的置信度,选取置信度前N名的事务项作为页面推荐内容。

  3验证与应用

  本文采用某电力调度中心智能电网调度技术支持系统(D5000)中的调度员历史操作数据进行推荐应用与算法验证。

  3.1算法验证

  3.1.1页面浏览统计

  本节以浏览行为模式挖掘为例介绍算法验证情况。收集的数据时间范围为2020年6月1日至6月30日。该时间段内共采集到操作记录5932条,涉及页面241个。

  其中,行为模式2对应调度员日常工作中联络线守护的操作模式。在该业务场景中,调度员通过查看电网负荷监视、联络线监视曲线确定联络线是否运行在考核范围内,如果超出范围则需要查看AGC运行监控确认是否有机组可进行反向调节[23]。行为模式8为故障发生后进行故障预演的操作模式。调度员一般通过断面越限和独立计算等功能预演出故障发生后的断面状态数据,作为后续决策的参考依据。行为模式12为调度员监视新能源出力受阻情况的模式,经常在上午发生。

  09:00—10:00处于新能源机组出力爬坡时段,此时调度员需要时常查看新能源受阻情况和新能源监视等图形监控新能源机组的运行情况,确保新能源的消纳能力[24]。行为模式14对应调度员进行调频、调峰的模式。水电站是比较经济高效的旋转备用电源,当调度员需要进行一次调频、深度调峰等操作时,通常需要查看直调水电站的水位曲线、出入库流量等数据,以判断水电站的调节能力边界[25]。

  3.2推荐应用

  基于本文的行为模式挖掘与操作推荐技术研发的调度操作智能推荐软件,为调度员的日常系统页面浏览和操作提供个性化、智能化推荐。该系统以独立插件的方式与D5000系统人机界面实现集成,在使用时调度员点击调度系统页面的悬浮图标,推荐界面会以滑动窗口的方式从页面右侧显示。

  以行为模式2和14为例,说明智能操作推荐的效果。当调度员进入“电网负荷监视图”后,智能操作推荐软件结合模式2自动推荐出调阅“AGC_运行监视、联络线监视曲线”等关联界面,结合模式14自动推荐出龙羊峡等水电站水位曲线和“水情信息监视”等关联界面,点击按钮可以直接跳转到相应页面。

  以此场景为例,简单对比使用推荐软件前后的操作效果差异。对于行为模式2原有系统从“电网负荷监视图”页面至少需要经过六步操作才能完成上述关联页面的跳转,分别为:①打开“系统首页”;②打开“实时监视”;③打开“AGC_运行监视”;④返回“系统首页”;⑤打开“联络线考核主界面”;⑥打开“联络线监视曲线”。而使用智能推荐功能只需要一键直接打开“AGC_运行监视”和“联络线监视曲线”画面,操作步骤由原来的6步简化到了2步,操作效率提升了约70%。对于行为模式14原有系统至少需要经过5步操作才能完成上述操作。

  分别为:①在龙羊峡水位数据上右键单击;②在弹出的右键菜单上点击“今日曲线”选项,打开“龙羊峡水位曲线”画面;③返回“系统首页”画面;④打开“稳态监控”画面;⑤点击水情信息按钮,打开“水情信息监视”画面。而使用智能推荐功能只需要一键直接打开“龙羊峡水位曲线”和“水情信息监视”画面,操作步骤由原来的5步简化到了2步,操作效率提升了约60%。以上文的196个调度会话为例,分析使用推荐工具带来的效率提升。未使用推荐工 具时完成会话需要的操作步数共1778步;使用推荐工具时完成会话需要的操作步数共1116步。通过统计分析,使用推荐工具时可以减少约37.2%的页面跳转流程,显著提升了调度员在调度系统上的交互效率和便捷性。

  此外,本软件系统还可提供依据操作热点统计的操作排行推荐、依据固定时段操作模式的定时操作推荐等多种操作推荐模式。例如对于行为模式12,推荐软件会在09:00—10:00期间直接定时推荐出当下调度员需要执行的打开“新能源监视图”、查看“新能源机组负荷曲线”等操作,无须频繁跳转到相关页面进行操作,通过对定时操作的智能提醒与一键交互,可以高效辅助调度员完成操作任务。

  4结语

  本文主要阐述了基于调度员的历史操作数据,结合机器学习、数据分析等方法对调度操作行为模式进行挖掘与推荐的技术。通过在实际调度系统上的验证分析,结果表明挖掘出的调度员操作模式与实际电网调度业务具有高度一致性,验证了该技术的有效性。此外,该技术采用了FP-tree数据结构存储模式数据,并在此基础上通过在线匹配、置信评估等方法为调度员提供了准确的推荐服务和便捷的操作方式。

  总的来说,调度员操作行为模式挖掘与推荐技术在改善调度员与调度系统交互方式、减轻调度员工作量、提高调度员工作效率等方面有显著的提升。但是本文提出的模式挖掘与操作推荐技术目前仍只适用于日常相对固化的流程性业务模式,在电网故障或异常等紧急场景下并不适用。当电网发生故障时,运行人员需结合电网运行数据、影响情况和处置经验进行针对性处置,并且处置过程的部分操作不是通过系统而是通过电话或其他手段实施的,完整的处置记录很难准确获取。因此在上述紧急场景下,如何结合电网运行情况和调度业务数据的复杂场景进行操作推荐,是我们后续研究的方向。

  参考文献:

  [1]胡彬,李苏苏.贵州电网调度优化操作模式建议[J].贵州电力技术,2012,15(2):73-75.HUBin,LISusu.SuggestiononGuizhoupowergriddispatchingoptimizationmode[J].GuizhouElectricPowerTechnology,2012,15(2):73-75.

  [2]王轶禹,王晶,冯长有,等.电网系统保护在线监视研究及典型应用[J].电力工程技术,2019,38(5):63-70.WANGYiyu,WANGJing,FENGChangyou,etal.Onlinemonitoringforlargepowersystemprotectionanditsoptimizationstrategy[J].ElectricPowerEngineeringTechnology,2019,38(5):63-70.

  [3]崔晓丹,李碧君,李威,等.设备月度检修计划给定下的电网运行方式优化方法[J].电力系统保护与控制,2016,44(9):102-107.

  作者:吴自博1,2,王波1,2,3,陈清1,2,郭耀松1,2,赵京虎1,2,闪鑫1,2,3

转载请注明来自发表学术论文网:http://www.fbxslw.com/wslw/29142.html