国内或国外 期刊或论文

您当前的位置: 发表学术论文网经济论文》 基于低频分量EEMD-SVR预测建模的指数择时策略> 正文

基于低频分量EEMD-SVR预测建模的指数择时策略

所属分类:经济论文 阅读次 时间:2022-01-24 10:36

本文摘要:摘要:以机器学习为基础设计高效的股票择时策略是量化投资领域的研究热点。文章结合集成经验模态分解(EEMD)和-不敏感支持向量回归(SVR)的优势,提出基于EEMD-SVR的指数低频分量预测模型,进而构建基于低频分量趋势预测的沪深300指数择时策略。首先,对沪深300指数进行E

  摘要:以机器学习为基础设计高效的股票择时策略是量化投资领域的研究热点。文章结合集成经验模态分解(EEMD)和ε-不敏感支持向量回归(SVR)的优势,提出基于EEMD-SVR的指数低频分量预测模型,进而构建基于低频分量趋势预测的沪深300指数择时策略。首先,对沪深300指数进行EEMD分解,剔除高频IMFs后利用低频IMFs和趋势项重构指数低频分量;其次,运用ε-不敏感SVR构建低频分量预测模型;然后,根据低频分量预测结果制定交易信号生成规则,构建沪深300指数择时策略;最后,对构建的策略和MACD等多种择时策略进行对比评估,结果表明:构建的策略能更高效地把握指数的中长期主要趋势,在收益获取与风险控制等方面的表现显著超越了对照策略。

  关键词:沪深300指数;量化择时策略;集合经验模态分解;支持向量回归;低频分量

预测建模

  0引言

  量化投资通过构建定量方法和模型来认知和刻画金融市场的发展变化规律,进而预测市场的走势,发现套利机会,并通过计算机技术代替人执行交易决策、风险管控等复杂的投资操作,有效克服了传统人工投资方式难以规避的经验、情感和精力等方面的缺陷,从而获得较传统投资方式更出色的风险收益表现[1]。投资择时依靠投资者对资产价格趋势的有效预判,选择适当的时机买卖资产,以实现规避风险、获取超额收益的目标[2]。股市指数量化择时是主动型量化投资研究的重要问题,其核心在于如何高效地预测指数价格的变化趋势[3]。宏观经济、市场供求、企业自身发展和投资者预期等多种复杂因素驱动了股票市场发展,使得股价波动具有显著的非平稳、非线性和高噪声的复杂特性,导致股价的有效预测成为一个公认难题[4]。

  现有研究大多使用ARIMA、GARCH等金融计量方法对股价序列进行建模预测,多数计量模型要求待建模数据符合特定分布假设,而股价序列通常很难满足这样严格的数据分布要求。机器学习算法对数据的分布和噪声含量等要求更宽松,且通常对非线性金融时序数据具有更好的预测能力。其中,SVR模型对待建模数据的分布不作任何假设,特别适用于金融复杂时序预测建模。Van和Suykens(2001)[4]利用LS-SVM对金融时序进行非线性回归建模,进而预测资产价格的波动率,实证结果表明该方法可获得较高的预测精度。

  刘道文和樊明智(2013)[5]利用SVR对上证指数进行预测,实证表明增量SVR模型比神经网络模型预测更准确。针对金融时序的长期依赖特征,黄婷婷和余磊(2019)[6]提出了一种基于深度学习的预测模型,其预测精度比传统神经网络更高。鉴于机器学习在金融时序预测领域的出色表现,研究者们尝试运用机器学习方法预测股市短期趋势并进一步构建量化择时策略,以获取超额投资收益。Huang等(2006)[7]运用SVM对股市趋势进行预测并构建量化择时策略,并证实该策略的表现显著优于基于传统指标判断的择时策略。

  傅中杰和吴清强(2018)[3]利用HMM模型进行特征筛选并预测市场状态,并证实HMM择时策略的市场状态识别能力比双均线策略更出色。徐茜茜(2018)[8]构建基于SVM股价预测建模的量化择时策略,获得了比“涨买跌卖”策略更好的收益。上述研究证实了利用机器学习预测股市趋势进而构建择时策略的可行性。然而,股价波动的复杂性使得利用常用机器学习算法很难充分提取其复杂变化规律,进而难以准确预测股价变化趋势。融合信号处理与机器学习的集成方法能更有效地挖掘股价序列蕴含的深层变化规律,实现金融时序数值和趋势的高精度预测。

  贺毅岳等(2019)[9]提出基于经验模态分解(EMD)的股市指数集成预测方法,显著提升了预测效果。EMD是一种非线性时序信号的自适应分解新方法,具有出色的时频局部化能力[10]。Wu和Huang(2004)[11]通过引入频率均匀分布的白噪声,进一步提出了集合经验模态分解(EEMD),有效解决了EMD中存在的模态混叠问题。张卫国等(2020)[12]利用EEMD对互联网保险理财收益率进行多尺度分解,结合各分量特征深入分析影响收益率的主要因素。上述研究证实,利用EEMD分解可获得复杂金融时序的多尺度波动与趋势特征,对提高金融时序预测建模精度具有重要价值。因此,本文结合EEMD的多尺度分解功能和ε-不敏感SVR的非线性建模优势,提出基于EEMD-SVR的指数低频分量预测模型,进而构建基于低频分量趋势预测的指数择时策略。

  1股市指数EEMD分解与重构原理

  1.1EMD方法原理

  EMD分解本质上是将时序信号中不同尺度的趋势或波动逐级分解,并保留各自尺度的特征,最后产生一系列本征模函数(IMF)。其中,IMF需满足两个条件:极值点与过零点数量相等或最多相差一个;对序列上任意一点,上包络线和下包络线的均值为零。时序信号EMD分解包括四个步骤[9]:步骤1:利用三次样条插值函数连接待分解的时序信号S(t)中所有局部极大值、极小值,拟合得到S(t)的上、下包络线。步骤2:对上下包络线求均值得到均值包络线m(t),并按照式(1)计算得到新序列d(t)。d(t)=S(t)-m(t)(1)然后按照式(2)计算得到Sd,依据Sd取值情况判断d(t)是否为本征模函数。

  1.2EEMD方法的改进思路

  在待分解时序信号不含噪声的条件下,EMD分解得到的每个IMF可表示原序列在特定频率下的波动模式。然而,现实中如股市指数等时序信号并不完全符合白噪声假设且信噪比特别低,导致EMD分解的模态混叠问题。针对该问题,在EEMD方法中逐次将频率均匀分布的不同辅助白噪声加入目标信号,进一步利用EMD分解该信号序列,重复执行上述过程N次,再对分解所得IMFs和趋势项求平均,最终获得原信号的分解结果[11]。为降低EEMD中所添加白噪声的扰动效果,通常对白噪声的统计特征加以控制:εn=εN,εn为最终误差的标准差,ε为辅助白噪声的标准差,通常设为0.1或0.2,N为集成操作的次数,默认值为100[10]。

  2指数低频分量的预测建模

  2.1指数预测建模的流程

  从聚宽量化平台提取2015-01-01至2017-12-31的沪深300指数收盘价,得到共732个有效交易日数据作为本文指数预测建模的训练集。训练期内,指数先后经历上涨、下跌和震荡三个阶段,包含一个完整、典型的股市指数运行周期,有利于验证本文指数预测模型对不同行情状态下股市指数复杂变化规律的提取与刻画能力,进而能增强本文择时策略有效性的说服力。

  以沪深300指数时间序列为输入,依次执行指数EEMD分解、低频分量重构以及SVR预测建模。具体建模流程为:首先,对训练期内指数序列进行EEMD分解,获得相应的多个IMF和残余项;其次,按指数低频分量的重构方法,对低频IMF和残余项进行加和,获得重构的指数低频分量;最后,运用ε-不敏感SVR构建低频分量的预测模型,并按日滚动预测获得下一交易日指数低频分量预测值。

  2.2指数EEMD分解及低频分量重构

  对指数序列进行EEMD分解,得到如图3所示的6个IMF和1个残差项。从IMF1到IMF6,频率变化模式复杂度依次下降,残余项反映了指数的平均变化趋势,这表明EEMD分解具有将非线性、非平稳性序列分解为若干个平稳且频率不同的IMF及趋势项的重要功能。依据本文所述IMF重组方法,依次对分解获得的各IMF进行均值不为0的t检验(显著性水平0.05)。IMF5均值显著异于0,故IMF1到IMF4为高频项,将IMF5、IMF6和残差项相加获得指数的低频分量。

  2.3低频分量SVR预测建模及优化

  以2015-01-01至2017-12-31共732天作为建模训练期,采用按日滚动的建模方式,即以最近30个交易日的指数低频分量为模型输入、以下一交易日(第31个交易日)的指数低频分量值为输出,构建基于ε-不敏感SVR的低频分量预测模型。当新增一个交易日的真实数据后,对2015-01-01至最新一个交易日的指数时序进行EEMD分解和低频分量重构,并重新建立相应的低频分量SVR预测模型,再用最近30个交易日的低频分量值为输入来计算下一个交易日的低频分量预测值。

  以此方式按日滚动预测,依次获得测试期内各交易日的指数低频分量值,测试期自2018-01-01至2019-08-30共406天。滚动预测过程中仅利用到当前时刻为止的市场信息,不含任何涉及指数的未来信息。建模过程中,为提升模型参数的训练精度与速度,对训练数据进行了Z-Score标准化。给定参数搜索区间[0.01,20]进行参数寻优,再采用随机参数优化方法在参数空间进行随机搜索以获得最优值,在保证参数寻优精度前提下加快了模型求解速度。

  3沪深300指数择时策略构建及评估

  3.1策略的构建流程与思路

  中长期趋势择时的关键是有效过滤股市指数短期变化的小趋势,而提取其中长期运行趋势,即择时策略要忽略指数短期波动趋势,以避免频繁交易导致的过高交易成本,同时要把握有利的中长期涨跌趋势,制定有效的交易规则,进而生成交易决策与买卖操作所需的交易信号,真正将高效的趋势预测能力转化为择时交易的超额收益获取能力。

  本文通过EEMD分解、低频IMF与残差项的重构获得指数低频分量,实现了对指数局部短期波动的有效过滤,很大程度上消除了原指数所包含的市场交易噪声。相比于原指数序列,低频分量更光滑、波动率频率更低,可显著降低进一步运用SVR算法提取指数长期变化规律的难度,从而可提升指数中长期发展趋势预测的准确度。如下页图5所示,根据沪深300指数低频分量的预测值,设计交易规则并计算获得交易信号,进而构建指数择时策略,包括择时和交易两步子过程:

  (1)择时子过程。建立基于ε-不敏感SVR的低频分量预测模型,通过按日滚动预测方式获得下一交易日指数低频分量的预测值。进一步,参考董竹和周悦(2019)[13]关于股市惯性效应、择时策略与交易规则设计的研究结论,设定交易信号产生规则:当低频分量预测值>其上一日实际值+10,则产生买入信号;当低频分量预测值<上一日实际值-3,则产生卖出信号;其他情况不产生交易信号。

  (2)交易子过程。根据择时过程所产生的交易信号执行交易:当交易信号为买入信号,则全仓买入;当交易信号为卖出信号,则留仓30%,其余卖出;无信号则不交易。考虑到频繁交易造成交易成本过高的问题,在不同调仓周期下执行策略回测,如图6所示,调仓周期为6日时收益达到最大值34.41%,故设定调仓周期为6日。

  3.2策略的回测分析

  在聚宽量化平台上设定回测区间为2018-01-01至2019-08-30,通过不断调整(最小调整比例为10%)卖出时的留仓比例,获得相应的多组体现收益获取与风险规避能力的策略评估结果。卖出时留仓30%的策略收益、阿尔法值和夏普比率明显高于其他组,此时策略的最大回撤达到最优值10.39%。综合考虑策略的收益与风险表现,当交易信号为卖出信号时,留仓30%其余均卖出。

  首先,从收益方面看,本文策略可稳定超越基准策略,在基准收益为-5.74%的情况下获得34.41%的策略收益;其次,从超额收益获取能力角度看,本文策略的阿尔法值为0.194,表明策略可获取正的超额收益;再次,夏普比率1.082意味着策略每承担1单位总风险,能带来1.082单位超越无风险的收益;最后,策略回撤为10.39%,与回测期间沪深300指数的市场行情基本相符。这表明本文策略能在一定程度上降低择时风险并获得相对稳定的超额收益。

  3.3与已有典型策略的对比分析

  3.3.1MACD策略

  指数平滑异同平均线(MACD)策略(策略A)的择时思路为:当DIF上穿DEA(金叉)时为买进信号,当DIF下穿DEA(死叉)时为卖出信号。该策略的择时过程为:设定MACD快速均线为12日均线,慢速均线为26日均线,参数M为9日。当产生买入信号时全仓买入;当产生卖出信号时,留仓30%其余均卖出,调仓周期为6个交易日。可以看出,该策略的收益超过了基准策略,在基准收益为-5.74%的情况下策略收益为-0.23%,其阿尔法值和夏普比率均为负值,表明策略未获得超额收益。最大回撤为0.49%,说明该策略非常稳定,未出现大幅亏损。然而,该策略风险与收益综合表现并不理想。

  3.3.2基于涨跌分布统计的择时策略

  基于涨跌分布统计的择时策略(策略B)的主要思想是通过统计方法来检验价量因子出现的概率,成功率高再继续进行买卖。该策略的构建思路为:对训练期每日指数涨跌幅度的分布情况进行统计,结果表明涨跌幅度1.5%以内的情形占多数,进一步统计2~5日的涨跌幅情况,寻找更具投资参考意义的涨跌规律,发现连续3日上涨、日均上涨超0.5%且每日涨幅差异较小时将大概率保持上涨趋势,连续2日下跌超过2%将持续下跌趋势。

  利用该统计规律构建择时策略:连续3日上涨超过0.5%时产生买入信号,连续2日下跌超过2%时产生卖出信号。交易过程、仓位控制规则的设定与本文策略相同。由回测结果可知,该策略收益可稳定超越大盘,在基准收益为-5.74%的情况下获得6.29%的策略收益。阿尔法值为0.011说明策略可获取较小的超额收益。夏普比率为-0.019,表明策略承受每单位总风险的超额回报为负。最大回撤11.72%,说明该策略相对较稳定。总体来说该策略收益较稳定,但风险控制能力不足。

  3.3.3指数EEMD-SVR预测的择时策略

  指数EEMD-SVR预测的择时策略(策略C)的指数建模预测过程为:首先,对训练期内的沪深300指数进行EEMD分解,利用分解获得的IMF依次重构其高、低频分量和趋势分量;其次,按照上文所述SVR滚动预测建模方法,分别构建高、低频分量和趋势项的预测模型;最后,采用按日滚动预测方式计算预测期内指数高、低频分量和趋势项的预测值,再通过求和获得指数的最终预测值。然而,该方法在指数重构过程中并未剔除携带噪声的高频IMF,使得其预测精度提升效果有限。

  策略C区别于本文策略的关键在于:其交易信号的产生是依据对指数预测值与前一交易日指数值的比较结果来确定的,而不是依据指数低频分量预测值与前一交易日低频分量值的比较结果。参照本文的信号产生规则生成交易信号,且交易过程、仓位控制规则的设定与本文策略相同。在基准收益为-5.74%的情况下该策略获得4.26%的累计收益,超越了基准表现。然而,其阿尔法值仅为0.064,表明该策略仅能获取少量的超额收益;夏普比率为0.039,表明策略在承受单位总风险下的超额回报较小。最大回撤23.38%表明其稳定性较差,可能出现较大亏损。总体来说,该策略的回测收益获取与风险控制能力并不出色。

  3.3.4各策略表现的整体对比分析

  为上述四种策略在聚宽量化平台上回测的详细对比评估结果,据此得到三个结论:

  (1)对比本文策略与策略A和B,从策略的思想来看,策略A从双移动平均线策略发展而来,其构建过程仅利用指数简单的数学运算;策略B通过统计一个经济周期内的指数涨跌规律,进而设计出相应的交易策略。相较于基于复杂机器学习算法而构建的交易策略,策略A和B的适应性和稳定性难以保证。从上述3个策略的收益结果来看,策略A未能获取正收益,策略B收益率较低,仅能获取较小的超额收益,收益表现远不如本文策略,证实本文择时策略具有良好的正向收益获取能力。

  (2)对比本文策略与策略C,从策略思想来看,策略C通过EEMD分解和SVR对指数进行分频预测并加和集成获得指数预测值,预测精度有所改善,但该策略的交易信号是通过直接比较指数预测值与其前一日指数真实值生成的,而原指数包含大量的噪声,故难以高精度预测指数进而把握股市指数的中长期主趋势,导致频繁交易、交易费用过高,影响其实际执行效果。策略C的年化收益仅为3.16%,明显低于本文策略为19.97%的年化收益率,这证实了本文通过低频分量预测来把握市场趋势的研究思路合理。

  (3)进一步从风险角度对本文策略和对照策略的风险管理能力作对比分析。本文策略贝塔值为0.454,明显高于策略A、B和C,且图7中本文策略的累计收益主要来自中后期上涨区间,说明本文方法能较准确地把握指数的中长期趋势,进而转化为策略的实际收益。本文策略的夏普比率为1.082,表明承担1单位总风险可获取1.082单位额外收益,远高于其他策略。本文策略的索提诺比率和信息比率也远高于对比策略,说明在承担单位下行风险时本文策略可获得更多的超额收益。同时,本文策略的最大回撤、阿尔法等其他风险收益指标结果均较优,充分证实在上述策略中本文策略的风险规避与控制能力最佳。

  4结束语

  本文针对基于机器学习预测的指数择时策略构建问题,首先通过EEMD分解与重构获得指数低频分量,低频分量的波动特征相对简单、市场交易噪声含量更低,有利于高效提取指数波动模式。其次,结合SVR在复杂序列非线性建模方面的优势,提出了基于SVR的指数低频分量预测模型。最后,根据低频分量趋势预测结果设计择时信号的产生规则,并构建基于低频分量趋势预测的指数择时策略。对比评估证实:利用去噪后的指数低频分量预测指数中长期趋势,进而构造指数量化择时策略的研究思路合理、有效,且显著降低了指数趋势预测建模的难度;同时,本文策略能更有效地把握指数中长期趋势,大幅提升了生成择时信号的准确度,其收益获取与风险控制表现显著超越了对比策略,并能长期保持盈利。

  参考文献:

  [1]李斌,邵新月,李玥阳.机器学习驱动的基本面量化投资研究[J].中国工业经济,2019,(8)

  [2]ChenYW,ChouRK,LinCB.InvestorSentiment,SEOMarketTim⁃ingandStockPricePerformance[J].JournalofEmpiricalFinance,2019,(51).

  [3]傅中杰,吴清强.基于隐马尔科夫模型的市场指数量化择时研究[J].厦门大学学报(自然科学版),2018,57(3).

  [4]VanGL,SuykensJT.FinancialTimeSeriesPredictionUsingLeastSquaresSupportVectorMachinesWithintheEvidenceFramework[J].IEEETransactiononNeuralNetworks,2001,12(4).

  [5]刘道文,樊明智.基于支持向量机股票价格指数建模及预测[J].统计与决策,2013,(2).

  作者:高妮1,贺毅岳2,马新成2

转载请注明来自发表学术论文网:http://www.fbxslw.com/jjlw/29465.html