为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

股票价格时间序列的隐藏瞬时模式识别方法研究

2012-09-22 10页 pdf 370KB 31阅读

用户头像

is_835533

暂无简介

举报
股票价格时间序列的隐藏瞬时模式识别方法研究 《数量经济技术经济研究》2008年第 5期 股票价格时间序列的隐藏 瞬时模式识别方法研究 杜宽旗 蒙肖莲 (1.南京理工大学经管学院; 2.北京理工大学管理与经济学院) ① 【摘要】由于时间序列数据挖掘方法具有刻画和预测所观察事件特征的突出特 点,将它运用于股票价格时间序列分析,不仅可以揭示隐藏于股票价格时间序列中 的瞬时模式,而且还可以有效预测诸如股票价格急剧变化等高频金融时间序列事 件。本文基于时间序列数据挖掘理论与方法的探讨,将其运用于具体的股票价格生 成的高频时间序列分析。结果表明,具...
股票价格时间序列的隐藏瞬时模式识别方法研究
《数量经济技术经济研究》2008年第 5期 股票价格时间序列的隐藏 瞬时模式识别研究 杜宽旗 蒙肖莲 (1.南京理工大学经管学院; 2.北京理工大学管理与经济学院) ① 【摘要】由于时间序列数据挖掘方法具有刻画和预测所观察事件特征的突出特 点,将它运用于股票价格时间序列分析,不仅可以揭示隐藏于股票价格时间序列中 的瞬时模式,而且还可以有效预测诸如股票价格急剧变化等高频金融时间序列事 件。本文基于时间序列数据挖掘理论与方法的探讨,将其运用于具体的股票价格生 成的高频时间序列分析。结果表明,具有统计显著性的、可以刻画和预测事件的隐 藏瞬时模式是能够被识别的。 关键词 股票价格时间序列 数据挖掘 隐藏瞬时模式 识别方法 中图分类号 F224.0 文献标识码 A idden Temporal Pattern Identificati0n M ethods of Stock Price Time Series Abstract:Due to lts abilities of characteristics and predictive,Time Series Da— ta Mining Methods can not only be used to reveal the hidden temporal patterns in stock price time series,but also be used to predict the,high frequency financial time series events efficiently.Based on the theoretical an?t methodological discussion, this paper applies the time series data mining methods to stock price time series to generate a set of analysis.The analysis results show that the hidden temporal pat— terns that are both characteristic and predictive of events in financial time series can be identified. Key s:Stock Price Time Series;Data Mining;Hidden Temporal Pat— tern;Identification M ethods 引 言 当前,研究与开发有效的金融时间序列分析理论与方法受到资本市场投资者和理论工作 ① 基金项目:教育部社科规划基金项目 “高频金融时间序列预测数据挖掘方法研究”,项目号:05JA910003;南京 理工大学经管学院青年基金项目。 H e h . t n 0 y d U . t S A 维普资讯 http://www.cqvip.com 股票价格时间序列的隐藏瞬时模式识别方法研究 · 115 · 者的高度关注,特别是对金融领域中出现的非稳定性、非周期性和不规则的高频时间序列进 行预测,显得更加迫切。但是,现有的一般的高频金融时间序列分析方法,还不能够满足投 资者对市场进行有效预测的实际需求。因为资本市场是易变的,很难用传统的时间序列分析 方法来预测外汇和股票等金融时间序列的动态行为。这就意味着,为了通过有效的手段来获 得有利交易地位和时机,资本市场投资者就必须研究与开发能够识别金融时间序列波动的预 测方法。 近年来,新出现的一种关注隐藏瞬时模式发现的时间序列数据挖掘方法表明,隐藏在高 频时间序列中的瞬时模式是可以通过数据挖掘的方法得到有效识别的,而且这种识别事实上 就是对事件的预测 (Provineli和Feng,1998),同时,预测事件也正是资本市场投资者在识 别金融时间序列波动过程中给予高度关注的核心。 不过,本文所要关注的问题是,虽然有研究证明,运用数据挖掘技术能够克服传统时间 序列分析技术对时间序列稳定性和线性等必要条件的限制性缺陷,能够成功地对复杂的、非 周期性的、不规则和无序的高频时间序列进行刻画和预测,但是,资本市场上的投资交易者 所关心的是,所识别的隐藏模式是否就是其关心的交易优势呢?如果是的话,这种交易优势 是否应被看成可以实现的、允许比预期收益还要大的一种优势呢?如何运用时间序列数据挖 掘方法才能够有效发现这种隐藏的、能够被用于实现交易优势的模式呢? 一 、 识别金融时间序列隐藏瞬时模式的理论和方法 根据目前现有的时间序列数据挖掘方法的基本原理,本文认为,金融时间序列数据挖掘 就是识别与发现隐藏于高频金融时间序列中的、能够刻画和预测所关注重要事件的、按时间 排序的结构 (称之为瞬时模式)的一种方法。成为重要事件发生前兆的瞬时模式是一种由事 件发生前的数据点组成的时间序列的次数列的原型。该方法通过时间滞后嵌入将观察的时间 序列 x嵌入到一个重新构建的、其拓扑等同于原来空间的状态空间,并在其中识别成为事 件发生前兆的瞬时模式 (Richard J.Provinelli,2006)。用遗传算法搜索这样的状态空间以 获得匹配问题特定 目标的最优瞬时模式聚类。这是通过定义问题的特定事件特征函数 C(·),使事件值的概念公式化来完成的。接着,利用搜索出的最优瞬时模式聚类预测新时 间序列中的重要事件。 金融时间序列数据挖掘方法有几个显著的特征。第一,该方法的重点放在识别能够刻画 和预测事件的瞬时模式。第二,利用所识别的瞬时模式,新方法的重点在于预测复杂的时间 序列事件而不是预测完整的时间数列,例如,此方法可以预测股票价格的快速增长。第三, 最优化的目标函数反映所考察时间数列的目标,这是问题特定的。 为了描述隐藏瞬时模式并对其进行有效的识别,首先需要定义一些基本概念,然后在此 基础上开发高度有效的有关时间和空间的算法,目标是从时间序列数据库中基于给定的查询 抽取相似的次序列。 1.基本概念 (1)事件、瞬时模式和瞬时模式聚类。在一个金融时间序列中,某个重要事件的定义取 决于数据挖掘的目标。例如,上证 5O股票的日开盘价 P的走势可以用 P一{ , 一l,⋯, N)来表示,如图 l所示。 在该时间序列中,一个事件可以被定义为股票价格的剧烈上升或下降,则在交易日内价 格变动超过 5 的情形就是股票交易者所关注的重要事件,即交易优势。可以使用时间序列 维普资讯 http://www.cqvip.com · 116 · 《数量经济技术经济研究》2008年第5期 图 1 上证 50被选样本股票价格时间序列 (1999~.2006年) 数据挖掘方法提前一步预测这种交易优势,即在一个给定的时期,确定买进和卖出股票。图 2显示了时间序列数据挖掘方法搜索的典型模式的两个例子。红色的模式即是时间序列中股 票价格急剧增长这一事件发生的前兆,即瞬时模式。因此,瞬时模式可定义为时间序列中能 够刻画事件特征和成为事件发生前兆的一种隐藏结构。瞬时模式S可描述为一个L维实数空 间中的一个点,即sC- 。 0 5 10 15 20 25 30 图 2 时间序列中的瞬时模式 因为噪音,瞬时模式并不完美匹配事件发生前的时间序列观察,为了克服这一限制,应 用一个瞬时模式聚类 S来描述与捕捉瞬时模式的波动性。瞬时模式聚类 5定义为瞬时模式S 的一个邻域,由在 5的一定距离y内的所有点组成。该瞬时模式聚类可表示为: S一 { C- :d (s, )≤≤y} 其中d为在空间上定义的距离,例如 d(s, )一 I 一 I。该式定义了一个维度为 z一 1 L、半径为 y、中心在 S的超球面。 (2)时间滞后嵌入和状态空间。给定一个训练的时间序列 X一 {z ,t一1,⋯,』\『), 通过称之为时间滞后嵌入的过程,可以重构一个拓扑等同于原始状态空间的状态空间。时间 滞后嵌入过程将时间序列展开嵌入,此时称为简单状态空间的重构的状态空间 。这一展 开机制将 X映射进入 。特别地,将一个从 X取出的长度为L的时间序列观察值的集合 {z 一( ,一1) ,⋯, £一2 , 一 , )映射为: O 9 8 7 6 5 4 3 2 1 维普资讯 http://www.cqvip.com 股票价格时间序列的隐藏瞬时模式识别方法研究 ·117 · 式中,X 为状态空间 中的点或列向量;r为时间滞后量;t为区间 [(L一1)r+1, NJ内的一个整数。 Takens(1980)研究证明,如果长度 L足够大,该状态空间 和生成时间序列X 的原 始状态空间是同胚空间,重构状态空间系统的动力学拓扑等同于原始状态空间系统的动力 学。因此,基于重构状态空间的特性刻画与预测和从原始状态空间获得的一样有效。 通过定义和重构状态空间,时间序列的次序列 {z I” ,⋯,z ,z ,z }就容易 与瞬时模式相比较,其中五表示当前的观察值,z ,⋯,z ,z一表示过去的观察 值。让 r是一个正整数,如果 t表示现在的时间指标 ,则 (£一r)是过去的时间指标,(£+ r)表示将来的时间指标。使用这些符号,时间被划分为过去、现在和将来。瞬时模式和事 件被放置在不同的时间类型中,瞬时模式在过去发生,在现在完成,事件在未来发生。 (3)事件特征函数。为了将瞬时模式 (过去和现在)和事件 (将来)联结起来,并确定 一 个瞬时模式刻画一个事件的效力,要求引入一个真实赋值的事件特征函数 C(£)。Stellios Keskinidis(2002)提出了一种定义事件特征函数 C(£)的方法。根据该方法,事件特征函 数定义为对于目前时间指标未来事件的值。如此定义事件特征函数以使它在时间t的值与一 个事件在未来某些特定时间的发生高度相关。也就是说,当使用时间序列数据挖掘方法解决 预测问题的时候,使用因果关系的事件特征函数。当使用时间序列数据挖掘方法解决系统识 别问题时,非因果事件特征函数是非常有用的。 例如,刻画提前一步预测事件发生的事件特征函数是 C(£)一z ,提前三步预测事件 要求事件特征函数为c( )一z ,更复杂的提前一步、两步或三步预测事件发生的事件特 征函数是c(£)一max{z£+l,z£+2,z£+3}。 在图 1的时间序列 P一 {P ,£一1,⋯,N}中,目标是决定是否应该今天购买股票而 明天卖出,这一目标的事件特征函数为c(£)一 ( 一 )/p ,则该函数给出的就是基于 目前时间指标的下一个交易日股票价格变动的百分比。 (4)增广状态空间。增广状态空间的概念是在定义了事件特征函数和状态空间概念的基 础上界定的。增广状态空间是一种在状态空间基础上用事件特征函数 C(·)作为扩展维数 而得到的 L+1维空间形式。每一个增广状态空间点就是一个向量E L+ 。 (5)目标函数。识别增广状态空间中的最优瞬时模式聚类要求定义目标函数 厂的概念 并给出其公式,也就是说,目标函数 厂表明的是瞬时模式聚类刻画一个事件特征的效力。 目标函数 .厂能够将状态空间中的瞬时模式聚类s映射为真实线,这提供了一种根据瞬时模 式聚类刻画事件特征的能力对它们进行排序的方法。以这样一种方式构造 目标函数 厂,目的 是找到能够最好地刻画事件特征的最优瞬时模式聚类 S ,以实现时间序列数据挖掘的目标。 令集A一 {t:£一 (L一1)r+1,⋯,N}为状态空间点的全部时间指标 t的集合,其 中 (L一1)r为最大的嵌入时滞 ,N为时间序列观察值的数量。集 M一 {t:X E S,tEA} 为在瞬时模式聚类s内的z 的全部时间指标t的集合。 M集的势定义为g( 一∑1;M的势定义为g( 一∑1,其中,M一 {£:Xt tEM £ M S,tEA},而以集的势为g (以)。 在瞬时模式聚类 S内的状态空间点的事件特征函数的C(£)平均值,同时也称为平均事 件值 ,其定义为: 维普资讯 http://www.cqvip.com · 118 · 《数量经济技术经济研究》2008年第5期 一 1 E M c(f) ) 式中,g ( 是M 集的势。 不在 S中的状态空间点的平均事件值是: M~ 一 — l_ ∑c(f) (2) g(M ) ∈M 所有状态空间点的平均事件值由式 (3)给定: 纵一 ∑ ) (3) 式中,(L一1)r是最大的嵌入时间滞后量;N是时间数列中观察的数量。 相应的方差是: 一 (4) 南一— ∑(c( )~脚) (5) g( M 一 ∑ f)一 x) (6) 基于上述的分析,可以得到根据事件值的高低对瞬时模式聚类进行排序的目标函数,并 且要求这一目标函数对事件特征的刻画至少要达到最小的事件数量,该目标函数为: f M 若g(M)/g(A)≥ s l(t~M--co) +c0其他 式中, M为在瞬时模式聚类S内的状态空间点的c(f)的平均值;g(M)是 M集的势; g(以)为以集的势; 为期望的瞬时模式聚类最小百分比集的势, 为状态空间点的最小事 件值,亦即 一min{c(f):t∈A)。选择式 (7)中的线性障碍函数中的参数 以使 g (M )是非零的,即围绕瞬时模式 S的邻域包括了全部状态空间点的一定百分比。如果 一 1,则 g(M )一1或者 c( )一c( ) Vi,J∈M ,即在瞬时模式聚类中全部点的事件 值是相同的。如果 一0,当瞬时模式聚类仅包含状态空间中的一个点时,它将达到最大, 这个点具有最高的事件值。如果存在许多具有最高事件值的点,则最优瞬时模式聚类可以包 含若干这样的点。当p=o,式 (7)仍可定义,因为 g( /g(以)≥0仍为真。 2.瞬时模 式聚类的优化与挖掘方法 时间序列数据挖掘方法的关键就是寻找刻画事件特征和预测事件的最优瞬时模式聚类。 因此,在整个5和y上最大化 (s)的优化算法是必要的。为了找到s ,需要使用一种修正 的样本遗传算法 sGA (D.E.Goldberg,1989),这一方法由蒙特卡罗初始化法、轮盘选择法 和随机染色体杂交组成。一般情况下可以运用蒙特卡罗方法生成sGA的初始种群。尽管突 变算子典型地集成在某个sGA中,但它并不用于发现本文所给出的结果。sGA使用一种具 有基因长度为六和优异个体的二进制染色体杂交遗传算法。它使用复述表存储以前计算的拟 维普资讯 http://www.cqvip.com 股票价格时间序列的隐藏瞬时模式识别方法研究 ·119 · 合值,因此不用牺牲精确度而能获得计算加速。GA运算的停止为所有拟合值的收敛。 种群的大小一般确定为 30,蒙特卡罗搜索的样本容量通常为 300。运用散列方法可以提高运 算性能 (R.J.PovineUi,2002)。 3.时间序列数据挖掘方法步骤 给定观察时间序列X一 { , 一1,⋯,N),首先运用时间序列数据挖掘方法发现刻 画X中所关注事件特征的隐藏瞬时模式,其中,在具体问题背景中的事件是特定的。接着, 对于给定的检验序列,y一 {Y ,t=R,⋯,W),N%R%W,运用在 X中发现的隐藏瞬时 模式来预测 y中的事件。因此,运用时间序列数据挖掘方法,分析和发现股票价格等高频 金融时间序列隐藏瞬时模式的具体步骤,大体上可以总结为如下两个阶段共九个步骤。 第一阶段——训练阶段: (1)根据事件特征函数、目标函数和最优化表达式时间序列数据挖掘目标:①定义 事件特征函数 C(·),②定义 目标函数 厂,③定义最优化表达式,包括能够使目标函数值最 优的独立变量和目标函数的约束条件; (2)定义 L,即状态空间的维度和瞬时模式的长度; (3)运用时滞嵌入法将观察的时间序列转换到状态空间中去; (4)联系状态空间中的每一个时间指标,根据事件特征函数对事件做出描绘,形成增广 状态空间; (5)在增广状态空间内搜索能够最好地刻画事件特征的最优瞬时模式聚类; (6)评估训练阶段的结果,如果需要的话重复进行训练。 第二阶段——检验阶段: (1)将检验时间序列嵌入到状态空间中; (2)使用最优化瞬时模式聚类预测事件; (3)评估检验阶段的结果。 二、挖掘股票价格时间序列瞬时模式的实际应用 将时间序列数据挖掘应用于股票价格等高频金融时间序列时,挖掘的目标就是要寻找一 种交易优势,一种能够使收益大于预期收益 (比如 5 的收益率)得以实现的优势,这需要 识别与发现能够被开发以获得这样一个交易优势的瞬时模式。因此,股票价格时间序列数据 挖掘的目标,是识别与发现能够刻画和预测股票价格增长超过正常增长的这一事件的瞬时模 式聚类。 为此,本文将分析两个时间序列集。第一个时间序列集为随机抽取上证 A股中的30只 股票自2002年 1月 4日到 2003年 3月 10日的交易日间收益序列。该时期至少允许有 200个 检验阶段。交易日间的收益 一(of_1--O )/o ,其中O 是日开盘价,亦即每日开盘时的初次交 易价格。该时间序列集的详细情况可以由各大著名证券公司提供的相关数据显示与刻画。 第二个时间序列数据集为随机抽取上证 A股中的 30只股票指数 自2006年 6月 8日到 2007年 8月 16日的交易 日内收益序列。该时间序列集也允许具有 200个检验阶段。交易 日 内收益 /'t一 ( --O )/o ,其中O 是 日开盘价,C 是 日收盘价即每天收盘的最后交易价格。 此时间序列集给出的总结结果,如图3所示。 1.训练阶段 在训练阶段,本文针对每一只选择的股票指数所构成的高频时间序列,运用198次时间 维普资讯 http://www.cqvip.com · 12O · 《数量经济技术经济研究》2008年第5期 2006—062006—082006一lO2006—122007—022007—042007—062007—08 图 3 上证 50被选样本股票价格时间序列 (2OO6—06—08~2007—08—16) 序列数据挖掘方法进行训练,对于每个时间序列集总共有 5940个训练阶段。利用一个长度 为 100的移动窗口形成198个观察的时间序列。检验时间序列是一个单独的观察。 事件特征函数用 c( )= 表示,该函数允许提前一步的特征刻画和预测;使用参数 为 一O.005的目标函数式 (7);最优化表达式为 maxf (S);状态空间维度确定为 L一2。 每一只股票价格指数的训练结果的统计如表 1所示。在 5940次训练过程中,每一次的聚类 平均事件值 ( )都大于总体平均事件值 ( )。对于67 的瞬时模式聚类,基于独立均值 统计检验的犯第一类错误 工的概率a小于5 。 表 1 30只股票指数的结果 (2oo2一O1—04~2003—03—10) 股票代码 M> x d≤0.05 O1 100 71 02 100 35 03 100 64 04 100 72 05 100 66 06 100 63 07 100 9O 08 100% 81 09 100 56 10 100 71 11 100 54 12 100 45% 13 100 73 1'1 100 74 15 100 8O 16 100 92 17 100 7O 18 100 53 19 100 57 2O 100 61 21 100 69 22 100 83 23 100 66 24 100 61 维普资讯 http://www.cqvip.com 股票价格时间序列的隐藏瞬时模式识别方法研究 ·121 · (续) 股票代码 ,uM~,ux a≤0.05 25 100 62 26 100 81 27 100 55 28 100 76 29 100 69% 30 100 7O 综合 100 67 2.检 验 阶段 对 2002年 1月 4日到 2003年 3月 10日的时间序列进行 5940次训练处理,预测出 451 个事件。对每个股票指数序列所做出的统计预测结果如表 2所示。在 63 9/6(30次中有 19 次)的情况下聚类平均事件值 (脚 )大于非聚类平均事件值 ( )。对于大约 2O 的瞬时模 式聚类 ,基于独立均值统计检验的犯第一类错误 I的概率小于 5 。并且,根据 Povinelli (1999)的研究结果可以证明,对金融时间序列的预测而言,这些在 5 9/6a水平上的低统计显 著性比率是比较典型的。综合所有的预测结果 ,聚类平均事件值大于非聚类平均事件值,并 且根据独立均值检验,在 5 a的水平上具有统计显著性。 表 2 30只股票指数结果 (2006—06—08~2007—08—16)(检验) 股票代码 g ( M O'M g ( 衬 Oral, ‰ O1 18 0.632 1.840 18O 0.118 2.457 0.264 O2 13 一 O.36 2.253 185 0.043 1.91 O.42l 03 1O 1.203 1.786 188 --0.190 1.651 0.008 04 12 0.157 1.602 186 0.051 1.708 0.762 O5 17 0.029 1.791 181 0.256 1.646 0.637 O6 12 0.348 1.732 186 --0.015 1.975 0.446 O7 11 1.362 1.867 187 0.04 1.984 0.023 O8 16 1.188 2.518% 182 0.027% 1.589 0.068 O9 11 --0.857 1.865 187 0.113 2.663 0.105 1O 16 0.661 2.O3 182 一0.151 1.867 O.139 11 13 --0.039 1.866 185 0.076 oA 2.002 0.831 12 16 0.516 1.934 182 --0.042 1.640 0.266 13 24 一0.003 1.804 oA 174 --0.096 2.128 0.807 14 13 0.024 oA 2.038 185 --0.021 2.63% 0.942 15 14 0.629 oA 1.635 184 --0.015% 1.61 O.183 16 13 --0.286 1.968% 185 --0.027 1.826 0.640 17 21 1.524 2.436 177 -- 0.146 2.619 0.004 18 14 1.425 2.671 184 -- 0.154 1.942 0.026 19 16 0.636 1.160 182 0.078 1.57 0.068 2O 19 0.238 1.043 179 0.059 1.248 0.522 21 11 1.783 3.397% 187 0.009 1.805% 0.087 22 12 0.652 1.442 186 0.163 1.549 0.031 23 16 一 1.082 1.782 182 0.177 1.48 0.007 24 2O 一 0.967 2.025 178 -- 0.064 2.54 0.075 25 14 0.095 1.413 184 0.000 1.89 0.812 26 2O -- 0.023 1.478 178 0.073 2.072 0.803 27 14 0.051 1.571 184 0.061 1.17 0.982 28 20 0.078 1.389 178 0.092 1.256 0.976 维普资讯 http://www.cqvip.com · 122 · 《数量经济技术经济研究》2008年第 5期 (续) 股票代码 g (M) l上M g(胁 研 耐 .∞n 29 11 0.063 2.048 187 — 0.029 2.183 0.849 30 14 0.428 1.438 184 一 0.101 1.850 0.184 全部 451 0.322 1.960 5.489 0.013 1.921 O.OO142 注:‰ 表示基于独立均值统计检验的犯第一类错误 I的概率。 为了进一步理解时间序列数据挖掘方法在金融时间序列中运用的有效性,本文给出模拟 交易的最终结果,这一结果可以应用上述发现的瞬时模式聚类来获得。初始的模拟投资策略 制定如下: 如果来 自于投资组合中的任意一只股票的瞬时模式聚类具有高事件值,对该只股票的初 始投资制定为一天。如果在所选的 30只股票中,瞬时模式聚类具有高事件值的股票有若干 个,则初始投资就在这些股票之间进行平均分割。如果不存在具有高事件值瞬时模式聚类的 股票,则初始投资就投在假定年收益率为 5 的短期资金市场上。使用新的 100个最近的观 察窗口,重新运行训练过程。第二天,再根据相同的规则,将初始投资资本加上收益进行投 资。在剩下的投资期内重复上述投资过程直到结束。 运用上述方法,本研究在 2002年 5月 31日到 2003年 3月 10日期间的模拟投资结果用 表 3的形式给出。由于仅使用时间序列的第一部分进行训练,所以该模拟投资期实际上要比 总的时间框架短。同时给出对全部股票采用买入和持有投资方法所获得的收益率,这一收益 率和对所有 30只股票采用买入和持有策略获得的收益率相比有一定的微小区别,因为全部 股票在各组成成分之间有不等的权重。 表 3 模拟交易结果 (2002—05—31~2003—3一10) 投资组合 投资方法 收益率 按年计算的收益率 所有 3O只股票 瞬时模式聚类 22.5O 29.73 全部股票 买人和持有 2.92 3.76 所有 3O只股票 不在瞬时模式聚类内 0.30 0.41 所有 3O只股票 买人和持有 3.16 oA 4.2O 2006年 11月 7日~2007年 8月 16日期间的投资结果如表 4所示。同样,这一阶段的 期限比总的时间框架 (2OO6年 6月 8日~2007年 8月 16日)要短,因为时间序列的前部分 仅用于训练。对全部股票采用买入和持有策略获得的收益显著不同于对所有 30只股票采用 买入和持有策略所获得的收益,这不仅仅因为全部股票在它的各组成成分之间有不等的权 重,而且更重要的是因为使用的是 日内收益时间序列。 表4 模拟交易结果 (2006一II一07~2007—08—16) 投资组合 投资方法 收益率 按年计算的收益率 所有 3O只股票 瞬时模式聚类 3O.96 4O.78 全部股票 买人和持有 17.64 22.1O 所有 3O只股票 不在瞬时模式聚类内 4.O5 6.23 所有 3O只股票 买人和持有 7.62 1O.19 维普资讯 http://www.cqvip.com 股票价格时间序列的隐藏瞬时模式识别方法研究 ·123 · 运用时间序列数据挖掘方法,如果将2002年 5月31日制定的10万元的初始投资投到 所选取的上证 30种股票上,到 2003年 3月 10日为止,资本应当增长到 122500元,在投资 期内,所引致的最大损失为 7.23 9/6。运用时间序列数据挖掘方法,在 2006年 11月 7日做 出10万元的初始投资决策,到 2007年 8月16日为止,资本应当增长到130960元,在投资 期内的最大损失为 9.82 。需要指出的是,在本文的模拟投资的结果中,没有考虑交易成 本问题。根据现实市场中交易成本占投资总量的百分比情况,交易成本所占比重通常维持在 0.02 9/6的范围内。尽管如此,运用时间序列数据挖掘方法识别隐藏的瞬时模式并将其应用于 模拟股票投资的结果证明,在高频股票价格时间序列中运用该方法是非常有效的。 三、结 论 本文通过引人时间序列数据挖掘的相关概念并构建其框架和相关方法,探讨了如何将其 运用于识别复杂的、非稳定时间序列的瞬时模式并预测所关注的事件。应用结果证明,在金 融领域,特别是在高频股票价格时间序列中运用该数据挖掘方法,能够有效地识别一种交易 优势而有益于股票投资者的决策。 本文的分析和应用研究证明了如下几个方面:第一,由于时间序列数据挖掘方法具有刻 画和预测所观察事件特征的突出特点,将它运用于股票价格时间序列分析,可以揭示隐藏于 股票价格中的瞬时模式,第二,运用时间序列数据挖掘方法,可以有效预测诸如股票价格急 剧增长等高频金融时间序列事件。第三,对股票投资者来说,运用时间序列数据挖掘方法就 是要识别交易优势,而具有统计显著性的可以刻画和预测事件特征的瞬时模式通常就是其关 注的交易优势,此类交易优势是完全能够被有效识别并加以利用的。 参 考 文 献 Eli R.J.Povinelli and X_Feng,Temporal Pattern Identification of n Semes Data using Pattern Wavelets and Genetic Algorithms[R],proceedings of Artificial Neural Networks in Engineering,St.Louis, Missouri.1998,691~ 696. [2]Richard J.Povinelli,Michael T.Johnson,Andrew C.Lindgren,Felice M.Roberts,Jinjin Ye. (2006)Statistical Models of Reconstructed Phase Spaces for Signal Classification [I ,IEEE Transactions on Signal Processing,vo1.54,No.6,June,2178~2186. [3]F Takens,Detecting strange attractors in turbulence[R],proceedings of Dynamical Sy stems and Turbulence,W arwick,1980,366~ 381. r4]Stellios Keskinidis(2002),Pattern Identi fication 0f m Series:A Parallel Genetic Algorithm Approach[D],Doctor dissertation of Bachelor of Information Technology,Honors Faculty of Information Technology,Queensland University of Technology,November 2002. [5]D_E.Goldberg,Genetic algorithms in search,optimization,and machine learning[J],Reading, M assachusetts:Addison-W esley,1989. r6]Richard J.Povinelli,Felice M.Roberts,Kristina M.Ropella,Michae1 T.Johnson.(2002)Are Nonlinear Ventricular Arrhythmia Characteristics Lost,As Signal D ration Decreases[J],Computers in Cardiology,M emphis,Tennessee,221~ 224. [7]R.J.Povinelli and X_Feng,Improving Genetic Algorithms Performance By Hashing Fitness z— ues,proceedings of Artificial Neural Networks in Engineering,St.Lo uis,Missouri,1999,399~ 404. (责任编辑:雷维平;校对:曹 宇) 维普资讯 http://www.cqvip.com
/
本文档为【股票价格时间序列的隐藏瞬时模式识别方法研究】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索