找回密码
 立即注册
搜索
查看: 150|回复: 0

自回归模型在预测方法中的应用与综述:定性、时间序列与因果模型

[复制链接]

2万

主题

0

回帖

6万

积分

管理员

积分
60855
发表于 2024-12-20 03:29:48 | 显示全部楼层 |阅读模式
自回归模型 1、预测方法概述 预测方法一般分为定性预测方法、时间序列预测方法和因果模型预测方法。定性预测法是在数据不多的情况下,依靠人们的经验和分析能力,运用系统性、逻辑性的思维方法,综合相关数据并做出预测的方法。定性预测方法包括德尔菲法、主观概率预测法、判断预测法等方法。时间序列预测方法是利用预测对象过去的统计数据寻找其随时间变化的规律,建立时间序列模型来确定未来值的预测方法。其基本思想是过去的变化将持续到未来,即未来是过去的延伸。时间序列预测方法包括时间序列平滑法、趋势外推法、季节变化预测法等确定性时间序列预测方法,以及马尔可夫方法和随机时间序列预测方法。因果模型预测方法是将待预测对象与其他相关因素联系起来进行分析,制定揭示因果关系的模型,然后根据该模型进行预测。因果模型预测方法包括回归分析预测方法、计量经济模型方法、投入产出预测方法等。由于时间序列预测和因果模型预测都是基于统计数据,应用统计方法进行预测,因此有时统称为“因果模型预测”。统计预测。迄今为止,已有近两百种预测方法。 1987年,Ledes和He首次将神经网络引入预测领域,无论是思想上还是技术上都是一次拓宽和突破。

常用的分析预测方法有以下几种: (1)投资分析方法。这是市场分析师常用的方法。 (2)时间序列分析法。该方法主要通过建立综合指标之间的时间序列相关性识别模型来预测未来的变化,如自回归移动平均模型(ARMA)、齐次非平稳模型(ARIMA)等。(3)神经网络预测方法。神经网络是最新的时间序列分析方法之一。 (四)其他预测方法。如专家评价法和市场调查法等定性方法,季节变化法、马尔可夫法和判别分析法等定量预测方法。传统的预测方法大多采用线性模型来近似表达预测对象的发展规律。例如,最常用的AR模型预测是基于时间序列平稳的假设建立线性模型,然后使用模型外推方法来预测其未来值。然而,这些方法仅适用于预测平稳时间序列。然而实际应用中的时间序列往往是高度非平稳的时间序列,传统的预测方法无法取得良好的效果。等人。对神经网络预测方法和多元线性回归方法在股市预测中的应用进行了对比研究,指出神经网络的平滑插值特性使其能够更好地拟合数据并具有更好的泛化能力。与统计预测方法相比,预测精度大大提高。社会需求推动预测理论和方法的快速发展。迄今为止已有近200种预测方法。尽管各种方法千差万别,但在具体的预测过程中,它们都遵循哲学层面的一般原理,如可知性原理​​、可能性原理、连续性原理、可控性原理、反馈性原理等。系统时间序列原理。分析方法及其模型 1 时间序列分析方法 在金融经济学的发展过程中,人们对金融预测进行了大量的探索,并取得了丰硕的成果。典型的财务预测是时间序列预测。

时间序列分析方法是指通过各种数学手段对研究对象的一组实测时间序列进行处理,找出序列的变化特征、发展规律和趋势,从而估计未来某一时刻的状态。时间序列的一个典型特征是相邻观测值之间的依赖性,为了研究这种依赖性,人们提出了许多时间序列模型。传统金融时间序列的研究方法大致有两种。一是根据基本经济原理建立金融时间序列所遵循的数学模型,如:资本资产定价模型(CAPM)、套利定价模型(APT)、期权定价模型等。事实上,这些理论的成功是基于基于非常理想的假设。假设与实际市场存在较大差距,因此这些理论的实际应用效果并不理想。另一种方法是从统计角度研究金融时间序列。该方法从实际数据出发,利用概率统计来推断市场的变化规律。尽管从经济学角度来看该方法缺乏理论依据,但在实际应用中效果良好。同时,统计方法还可以检验和评估经济模型。主要模型有:自回归模型(AR)、移动平均模型(MA)、自回归-移动平均模型(ARMA)和齐次非平稳模型(ARIMA)。时间序列预测方法是根据预测对象过去的统计数据,通过分析数据之间的依赖关系,找出其随时间变化的规律,并利用回归分析方法建立描述预测对象的时间序列模型。当前时刻与过去时刻观测数据之间的关系。 ,一种确定未来值的预测方法。

其基本思想是:过去的变化规律将延续到未来,即未来是过去的延伸。时间序列预测方法包括时间序列平滑法、趋势外推法、季节变化预测法等确定性时间序列预测方法,以及马尔可夫方法和随机时间序列预测方法。 2 随机模型分析 随机过程模型分为两类:自回归过程模型和移动平均过程模型。前者利用其滞后变量作为估计其未来价值的基础,而后者则利用过去的误差项作为估计其未来价值的基础。有时,两者一起使用来生成自回归移动平均模型。自回归模型(AR) 在 AR 模型中,序列的当前值由序列的当前值和前一个长度为 M 的窗口中的序列值决定。自回归过程是变量在某一点的变化时间上,相对于前一时期的变化是线性的。一般来说,相关性随时间呈指数下降,并在相对较短的时间内消失。在高频金融时间序列(如日内交易)中,由于数据是最基本的交易数据,且交易者之间相互影响,通常表现出明显的自回归倾向。这种属性是可以预期的,因为高频数据是基本交易数据,并且交易者之间确实存在交互。然而,如果周期是每周或每月,这个过程就会减少,因为当间隔拉长时,交易的相关性效应就会降低。移动平均模型(MA) (3.3) 该公式表明序列的当前值是由当前值开始的长度为N的窗口中的序列值决定的。

在移动平均模型(MA)中,时间序列是不可观测的时间序列平均运动的结果,如下: (3.4) e 是独立同分布的随机变量,c 是常数,且 c ≤ 1对平均运动参数c的限制确保了该过程是可变换的。表明未来事件不太可能影响当前事件,这个过程是稳定的;对 e 的限制与 AR 过程中的 e 一样,是一个均值为零、方差 r 为零的独立同分布随机变量。观测到的时间序列C是未来观测到的随机时间序列平均运动的结果。由于移动平均过程,所有过去和短期记忆结果都存在线性依赖性。自回归移动平均模型(ARMA) ARMA 由 AR 和 MA 两部分组成,其形式如下: (3.5) 在 ARMA 模型中,序列的当前值在一个长度窗口内从当前值向前推进N 序列值与前一个长度为 M 的窗口中的序列值一起确定。在自回归-移动平均模型中,同时存在自回归项和平均移动项: (3.6) 该模型是混合模型,称为ARMA(p,q)。 p 是自回归项的数量,q 是平均移动项的数量。也就是说,ARMA(2,0)进程与AR(2)相同,ARMA(0,2)进程与MA(2)相同,但ARMA仍然是无记忆进程。

关家成和沈美琴曾从美国股市中选取了一些股票价格时间序列样本,并利用该模型进行分析。李敏和邹杰忠利用ARMA模型对深沪市场指数进行了分析和预测。齐次非平稳模型 (ARIMA) 将 AR 和 ARMA 两个模型组合成一个更通用的过程,即齐次非平稳模型,也称为自回归集总移动平均模型。 ARIMA模型专门用于不稳定的时间序列。这些不稳定过程的均值和方差往往不稳定,但由于使用了数据的累积差异,结果是平稳的。比如,由于长期增长因素,导致价格序列不稳定。它可以无边界地任意增长,从而使价格本身不再趋于平均值。但有效市场假说可以接受的是,价格或收入的变化是稳定的。此外,价格变化通常以百分比表示。在这种情况下,可以表示对数差。这是一阶差分的情况。在某些序列中,高阶差异可以稳定数据。假设它是一个ARMA(p,q)过程,则认为它是阶(p,d,q)的积分ARIMA,其中p是自回归项的数量,q是平均移动项的数量,d是所需微分运算的数量。如果是ARIMA(p,d,0)过程,那么它就是AR(p)过程。类似地,如果它是一个 ARIMA(0,d,q) 过程,那么它就是一个 MA(0,q)。



典型的 ARIMA(p,d,q) 模型考虑整数差。自回归条件异方差模型(ARCH)、自回归条件异方差模型(ARCH、Auto)和一般ARCH(ARCH、GARCH)近年来得到了广泛的应用。因为,首先,它们是 AR 和 MA 线性相关过程的非线性随机过程族。其次,它们的分布峰陡肥尾。最后,实践经验表明,金融时间序列在统计上与 ARCH 非常相似,也就是说,它们表现出显着的 ARCH 特征。 ARCH是由恩格尔开发的。他认为,虽然个体分布的方差是稳定的,但它也会随着时间的推移而变化。这就是条件异方差过程的命名方式。这个过程也是自回归的,并且还具有时间依赖性的特征。样本的频率分布将是这些扩展和收缩正态分布的平均值。因此,在任何时间点,它都可能具有陡峰厚尾的分布。它的基本定义如下: (3.7) (3.8) 其中,e 是标准独立同分布,f 是常数。并且为了方便,一般都是和。 ARCH 模型与之前讨论的 AR 非常相似。然而,ARCH 是非线性的。在这里,小变化接踵而至,有缩小的趋势;大的变化伴随着大的变化,并且有放大的趋势。

这导致了陡峭的峰值和肥尾分布。近年来的实证研究表明,许多经济变量时间序列尤其是金融时间序列的非正态性,其根源在于异方差性。用GARCH模型来反映收益的分布是非常合适的。 3、AR时间序列模型在股票预测中的应用对于一般的时间序列预测,可以通过相关性分析选择建模变量,进行回归分析预测。对于已知受多个因素影响的单个变量的预测,您可以选择对要建模的变量影响最显着的变量。如果影响因素已知,但影响程度不明显,则可以利用协方差分析,筛选出最少相互无关但与预测变量密切相关的定量变量作为建模变量。对于影响因素较多、相关性分析复杂的变量,可以利用变量时间序列的历史值进行自回归预测。这时重要的是变量选择的延迟间隔、变量选择的数量等,可以逐渐增加变量的数量。方法。 1 AR(p)模型的定义: (4.1) 上式表示的数学模型是p阶自回归模型,记为AR(p)。其中,p称为模型的阶数,称为模型参数,是因变量,即可以用前几期的值来表示,是一个白噪声序列。它的数学期望为零,方差为,并且彼此不相关。它代表模型无法解释的随机因素。 2 时间序列建模的实现过程从时间序列模型的特点可以看出,AR、MA、ARMA模型适合描述的对象应该是均值为零的平稳随机序列。然而,实际的建模对象通常包括平稳随机部分。 ,并包含某些非随机成分。

因此,在进行时间序列建模时,首先需要对观测数据序列进行平滑处理,使非平稳数据序列转化为均值为零的平稳随机序列。时间序列分析是根据系统观测得到的时间序列数据,通过曲线拟合和参数估计建立数学模型的理论和方法。一般采用曲线拟合和参数估计方法(如非线性最小二乘法)来进行。时间序列建模的基本步骤是:(1)利用观测、调查、统计、抽样等方法获取被观测系统的时间序列动态数据。 (2)根据动态数据制作相关图,进行相关分析,求出自相关函数。相关图可以显示变化的趋势和周期,并可以找到跳跃点和转折点。跳跃点是与其他数据不一致的观察结果。如果跳跃点是正确的观测值,则在建模时应将其考虑在内。如果出现异常,应将跳跃点调整至预期值。拐点是指时间序列从上升趋势突然转变为下降趋势的点。如果存在拐点,建模时必须使用不同的模型对时间序列进行分段拟合。 (3) 确定合适的随机模型并确定模型的阶数和参数。由于用解析方法很难推测和确定模型的阶数,因此一般采用试错法来确定模型的阶数,从较低阶数开始,逐步提高阶数,确定模型的参数。相应型号。直到建立的模型精度满足要求。最后,需要测试所构建模型的适用性。进行曲线拟合,即使用一般随机模型对时间序列采集的数据进行拟合。

对于短或简单的时间序列,可以使用趋势模型和季节模型加上误差来拟合它们。对于平稳时间序列,可以采用一般的ARMA模型(自回归移动平均模型)及其特例的自回归模型、移动平均模型或组合-ARMA模型进行拟合。当采集值超过50个时,一般采用ARMA模型。对于非平稳时间序列,必须先对采集的时间序列进行差分运算,将其转换为平稳时间序列,然后使用适当的模型来拟合微分序列。 3数据选择数据处理是处理日常股票交易行情及相关信息的问题,包括数据采集(获取交易行情信息)、数据转换(将数据信息转换为文本格式)和数据处理。预处理(根据模型的要求对数据进行相关处理)。 AR方法是一种精度相对较高的短期线性预测方法。它适用于各种类型的时间序列。 AR方法是一种相对灵活的预测模型。在建模过程中,可以采用一系列统计方法来检验模型的适用性,并不断调整模型的阶数,直到得到满意的结果。 AR模型仅考虑时间序列本身的特征进行预测,并没有考虑到股票市场本身受到许多不可预测的政治、经济等复杂因素的影响。因此,这些因素的突然变化可以用AR模型中的随机扰动项来表示。显然他们的表现没有达到预期。而且,随着股市的不断成熟,任何人都不可能从历史股价指数和相关信息的分析中得出确定性。

AR模型作为一种获取超额利润的投资策略,在成熟市场中只能预测市场的大势,但无法准确预测市场的涨跌来获取超额利润。因此,上述结果表明AR模型的预测结果在短期内是可以接受的。 4 常用股票术语和技术指标 股票术语 (一)开盘价,开盘价是开市前集中竞价形成的,是指该股票当日开盘后第一笔成交的价格。开盘后30分钟内无成交价格的,以前一日收盘价作为开盘价。 (2)收盘价是指每天最后成交的股票的价格,即收盘价。 (三)最高价是指当日成交价格中的最高价。 (四)最低价是指当日成交价格中的最低价。 (五)交易量,即交易的股票数量。手是股票交易的最小单位,1手为100股。 (六)交易金额是指以货币表示的股票交易总量,等于交易价格乘以交易数量。 (7)涨跌:将每日收盘价与前一日收盘价进行比较,判断股价是上涨还是下跌。 (8)压力点(压力线)。在上涨过程中,股价达到一定的高点(或线)后停止上涨。该点称为压力点(或压力线)。 (9)支撑点(支撑线)。下跌过程中,股价触及某一点(或线)后停止下跌,甚至反弹。该点称为支撑点(或支撑线)。 (十)市盈率是某种股票的每股市场价格与每股收益的比率。

市盈率是估算普通股价值最基本、最重要的指标之一。市盈率=普通股每股市场价格/普通股每股年收益。一般来说,市盈率表明公司需要多少年的利润积累才能达到目前的市场价格水平。因此,市盈率指标值越低越好。该值越小,投资回收期越短,风险越小,一般投资价值越高。高的;倍数大意味着恢复期长、风险高。 (11)市净率是指股票市场价格与账面价格的比率。市净率反映了股票泡沫成分的大小。市净率=股价/每股净值。一般来说,市净率越大,泡沫成分越高,但也表明投资者对股票前景更加看好;市净率越小,泡沫成分越低,但这也表明投资者对该股的前景更加乐观。更加看跌。 (12)资产回报率是指公司净利润占公司平均总资产的百分比。资产回报率=(净利润÷平均总资产)×100%。该值反映了公司资产利用的综合效果。一般来说,同一板块内,资产回报率越高,股价越高。也就是说,这个数值与股价有直接关系。 (十三)银行家,是指证券、保险、金融等资金雄厚、参与股票市场经营的机构。他们构成了股市的主力军。庄家的操作意图对股市走势起着决定性作用,是散户投资者的攻击对象。 (十四)投资热点是指一定时期内投资者关注的话题。主题区间内的股票备受大众关注,往往是涨幅较大的股票,也是投资者可能获利或亏损的股票。

投资热点的分析和预测可以指导投资者制定投资计划,也可以根据投资热点分析预测股票的影响方向和程度。 (15)股票指数,即股票价格指数。它是由证券交易所或金融服务机构编制的用于指示股票市场变化的参考指标编号。由于股票价格波动,投资者必然面临市场价格风险。投资者了解特定股票的价格变化很容易,但要一一了解多只股票的价格变化并不容易或麻烦。为了适应这种情况和需要,一些金融服务机构利用其业务知识和对市场的熟悉程度,编制股票价格指数并公开发布,作为市场价格变化的指标。在我国,主要有上证综指和深成指。 (十六)K线图,所谓K线,是记录每天(周、月)股市交易的开盘价、收盘价、最高价、最低价的图表,用实线或空白条表示。股票技术指标介绍技术分析是很多投资者进行中短期投资的主要分析方法。技术指标往往是投资决策的重要参考。 (1)移动平均线MA 移动平均线是利用统计处理,将几天的股价进行平均,然后将它们连成一条线,以观察股价的走势。移动平均线的目的是获得一定时期内的平均成本,并利用平均成本的移动曲线来配合每日收盘价的线条变化来分析一段时间内多空情况的利弊。一定时期内研究股价可能发生的变化。



(2)同差平滑移动平均线的原理是利用快速移动平均线和慢速移动平均线收敛和分离的征兆函数进行双重平滑操作来研究买入和卖出的时机和信号。将第12天设置为快速移动平均线(12日EMA);将 26 日设为慢速移动平均线(26 日 EMA)。将12日EMA平滑系数设置为0.1538;将 26 天 EMA 平滑系数设置为 0.0741。设置离散值DIF=12日EMA-26日EMA其中:12日EMA=0.1538×(今日指数平均线-12日指数平均线)+12日指数平均线26日EMA=0.0741×(今日指数平均线)指数平均线-26日指数平均线)+26日指数平均线MACD 计算公式为:MACD=平滑系数0.2×(今日离散值-昨日平均离散值)+昨日平均离散值。离散柱 BAR 的计算公式为: BAR=DIF-MACD(2.1)(3) 随机指标(KDJ) 随机指标最初在期货市场非常流行,因此标准公式适用的时间跨度很短。其隐含的理论是:在上涨行情中,收盘价往往会接近交易区域的最高价,而在上涨趋势结束时,收盘价会远离交易区域的最高价。交易区。下降趋势则恰恰相反。随机指标一般包括两个,本文使用三个。公式如下: (2.2) (2.3) 随机指标之所以被广泛使用是因为它的平滑性质。它能够顺利地从超买状态过渡到超卖状态,使得价格走势变化非常有序。与从 RSI 或 ROC 指标中看到的不同。

与此同时,市场指标技术分析百科全书指出,随机指标的交叉相对移动平均线和其他动量指标而言较少。 (4)相对强弱指数(INDEX) 相对强弱指数是一个非常流行的常用指标。相对强弱指数不是用来比较两种证券的相对强弱,而是衡量单一证券的内在趋势。相对强度指数是一个跟随价格的波动变量 - 范围从 0-100。 (2.4) 其中: 其中, 、 分别为当时价格的向上和向下变化。 (5)人气指标(OBV) 所谓人气是指投资者在股票市场上的活跃程度。如果交易中买卖双方情绪高涨,股票价格和股票交易量就会增加,股市气氛就会热烈,俗称人气旺盛。如果人气不强,股价和股票交易量就会下跌。可见,人气的盛衰影响着股价和股票交易量。股票价格和股票成交量可以反映人气的盛衰。因此,OBV指标是利用股价和股票成交量指标来反映人气的涨跌。该指标的发明者是美国股票专家格林威尔()。 OBV的计算公式很特别。这纯粹是人为的规定。交易量分为正值和负值来勾画人气的上升和下降。即:每天将股市收盘价与昨天收盘价进行比较。如果今天的收盘价高于昨天的收盘价,则今天的成交量值将列为正值,否则将列为负值。

经过一段时间的正负值的积累,就形成了OBV值。 (6)容量比,指(VR) VR值可以表达股票市场交易的动能,从而把握股票价格的走势。若某日为正日,则将该日交易量添加到N天内强统计的累计总和中;如果是负数日,则将当天的交易量添加到N天内弱统计的累计总和中。若某日收盘价等于开盘价,则将当日交易量的一半加入N天内强统计的累计总和中,另一半加入弱统计的累计总和中N天内的统计。根据VR值确定买入和卖出时机:低价区间40-70时可以买入;当股价在80-150之间波动较小时,可以持有;当盈利区间为160至350时,即可获利了结;当警戒线在350以上时,等待卖出机会。 (7)运动指标(DMI) 运动指标的基本原理是探索价格上涨和下跌过程中买卖双方力量的“平衡点”,即供求关系达到“平衡点”。通过价格变化摆脱“紧张”局面。 ,然后又“紧张”,然后又“和谐”,无限循环。 (8)威廉指标(W%R) 威廉指标是根据一定时期内(通常设定为第10日或第14日)的最高价与该时期最后一天收盘价的差值,然后得出期间最高价与最低价之间的差额。计算差值比例以及时观察股市超买超卖信息的技术分析指标。 w%r = [(10天内最高价格 - 第10天的收盘价)÷(10天内最高价格 -  10天内最低价格)×100%分析指标需要与其他技术指标一起研究,决定不能单独做出。

w%r值的波动范围在0-100范围内。一般的经验可以证明,当w%r值接近80甚至低于80时,这意味着股市处于超售状态,并且可能会降低和反弹。因此,投资者可以等待机会并在正确的时间购买一些股票。当w%r值接近0甚至低于20以下时,这意味着股票市场处于超买状态,可能达到高峰和下降。因此,投资者不再盲目地追逐崛起,而应该停止及时买卖一些股票。 50是威廉指标的中央轴。当w%r值向上超过50或向下接近50时,这意味着股票市场是看涨的,投资者可以适当地购买股票。当w%r值仅低于50或接近50时,这意味着股票市场是看跌,投资者应出售适当的股票。如果w%r的价值进入了过多的区域,但保持不变,则意味着市场仍然具有一段时间的实力,投资者可以坚持下去并决定购买和销售行为。一旦发现w%r值向下变下,您就应该立即出售。同样,当w%r值在超售区域停滞不前时,投资者也可以适当地保留并选择搬家的机会。一旦看到w%r向上,请立即购买。 w%r进入前4次,第四次是一个很好的卖点。它的最低点是4次,第四次是一个很好的购买点。 (9)偏差率偏差率使用股票价格指数与移动平均值之间的比率来观察股票价格偏离移动平均水平的程度,以确定投资者的买卖行为。 bias = [(当天股票市场的收盘价 -  n天移动平均值)÷n天移动平均线]×100%当偏差率与移动平均线一致时,偏差为0。

如果偏差率为正,并且偏差率高于移动平均线,则意味着股票市场处于上升趋势。如果偏差率为负,偏差率低于移动平均线,则意味着股票市场的下降趋势。一般而言,移动平均线的偏差率范围从15%到-15%。也就是说:当偏差率为0-15%时,股票可以适当出售。否则,股票价格可能会退缩。当偏差率为-15%-0时,您可以适当购买股票,股票可能会反弹。 (10)PSY心理线指标心理线主要研究投资者的心理趋势。它将投资者的心理事实转换为一定时期内的买卖双方,以形成普及指标,以判断股票价格的未来趋势。其中,n可以作为第十二或第24位,分别用作短期和中期投资指标。由于PSY指标的设计太简单,因此在研究和判断市场趋势时必须将其与其他技术指标相结合。人们普遍认为,心理线指标在20到75之间,这是一个合理的变化范围。如果它高于75或低于20,则意味着超买或超卖。股价可能会下跌或上涨。目前,您可以准备出售。或购买。当PSY指标低于10或高于90时,它是一种真实的超卖现象。因此,这可以用作买卖机会。什么时候
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|【智道时空】 ( 京ICP备20013102号-16 )

GMT+8, 2025-5-7 21:27 , Processed in 0.059685 second(s), 20 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表