二、数据的处理 1.股价指数的处理 本文研究所采用的数据是2012年上海证券交易所所有交易日,共243天的交易数据。通过比较分析相关论文的处理方法,与本文需要,即反应指数的变化,本文处理方式为:首先依据每日开盘价与收盘价计算当日收益率,然后取一阶差分,即对数形式来表示收益率的变化。 2.天气数据的处理 由于我国对天气数据有严格封锁,所以无法从官方取得数据。本文数据来源为http://www.wunderground.com,该网站数据来源于BestForecast?系统搜集到的世界各地22000多个私人气象站的数据,数据准确性较高。通过相关资料,我们发现人体最适温度、适度湿度分别为:27*0.618、45%,因此,对天气数据处理方式为:对湿度的处理数据方式为: 同时,本别对处理后的天气数据取对数,保持与收益率的形式一致。 3.数据的检验 (1)单位根检验 由于文章采用的数据为时间序列数据,为避免出现"伪回归"现象,首先对数据进行单位根检验。检验结果表明,通过采用ADF检验发现自变量与因变量均满足在一阶差分下,在ADF第3个模型中是平稳的。因此,只要模型的残差序列满足0阶单整,那么模型就是(1,1)阶协整的,即不存在"伪回归"。 (2)Pearson相关性检验 本文对这14个变量与上证指数收益率数据进行Pearson相关性检验,本文采纳了Michael,D.与B.M.Lucey的数据处理方法,即对数据重新进行最小一乘线性回归(LeastAbsoluteDeviation,LAD)分析,数据结果如下: 表1:相关性分析 *.表示在5%水平上系数显著,**.表示在1%的水平上系数显著 三、最小一乘线性回归模型构建 1.模型简介 由于所采用的天气数据仅有一年,且天气时常会有异常波动,因此对含有异常值的数据进行建模和参数估计时,应尽量减少异常数据对模型的影响。如果使用标准的最小二乘法进行预测,由于异常点有较大的偏差,其平方值相对更大。为了压低平方和,会虚增加了残差大的数据对回归线施加的影响,从而异常点会使回归线偏离真实情况,导致回归线准确性较差,最小一乘准则恰好可以克服最小二乘的上述缺点。 设观测数据为X∈Rn×p(n>p)即样本个数大于变量个数,y∈Rn×1,线性模型为: y=[1,X]β+ε…(1) 其中1∈Rn为元素全为1的n维列向量,β∈Rp+1为回归系数向量,ε~N(0,σ2I)。最小一乘线性回归系数β的估计,需要求解下面的无约束不可微最优化问题: 即要求超定矛盾线性方程组 [1,X]β=y…(3) 的范数极小解。令A=[1,X],b=y,β可以看作两个非负的p+1维列向量u,v之差,令β=u-v,又设ξ,η为非负的n维列向量,则(3)可以变成一个相容的线性方程组 A(u-v)+(ξ-η)=b…(4) 问题(2)变为求||ξ-η||1最小的问题,再设0p+1,1n分别表示含有p+1个0,n个1的列向量,于是问题转化为求解如下的线性规划问题模型 其中, 使用求解线性规划的算法,求出问题(5)的最优解后,即可得到问题(1)的最优解β=u*-v*。同时我们也可以发现,对于应用LAD进行估计来讲,拟合优度检验与OLS方法是一致的。 2.LAD模型构建 本文构建的模型为:ln=c+betat×ln(?temp)+betah×ln(?humid)+ε,?表示地区,估计结果为: 表2:系数估计与t检验结果 对模型整体估计性能进行检验。F=0.896384056P-value=0.0000R2=0.940397,因此模型估计效果良好。 然后,通过对残差序列进行ADF检验,发现符合模型3,即残差序列为0阶单整序列,模型为(1,1)阶协整,因此不存在伪回归问题。 同时,由于残差序列中包涵着其他影响收益率的因素,可能有异方差性存在,采用ParkTest,即模型进行估计,结果表明在统计上非显著,因此不存在异方差性。 因此,从实证角度来看,我国沪市收益率的确与天气情况有关。 四、结论 通过上述分析我们可以得出结论:从心理学、行为金融视角来讲,通过对文献的综述我们发现天气的变化的确会带来情绪的变化,而情绪的变化又会带来决策上的偏差,如过度反应与反应不足,进而造成投资收益率的变化;从实证角度看,我国沪市每日收益率的变化确实会受到天气变化的影响。 |