分类目录归档:金融统计

统计学在金融中的应用

股市稳赚不亏?标普 500的 40 年的投资回报

本文翻译自 GitHub 项目 zonination/investing 的描述文件 README.md。译者对原文顺序有所改动。

原文以 MIT 协议发布,已征得作者  Zoni Nation 许可进行翻译。译文版权归统计之都所有,转载请注明出处。

很多人是从 Reddit 上的 “个人理财”(/r/personalfinance)板块的贴子和评论里认识我的。我最近也经常逛“美丽数据”(/r/dataisbeautiful)板块。(译者注:Reddit 是一个在美国受众广泛的娱乐、社交及新闻网站。它与论坛类似,注册用户可以在网站上发布文字和链接。)

前段时间,我开始了我的第一个数据可视化项目。我先从 Robert Shiller 的标普 500 数据项目中下载了标普 500 的一些数据,开始了疯狂的数据可视化之旅。

最近,我终于把手头上的其他几个项目处理好,安定下来,于是我又回到这些数据上,同时决定用它完成一个完整的可视化项目。

这里引用美联储主席 Alan Greenspan 对 股神 Warren Buffet 说过的一段话:

Warren,你让我太震惊了!你只要不去理会股票市场的短期甚至长期的衰退,咬紧牙关,什么也不做,不卖出任何一支股票,你就总能获得好的股票收益。也就是,你只要把你所有的钱都投到股票里,然后回家看也不看它们一眼,之后你获得的收益比每天尝试进行股票交易的情况还要高。

“个人理财”板块上经常有人在讨论长期持仓(buy and hold)策略的资金安全问题,是选择长期持仓,还是选时操作捕捉市场(time the market)。在这个可视化项目中,我尝试做下面三件事情:

  • 客观地回顾标普 500 相关股票的各个切面的长期投资收益(过去和现在)。
  • 验证和量化 “Invest Early and Invest Often” “早投资,勤投资” 这一格言。
  • 观察使用长期持仓策略会带来什么,以及这个策略的收益。

长期持仓收益

长期持仓收益

继续阅读股市稳赚不亏?标普 500的 40 年的投资回报

COS每周精选:再谈R学习

本期投稿: 王小宁 Ron 王威廉 

编辑:王小宁
小编注:小编上网看科技新闻,大多数的文章都在讲“大数据”“深度学习”“互联网+”等等高大上的名词,作为一名统计学的研究生小编觉得再高大上的东西,也需要一项或几项核心的技术。近日,小编再为您提供一些R学习的资料。

R语言的优劣势是什么?

工欲善其事,必先利其器。应用场景决定知识的储备与工具的选择,反过来,无论你选择了什么样的工具,你一定会努力地把它改造成符合自己应用场景所需的那个样子。

继续阅读COS每周精选:再谈R学习

我国黄金期货市场的VaR风险度量——基于历史模拟法

0.引言

VaR(Value at Risk)是上世纪90年代由JP·Morgan公司在风险矩阵中提出的一种新型风险管理工具,VaR定义简单,计算简便具有很高的实用价值。因此,VaR自诞生以来就在金融领域得到了广泛的应用,且目前在全世界已发展成为金融市场风险测量的主流方法。

1. VaR方法概述

VaR全称为Value at Risk,统译为“在险价值”。其是指:在市场正常波动情况下,在指定的概率水平(置信度)下, 金融资产组合的价值在未来特定持有期T内的最大可能损失,该定义可直观表示为:

$Prob( \Delta v>VaR_{\alpha})<(1-\alpha) $

其中,$\Delta v$为金融资产组合的价值损失。VaR的严格的数学定义则由Altzner(1999)给出,即

$VaR_{\alpha}=-inf\{x|Prob(\Delta v\leq x)>1-\alpha\}$

其中,$inf{\{x|A}\}$表示使A成立的所有所组成的集合的下确界,其余符号同上。

目前,典型的VaR的计算方法包括:历史模拟法、蒙特卡洛模拟法、方差-协方差法以近年来广为流行的Coplus方法。其中,历史模拟法和蒙特卡罗模拟法属于全值估计方法,其中历史模拟法的特色在于不需要对市场因子的统计分布进行假设,因此有希望较好地处理金融事件序列中的尖峰和厚尾现象。本文将采用历史模拟法以我国上海黄金期货交易所推出的au0901为研究对象,分析测度au0901的VaR值,最后用Kupiec方法对模型进行有效性检验。

2. 历史模拟法简介

2.1 历史模拟法的定义

历史模拟法是计算VaR的一种非参数方法,通常适用于那些不易取得完整的历史交易资料的金融资产的VaR值的计算。这种方法的核心是用给定历史时期上所观测到的市场因子的变化来表示市场因子的未来变化,也就是说它用历史上金融资产在一定概率水平下所出现的最大损失值作为相应的VaR值。可以形象的说,历史模拟法是一种“以史为鉴”的VaR计算方法。

历史模拟法计算VaR的具体步骤如下:

1、  收集数据资料,确定市场因子。

2、  确定模拟的时间长度N。

3、  对所选取的时间长度N的历史资料计算计算金融资产的收益率。

4、将计算出的收益率按从小到大的顺序进行排序,并按照不同的置信水平计算出相应的分位数,即得到VaR值。

历史模拟法的重点环节是确定合适的历史资料的时间长度N。一般而言,只有足够长的的时间长度,才有可能描述在极端状况下的风险值。如果模拟的时间长度过小,就无法精准刻画金融资产的VaR值。然而,如果模拟的时间长度过长又会因为吸收了过多的历史陈旧信息而是的VaR值的计算不精确。

2.2 历史模拟法的优缺点

1、历史模拟法的优点

(1)不需要对市场因子的统计分布进行假设

历史模拟法完全依赖历史资料进行VaR的计算,不需要对市场因子的统计分布进行假设,可以较精确刻画市场因子的特征,例如一般资产报酬具有的厚尾、偏态现象就可能透过历史模拟法表达出来 。

(2)不需对市场因子的波动性和相关性进行假设

历史模拟法不须对资产收益率的波动性、相关性进行假设,因为历史资料已经反应资产报酬波动性、相关性等的特征,因此免除了估计误差的问题,历史模拟法相较于其它方法,较不受到模型风险的影响。

(3)完全评价法

历史模拟法是一种非参数方法,因此无论资产或投资组合的收益率是否为常态或线性,波动是否随时间而改变,皆可采用历史模拟法来衡量其风险值

2、  历史模拟法的缺点

应用历史模拟法计算VaR值主要有以下缺点:

(1)历史资料的耗费大量人力物力

历史模拟法一般需要庞大的历史资料库。数据储存、校对、除错等工作都需要庞大的人力与资金来处理,这是一个复杂繁琐的且极易出错的过程。

(2)极端事件的损失不易被模拟

一般而言,重大极端事件的损失比较罕见,所以在进行历史模拟时,很难将极端事件包罗在内,因此采用历史模拟法是常常无法估计出极端事件的发生。

(3)因子的变动假设

历史模拟法假定未来风险因子的变动会与过去表现相同的假设,然而这不一定可以反映现实状况。随着时间的发展,影响金融资产收益的各种因素都在发生这变化,时过境迁之后,未来的市场因子变化可能会异于历史状况,这是历史模拟法最大的软肋。

3. 模型的检验方法

VaR模型的检验方法有很多种,其中Kupiec(1995)提出的失败率检验法最具权威性和实用性。失败率检验法的基本思想是:如果VaR模型计算的VaR 值是准确的,那么金融资产实际损失超过VaR值的例外可视为从一个二项分布中出现的独立事件,即如果损失小于VaR 值,则为一个成功事件(记为1) ,如果损失大于VaR 值,则视为一个失败的事件(记为0)。在原假设 中,P =N/T,其中N 为失败(例外) 天数,即实际损失超过VaR值的天数;1-P为VaR的置信水平; T为实际考察天数。Kupiec 给出了相应的极大似然统计量:

$LR_{POF}=-2ln[P^N(1-P)^{T-N}]+2ln[(N/T)^N(1-N/T)^{T-N}]$

在零假设成立的条件下,统计量LR服从自由度为1的分布。如果统计量值超过了临界值,我们则拒绝原假设;否则,则接受原假设。

4. 实证分析

4.1 数据基本描述

本文以交易活跃且具有代表性和国际影响力的上海黄金期货的代号为au0901的黄金期货为例来探讨所选方法的优劣。所用数据为每个交易日的开盘价格连续数据,数据来源于上海期货交易所。考虑到数据的可得性和有效性,au0901的时间跨度定为2008年1月16日至2008年12月31日。在剔除没有交易的交易日后,期铜连续合约的数据个数为252个。为方便处理,本文将期货收益率定义为$r_t=lnP_t-lnP_{t-1}$。其中,$P_t$为连续期货合约第t日的开盘价格。这里,首先用R软件对样本数据进行基本描述,样本收益率的序列图和收益率的直方图如下:

图2 收益率的序列图和收益率的直方图

表1:au0901收益率的基本统计特征

N 均值 标准差 偏度 峰度 J-B值 D-W值 Q(25) Q^2 (25)
251 -0.00072 0.0224 -0.518 1.067 23.928 2.261 27.534[0.3] 47.849[0.03]

由表1可知,au0901的收益序列是右偏的,且峰度大于正态分布的峰度,从而该序列具有尖峰厚尾的特征,且根据J-B统计量我们可以拒绝原序列为正态分布的原假设。另外,由于D-W统计量的值接近于2,说明该收益序列的自相关性微弱。

4.2 计算及检验VaR

1.用历史模拟法计算VaR值

在应用历史模拟法时,本文选取的历史数据模拟长度为25,置信水平为95%。根据2.2中所述方法计算au0901的时变VaR值,将其与实际收益率对比如下:

图3  置信水平95%下的时变VaR值与实际收益率对比图

2.Kupiec检验

用前文所述的Kupiec失败率检验方法对模型的结果进行检验,结果如下:

表2:Kupiec失败率检验结果

样本长度 失败次数 LR统计量 置信水平 P-value
250 16 1.54[<3.84] 95% 0.215

由表2结果可知,在95%置信水平下LR统计量的值小于临界值3.84,因此历史模拟法计算的VaR值通过了Kupiec失败率检验。

4.3 结论

根据前文au0901的VaR的计算结果以及Kupiec的失败率检验结果,我们可以认为:历史模拟法通过了Kupiec失败率检验,可以有效的估计我国黄金期货的风险,适合于我国黄金期货价格的风险度量。

参考文献:

[1]王春峰.金融市场风险管理[M].天津大学出版社,2001.

[2]张尧庭.金融市场的统计分析[M].桂林:广西师范大学出版社,1998:32-120

风险评价的VaR方法简介

风险管理作为商业银行维持其正常经营的重要手段,19世纪初就已在世界范围内得到共识。西方发达国家早已建立起一套成熟的风险管理体系,其运作的依 据通常都是某种统计或者数学模型。虽然中国的风险管理才刚刚起步,然而,近年来在风险管理方面也进行了如火如荼的探究。由于中国过去的风险管理理念是建立 在定性和主观经验的基础之上,因此现阶段对定量的数学模型的引进及探讨十分得宠。VaR作为风险管理的最重要的模型之一,尤其需要学者和风险管 理者的重视,本文对其进行简单介绍。

一、VaR模型的由来

1993年7月G30国成员曾发表了一个关于金融衍生工具的报告,首次建议用“风险价值系统”(Value at Risk System,简称VaRS)来评估金融风险。1999年的新巴塞尔协议征求意见稿中, 新巴塞尔委员会又极力提倡商业银行用VaR 模型度量其所面临的信用风险, 在2004年发布的新巴塞尔协议中委员会把风险管理的对象扩大到市场风险、信用风险和操作风险的总和,并进一步主张用VaR模型对商 业银行面临的风险进行综合管理。此外,委员会也鼓励商业银行在满足监管和审计要求的前提下, 可以自己建立以VaR 为基础的内部模型。此后,VaR 模型作为一个很好的风险管理工具开始正式在新巴塞尔协议中获得应用和推广,并逐步奠定了其在风险管理领域的元老地位。

二、VaR模型的含义

VaR(Value at Risk),通译为“风险价值”。其内涵是在正常情况下,一定时期内$\Delta t$内,一定的置信水平$1-\alpha$某种资产组合面临的最大损失。统计学表达为:
$Prob(\Delta p\leq VaR)=1-\alpha$
其中$\Delta p$是指在一定的时期$\Delta t$内某种资产组合市场价值的变化,$1-\alpha$为给定的概率。即在一定的持有期$\Delta t$内,给定的置信水平$1-\alpha$下,该资产组合的最大损失不会超过VaR。用VaR进行风险衡 量时,首先要确定持有期和置信水平,巴塞尔委员会规定的持有期标准为10天,置信水平为99%,但各个商业银行可以确定自己的标准。如 J.P.Morgan 公司在1994年的年报中,规定的持有期为1天,置信水平为95%,VaR值为1500万美元。其含义即为J.P.Morgan公 司在一天内,其所持有的风险头寸的损失小于1500万的概率为95%,超过1500 万的概率为5%。当然,使用者也可以根据自己的喜好来选择持有期和置信水平,一般而言,置信水平直接反应使用者的风险偏好水平。

三、VaR的主要性质

VaR的 主要性质:
(1)变换不变性:$a\in R$,满足$VaR(X+a)=VaR(X)+a$
(2)正齐次性:$h<0$,满足$VaR(hX)=hVaR(X)$,保证资产的风 险与其持有的头寸成正比。
(3)协单调可加性:$VaR(X_1+X_2)=VaR(X_1)+VaR(X_2)$ 。
(4)不满足次可加性和凸性。不满足前者意味着资产组合的风险不一定小于各资产风险之和。这一点是不合理的,因为它意味着,一个金融机构不能通过计算其分支机构 的VaR来 推导整个机构的VaR。 不满足凸性意味着以VaR为 目标函数的规划问题一般不是凸规划,其局部最优解不一定是全局最优解。所以在基于VaR对资产组合进行优化时,可能存在多个局部极值。因此,也 就无法求得最佳资产组合。这也是VaR用于资产组合风险研究时候的主要障碍。
(5)满足一阶随机占优。
(6)VaR 关于概率水平$1-\alpha$不是连续的。
Artzner(1999)指出好的风险度量方法需满足一致性,满足一致性意味着其能同时满足次可加性、正齐次性、单调性和变换不变性四个性质。显然, 不具有这个特性。

三、VaR模型的优点

VaR模 型作为现代商业银行风险管理最重要的方法之一,存在不少优点。首先,VaR 使用规范的数理统计技术和现代工程方法来度量银行风险,与以往靠定性和主观经验的风险度量技术相比更具客观性;其次,它使用单一指标对风险进行衡量,具有 直观性,即使没有专业背景的投资者和管理者,也能通过这一指标评价风险的大小;再次,它不仅可以衡量单一的金融资产的风险,还能衡量投资组合的风险;而 且,它对风险的衡量具有前瞻性,是对未来风险的衡量,不像以往对风险的衡量都是在事后进行;最后,VaR 把对未来预期损失的规模和发生的可能性结合起来,是管理者不仅能了解损失的规模,还能了解在这一规模上损失的概率。并且通过对不同的置信区间的选择可以得 到不同的最大损失规模,便于管理者了解在不同可能程度上的风险大小。

四、VaR模型的缺点

VaR模 型当然也有一些缺点,首当其冲的是,VaR模型是对正常的市场环境中的金融资产的风险的衡量,但一旦金融环境出现动荡,即当极端情况发生时,VaR模型所代表 的风险大小就失去了参考价值。然而,很多时候恰恰是这些极端值,决定了为了完善对所有市场状况下的风险衡量。因此,为了完善对所有市场状况下的风险衡量, 通常在VaR模 型的基础上可以引入Stress Test即压力试验和极值分析两种方法进行辅助。压力试验主要是在违背模型假设的极端市场情景下,对资产组合收益的不利影响进行评价;而对VaR进行辅助的 极值分析的方法有两种,分别是BMM和POT,其中最常用的一种模型是POT模型。它是在当风险规模超过某一最大值的情况下进行的建模。它直接处理风险概 率分布的尾部,事先并不对数据的分布做任何假设,在利用设定参数建立的模型的基础上,对极端情况下的风险规模和概率进行衡量。
第二,VaR模型是在收益分布为正态分布的情况下的衡量。但事实表明,资产的收益的尾部比正态分布的尾部更厚,通常成为厚尾性,且其与正态分布的对称性也并不一致。当这 种情况出现的时候,VaR模 型就不会产生一致性度量的结果。所谓一致性风险度量即是风险衡量得出的度量值的大小与风险的实际大小具有一致性。对风险大的金融资产衡量得出的风险值大于 对风险小的金融资产衡量得出的风险值,具有相同风险的金融资产具有相同的风险度量值,具有不同风险的金融资产具有不同的风险度量值。针对VaR模型度量的 不一致性可以引进ES(Expected shortfall)或者CVaR(conditional value at risk)模型对VaR模型进行修 正,两者是同一概念的不同说法。CVaR称为条件风险价值。它是当资产组合的损失超过某个给定的VaR的情况下,资产组合的损失的期望。用数学公式表达为:
$CVaR_{\alpha}=E(-X|-X\leq VaR_{\alpha}(x))$
其中X表示资产的损益。
根据CVaR的定义可以证明CVaR满足以下性质:
(1)是一致连续的。
(2)满足次可加性。
$\forall X,Y$,满足$\rho(X+Y)\leq\rho(X)+\rho(Y)$。
(3)满足二阶随机占优。
(4)满足单调性。
$\forall X,Y$满足$\rho(X)\leq \rho(Y)$,如果 $ X\leq Y $。