次贷冲击下的统计学反思
有点标题党的意思了,确切地说,本文只是一个小小的通讯稿。前两天(11月25-26)我参加一个“中国银行风险管理国际峰会2008”,其中SunGard公司的David M.Rowe博士的主题演讲Lessons from the Subprime Mortgage Crisis(次级按揭危机经验教训),第一条就是Limits of Statistical Analysis(统计分析的局限性)。Rowe先生是SunGard公司风险管理部门的高级副总裁,宾大计量经济学与金融学博士,沃顿商学院MBA,以及卡内基梅隆大学的经济学学士。
这次次贷危机,对外部评级机构如Moodys来说是一个丑闻,它们利用各种复杂的统计模型为各种证券评级。Rowe举一个例子,AAA级的债券,定义的年违约风险是0.01%,也就是说,其违约是每一万年发生一次,而最优良的次级房贷抵押债券,在外部评级机构的评分中,享有AAA甚至更高的评级。Rowe就问:在这样的评级中,实证研究何在?
Rowe的总结是:
Statistical analysis can extract information from data, it cannot create information not already contained in the data. Like water, information cannot rise higher than its soucre.
统计分析只能从数据中提取信息,而不能创造数据本身。正如联通器中的水,不能超越水源的高度。
最后,Rowe提到Nassim Nicholas Taleb的黑天鹅理论(Black Swan Theory),最近似乎很流行。一般认为天鹅是白的,但一旦发现天鹅也有黑的(的确是发现了),就会对人们的视野产生极大的冲击。黑天鹅理论就是讨论这些极少发生的、难以预测的,一旦发生,就会造成很大影响的事件。不知道统计系在读这本书没有。

就是,我也一直质疑统计学在数量经济学实务中是否能起到重要的作用。假期里看过几篇名校的硕士、博士论文,是讲我国外汇储备的,里面全是协整分析之类的模型,经济实际背景反倒很少。看起来就不像经济学的论文,而像是数学建模论文。
这个问题我个人说过很多遍了,现在很多人总是追求数学模型,而不管模型是否有实际意义或不管模型的预测性能如何。用邓的抓老鼠理论来说就是,我们都看重一只猫如何绕来绕去、满屋子跑去抓老鼠,看重猫是沿着抛物线跑呢还是沿着均匀分布密度线跑呢还是在屋里做布朗运动,表演结束之后,没人关心那只老鼠是不是被抓到了。
[...] 9·次贷冲击下的统计学反思 [...]
这个问题反过来看也有意思(仅仅是个人观点而已):似乎是金融和经济的问题需要统计学来解决或是支持,但是又很怀疑统计学的结果。有些时候统计的结果是考虑了需求方的实际需求的,而不是实际真实的情况,譬如证券评级,统计给我们了结果,可我们非要给他“好”或“坏”的名称,是不是我们画蛇添足了呢?
我不认为金融领域的行家真的是被统计骗了。统计只是一个说服同行的工具,为了说服的效果,金融行家会小心地忽略统计模型假设前提的脆弱性,特别是external validity的脆弱性。
与金融领域相比,心理学界对统计的滥用有更为程序性的质疑。Validity是心理专业学生很害怕的一个词,因为它几乎是伪科学,动辄用全称谓词,比如wikipedia上的”Construct validity refers to the totality of evidence about whether a particular operationalization of a construct adequately represents what is intended by theoretical account of the construct being measured.” Totality意味着这件事情永远做不够。
或者说,统计应用的局限性是天然的,应该讨论的不是统计应用有没有局限性,而是为什么有那么一圈子人以为或者曾经以为统计应用没有局限性。