notts_li 各位R专家,问题是:如果对一个序列做预测,如果用auto.arima()函数来识别最优模型,当到步骤对平稳序列进行白噪声检验时,如果发现序列是白噪声,这种情况下是无法预测的,直接就结束分析。现在有没有一种R包,或者R程序能对一个序列分别进行arima、门限自回归模型、GARCH模型族、指数平滑模型族等其它模型拟合,再根据某个类似AIC,BIC、SBC准则函数,最后自动从所有模型库中选出一个最优的模型,这样就不用手动一个模型一个模型的拟合,就像机器学习一样。如果用试错法一个模型一个模型的试,这个传统的方法效率太低了。
lingbing notts_li “所有模型库”是一个很难定义的概念。就你提出的预测问题而言,我的初步回答是: auto.arima()就是基于准则进行贪婪定阶,对于单序列时间序列预测而言,这个函数是一个很大的贡献。另外它存在的合理性是:arima的参数很少(p, d, q, S),通过贪婪搜索可以实现。 门限自回归首先要确定是否有必要用门限,即便门限是显著的,对于预测也未必有贡献。人们用门限更多的是用它来解释时序的某种非线性结构,而不是做预测。 GARCH模型很难做贪婪搜索,为什么?因为可调参数实在太多了,看看ugarchspec的参数设置就知道了。另外,GARCH模型是做波动率建模和预测的,不能跟arima混为一谈,一个是条件方差过程,一个是条件均值过程。对均值过程进行严肃的arima建模往往是GARCH建模的基础。 4。 机器学习里面也没有一个工具可以从“所有的模型库”中选出一个最优的模型。因为有太多的机器学习模型,每一个模型都需要调参才能获得有用的预测。况且这个“模型库”可能每天都有新成员进来。 指数平滑?Rob解释的很清楚: https://www.otexts.org/fpp 总而言之,预测的精度依赖于研究人员对数据生成过程(及其可能的影响因素)的思考与认识,至于人们会绞尽脑汁到什么程度,可以看看这个竞赛:https://tianchi.aliyun.com/competition/introduction.htm?spm=5176.100066.0.0.3f6e7d832USuMA&raceId=3。 至于工具,“所有的模型库”的概念是个伪命题,从这个库中自动化的选一个最优的模型自然是不切实际的。
notts_li lingbing 谢谢您非常仔细的解释,原来我这个问题的提法就存在问题,主要还是受了机器学习的影响,互联网的模型建立就希望通过这种模型库的建立快速的得出结论,从统计的角度看确实不切实际的。谢谢专家的指点!