R时间序列最优模型机器学习自动选择求助

notts_li

各位R专家，问题是：如果对一个序列做预测，如果用auto.arima()函数来识别最优模型，当到步骤对平稳序列进行白噪声检验时，如果发现序列是白噪声，这种情况下是无法预测的，直接就结束分析。现在有没有一种R包，或者R程序能对一个序列分别进行arima、门限自回归模型、GARCH模型族、指数平滑模型族等其它模型拟合，再根据某个类似AIC，BIC、SBC准则函数，最后自动从所有模型库中选出一个最优的模型，这样就不用手动一个模型一个模型的拟合，就像机器学习一样。如果用试错法一个模型一个模型的试，这个传统的方法效率太低了。

Cloud2016

cran官网taskview下时间序列栏有很多针对不同模型的R包，你可以自己去整合，没有现成的各种模型的组合包 notts_li

lingbing

notts_li “所有模型库”是一个很难定义的概念。就你提出的预测问题而言，我的初步回答是：

auto.arima()就是基于准则进行贪婪定阶，对于单序列时间序列预测而言，这个函数是一个很大的贡献。另外它存在的合理性是：arima的参数很少（p, d, q, S），通过贪婪搜索可以实现。
门限自回归首先要确定是否有必要用门限，即便门限是显著的，对于预测也未必有贡献。人们用门限更多的是用它来解释时序的某种非线性结构，而不是做预测。
GARCH模型很难做贪婪搜索，为什么？因为可调参数实在太多了，看看ugarchspec的参数设置就知道了。另外，GARCH模型是做波动率建模和预测的，不能跟arima混为一谈，一个是条件方差过程，一个是条件均值过程。对均值过程进行严肃的arima建模往往是GARCH建模的基础。
4。机器学习里面也没有一个工具可以从“所有的模型库”中选出一个最优的模型。因为有太多的机器学习模型，每一个模型都需要调参才能获得有用的预测。况且这个“模型库”可能每天都有新成员进来。
指数平滑？Rob解释的很清楚： https://www.otexts.org/fpp

总而言之，预测的精度依赖于研究人员对数据生成过程（及其可能的影响因素）的思考与认识，至于人们会绞尽脑汁到什么程度，可以看看这个竞赛：https://tianchi.aliyun.com/competition/introduction.htm?spm=5176.100066.0.0.3f6e7d832USuMA&raceId=3。
至于工具，“所有的模型库”的概念是个伪命题，从这个库中自动化的选一个最优的模型自然是不切实际的。

notts_li

lingbing 谢谢您非常仔细的解释，原来我这个问题的提法就存在问题，主要还是受了机器学习的影响，互联网的模型建立就希望通过这种模型库的建立快速的得出结论，从统计的角度看确实不切实际的。谢谢专家的指点！