statistics_man 我在大数据的一本书上看到这样一种论断:“在大数据时代进行抽样分析就像是在汽车时代骑马一样。在某些特定的情况下,我们仍然可以使用样本分析法,但这不再是我们分析数据的主要方式。慢慢的,我们会完全抛弃样本分析。”关于这样的结论,大家是怎么看待的呢?
easttiger 1。在无穷大总体面前: 甲抽了30个点作推断,忽略了剩余的无穷多个点的信息。 乙抽了1亿个点作推断,试问乙忽略了多少个点呢?乙还是忽略了无穷多个点的信息。 误差是永恒的。 2。非参方法确实览小于参数方法,但计算机科学家还是没有搞清楚NP和P之间的关系,更不提对“非参方法都有多项式时间解”的论证。
enthumelon 回复 第2楼 的 yanlinlin82: Big Data: A Revolution That Will Transform How We Live, Work, and Think 大约看了用来吹牛不错。 回复 第3楼 的 easttiger:我记得原文是强调是population而不是sampling什么云云。因为总体有限,所以抽样和基于随机的模型会被慢慢抛弃(感觉好忽悠人的啊)。
easttiger 回复 第4楼 的 enthumelon:于是乎作者也许并不理解什么是总体。我想计算机背景的人总是持有一种有穷世界观,觉得凡事困难莫过于枚举,只不过计算机速度不够作枚举而需要动脑筋想算法。而许多基础算法的思维起点都不约而同地是不完全归纳法。久而久之便无法理解抽象无穷的概念。