set.seed(3000),不是运行3000次,而是把种子设置为3000。
计算机的程序,都是通过确定的算法,根据确定的输入,算出确定的输出。想要得到真正的随机,需要通过外接物理随机数发生器,通过把随机的物理过程转变为随机值,才能实现。因此我们平常使用的计算机的随机数,其实都只是通过算法模拟得到,也就是伪随机。一般采用的办法是线性同余(参见
http://en.wikipedia.org/wiki/Linear_congruential_generator)。
X[n+1] = (a * X[n] + c) mod m
为简单起见,我取简单的参数(a = 1, c = 3, m = 5),得到一个简单的算式:
X[n+1] = (X[n] + 3) mod 5
这时,把X[0]视为种子,于是:
若种子为0,得到数列:0, 3, 1, 4, 2, 0, ...
若种子为1,得到数列:1, 4, 2, 0, 3, 1, ...
若种子为2,得到数列:2, 0, 3, 1, 4, 2, ...
若种子为3,得到数列:3, 1, 4, 2, 0, 3, ...
若种子为4,得到数列:4, 2, 0, 3, 1, 4, ...
对于每个种子,所得到的数列看起来都是随机的(每个数值出现的频率都是相同的)。而一旦种子给定,每次调用随机数函数,函数都会根据上次得到的数列的某个值,计算出数列的下一个值并返回回来。而对于随机浮点数,一般是用随机产生的整数除以最大整数得到。
所以,随机数的种子一般只需要在调用随机函数之前设置一次,不建议设置多次。
另外,我一直没有搞明白一件事:设置多次种子,在算法上会不会对最终生成的随机数的分布造成影响?不知道有人了解么?