关于搜索统计资源(写给在统计学院学习的学弟学妹之二)

By 谢益辉 @ 2008/11/29
关键词, , , 分类基础统计
作者信息:目前在Iowa State University统计系跟着Di Cook读PhD。统计之都网站创办者;研究兴趣为统计图形及数据可视化,对前沿统计模型方法的发展感兴趣但不喜纯粹抽象的数学理论,以直观、实用为学习标准;偏好以R语言为工具;Email:xie@yihui.name;个人主页:http://yihui.name
版权声明:本文版权归原作者所有,未经许可不得转载。原文可能随时需要修改纰漏,全文复制转载会带来不必要的误导,若您想推荐给朋友阅读,敬请以负责的态度提供原文链接;点此查看如何在学术刊物中引用本文

关于搜集资料,其实是许久以来我很想谈的一个话题,因为身边太多太多的同学在这方面根本就没入门。找点资料,也不知上哪里找。顶多Baidu一下,高级一些的就Google一下,就算完事了。

拜托,老大们,这是二十一世纪哎!

记得古时候有一个词叫作“獭祭”,语出《礼记·月令》:“獭祭鱼”。印象中李商隐和这个词似乎有某种联系,可惜古文修养太差,也弄不清了:

“商隐工诗,为文瑰迈奇古,辞隐事难。及从楚学,俪偶长短,而繁缛过之。每属缀,多检阅书册,左右鳞次,号‘獭祭鱼’”。

元·辛文房·《唐才子传》

大意也就是说的找资料的事情,可见,写点东西(无论文人与否),都是要资料的。古人把书册一排排鳞次,今人恐怕不会那样做了,很可能就是在遨游(Maxthon)浏览器中一口气点开好多个窗口,然后把网页挨个来看,也算是某种形式的“獭祭”吧。

这篇小文,依旧是写给统计学院的学弟学妹们的,因此,仍然围绕着“统计”的话题展开。大约也就谈两方面吧:

一、怎样找数据

数据是统计的生命之源,其重要性就不在罗嗦。在上一篇文章“统计学的领域”中,我所说的数据来源其实主要是一手数据(调查和试验),做研究当然也可以使用二手数据,也就是别人已经通过调查或试验取得的数据,我们拿过来借用一下。

提到统计数据,可能人们首先想到的就是统计局,不错,这是我们的选择之一,比如中华人民共和国国家统计局:http://www.stats.gov.cn/,在这个官方网站中,包含了大量的统计数据,其中有年度数据、进度数据、专题数据、部门数据等等。比较方便的是,大多都是文本形式的数据,可以复制出来供分析使用。

很多地方统计局也都有自己的网站,如果需要某地的数据,可以登录相应的网站查看。

除了统计局,也别忘了学校的图书馆,人大的图书馆购买了一些统计数据库,从首页http://www.lib.ruc.edu.cn/登录就会看到“参考工具”一栏中有“年鉴资源库”,点击进入就会看到大量的年鉴资料,不过不幸的是,里面很多资料都是图片格式,不能直接复制出来供分析。

上面说的是中文数据,若要找国际数据,其实Unitied States也是个可以考虑的地方,在那里有专门的Statistics Division,http://unstats.un.org,里面的数据有Excel格式的,也提供了相应的PDF格式文件。事实上,国外的数据比国内要丰富得多,大家平时浏览网站的时候多多注意,一定会有很多积累的。比如OECD的网站,http://www.oecd.org;U.S. Census Bureau:http://www.census.gov;等等。

二、怎样找参考文献

对于写论文来说,大多数情况下恐怕找参考文献比找数据更重要。

这里首先仍然是介绍我们图书馆的资料,一般说来,中文方面的论文库当然要数“中国期刊全文数据库”比较全面(http://www.edu.cnki.net/),其中收录了大量的期刊全文,图书馆网站上给出了登录用户名和密码,大家可以尝试进去看看。统计类的期刊有《统计研究》、《统计与决策》、《数理统计与管理》、《数理统计与应用概率》等等,这些期刊都可以通过右上角的“期刊导航”找到。当然,也可以按照关键字搜索论文,网站左侧有检索的文本框,诸多选项大家自己去看吧。

其他的数据库诸如“万方数据资源系统”等都是比较好的资源中心,大家可以去尝试尝试;最后要说的是除了文本形式的数据库,其实图书馆的资源中也有视频/音频数据库,一些名家的讲座都可以从中直接看到。

中文论文库就不介绍太多了,是个中国人都能自己看懂,下面说说外文数据库资源。

如果要查找5年前的期刊论文,那么JSTOR也许可以满足你们大部分需要了,JSTOR就是Journal Storage的缩写,网址为www.jstor.org,其中收录的论文基本上都是图片格式,可以在网站上一页一页翻着看,或者直接Download为PDF文件阅读(里面仍然是图片格式)。关于统计界的外文刊物,大家不能不知道这些:Journal of the American Statistical Association(JASA)、Annals of Statistics、Journal of the Royal Statistical Society,其实还有Biometrica等等,暂时还是别介绍太多了。

Wiley InterScience(图书馆网站上写的“John Wiley电子期刊”,网址)这个网站中有不少统计学的宝贝,有空应该去淘一淘,比较难得的是里面有大量的Online Books,如”Introduction to Bayesian Statistics”,”Regression Models for Time Series Analysis”,”Statistical Analysis and Data Mining”,”Analysis of Financial Time Series (Second Edition)”等。

其它数据库我平时较少用,不过也是比较好的资源,如“ProQuest学位论文全文数据库”等,在此不多加介绍了。前面提到的JSTOR只能看好几年前的期刊论文,如果要看最新的文章的话,也可以试试EBSCO或者ProQuest数据库,不过至少我似乎没发现JASA的文章,可能跟学校购买的数据库限制有关。如果有比较重要的外文文献需要下载全文阅读而学校图书馆又没有购买相应的数据库,那么也可以找你们在国外的同学或朋友,国外大学图书馆购买的英文数据库肯定比我们要全。

说了这么多,归根到底都是一些辅助工具,真正要需要脑子的仍然在于专业知识,否则手中掌握再多的资源也白搭。不过话说回来,能尽早接触统计方面的专业知识,对大家应该也是有好处的。

希望这些东西对大家有用。

谢益辉
2006-10-21夜

这个……好像没有相关文章,客官看点儿别的吧

6 Responses to “ 关于搜索统计资源(写给在统计学院学习的学弟学妹之二) ”

  1. [...] 13·关于搜索统计资源(写给在统计学院学习的学弟学妹之二) [...]

  2. priss111 on 2008/12/06 at 07:41

    谢版辛苦,祝cos越来越牛。

    对了,比如想找一些大型疾病调查的资料,比如糖尿病调查的,或者一些连锁分析的资料该去哪里找呢?

  3. 谢益辉 on 2008/12/06 at 23:38

    这些具体行业或领域的数据一般很少公开,我觉得只能依靠你的人脉去找了,本文的范围是针对那些公开数据的。

  4. 小张 on 2009/07/21 at 10:15

    谢版辛苦了,祝cos越来越牛。

  5. Y头 on 2009/08/28 at 15:16

    多谢了,我正忙着找资料呢?

  6. 大熊猫 on 2009/09/07 at 10:53

    中国人民大学每个学期都会开很多文献检索方面的课程,颇有用处。
    学完这个课程之后,我又到图书馆勤工俭学,插了三个月的书,弄清图书分类、摆放原则对找文本资料用处也不少。

    PS:国外经济资料最全的应该首推world bank的数据库。自己可以去找找www.worldbank.org

Leave a Reply

搜索

推荐阅读

大规模系统内变量关系的研究以及可视化-1因果分析

By 黄帅

引言——变量关系分析的广泛意义
在统计分析中,有这样一类具有普遍意义的问题:在测得了(取样)一个变量系统的数据以后,如何从数据中发现并且验证这些变量之间的关系?了解…阅读全文 »

相关文章

用GERT方法求解两个抛硬币问题

问题:一枚均匀的硬币,一直抛直至出现HTT(H表示正面,T表示背面),期望要抛多少次?一直抛直至出现HTH(即正反正),期望要抛多少次?假定出现H面的概率为p,出现T面的概率为阅读全文 »

相关文章

分月存档