有这么一个想法是之前参加全国*统计建模大赛的时候找数据费了好大的功夫,后来,发现有很多学统计的学生都在愁数据的问题。我们需要数据来实证方法,不见得一定是用来做大project才可以。数据越真实,我们对知识和方法的了解才越深入才是。
分享几个链接,但是要把那里的数据下下来可能需要费点功夫,希望大家在不影响自己的前提下,都可以分享一些真实有用的数据吧!分享的时候,可以把背景知识、试验设计、抽样方法和变量解释都附上,供大家学习参考用。
因为对R很有感情,所以就发在这板块上了,斑竹不要恼我……谢谢……R里面有很多经典的数据,大家把Rcommander打开直接就可以查看了。最直接的方法是把你已经attach的包的帮助打开,所有的data一目了然。
人地系统主题数据库
http://www.data.ac.cn/index.asp
国家统计局
http://www.stats.gov.cn/
Research and Innovative Technology Administration (RITA) • U.S. Department of Transportation (US DOT)(我很喜欢的一个数据库)
http://www.bts.gov/
World Bank:Data[/b][b]http://web.worldbank.org/WBSITE/EXTERNAL/DATASTATISTICS/0,,menuPK:232599~pagePK:64133170~piPK:64133498~theSitePK:239419,00.html
建议开一个数据来源和数据处理板块……
(16 篇回复) (7 个人参与)-
我开放提取股票交易市场的日线数据,真实有效。不过数据仅供学习者使用。
响应提供准确数据源的号召,提供一个股票市场的数据源程序代码。
针对通信达交易软件,下载所有历史数据,交易软件的数据下载到安装目录\vipdoc\sh\lday(上海) 和 vipdoc\sz\lday(深圳) 中,把这些文件导到linux主机里。
软件代码是linux下的(我是VC盲,不会提供M$Win的程序),在CPU arch 是小尾端的平台上测试过没有问题(Mac PPC 上有问题,但我不想解决它了)。
系统要求:
linux - x86 或者 linux - mipsel 环境,gnu gcc/g++ 和 gfortran 开发环境。
安装方法:
先安装R, 2.8.2 以上的都可以使用。
先安装 zoo 和 xts 包(这是原TTR包需要的)。
再安装 R CMD INSTALL ./TTR_0.20-1_moore.tar.gz (这是我添加了 get_ttrc 版本的)
使用方法:
get_ttrc(c("file name from vipdoc/sh/lday/file_name.day"), Integer_last_days_of_req,1)
这样就得来数据了。 -
-
可以开一个版块用来处理数据需求,但我倾向于把数据本身单独放在一个子站中,而不要发在论坛上。可以做成像StatLib那样的一个网站。
你去http://download.cos.name看一下就知道,其实我们是早有想法的,只不过没人牵头做。
回复
您必须登录才能回复。
省事了就