jianghang001
rstatscn是一个R包,它提供了一些访问中国国家数据(http://data.stats.gov.cn)的一些方便的接口。可以比较方便的获取想要的国家数据。 希望这个包能够让我们更好的使用国家数据库。
详细的中文文档再这里: http://www.bagualu.net/wordpress/rstatscn-the-r-interface-for-china-national-data
下面是一个使用实例:
> library(rstatscn)
> statscnDbs()
dbcode description
1 hgnd national data, yearly #宏观年度数据
2 hgjd national data, quaterly #宏观季度
3 hgyd national data, monthly #宏观月度
4 fsnd province data, yearly #分省年度
5 fsjd province data, quaterly #分省季度
6 fsyd province data, monthly #分省月度
7 csnd city data, yearly #城市年度
8 csyd city data, monthly #城市月度
9 gjnd international data, yearly #国际年度
10 gjyd international data, monthly #国际月度
11 gjydsdj 3 main countries data, monthly #三个主要国家月度数据
> statscnQueryZb(dbcode='hgnd')
dbcode id isParent name pid wdcode
1 hgnd A01 TRUE 综合 zb
2 hgnd A02 TRUE 国民经济核算 zb
3 hgnd A03 TRUE 人口 zb
4 hgnd A04 TRUE 就业人员和工资 zb
5 hgnd A05 TRUE 固定资产投资和房地产 zb
6 hgnd A06 TRUE 对外经济贸易 zb
7 hgnd A07 TRUE 能源 zb
8 hgnd A08 TRUE 财政 zb
9 hgnd A09 TRUE 价格指数 zb
10 hgnd A0A TRUE 人民生活 zb
11 hgnd A0B TRUE 城市概况 zb
12 hgnd A0C TRUE 资源和环境 zb
13 hgnd A0D TRUE 农业 zb
14 hgnd A0E TRUE 工业 zb
15 hgnd A0F TRUE 建筑业 zb
16 hgnd A0G TRUE 运输和邮电 zb
17 hgnd A0H FALSE 社会消费品零售总额 zb
18 hgnd A0I TRUE 批发和零售业 zb
19 hgnd A0J TRUE 住宿和餐饮业 zb
20 hgnd A0K TRUE 旅游业 zb
21 hgnd A0L TRUE 金融业 zb
22 hgnd A0M TRUE 教育 zb
23 hgnd A0N TRUE 科技 zb
24 hgnd A0O TRUE 卫生 zb
25 hgnd A0P TRUE 社会服务 zb
26 hgnd A0Q TRUE 文化 zb
27 hgnd A0R TRUE 体育 zb
28 hgnd A0S TRUE 公共管理、社会保障及其他 zb
> statscnQueryZb('A01',dbcode='hgnd')
dbcode id isParent name pid wdcode
1 hgnd A0101 FALSE 行政区划 A01 zb
2 hgnd A0102 FALSE 人均主要工农业产品产量 A01 zb
3 hgnd A0103 TRUE 法人单位数 A01 zb
4 hgnd A0104 TRUE 企业法人单位数 A01 zb
5 hgnd A0105 TRUE 民族自治地方 A01 zb
> statscnQueryData('A0102',dbcode='hgnd')
2014年 2013年 2012年
粮食人均占有量(公斤) 0 443.456070 436.500957
棉花人均占有量(公斤) 0 4.640549 5.061080
油料人均占有量(公斤) 0 25.910172 25.444427
糖料人均占有量(公斤) 0 101.300000 99.840657
茶叶人均产量(公斤) 0 1.320000 1.325061
水果人均占有量(公斤) 0 184.900000 178.107095
猪牛羊肉人均占有量(公斤) 0 48.644283 47.427051
水产品人均占有量(公斤) 0 45.469971 43.738046
人均原煤产量(吨) 0 0.000000 2.702313
人均原油产量(公斤) 0 0.000000 153.608328
人均纱产量(公斤) 0 0.000000 22.092330
人均布产量(米) 0 0.000000 62.852087
人均机制纸及纸板产量(公斤) 0 0.000000 81.117795
人均水泥产量(公斤) 0 0.000000 1636.076835
人均粗钢产量(公斤) 0 0.000000 535.933131
人均发电量(千瓦小时) 0 0.000000 3692.582707
zggjtsgzczh
[未知用户]
首先说,干的漂亮 ;-)
用了一下,效果很好,不过有几个问题想问一下:
三个问题:
1.如猎数博客介绍的,这是一个方便的访问国家数据可的R接口,我是否可以理解为:这是一个通过R的函数直接访问国家数据库数据源的接口,而不是一个被同步备份数据后的第三方数据源,我的理解正确么?因为这关系数据的实时性和数据误差问题。
2.是否有相应数据集的特定描述信息访问函数,比如08年的通货膨胀往往会使用05年的价格为基准,相应的数据下载页往往会有一个注释描述在表格的指定位置出现。
3.楼主是私人贡献的这个包还是属于组织呢?因为cran上有几个经济金融数据包,大多数都是私营组织或数据发布机构提供的,比如quantmod、eurostat、SmarterPoland等。一方面涉及使用时的数据源声明,另外一方面也涉及对发布者的尊重以及研究者的可重复性研究。
再次感谢楼主提供的这个包,非常有价值,并且也是一件积极和有意义的事情对于国内使用R包的一些经济数据分析者,提高了获取数据的效率,降低了获取的成本。
jianghang001
首先谢谢关注,简要回答下这些问题:
1.关于数据的实时性问题,获取的数据和网站http://data.stats.gov.cn中展示的数据是一致的。 比如这个页面 http://data.stats.gov.cn/easyquery.htm?cn=C01 。 如果获取的数据和网站不一致,可以告诉我。
2. 关于数据的描述问题,目前数据的描述仅止于指标的名字,数据库中本身有一些关于数据的注解,但是我这里的R包中尚未进行处理。如果需要去关心数据的描述,或者对数据有些疑问,可以到http://data.stats.gov.cn中进行类似的查询,看是否有数据说明(在页面中表的下面)。
3. 这个包是我的个人成果。不属于任何组织。希望能够方便大家使用和研究国家数据。