R时代,你要怎样画地图?

不知道各位平常有没有过需要画地图的需求,有的时候需要在地图上标出特定位置的数据表现或者一些数值,然而怎么实现?

这里主要介绍下在R语言中绘制地图的个人琢磨的思路。绘制地图步骤有三:

  1. 你得需要绘制地图;(约等于废话)
  2. 你得有要绘制地图的地理信息,经纬度啊,边界啊等等;
  3. 你得利用2的数据在R中画出来。

以上步骤中,目前最关键的是2,一旦2的数据有了,在R中不就是把它们连起来嘛,这个对于R来说就是调戏它,就跟全民调戏小黄鸡一样。

R语言中绘制地图的思路也是由于2的获取方式不一样而分开的。

第一种思路:有一些R包中存储着常见地图的数据,比如maps包中存有世界地图、美国地图、美国各州郡地图、法国地图以及加拿大城市地图等,加载了这个包,就可以轻松愉快地绘制上述地图。mapdata包中存有中国地图的数据,但是比较旧了,这个数据,重庆还没有从四川分出来呢。

总体来讲,第一种思路受包中已有的数据数量限制(但我R包多!),如果各个包中都没有梵蒂冈的信息,那咋办啊(其实可以通过绘制世界地图,然后限制区域把梵蒂冈画出来)。而且,如果我想画中国人民大学的地图怎么办???哭……

第二种思路:我先去一个地方下载所画图的地理数据,然后读入R进行绘制。比如由于mapdata中的中国地图比较久远了,谢老大的《终于搞定中国分省市地图》一文中就介绍了,先从国家基础地理信息中心下载中国各省市的地理数据,之后再绘制。后来肖凯老师又介绍googleVis包也可以按照这个思路来绘制地图,具体可参考《利用googleVis包实现环境数据可视化》(友情提示,需科学上网)。之后的OpenStreetMap包也是提供了方便下载地理数据的途径。

如您所看到的,第二种途径的步骤稍多,不利于大家上手。我知道,如果过程越长,越艰辛,最终绘制出地图的那一刻的快感就越强烈,但是“少折腾”的指示,还是提醒我们,尽量化繁为简。于是第三种的思路,就是既继承了第一种思路简洁的操作方式,又吸取了第二种思路的数据来源广泛的优势。

第三种思路:既然R是自由的,那我能不能直接去调取专业的地图企业或者网站的数据呢,这样就不会受包中数据集所限,我只需要有一个途径去专业的地图供应商那取数据就可以了,比如Google Map,Baidu Map等,这可都是专业的地图网站,里面的地理数据应有尽有,想取啥取啥。自由的R只需要连接Google Map的API,一切就都有了,当然Google大爷不会让你无限制的取数据,目前的限制是2000次(应该是单天的限制),于是ggmap包诞生了,两位作者David Kahle和 Hadley Wickham真是太会解放全球人民了,并且该包中有几个让我无比激动的命令,下文见!!!

好,我们先来按照第一种思路来画几个图:

1、 画世界地图

如果是首次使用,需要在R中装载maps包(install.packages('maps')),这个包中存有世界地图和美国地图的地图数据,所以,几行代码便可以画出世界地图。

代码如下:

library(maps)
map("world", fill = TRUE, col = rainbow(200),
    ylim = c(-60, 90), mar = c(0, 0, 0, 0))
title("世界地图")

输出为:

world_map

无比绚丽的世界,引无数骚客竞折腰啊……

2、 画美国地图

同样在maps包中包含了美国地图和美国各州郡的详细地图数据,同样的,也可以用简单的代码画出美国地图,便于我们使用。

代码如下:

library(maps)
map("state", fill = TRUE, col = rainbow(209),
    mar = c(0, 0, 2, 0))
title("美国地图")

输出为:

us_map

整体形状这是像啥啊,山姆大叔……

对于美国地图,该包提供画出指定几个州的图,比如这里只画出New York, New Jersey, Penn三州的地图:

代码如下:

library(maps)
map('state', region = c('new york', 'new jersey', 'penn'),
    fill = TRUE, col = rainbow(3), mar = c(2, 3, 4, 3))
title("美国三州地图")

输出结果为:

states_map

三州鼎力!!

3、 画中国地图

上述的maps包中并没有中国地图的数据 ,在另外一个包mapdata中有中国地图的数据(比较旧的数据)。

代码如下:

library(maps)
library(mapdata)
map("china", col = "red4", ylim = c(18, 54), panel.first = grid())
title(" 中国地图")

输出为:

China_map

哭,重庆在哪里,重庆在哪里??

好,我们来强力介绍ggmap包,先来说下该包让我惊讶的几个命令:

1、geocode()

比如:

> geocode("Beijing")
       lon      lat
1 116.4075 39.90403

这大哥可以返回一个地方的经纬度,那我再调戏之:

> #这意思就是大哥你多给点!!
> geocode("Renmin University of China", output = "more")
       lon      lat              type     loctype
1 116.3184 39.96998 point_of_interest approximate
                                                                                address
1 renmin university of china, 59号 zhongguancun street, haidian, beijing, china, 100086
     north    south     east     west postal_code country
1 39.97853 39.96142 116.3345 116.3024      100086   china
  administrative_area_level_2 administrative_area_level_1 locality
1                        <NA>                     beijing  beijing
               street streetNo          point_of_interest
1 zhongguancun street       NA renmin university of china
                       query
1 Renmin University of China

信息给多了,我说几个点,不但有人民大学的经纬度,还有该大学的详细地址(中国人民大学,中关村大街59号,海淀,北京,中国),还有邮编好吧100086!!!!但是好像跟我们实际的100872有差距(倒是跟10086很接近啊),但是它确实是返回了邮政编码,还有zhongguancun street就不说了……这完全就是返回的Google地图存储的人民大学的信息啊……

2、mapdist()

第二个颠颤颤的命令式mapdist()。比如:

> mapdist('China Agricultural University',
+     'Renmin University of China', 'walking')
                           from                         to    m    km
1 China Agricultural University Renmin University of China 6022 6.022
     miles seconds  minutes    hours
1 3.742071    4523 75.38333 1.256389

1 mile = 1609米。

这意思就是说从农大到人大距离6022米,如果您步行,需要4523秒……汗,我下次考虑下步行试试。不过,您说的是农大东校区还是农大西校区啊……

另,ggmap包中不仅仅可以调取Google Map的数据,还可以调取OpenStreetMap (‘osm’)、Stamen Maps (‘stamen’)和CloudMade maps (‘cloudmade’)。亲,这够用了吧。那地图的表现形式也是个性化的,有’terrain’(地势图)、’satellite’(卫星图)、’roadmap’(道路图)和 ‘hybrid’(混合)等。您自个儿选。

其他的不谈了,直接画地图:

1、中国地图

library(ggmap)
library(mapproj)
## Google啊Google给我China的地图数据吧
map <- get_map(location = 'China', zoom = 4)
ggmap(map)

于是:

China_map_2

我天朝雄赳赳,气昂昂啊!!请注意左下角的Google logo!!

再来北京道路地图:

#Google啊Google给我Beijing的公路地图数据吧
map <- get_map(location = 'Beijing', zoom = 10, maptype = 'roadmap')
ggmap(map)

于是:

Beijing_map

最后,我想看下大冬天的有没有人在人民大学的各个楼顶上晒太阳浴:

## Google啊Google给我RUC的卫星地图数据吧
map <- get_map(location = 'Renmin University of China', zoom = 14,
    maptype = 'satellite')
ggmap(map)

RUC_map

太不清楚了,根本看不清楚哪跟哪啊。就这么着吧,我估计快够当天限制数了。

最后来个正经的,借用肖凯老师编好的代码(肖老师的原文后面还有用谢老大animation包做的动态图呢),从中国地震数据中心下载 2013.1.5-2013.1.11 这一周发生在中国的小地震,呃,应该都是小地震,因为没有听到相关的大地震的新闻报道。

earthquake_map

从这图上看,每周发生在我亲爱的祖国上的地震真心不少啊,我大台湾也饱受其苦啊。向天祈祷,让地震少震我中国吧……

参考文献:



  1. 为什么我运行
    hdf <- get_map()
    ggmap(hdf, extent = 'normal')
    会出现如下的错误提示呢?
    错误于rename(x, .base_to_ggplot, warn_missing = FALSE) :
    没有"revalue"这个函数
    还望您可以帮我解答一下,谢谢

    • 建议把plyr包升级一下,update.packages(),如果还不成,再试下,把所有的包升级一下。大部分问题应该都是R包版本的问题。如果还不成,再跟我发邮件哈。

      • 从去年5月听了肖凯老师的ggplot2的报告之后,回来就想试试,可是始终没有成功过。目前的R版本是R.2.15.2,也安装了plyr包,也做了更新。目前报错是:

        错误于initFields(scales = scales) : 没有”initRefFields”这个函数

        请教如何搞定?多谢

      • 谢谢您,我重装了一下2.15.2,之后就可以了的

  2. 文章来的真及时,R画地图变的越来越简单了!

  3. @bigknife,我倒是没有碰到过这个错误。。刚才查了一下,你试试加载下library(scales)这个包,能不能解决问题。。

  4. 为什么R这么火。。虽然说有不少toolbox可以直接用,但matlab(虽然是商用软件), python等也有。R的速度又挺慢。恳请大家指点。

  5. 好像参数location的值只能是英文啊,不能使用中文

    • 恩,对,geocode和get_map中都只能用英文的。但是在mapdist的函数中有language这个参数,这个是可以改成中文的。

  6. 请问下地图中需要一某一个指标比如GDP用不同的颜色显示时,用什么命令显示图例,好清晰的知道什么颜色代表该指标在什么范围

  7. 怎么样把中国之外的区域白化(去掉)呢?

  8. Pingback: Getting data from some urls | Hello, Bio

  9. Pingback: R时代,你要怎样画地图? | 土人瓦力

  10. Pingback: Map data with R | 用R处理地图信息 | Dong Lei's Blog

  11. 苏老师,您好,我输入library(ggmap)
    library(mapproj)
    map <- get_map(location = ‘China’, zoom = 4)
    ggmap(map)之后只得到一个空的画布,是不能从谷歌成功下载吗?还是需要设置什么函数或者参数吗?希望能得到您的指点,谢谢了。