因为一些原因,需要记录某个城市地方每天的实时天气数据。
本来想去中央气象局对应城市网页抓取数据的,
也搜索了相关的R语言抓取网页数据的帖子之类的,
模仿着利用XML包和RCurl包写了一点小段代码(以抓取北京实时气温为例):
url <- getURL("http://www.nmc.gov.cn/publish/forecast/ABJ/beijing.html",.encoding = "UTF-8");
html <- htmlParse(url,asText = TRUE,encoding = "UTF-8");
temperature <- getNodeSet(html,"//*[@id='realTemperature']");
xmlValue(temperature[[1]]);
结果为:
[1] " "
我查看了对应网页的源代码,源代码里面对应的部分是:
<td>气温<br><br><span id="realTemperature"> </span></td>
我估计我写的代码直接读取的是网页的源代码,所以结果是空白,也就是
但是我在对应网页页面的审查元素里面查看是有气温数据的:
<span id="realTemperature">20.2℃</span>
对其中的原因也是一知半解的。
:?: 求问,有什么方法可以把我需要的气温数据从网页上抓取下来?
求大神解答啊,不胜感激