superdesolator
RT, 我html_nodes()返回的大多是空,除了那些导航什么的可以返回,抓评论返回空,不知道有无高人指点?
jht0220
html_nodes只能抓取静态网页的上的数据,即你使用查看源码看到的数据。一般情况下数据会存在json中,通过调用才被显示。
可以参看http://blog.sina.com.cn/s/blog_4ac9f56e0102vq7t.html
superdesolator
[未知用户]
谢谢
superdesolator
我刚才看了下 你给的东西 有一点我没看明白 就是 url_baidu 是怎么构造的,他怎么知道数据在这个url里?
jht0220
[未知用户]
这个需要你自己在相应的网站进行查找确定的,chrome可以通过F12调出查看器,然后刷新页面,就可以知道你要的数据是在哪个文件或者链接里的
superdesolator
[未知用户]
那还是很复杂。。。