下面这段程序是循环了三次,但是每次都是一样的结果,不是预想的三个网页的数据。
library(rvest)
library(stringr)
page=1:3
Pages = function(x){
url = paste("http://t.dianping.com/movie/shanghai/tab_deal?pageno=",x,"#nav",sep='')
doc = url %>% html() %>% html_nodes(".J_floor_box")
id = doc %>% html_node("h3") %>% html_text() %>% str_trim(.)
term = doc %>% html_node("h5 em") %>% html_text()
price = doc %>% html_node("h6 em") %>% html_text()
buy = doc %>% html_node("span em") %>% html_text()
data.frame(影院 = id, 团价 = term, 原价 = price, 已售 = buy)
}
lapply(page,function(i) Pages(i))
[[1]]
影院 团价 原价 已售
1 [8店通用] 上影永华·海上国际影城连锁影院 71 240 13766
2 [3店通用] 百丽宫影城 49 150 11917
3 [多商区] 上影CGV 45 108 6305
4 [多商区] 上影CGV 45 108 6007
5 [中山公园] 龙之梦影城 40 130 73942
6 [虹口足球场] 金逸影城 40 120 3643
[[2]]
影院 团价 原价 已售
1 [8店通用] 上影永华·海上国际影城连锁影院 71 240 13766
2 [3店通用] 百丽宫影城 49 150 11917
3 [多商区] 上影CGV 45 108 6305
4 [多商区] 上影CGV 45 108 6007
5 [中山公园] 龙之梦影城 40 130 73942
6 [虹口足球场] 金逸影城 40 120 3643
[[3]]
影院 团价 原价 已售
1 [8店通用] 上影永华·海上国际影城连锁影院 71 240 13766
2 [3店通用] 百丽宫影城 49 150 11917
3 [多商区] 上影CGV 45 108 6305
4 [多商区] 上影CGV 45 108 6007
5 [中山公园] 龙之梦影城 40 130 73942
6 [虹口足球场] 金逸影城 40 120 3643