回复 第12楼 的 lyxmoo:
用chrome的F12的source找了半天没有发现相应数据地址,source不停的刷新链接,看得我眼花缭乱的。
还是用这个吧:
<br />
wget o "http://stock.online.sh.cn/F10.aspx?code=600000" -O 60000.txt<br />
sed -i "297,342!d;$!N;s/\n/ /;/tr/d;s/<[^>]*>//g;s/\t//g;s/ /\,/g" 60000.txt<br />
</p>
测试了一下,下载约一秒,处理0秒。建议你生成一个股票代码列表链接,然后用wget的-i参数下载,接着统一用sed处理目录下所有文件就可以了。这个站点至少支持单一IP下40个下载进程,也就是说,你可以用cut命令把股票代码列表链接文件分割为40个,然后wget并发他们,全部处理时间应不超过5分钟。
处理后的数据
[data]
每股收益,1.040000
每股净资产,10.0090
净资产收益率,10.3833
每股未分配利润,2.2248
每股资本公积金,3.1973
市盈率,5.5137
每股现金含量,13.4760
营收入增长,16.2892
净利润增长,12.7552
报告期,2013-06-30
所属行业,银行和金融服务
市净率,1.0081
总市值(亿元),1882.1353
流通市值(亿元),1505.7082
总股本(万股),1865347.1415
流通股本(万股),1492277.7132
[/data]
如果想合并为一行可以是使用以下命令(可更改代码中的分隔符逗号为其他符号):
<br />
sed "N;N;N;N;N;N;N;N;N;N;N;N;N;N;N;s/\n/\,/g" 60000.txt<br />
[data]
每股收益,1.040000,每股净资产,10.0090,净资产收益率,10.3833,每股未分配利润,2.2248,每股资本公积金,3.1973,市盈率,5.5137,每股现金含量,13.4760,营收入增长,16.2892,净利润增长,12.7552,报告期,2013-06-30,所属行业,银行和金融服务,市净率,1.0081,总市值(亿元),1882.1353,流通市值(亿元),1505.7082,总股本(万股),1865347.1415,流通股本(万股),1492277.7132
[/data]
</p>