回复 第9楼 的 shizairenwei:
仅就数据分析来说,他是一个完整流程的一部分,即数据分析;除此以外,还有数据获取,数据整理,数据储存,分析模型,数据计算,结果输出等部分。而curl,wget这类基本上属于数据获取部分。然后就是数据整理的sed,awk等。接着是数据储存的database的mysql,Oracle等。分析模型搭建基本上就是sas,splus,R等(其他领域省略)。数据计算可以用前述软件或通过其模型调试后用C,FORTRAN,C++等处理。具体到输出就取决于各自认为恰当的形式了,比如电子图标或是Ctex等或直接命令行到打印机即可。
在了解上述要点后,知道看什么后,具体到哪里看,这个问题还是一个较为个性化的问题。个人倾向于纸质的官方基本教程,看懂结构就基本上掌握了。当然,实时性便捷性还是网络较好。Google是资料检索的必选,不推荐Baidu,因为这些信息较为分散,baidu更多的关注在于普及型、区域性、地域性,适合Hao123类用户人群。
ps:curl、wget、sed、awk等都是Linux系统的基本命令(long long ago),早在UNIx时代这些命令就或多或少的存在了,只是这几年国内Linux泛滥,才被更多的鼠标一代、视窗一代、触摸屏一代人知道。坦率的说,常用程序处理不了就编个小程序然后编译就可以用了,其实这些都不是小操作,而是正经的计算机工作处理方法(卡纸一代除外),工作效率是很高的。如果是win平台,建议安装cygwin,也就是win下的Linux模拟环境,然后连接其bin文件夹到win的path环境变量,这样就可以使用Linux的基本命令行工具了。找本Linux常用命令的资料看一下,或者找本关于sed,awk之类的正则表达式资料看一下。