Think SAS(一)

think_SAS 为什么你应该学SAS?本文不想卷入SAS与R,或者与SPSS、S-Plus、Matlab等统计软件孰优孰劣的争论中去,我是说,作为一个有志于投身工业界的统计分析人员,你为什么应该把SAS纳入你的分析工具箱?这会是一篇动员贴,尤其是对广大对数据分析感兴趣的在校生。在默认统计编程语言是R的“统计之都”,我需要拿上面这幅图来吸引眼球:学SAS吧。

R是好东西,不只是在COS,现在全世界的统计系和统计学生当中,R是主导性的学术语言。但不妙的是,国内高校学生中,学SAS的明显少了,医药、金融等行业经常苦于招不到合适的SAS程序员。在统计分析领域,SAS是主导性的工业语言,它与R,不应该是此消彼长的关系。工业界与学院的隔膜,现在我感觉是非常明显。下面讲的就是,关于SAS,我们在学院可能不太关注的事实。

0. SAS是什么?

这是一个问题,SAS已经不是你所想象的那个样子。作为一家年收入超过20亿美元的、全球最大的独立BI/分析厂商,SAS就是那家由Dr. Jim Goodnight领导的私人公司。作为一个庞大的软件系统,以下只是SAS系统的一个不完整、不系统的介绍:

1.传统SAS(编程驱动)

1-1 基础模块(Base SAS):包括类似于PL/L的第四代编程语言data steps、SQL、ODS、XML Engine、Macro以及大量的内置函数(支持Perl 正则表达式)和过程步(procedures)等。对一个SAS程序员来说,这个BASE模块几乎就是全部(说学SAS,就是先学这个,这不需要统计背景或者计算机背景)。又,狭义的SAS Base仅指data steps。

1-2 数据存取模块(SAS/ACCESS):支持大量的PC文件(除文本文件外,还包括Excel、SPSS的.sav、Stata的.dta等等)以及所有主流的关系数据库及ERP系统(Oracle、SAP、SQL Server、DB2、MySQL等等)

1-3 作图模块(SAS/GRAPH):SAS作图功能强大,只是模样够土。新版SAS 9.2在这块有不少让人兴奋的改进,比如支持ODS、TrueColor、ActiveX、SVG(Scalable Vector Graphics)等,另外还加了一个graph editor,新潮不少。

1-4 统计分析模块(SAS/STAT ) :包括回归模型、方差分析模型、混合模型、贝叶斯分析、分类数据分析、多元分析(主成分和因子分析等)、判别分析、聚类分析、生存分析、非参数分析等,多是我不熟悉的领域,只管罗列。有个Stat Studio支持R。

1-5 时间序列与计量经济学模块(SAS/ETS ):同上,X11、X12、ARIMA、PANEL、AUTOREG、……。又,做资产组合等投资分析也是在这个模块。

1-6 矩阵运算模块(SAS/IML) 1-7 运筹学模块(SAS/OR) 1-8 地理信息系统模块(SAS/GIS) …… 以上部分是大部分SAS高校用户能接触到的东西,主要用命令行实现功能。下面则是有GUI的客户端工具,一般都用它们作计算引擎。

2. 客户端工具

2-1 元数据管理(SAS Management Console,SMC):元数据(metadata)就是关于数据的数据。最简单的,一个数据集的变量属性就是metadata。SMC是SAS产品元数据管理的统一中心。

2-2 ETL工具(SAS Data Integration Studio):ETL就是数据抽取(Extract)、转换(Transform)和加载(Load)。完成企业数据处理的工具还有SAS OLAP Cube Studio、SAS Information Map Studio等。

2-3 数据挖掘模块(SAS Enterprise Miner,EM) :SAS的重磅产品之一。5以上是Java客户端版本,用户体验增进不少。

2-4 综合分析工具包(SAS Enterprise Guide,EG): 有完善的GUI界面,完成SAS从数据整合、分析到报表的一系列功能。EG与JMP,是SAS公司的两个明星产品。 ……

3. 其他

3-1 统计探索软件包JMP:这是一个独立于Base SAS的软件,由SAS公司的二把手John Sall主管,界面很炫,功能很强,让业务人员爱不释手那种。JMP9支持R。 ……

以及,由以上SAS产品整合打包、再加上业务规则支持形成的各种SAS行业解决方案,广泛运用于金融、通信、能源、政府、医药、保险、制造、零售等各个行业。 SAS不仅仅是一款统计软件,它的官方定位是“商务分析和商务智能软件”(Business Analytics and Business Intelligence Software, BA & BI)。现在我们的重点放回SAS 1.1 即Base SAS上来。

1. SAS是最流行的数据分析类语言

我们看一个编程语言4月份的排名,来自TIOBETIOBE编程语言排名是各种程序语言流行程度的指标,每月更新。它参考全球范围内的技术工程师、培训师以及第三方厂商的意见,通过google、MSN、Yahoo!等常用的搜索引擎搜索结果来计算每种编程语言的流行指数。这个排行榜是程序员查看自己掌握的编程技能是否过时的权威参考之一。具体的评分标准,可以参阅其官分评分文档。现在最新的排行榜是(前20名,2010年4月):

rank_201004

这个TIOBE排名,有它自身的局限。比如,Google新推出的Go,一时广受追捧,4月的排名噌就上去了,但这并不能代表它的实际流行程度。但长期看来,模式还是很明显,比如,通用型的编程语言C/C++、Java、Perl、Python等一直占据这个榜单的榜首,而SAS,则一直是数据分析类语言的龙头,与Oracle数据库内置的PL/SQL语言不分上下。在2010年4月这份榜单中,我们可以把常见的统计分析类语言(关于“统计分析类语言”,这里表述不够精确,比如Matlab,可以作为统计分析工具用,但更多用在科学计算方面。得其大意了。)单独摘出来做一份表单(Maple、Mathematica、R和SPSS由于在榜单上差异不大,故按字母顺序排序):

统计分析语言 TIOBE排名2010年4月
1 SAS 13
2 Matlab 18
3 Fortran 34
4 Maple #51 to #100
5 Mathematica #51 to #100
6 R #51 to #100
7 SPSS #51 to #100

SAS是工业界最流行的统计分析语言。以前,号称有工业用途的三个统计软件是SAS、S-plus和SPSS,它们都是二十世纪七十年代问世的。S-plus与R同源,根正苗红,前身是上世纪七十年代末诞生于AT&T的贝尔实验室(Bell Labs)的S语言,八十年代末由StatSci公司运作,九十年代初转主MathSoft,2001年公司改组,改名叫Insightful,前年(2008),Insightful又被BI产商Tibco收购,从此,江湖上再也听不到S-plus的名号,它被融入Tibco的一个叫TIBCO Spotfire的分析平台。

再说SPSS,它的历史最早,1968年就有第一个发行版,由当时斯坦福大学的研究生Norman Nie等人发明,原意是Statistical Package for the Social Sciences。1975年SPSS公司成立,1993年上市。2009年,SPSS公司被IBM以12亿美元收购。现在,这家公司称作”SPSS: An IBM Company”,那个软件,叫做PASW (Predictive Analytics SoftWare) 。我们默认的那个SPSS也已经不复存在。

2009年,SAS公司的全球收入是23亿美元,它创立于1976年,比SPSS公司还晚一年。SAS软件1972年就有一个较稳定的发行版。随着BO等BI公司、SPSS等数据分析工具提供商一个个被IT巨头收购,SAS现在是全球最大的独立的BI/分析厂商,迄今没有上市。

2. R和SAS

这里要单独说下R。R现在被认为是SAS的一个潜在竞争者。SAS公司在细分市场上的主要竞争对手是SAP、Oracle、IBM、Microsoft、Teradata、SunGard、Unica等IT厂商。R对SAS的(潜在)威胁,不是体现在软件本身,而是体现在用户尤其是高校用户上。前面提到,R现在是学院里的标准统计语言。随便揪一个统计系的学生问:“为什么学R”。答:“因为课程项目用。”“为什么课程项目用?”答:“因为老师用。”或者“因为谢益辉在用。”

那我们再问R的传道者像谢益辉,“为什么用R?”答:“因为R开源”、“因为R统计功能强大,算法日新月异”、“因为某某大佬用R”等等。——通常,你不会因为,比如“R比SAS好”便去学R,或者“SAS比R好”便去学SAS。但是,假如一个人的时间精力只允许他/她学一门语言,那么,由于学院派益辉同学等的大声疾呼,R的确抢走了SAS的很多高校用户。但如果一个在校生还有额外的时间精力,而且他的志向不限于学院,那么,他或许应该再听听工业界的呼吁。

前面提到“算法日新月异”是R的一个优势,这对学院研究颇有吸引力,但工业界相对就保守些,对新算法的需求就小些。——平常听起来“保守”似乎是一个不太积极向上的词,但想想,一个法官应该是保守的,在统计学的假设检验里,遵守的其实也是一个保守原则。举个例子,在学院研究中,Bayesian(贝叶斯分析)在概念上已经不是那么新潮了,但在医药行业(就是那个由保守的药监局如FDA监管的行业),现在用的还是传统的Frequentist方法(参见ICH E9,Statistical Principles for Clinical Trials)。学院里的优势不必然是工业界的优势,那么你为什么不额外再学一门SAS,这个工业界的金标准?以前说过,R的不足刚好是SAS所长,反之亦然。

又,有在校生说,R免费,而SAS是商业软件,故学R,——这是一个不成熟的、人云亦云的说法。你在学校实验室能免费学到SAS,以后你的东家自然会为SAS软件买单。费用不是你应该考虑的问题。

3. SAS可以作为一门职业

从实际的角度来说,有一个工种就叫做SAS程序员(SAS Programer, 或叫做Statistical SAS Programmer、Statistical Analyst)。在全球最大的求职网站www.monster.com,分别以SAS等作为skill关键词,搜索结果如下(测试时间:2010-04-13,你现在看到的会有细微的差别):

1645 SAS jobs

577 Matlab jobs

329 SPSS jobs

87 Fortran jobs

59 STATA jobs

59 Maple jobs

24 Mathematica jobs

这是英语世界的大致情况。说说我们身边的机会。SAS使用者大多集中在医药、金融等行业。现在国际上的大药厂(辉瑞、拜耳、诺华,……)纷纷在中国开研发中心,对生物统计师(Biostatistician,包括统计师和程序员。程序员就是SAS程序员,而SAS编程也是统计师的基本要求之一)的需求渐长。在金融领域,拿我稍熟悉的信用评分领域来讲,熟悉SAS和数据挖掘的人才也很短缺。另外,广泛的机会还能在国内如火如荼的互联网公司和通信行业找到。

其实,即使不把SAS作为一门职业,对一份分析类的工作,你简历中出现SAS也会比出现其他类似的东西(Excel、……)更能吸引雇主的眼球。SAS被普遍认为是一种重量级的工具。 对于统计系的学生,我知道R是你的首选。你需要再学习一门SAS的理由是,SAS是工业界的流行语言。 对社会学、经济学等社科类的专业学生来说,你们需要学习SAS,还有一个额外的理由,SAS会让你的背景显得更硬朗一些,大白话就是说,能让文科气息稍微淡一些。 对IT类学生来说,学习SAS不会占用你太多时间,然后在就业市场,你的选择会宽广很多。(待续)

Think SAS(一)》有112个想法

  1. 以前只学R,昨天刚刚装上sas,想了解一下,楼主说的是挺有道理,尤其是强调不是讨论而这之争,只分析实际,两者都有两者的优势,就目前情况来说感觉sas还是没法取代的

  2. 支持一下!所谓兼听则明,COS不能只有一种声音。计算机语言这类事物,最佳的状态就是在互相的竞争中不断发展,最终有利于用户本身。期待后续的文章。:)

  3. 做一些方法已经很成熟的统计分析,尤其是biostatistics方面,SAS确实比较方便。比如我做重复测量的方差分析,就直接用 SAS proc mixed 完成,比R方便。但是,SAS的作用也就仅限于做这种早已经存放于博物馆中的统计方法。

    1. biostatistics方面有应用面虽窄但很方便应用软件的,一般都和基因芯片,数据库之类一并开发了,sas真不见得有优势

  4. 我认为R并没有抢走SAS很多的高校用户,事实上,大多数统计专业的学生都开SAS这门课,但几乎没高校开R,学R的大都是自己折腾的。

    据我观察,国内高校学生(至少在能代表统计学一般水平的CSU),无论对R还是SAS都相当冷漠。即便是R和SAS之间发生的各种我们以为很激烈、有趣的、有意义争论,绝大多数人并不关注——关注、学习、使用SAS、R的目前都还只是小圈子。它们之间应该不存在此消彼长的关系。

    很喜欢这样活泼生动的文章,期待续文:)

    1. 恩 也是的,我们学校也只开sas课程 不过感觉还是R方便 所以就自学了

  5. SAS的职业搜索数据中掺杂了一些硬件工作,因为SAS还有另一种含义:Serial attached SCSI。我看第一页搜索结果中至少就有三条跟后者相关的工作。

    就免费与年年收费而言,我个人有个韩复渠式的想法:东家拿买SAS的钱发给大家吃火锅,岂不更好?

    话说FDA的保守吧,有其道理,但这个问题在逻辑上是有冲突的。如果真的要保守,一方面,FDA的官员应该要求SAS开源才对,或者派人去SAS一行行检查源代码,确保软件没有Bug;另一方面,就统计方法而言,FDA不仅该禁用贝叶斯,而且大部分频率学派方法都要禁了,诸如假设检验方差分析,有哪个FDA官员能从实际中找出一例独立同分布(正态)的数据来?所以他们的保守也是有一个尺度的,那我们就要问了,为什么你们恰好保守到33%,我就不能到35%呢?新方法并不代表着危险,老方法也不一定安全,所以我常说这两个软件之争的背后,统计是更本质的问题。学界的象牙塔,和工业界的保守,在外人看来,都有其可笑之处。(注:保守行事可以看作是一种贝叶斯方法,即给历史经验一个大的先验)

    据我所知,R的一些开发者如Douglas Bates,也是很关心他们的结果与SAS结果的比较的(如混合效应模型lme4),SAS是一种标准,但不是金标准。关于这一点,R界有大量的论述(如 https://stat.ethz.ch/pipermail/r-help/2006-May/094765.html )。

    对我个人而言,我要做的工作都能用免费的工具有效地完成,这一点就够了。我并不关心程序语言的流行程度,也不关心FDA要求大家用什么方法(我不一定在医药行业工作),我只关心能抓老鼠的猫,至于找工作嘛,各人也有各人的喜好,有人喜欢for (day in year) {print("报表")}的工作,有人喜欢plot(x,y); lines(lowess(x,y)); fit = lm(y~x); plot(fit); update(fit, .~.+I(x^2)); ...

    不过我可不希望有人会因为“谢益辉在用R”而用R……将来没饭吃可不要找我……

    1. FDA保守是有最基本的考虑,即食品与药品产生问题时的致命风险更高,而人的生命是最为宝贵的,所以对新方法的态度宁可保守一点。至于发信用卡的,就激进多了,反正破产了有政府救市,没太多根本的顾虑,这也是工业界对于所谓数据挖掘方法兴致盎然的原因之一。

  6. 不过掌握SAS比掌握R更容易找到工作,(至少现阶段在国内)那是真的。所以我也重新开始学习SAS,争取赶快找到个糊口的饭碗。

  7. 我问过SAS总部那边开发的家伙们了,api是绝对不会开放的,晚安老头儿也是这个意思。所以局限性比较大。而且有些的东西现在有些混乱。

    但是sas/iml 现在支持R(有条件的),也算是一个进步,但是还是不够用的。
    而R虽然包多,但是bug也不少,而且模型导出使用是个问题。
    matlab那个东西我看着还是别扭。
    现在我倒是看好statistica 9.1 x64

  8. SAS什么都好,就是太贵,当然它有贵的理由。
    我现在想学下Fortran,好多强大的科学计算代码都是用它编的。

  9. 在校的学生,想工作学SAS,想读博学R,任何一个学入门就可以了。至于SPSS和Excel相对简单,工作中学就可以。想学精还得本科或硕士毕业后若干年。

    数理统计理论知识才是王道,程序员永远是可以替代的,国外公司来中国开厂就是看中国内廉价的硕士统计程序员。在校的学生有时间还是全面看看统计知识吧,这个才是工作几年后的核心竞争力。SAS或者R入门就可以了,但想入门也不容易啊,各种软件诱惑太多,缺乏坚持学习一种软件的决心。

    工作用什么软件学什么,学得才快。我建议学SAS,读博还是少数。

    In a word, do not waste all your time learning SAS or R in the campus.

    1. I can’t agree with you.
      Your view is from the old school and out-dated.
      In the world of modern statistics, computing skill is playing more important role than ever.
      Take a look at websites of J. Friedman @ stanford and B. Ripley @ oxford. They all are world-class statisticians and also have top-notch computing skills.

      1. Hi,
        I agree with you up to a point that the computing skill is playing more important role than ever. Perhaps I didn’t make myself clear.
        Actually, I am interested in Computational Statistics, especially MCMC. To understand this discipline better, theoretical knowledge of Markov Chain and Bayesian Statistics are needed. The essence of them is still Probability and Statistics. On the other hand, Statistics is combined with computer, Data Mining or Machine Learning seems popular. Maybe computer courses such as data structure and algorithms are worth learning for students major in statistics or mathematics.
        In my option, campus is a precious place to learn these theories and social is a better place to learn software. Statistical Software and Program Languages are tools. We learn them quickly in job.
        This is a good place to exchange points of view.
        BTW, I visited your MSN Space before, and I got many learning.
        Thanks.

    2. 同意,工具就是工具,我们应该主导工具,而不是工具主导我们。该用什么就用什么,学起来都挺容易的。不过可以把SAS和R同时列为我们的“业余爱好”

  10. 现在进药厂啥的还是得靠sas,要考个sas证,但是有的来招聘的公司也开始鼓励r了,原因只有一条,那就是免费。

  11. 其实,走出学校,基本上没有什么单位主要用R来做统计分析。但是许多单位不允许用R。在学校里为什么许多学生自动选择用R的原因1.免费2.容易入门3.导师在用。走出学校,许多人都很快忘记R,因为R没有应用的市场。另外,在学校里所学的,除了某些牛人(们),一般人无论R还是SAS,技能都不足以应付日常的工作。所以往往是工作中所需要的所使用的软件,才算是你真正得心应手的工具。所以说实话,对于一般的学生来讲,不算真正懂R。只是个入门而已。

    1. 我想知道什么单位不允许用R呢?(FDA要求的除外,世上的数据分析工作中,医药只是一块而已)

      再三重复小马过河啊小马过河,所有人的意见都只能是偏见……

      我曾经给某重量级政府部门(不便透露名称)做过R的程序,人家一样用得好好的,也没说R咋的了,相反,人家倒是对R很感兴趣。还有,如果你觉得我太书生气、接触实践不够的话,也可以问问实战派的刘大版主的经验( http://www.bjt.name/ )。这问题从某种程度上来说只是软件诞生的先后次序而已,SAS出世早,赢得了一批老统计学家和FDA,从而有了发展的根基,并不意味着它不可取代或不会被取代。

      “1.免费2.容易入门3.导师在用”这个排序应该加上“0.功能灵活强大”,“2”也不太合适,我觉得R相对来说并不太容易入门。

      “R没有应用的市场”这个论断几乎等价于“统计没有应用的市场”。如果你有论据,小的愿洗耳恭听。

      新生事物遭受一些挫折是正常的,没有人愿意看见自己熟悉的饭碗被别人抢掉,但从大局来看,这种“竞争”只是表象,人人都觉得自己明白在争什么,但其实很多人都栽在自己的使用习惯上了。抛开用户习惯或假设所有工具都不存在,再给你一批数据,你如何分析?

      1. R在应对工业界随处可见的large-scale数据集时力不从心,这个问题在短期内也无法解决,毕竟是免费维护的。另外大部分“丰富多彩的”R-package,其可靠性和稳定性都没有经过专业的测试,我想短时间内R想在工业界流行起来有困难

    2. 我想“基本上没有什么单位主要用R来做统计分析”的主要原因一是R缺少或甚至没有专业的技术支持服务,商业领域所有人都希望出钱买稳定和平安;二是推广的原因,商业软件有大量的资金去推广去公关,而免费软件则基本没有推广的资金,即使有也难以与商业软件相比。其实免费软件大都有类似的情况。但随着现在开源软件的盛行,专门做开源软件支持服务的公司也越来越多,我相信有一天R也会出现在商业领域的!

      我在想不久的将来,咱们的谢老大有没有可能成立一家专做R支持的顾问公司呢?:)

      1. 那是极有可能的,哈哈,其实我觉得基于开源软件做商业还有另一点优势,就是这些人(写代码的)基本上都是自我驱动的,这种精神价值应该好好研究一下转化为更强大的生产力

      2. 在BGI工作一年,大部分人推崇R,几乎没人用商业统计软件。没必要花大量资金去买灵活性不高的软件,这是科研单位和公司的区别,也是创新与守旧的区别。

  12. 从来没听说不准用r的噢。上次air force的人过来讲座,我看他那些图全都是r画的。军队的人都没说不准用。。

    1. air force?听起来你应该是在国外工作了。首先,即使如你所说,空军用R画图,也不足以推知其他的行业可以用R分析。首先,药厂众所周知,禁止用sas之外的软件做官方的统计分析。另外,SAS也是一般银行首选的统计软件。许多的工作类似于流水作业,你输出的东西往往是下一级输入的东西。我很难想象众人sas我独R的情形是什么?另外,你有这个随便装载软件的自由度吗?
      孰优孰劣,只是个争论;R的普及比你臆测的要小的多,尤其是走出校门,是个不争的事实。‘精通’R是个优点,但是如果持之自重,就未免太过了。不过,学生好争善辩,这也是R-user们的特点。另外,如果只是本科或者硕士选修统计和其他相关的,对大部分而言,谈何懂R?只是简历上的一点装饰而已。统计分析如同建筑,模型是在高端,是基础于大量繁琐的数据读取校正转换。如果只是一般的毕业生,你自觉水平够吗?
      另外如果反驳他人,不要以牛人精英的角度来做立论。在统计上较outlier,是最令人头痛的。如同鸡肋,弃之可惜食之无味。

      1. 看你这架势,似乎总觉得学生都眼光狭隘没见过世面,而且对统计对R都知之甚深,我等小辈是没必要争论了。新事物的发展,总是会有挫折的(如果新事物不是离群点,那它就不是新事物了);是骡子是马,也不会因争论而改变。

        另:如果有什么事情是专指我个人的话,可以明说。

      2. 呵呵,“生好争善辩,这也是R-user们的特点”这个打击面大啊。不过,这里很多人也知道的,我不用r的,我用matlab。而且,我也不是和你争,我当时看到你说“许多单位不许用r”,我就想到要补充一下这个说法,除此以外没啥别的意思。毕竟这个东西,国内国外不一样。就我所知,用r的大公司越来越多,google, intel,simens,他们的研发部门里用r的很多。

      3. 国内外对sas的使用状况,在认识上确实有非常大的距离。大家以后有机会到美国可以参加SAS Global Forum,可以看看sas发烧友对sas的崇拜程度。这个forum不是sas花钱搞的,而是客户赞助的。 sas在国内做得并不好。

  13. 我觉得对国内初学者来说最大的麻烦是:
    第一,这文件很大,下起来要很长时间
    第二,无法完全破解(实话实说,中国特色的问题,毕竟你要小孩掏个多少刀买这个是不可能的)
    第三最主要的还是市场的需求,我找工作时还留心了下,要求会sas的没要求会spss的多,国内尤其是官方还没严谨到像FDA那样非sas报告不认的地步,sas的推广需要外部因素的,毕竟其他几个大商用软件正常应付是够了

    最后,sas是个好软件,但要专业,要扎实,要长时间刻骨学习,类似气宗和剑宗的差别。

    1. FDA要求企业必须用sas是个误解。其实是FDA用了sas,其他企业不得不用sas,主要是容易融合大家的数据和分析。和中国联通用了什么标准,手机厂商必须和他一致是一样的。使用sas,还是使用R,不同人有不同选择,不可苟同。相信大家会根据自己的职业和发展选择正确的工具。我不会花1万元买把刀,杀100元的鸡,而且只用一次。

  14. 退一步海阔天空。我只是阐述自己的观点而已。我不懂r,但在学校里也曾经用R做过4门功课:statistical computing, linear regression, data mining, and simulation.当然不敢自称是入门级, 或者是曾经入过门。我所用的都是矩阵的运算,最简单的东西。因为知之不多不深,所以忘得更快。但这也正是学校里所需要的,足矣!我也真的不知道Google等等卓著的公司在用r做科研。如果不错的话,这足以彰显R的伟大,因为Google显然不是因为R开源而使用的。另外,我的观点,一般学生的R水平不足以应付工作需要,应该不谬。我自己是个例子。我总觉得这都是常识性的东西,遇到精英们,就变成胡说了。惭愧!
    我入读的是北美的一个高校,也不算很差。在统计系,不乏R的专家,但他们显然不以R自居,如你所说,看的是统计知识。在生物统计系,许多教授擅长sas,也不以SAS自居,如你所说看的是统计知识。前后两届,我和二十多个同学保持联系。毕业五年,没有一个在工作之中常用R,1 到2个偶尔用到R。十五六个离不开sas。样本再小,也有代表性。你可以告诉我,空军在用R,Google在用R,说明什么问题呢?“就我所知,用r的大公司越来越多。。”这样话不适于立论1.据你所知,失之于偏颇;越来越多,流于推断。不足为凭。
    我是瞎费劲让你们接受我自认为是事实的东西。其实, 未尝不可能谬之千里。因此,只是谈谈而已。

    1. 这里的人也并没有以R自居,更没有持之自重。只不过R在国内受的关注太少,这地方算是个介绍R、宣传R的地方吧。目前国内用R的公司已经多起来了,我以前也觉得R只在学界和生物信息领域有市场,但最近发现情况并非如此——矛盾是变化的,要以发展的眼光来看待。谈及SAS,它在国外工作市场上可能炙手可热,但在国内,没有很多家用SAS的。

      R作为一个新生物,其发展速度已经相当快了,当然在前进的路上,R不可避免的要受到种种非议,就如同庞龙的《宽容》序言中探索者受到守旧老人们的苛责一样,这个是历史的规律。

      从经济学的角度来看,任何一个近乎垄断性的东西,都会攫取超额利润,并或多或少地缺乏前进的动力。Microsoft如此,SAS亦是如此。R的出现为SAS的前进起到了推动型的作用,因此,无论是SASor还是useR,我觉得都应该感谢R,因为竞争才能带来更高的效率、更低的价格。

      最后声明一下,我不是anti-SAS,以后也可能会用到SAS。唯物辩证有时候是一种狡猾——各打五十大板,言之无物。因此,我很喜欢两派坚定立场的人激烈的争论:)

      1. sas很关注R的发展,就足以说明了R的重要性,和R可能对他带来的威胁。
        世界本来就需要多样性,没有人可以独揽天下。

    2. -_- 汗,我说错啥了吗?

      起初我说“现在进药厂啥的还是得靠sas,要考个sas证,但是有的来招聘的公司也开始鼓励r了,原因只有一条,那就是免费。”,我说的SAS的好话吧。后来我补充一条信息,无非是说有些有名的单位也用R。我说的东西除了提供信息以外,也没有偏颇之嫌啊。你一个劲要我们接受你的观点干嘛呢。

  15. 另外我又何尝不佩服谢同志用R写的东西?关于你对一些统计现象的观点,也是认为非常难得。毕竟批评是需要勇气的。我对统计的理解是,如果你要探索,不妨多加审视和批评;如果只是使用,应该做到不疑。毕竟一个通行理论的漏洞不是俯首可拾的。我的老板很反感我反驳他,原因如果不是种族歧视的话, 我琢磨了,就是我的论据让他不信服故而有取闹之嫌。另外, 在学校里, 我的一个教授坚决反对把自己的讲课笔记公开到网上,原因是他不想让远在澳洲的人嘲笑他学艺不精。不过他都60岁了,怎敢和我们小辈们争先?

  16. 我觉得江堂兄的词用得很精妙: “SAS可以作为一门职业(occupation)”.

    那我们可不可以有 “SAS不是很适合作为一项事业(enterprise)” 的理解呢? 十分好奇江堂兄对这个问题的看法是怎样的, 如果能从vision的角度分析就更好了. 多谢江堂兄指点.

  17. 江堂说得很好哈。R和SAS能精通一样就行了,不必在乎哪个更流行。

  18. 好,有意思!各有利弊,不过我还是喜欢R一些,至少我觉得在编程上R要比SAS方便自然。在bioinformatics这个网站上,很多单位,包括医药公司也是把R和SAS等同地位的或者只明确列出有R经验的要求

  19. 有感于R在学院(尤其是统计系)的流行,这篇文章主要是写给对工业界感兴趣的在校生看的,动员他们在学R之余,不妨考虑一下SAS。前些日子我在mysas论坛发了个招聘SAS程序员的帖子,对学院跟业界不一样的偏好,感触颇深,加上平时的一些观察,就在UserR国内的大本营COS喊一声了。

    关于软件的功能,比如R或SAS,本身没有任何问题。一个语言,只要能使分支语句和循环,再加上极少的要求,就可以完成几乎所有的任务了(语言的完备性,要求其实很简单)。所以讨论R与SAS谁更强大,意义不大,这更多是个人使用偏好的问题。抛开价值问题,那剩下的就是事实问题了。一个事实是,在工业界普遍使用SAS,在统计系普遍使用R,所以,如果兴趣在学院之外,不学SAS就亏了。

    关于SAS与FDA,有必要澄清一点。虽然药厂一直向FDA提交用SAS完成的统计分析报告,但是,FDA却没有规定统计分析必须得用SAS完成(所以说在医药行业,SAS是事实上的标准,但却不是法定的标准)。根据法律,FDA是要vendor neutral的。一个直接的联系是,1999年,FDA要求用SAS公司研发出来的一种数据格式提交临床数据,叫做SAS version 5 transport file (XPT)。而这种格式的数据,是平台无关的。

    那为什么要用SAS?也可能是用户习惯吧。但却不是因为SAS出道早,因为SPSS比SAS还早几年问世——那可能是因为出道较早。不管怎么说,业界多使用SAS应该是求职者再学习一门SAS的理由。

    1. 不要总把sas等同于统计软件。sas还包括数据挖掘,计量经济学,运筹学等等。sas能够做预测和优化,有几十种业务解决方案。

  20. 喜欢科研的,喜欢捣鼓的,继续R,想要进入偏好SAS的企业(的确很多),就去拿个SAS认证吧,世界上从来就不是黑白两色。
    我并非统计专业的,平时绝大部分工作用SPSS足以应付。至于学习,我个人还要推荐MatLab,自己把统计程序写出来,不一定要多么健壮,多么高效,只要能按书上的算法自己编写出哪怕像ANOVA,OLS,PLS,PCA这些简单经典的程序,对统计算法的理解一定能更深入一些。

    1. 同意,我也持这样的看法,在今后很长一段时间内Matlab是最不可能错的选择

  21. 研究性问题用R
    找工作还是要用SAS.
    国内SAS教学比较落后,与社会需求大大脱轨。

    1. 这种需求有多大呢?哪位能统计出来?是否可以做个项目?帮你找人出钱赞助。

      1. SAS的社会需求,用SAS软件本身或许就能分析出来。中华英才网(chinaHR)就利用SAS Text Analytics套件来对它们的工作岗位和简历进行自动分类和匹配。同样可以利用SAS的文本挖掘技术对社会上已经发布的SAS相关的工作机会进行分析。

  22. 看你需要什么吧?两个都会岂不是更好~

    R,SAS,Matlab都应该学一学~

  23. 总的来讲,SAS是一种很过时的软件,已经应该到被淘汰的地步了,可是仍然有很多工业巨头和政府机构使用。都是历史原因造成的。对于很多大公司来说,他们的数据都在SAS数据库里,已经没法倒腾出来了,对于他们来说数据的安全性远远大于SAS每年那点许可证费要宝贵。所以只能将就了。

    但这个不是整个工业界的大趋势,由于它的笨重和绑架式的机制,越来越多的新兴的创业公司是不会选择SAS这样一个软件的。而那些工业巨擎们和SAS就成了拴一起的两只蚂蚱。对于研究机构而言同样如此,人们更愿意自由的使用软件 —— “Free as in freedom”.

    至于SAS所宣扬的他的权威性也越来越多的遭到人们的质疑。一个不透明的软件的如何让人觉得放心呢?

    另外我自己也用SAS,你SAS公司永远也体会不到一个程序员觉用你那个软件的别扭劲儿!

      1. SAS曾经有的优点不可否认,但是到现在了已经不能说仍然是“不可替代的”了,不论用户还是开发者,应该认识到软件的的本身缺点,才有改进的余地。如果门口永远站着腐朽士道夫,那只能慢慢自己腐烂了。你口气倒挺大的,一个“sense”就秒杀了成千上万的人。其实这样的讨论本没有什么实际意义,一个东西的没落和退出历史舞台之前垂死挣扎是免不了的。

      2. 我说的一点没错,学好sas确实需要正常的逻辑思维。学不好的人也确实是个人原因。sas是会被代替,但是目前还没有替代者,差距不是一点点。

    1. 说两句。“对于很多大公司来说,他们的数据都在SAS数据库里,已经没法倒腾出来了”,——实际情况是,现在大公司的数据,大多都存储在关系数据库里;为了分析的方便,一些数据被抽取出来,存成SAS的专有数据格式,所以不存在上述说的路径依赖问题。

      还有,“一个不透明的软件的如何让人觉得放心呢”,——如果这里“不透明”是“不开源或不免费”的意思,那么,我们日常生活工作中用到的很多软件都是“不透明”的(Matlab、PhotoShop、网银支付系统、…… ),不知道它们是不是让人觉得放心的……

    2. SAS软件会不会被淘汰我不知道。 但是今年福布斯杂志评比的全美100家最佳雇主, SAS INSTITUTE 排名第一, 要知道SAS的工资比不了GOOGLE, MS, 而且作为一家私人企业, 也不能给员工股票,这样的企业能得到雇员和业界这样的首肯, 还是非常值得尊重的。

      我觉得同学们啊, 还是不要过于心浮气躁, 不要学校学了一点东西,网上看了一点东西, 还没有很多的工作经验的时候, 就指点江山, 什么这个要淘汰, 那个要不行, 有这个时间不如静下心来搞点研究, R, SAS, MATLAB不管那个, 做好了就行!CRAN里的PACKAGE有多少是中国人贡献的?

    3. 好久不来,居然发现这里还有这么多评论,那么我就当一回粪青,指点指点那些迂腐的老东西们。说归说,大家该干嘛干嘛,该学SAS学SAS,有时候理想很丰满,现实也很骨感。

      @胡江堂

      第一句,你说的很对,是“现在的大公司”确实是那么做的,因为他们变聪明了,不想让SAS拴住腿,你回去学一下SAS的历史,顺带看看有多少老公司,政府统计数据还在SAS数据库里,你要是找不到,我帮你去SAS要去。

      第二句,我说的不透明是”不可重复性“,你在Matlab里写一段程序,我可以用C,R,随便什么东西都可以重复实现,你用比如 Photoshop 的虑镜功能,那是Gaussian blur算法,你知道统计,我想给你张照片你能用R做出同样的效果来,只不过是时间和复杂程度而已。还有网银的加密算法是公开的,你即使有源代码也不会得到权限,因为你没有秘钥。简答的说就像工匠制锁,大家都会,大家都可以制造,但是一把钥匙开一把锁,这是为什么Linux的密码指明了就放在/etc/shadow里你也打不开。扯远了,回到SAS,我现在有这么段SAS代码,

      PROC AUTOREG DATA = mydata;
      MODEL Y = X2 Y_1 / LAGDEP = Y_1; *

      RUN;QUIT;

      他给我打出个 durbin-h statistic = 0.5 我翻遍SAS帮助文档也没有找到。你回去问问你们的头这是怎么算出来的?你别说我用同样数据用其他软件得到同样的结果,那么SAS就是正确的。这是Black-box testing。科学实验是需要 White-box testing。

      @sasuser

      “学好sas确实需要正常的逻辑思维” 我没有说不喜欢SAS的人都没有学好SAS.
      “但是目前还没有替代者,差距不是一点点” 你想让开源世界的人们给SAS列一个“SAS can’t do list”?搞笑。

      @xin

      你先把概念搞清楚,我们讨论的是SAS软件的利弊,我们不关注SAS是哪里的什么性质公司,既然我们付费了,那么我们指点指点又怎么了?你读过毛主席语录吧,不要就记得激昂文字,顺便回去学学毛主席是怎么教育下一代的。”CRAN里的PACKAGE有多少是中国人贡献的?“ GPL协议没有这个要求。顺便,PACKAGE应该用复数。

      1. “总的来讲,SAS是一种很过时的软件,已经应该到被淘汰的地步了” 这个是你说的把, 这是评论软件的利弊吗? 软件公司的发展自有其规律,SAS做不好也自然会被淘汰, 再多的老公司也用他也是白搭。你大刺刺地说一个福布斯第一的公司明天就要被淘汰, 那还排在后面的GOOGLE是不是今天就要关门?

        你那个什么durbin-h statistic, 我加上SAS, AUTOREG一 google就出来了啊, 第二条, http://support.sas.com/documentation/cdl/en/etsug/60372/HTML/default/etsug_autoreg_sect005.htm
        你为什么不查查这个durbin-h statistic的原始文献然后用fortran,C 验证一下, 如果结果不一样像SAS举报BUG, 在论坛散播不就行了, 你要是有本事查出了错再抱怨你家不透明也可以啊。 谈到OPEN SOURCE, 有多少人用R之前是先把R SOURCE CODE检查一边的,那么多人贡献的所谓“PACKAGE”, 写法逻辑奇形怪状(当然也有很多好的, 比如RMA和ANIMATION),又有谁有耐心和时间给他们差错? 还不是拿来就用, 信不信由你。我亲见的某些牛package也就牛了一段时间, 结果BASE R一升级他就彻底歇菜了,啥时候修好取决于人家啥时候从休假回来,如果是公司的核心系统依赖这些PACKAGES, 那后果会怎么样? 所以诸君大力强调的OPEN SOURCE, FREEDOM也要打个折扣了…….

      2. 关于SAS与数据存储。在早期,一些临床试验和农业数据会用SAS专有的数据格式存储。那阵子,关系数据库的概念和产品也都有了,跟SAS几乎在同一个时代,SAS也无意在存储方面与它们一较高低。说“很多大公司”或者“有多少老公司”的数据“都在SAS数据库里”,可能真要麻烦你提供更多的证据。或许,能看到大量的SAS数据格式的数据,但背后也会有各种存储介质,除了数据库和一些专有文件系统,还有文本、磁带等等。

        况且,即使所有的原始数据都用SAS专有的数据格式,这也不能构成这个机构依赖SAS的理由。因为把SAS数据格式转化成其他数据格式或者导入数据库也是很方便的。

        关于不透明,如果它是“不可重复”的意思。如果SAS计算出来的结果不能用其他工具复制出来,它早就垮了,用不着我们在这里讨论。我想,对SAS,我们这点基本的信心还是应该有的。

  24. 企业不是不让用R,而是没有人敢做决定使用R。应为如果带来了损失,是要负责任的。R是人人都做贡献,但没有人承担连带责任。

    胡找不到sas程序员了,所以到这里鼓吹他的思想,想把这里变成sas程序员的基地。

    1. 1991年,Linux面对Unix、*BSD等辈时,不见得当时的人能预见今天的Linux大规模应用。如果出现以R服务的企业推出Enterprise Version,我相信,SAS只能成为下一个SGI。

  25. 看到这些,觉得这情景很熟悉,后来想想在论坛上看大家争论TeX和word的优劣也是这种情景,他们都有自己的忠实用户,这种争论到了最后真的没有什么意思

  26. 看大家争论了这么久,想必也累了,希望不要伤了和气。:)
    我一直的看法是,争论不一定是坏事,其实上面这些SAS和R之间的你来我往跟当年老Pearson和Fisher的恩怨颇为相似,都是在权威与新秀之间产生碰撞。但是一场有意义的辩论不是说一方要压倒另一方,事实上这也不可能,就像老Pearson和Fisher并没有只留下一个。
    我觉得前面xin说的一句话非常中肯,与其在口头上较个高下,不如静下心来搞点研究。对于useRs,可以多给CRAN贡献几个包,或分享一些自己关于R和SAS的经验(例如谢大哥的这篇);对于SASers,我们也非常期待你们为我们带来SAS的实际应用案例,丰富大家的视野(例如胡大哥的这篇)。
    我觉得既然我们都是统计之都中的布“道”者,那么所使用的“器”不同又有何妨呢?:)

  27. 应该不会伤和气把, 大家对事不对人, 呵呵。 最后再贡献一个牛人的blog,
    http://statcompute.spaces.live.com
    据我所知, 博主这样的牛人根本不会去参加什么R/SAS的辩论,也不会去列什么XX软件的cannot do list, 人家就是埋头写code, 不论是R, SAS 还是PYTHON…..

  28. 现在我国还没有SAS User Group吧?
    亚洲这边,日本2000年成立,韩国2004年成立,新加坡2009年成立。我们也得要一个。
    要不,大家组织一个SUG-C吧?明年在北京开一次年会看看。

    有赞成的举手

  29. 其实SAS来说
    热爱编程的人来讲 R更具有成就感
    对于寻找工作来来说 SAS更有优势

  30. 其实中国院校用R的可能应该是人大几个学校在用,我们学校根本就不提,当然可能是我们学校的统计学这个专业不怎么样,但是我们学校用SAS的人很多,很牛B,他们用SAS来编程解决遗传方面的问题,用SAS来做多元统计分析,他们只用SAS,在学校的时候,第一次听说R,是吴喜之的非参数统计里面讲的,说R很流行云云,什么世界上很多人用啊,什么的,当时看了这些也是被忽悠的心动了,也去学了下R,学了几天,就不了了之了,学的时候就觉得R很像MATLAB,因为matlab就可以编一个个的function再调用,其实SAS,R,SPSS等统计软件,不就是像练功人用的武器吗?有的人喜欢用剑,有的人喜欢用刀,有的人喜欢用鬼子刀,有的人喜欢用枪,但有的人很牛B不喜欢用武器,用手,有的人用武器还不如别人用叶子,武器在牛B又能怎么呢?还是要自己的武功高

    1. 武功高是基础,不过有件趁手的兵器也挺重要的。工欲善其事,必先利其器,这个器包括很多,当然也包括工具啦~~~

  31. 问个外行的问题,请问SAS和R在处理大型数据(上G的),哪个更有优势?

  32. I want to know you. Is there any other way to communicate except this? I am a undergraduate student and major in finance. But now still no idea about SAS. while it may not be suitable to say that because I have read few of your articles. I want to learn SAS. Is there any suggestion? If you say learn by myself, please recommand some books the is easy and useful for a beginner.

  33. 只用两个语言Python+Matlab(计算机技术在精不再多),我坚信这两个语言是无所不能的。

  34. 您好,想咨询一下SAS能与其他语言混合编程,并提取SAS的统计结果显示在系统界面上吗,非常感谢

  35. 刚刚发现这么火的帖子~~

    其实,我觉得光说国内高校的话,最重要的不是学SAS还是学R,而且如何消灭那个恶心的SPSS~~

    1. SPSS挺好的阿,人家是social science领域的王牌软件,功能齐全,为啥要说人家恶心呢?

  36. 匆匆过客.我是统计学本科毕业的,现在工作三年了,大三开始学习SAS.现在陷入SAS疲惫期,毕业第一年做临床试验数据分析,现在在银行业做了两年数据挖掘.在校期间用过所有数学软件(不精).看到中国统计学的大家们,还是有一点小小的感慨,毕业第一家公司老总是美国政治学教授,我应聘时问了我一下LOGISTIC回归,争论R,SAS,MATLAB…我也曾想过.我也没有答案,不过这里,我想要说的是,请诸位大家,多学学美国CRO LISTING的美观与严谨,多学学美国统计学这个专业为什么能够列为第一(至少曾经),多学学人家每周都会讨论新的统计学方法…
    SAS有它的弊端(比如IML),但是我至今所接触到国内学习SAS的人(包括我在美辉瑞用SAS工作十五年),对SAS的了解程度(不单SAS),对该门语言的机制,对SAS sas help==>proc **==>details的了解…我想说的是,没有人让我满意过,不管是研究生还是博士生,治学要严谨,不要浮躁…
    R,SAS,有人研究过统计学的算法吗?如果我说我崇拜美国的统计学家们,各位莫要生气….
    有人研究过R的并行算法吗?有人读取过上十亿条观念上千个变量的数据吗?
    软件是门很深的学问,特别是统计学,…它需要统计学理论,IT知识(数值计算等)…看看人家SAS的研发团队再说…所以不要单纯的来比较R与SAS,有功夫多去研究统计学理论,如果你上不了高度,多学学R或者SAS别人是怎样将统计学应用于实践中的,再甚者多看看行业的解决方案,
    银行业信用评分复杂吗?理论并不复杂,但是标准很好.再回过头看看中国银行业的信用评分…不敢苟同.
    多做些实际的工作,同志们,不要老让外国人给我们提供解决方案…
    多看看人家的一个软件的架构,看明白了再来提升我国的水平…

    我希望转向基于R的BI架构…但是路还很长很远…
    不要待在学校里谈理想谈抱负,也不要因为学校资源的优势拿到一些社会上的项目就以为自己有多了不起…
    做些实事.希望我以后不要困惑于只能通过google外国网站才能找到帮助.

    1. 顶,现在的学生就是fickleness,我不是统计学专业的学生,不过看着论坛里就SAS和R无休止的争论感觉还是蛮有意思的,统计学在应用上有这么多的争论,这点起码能反映出学科内还是蛮活跃的,但是似乎缺少一些统计学原理的探讨,这点很遗憾。

  37. 呵呵,有争鸣才好了,通过比较,才会发现同类事物的差别。Unix和GNU/Linux|*BSD,GIMP和Photoshop,Matlab和GNU Octave,SPASS和PSPP,AutoCAD和QCAD(Free Version),Inkscape和Coreldraw,都存在类似的关系。今天的R和SAS,其实没有什么特别,如果有以R为服务的公司出现,那就是R走向工业界的开始。例如RedHat,银行也大规模部署此系统了,尽管1991年Linux内核比起正统Unix如此幼小。我个人比较倾向“学院派”:理想化为现实,with Clever Way.

  38. 本菜SAS,R双修,深感此类争论没有必要。。。。
    任何一个用好了,皆是屠龙刀。
    请诸位埋头仔细研究理论和算法。

  39. 我以前一直用SAS,后来接触过R后基本上不怎么用SAS了,只是偶尔需要的时候用一下,把以前SAS写的一些宏也用R改写了。的确在使用上,个人感觉R灵活方便,还免费,SAS的费用不是一般人能承受的起的,一般的高校用的SAS也是经常改改日期,不是每年都掏钱的,没有几个能够每年掏的起那么多钱的。
    从找工作的角度看,本人曾经找过几个postdoc position,尽管最后各种原因拒掉了offer,但是发现能够有offer的其中一个原因就是会用R。
    如果在windows下批处理文件中调用SAS,经常会自动打开sas窗口,这个很讨厌,R没有这个问题。
    萝卜青菜各有所爱,当我一接触R时就喜欢上了R,可以说一见钟情了。

  40. 就我的经历和感觉而言,学习R主要还是因为开源;另一方面也是因为R容易上手,使用者能够快速掌握相关library的使用!就个人的兴趣而言,我一直也想学习SAS,我的出发点是SAS是行业认可的金标准软件!

    以下为题外话:坦率地说,SAS之所以能够成为今天行业统计分析的金标准,一方面是因为她确实强大(例如SPSS没法比),已被无数事实所证明;但是另一方面,可能和他是美帝国的公司是有关系的,因为FDA也是美国人的,在科研界包括医药界唯美国马首是瞻的时代下,美国人当然会运用其影响力,扩大自己的产品!当FDA将其当做唯一标准的时候,SAS强行推广到全世界了!

    一家之言,请勿人身攻击!

  41. 这是我在saslist.net上发的贴子,转于此。
    大部分人都是从统计学的角度谈SAS和R,而且对统计也不太熟。你一小伙子和我这50多岁的老头相比,我当然不如你灵活,可是在职业上我会比你值钱的多。年轻人喜欢宝马的驾驶感,有身份的人喜欢劳斯莱斯的庄重,他们之间是不可替代的。SAS上百种产品岂是一个R能比得了的?Nie就是做梦。做SPSS 40多年也没做出什么名堂,他自身的思路有问题,Revolution根本就救不了他。如果比较SAS和R,就是美国和中国。美国现在变化慢,经济增长慢;中国快。美国人感到了压力:美国真笨,看中国变化多块,多有钱。如果一项一项来比,中国80%不如美国,教育,军事,社保体系,文化,环境……。中国能威胁到美国什么?SAS的领导头脑很清晰,晚安同学就是SAS创新的推动力,SAS R&D的头可不是好当的,压力很大。社会上任何风吹草动,马上就有评论出来,也就一天到两天的反应时间。学院派的有很多特殊情况,他们用什么都是可以理解的,毕竟玩错了,再玩一遍就是了。
    大家都以为SAS变化慢,或没有新东西。其实是客户不希望变化大,就像有的人说的,20年前的知识,也一样使用SAS。科学的东西有定势,不会有大的变化。另外,比起算法来,SAS更关注高速计算,系统的稳定等大的方面。新算法解决问题的能力如何还要看,什么也不是越全越好。很多评论者其实是学院派的背景较浓,希望SAS包括他们了解的新算法。作为商业客户,对此不是那么关注。SAS是两个人的公司。这两个人都是关注技术胜于任何方面的人。利润不是他们的关注点。公司300英亩的园区,各种设施齐全,就像一个小社会。这些都是那些上市公司无法比的。华尔街的大佬们(真正的老板)是不会让他们养那么多的服务人员的。SAS员工不存在没有动力,养老的思维,否则也不会站住行业的最前列。SAS接下来的战役就是对IBM,可以说是生死决战。

  42. SAS确实是很强大的统计分析软件, 不过一般人可能用不起. 另外SAS的软件界面和语法比较原始原始, 软件的入门, 各种模型的参数含义, 这都需要花费很多时间才能搞清楚的. 个人感觉如果是R可以胜任的统计分析功能, 还是用R比较好.

  43. 哈哈突然觉得自己是统计系学生很自豪,不是每个学生都flickleness的,公司还嫌我应该去研究院呢,不过实习以来的确用R比较多,鉴于SAS费用和开放问题,很多都做不了。。

发表评论

电子邮件地址不会被公开。 必填项已用*标注