msgbartop
List for SAS fans and programmer
msgbarbottom

12 5月 11 一篇SAS评论引发的思考 by sxlion


在2009年初,江堂的一篇博文“R与SAS之争:一个导读”描述了国外一家主流媒体纽约时报的一篇报道Data Analysts Captivated by R’s Power引起国外SAS社区和R社区的粉丝们的大讨论。报社记者写报道嘛,肯定会找些社会矛盾点,专业称“焦点”来引起不同人群的注意。为了达到吸引眼球的效果,适当的添油加醋(专业称“润色”)也未尝不可。当然,也不能否定记者的对社会趋势发展的职业敏感性。就这样一场偶然或必然的口水战拉开了。然而,那时并没有引起国内的R粉和SAS粉们注意。

而在2010年4月胡江堂的另一篇在统计之都的博文Think SAS(一)则为了突出SAS,把其他统计软件进行了对比。尽管是客观的对比,不过放在R粉汇集到地方,难免争议。尽管江堂表示了担心,但是还是不可避免地引起广大中文社区的SAS粉和R粉们的罕见的大PK。同为统计分析软件,毕竟R作为后起的免费工具,还是受到很多人的拥护的,并且R作为开源软件允许个人自由发布R包所带来的成就感吸引了很多学院派的亲睐。显然R粉的优越感天然的要强于SAS粉,毕竟大多用盗版SAS的总不如正大光明用R的有底气。

最近(2011年5月)dapangmao在SAS圈子一篇关于SAS软件的评论”SAS, 一个华丽时代的结束(原创by dapangmao)” (经作者同意,转载如下)引起了众多SASor们的讨论,这篇文章很多转载,并且在微博上也很受关注。从正文和众多跟贴来看, SAS软件发展似乎不能跟上目前这个时代快速发展的潮流, 很多SAS粉们纷纷表示出一种担忧, 当然更多的是出于自身职场的考虑。而R粉们则表现出一种旁观的心态,可能缺乏对SAS的了解,更有可能的是他们走的是学术研究的那条学院派道路,和工业界的职场派没有利益冲突。

这次SAS粉们集体唱衰,并不代表SAS处于弱势,只是表达对SAS软件发展较慢而不能有所作为的一种无力感。因为在商业上,纯R无法和SAS较量(在这个时代,个人始终不是团队的对手),即使是可能对SAS造成威胁的R商业版本Revolution, 现在还处于襁褓中,它以后将遇到和SAS同样要面临的商业化所带来的问题。http://saslist.net/

另外,这三篇评论都是SASor作者主导的,说明SAS粉们对SAS软件及公司的思考,也说明SAS粉一般对SAS和R软件都熟悉的。从跟贴看来,R阵营还不够SAS阵营成熟,至少在自我反思方面还不够。面对网络信息的海量暴增和各种新型的商业需求,也许有更新型的数据分析软件来满足数据分析人员的需求。

在这里我们没必要通过比较SAS与R之间的优劣来选择他们中的任意一个,因为这些优劣总是暂时的。因此,我们不如祛噪取精,从正文和回复中了解这两种软件具体在各个细节方面上的长处,以便以后灵活运用。对于数据分析人员来说,他们只是工具的一种。与其花时间犹豫该学那种软件,不如都修炼一番,以便日后业务处理上能够随心所欲,不受工具之困。
 
点击阅读更多

下面除转载大胖猫的原文外,并收罗转载博客和新浪微博的评论,一并展示给大家阅读。

SAS, 一个华丽时代的结束

dapangmao原创

出处:http://mysas.net/sns/space.php?uid=808&do=blog&id=853

我是从2000年左右开始接触SAS的。当时还是本科生,带我的师兄要发表英文文章,杂志要求用SAS,所以需要用SAS做几个ANOVA和t-test。那时候用的SAS是存在十几张软盘上的一个dos程序,还请了高手帮我们破解,很是花了一番功夫。印象深刻的是,第一SAS的data step有一个内循环,初学者不需要基本的循环知识就可以上手,第二可以把数据直接考到程序里面,不需要像其他软件那样需要指定路径,读取硬盘上的文件。所以SAS尤其适合像大胖猫这样不是出身计算机相关领域,但是又想要做一些统计分析的业余选手。后来认真学SAS是05年以后的事情了,来到美国可以用正版的SAS,学习SAS也方便很多了。这时候的SAS是8.2版本了,该有的都有了,Proc SQL也变得很流行。再以后,变化就不大了,9.1有了hash object,9.2有了画图的SG procedures,SAS的老本行,广义线性模式,也升级到了Proc GLIMMIX。今年下半年,9.3也应该面世了。

一直在SAS-L潜水,觉得最近几年邮件组里人气掉的厉害,讨论的话题也一直没有什么变化,倒是跟oloolo这样的新生代大侠学到了一些新的编程风格。Oloolo大侠把一些新的算法和数据挖掘方法整合进SAS,让人耳目一新。还有经常出没SAS-L的 Liu Wensui大侠,也是华人中间的SAS高手。刘大侠的Blog也是学习SAS的好地方,他用macro封装输入-计算-输出的模式是我们规范SAS编程的好榜样,而且他很早就开始使用SAS和R的混合编程(可惜他的blog最近关门了,无缘瞻仰了)。

SAS的疲软,一部分原因是因为SAS自身的因素。SAS开发过SAS/AF和SCL,后来都失败了。一个有经验的SAS Programmer没法转变成为一个SAS Developer。 把所有的模块(Base/STAT/ETS/IML 等等)和系统(PC,UNIX,z/OS)弄过一遍就没有什么好学的了。想自己在SAS里面开发自定义模块,困难重重。另外有很大一部分原因是因为R的挑战。R最近几年的发展让人目不暇接,已经成为定量金融,生物信息学和网络分析领域的行业标准。而这三个领域恰恰是发展最快的三个领域。学习R,很快就能开发自己的package,放到CRAN上面就可以扬名立万。所以从职业生涯考虑。有能力的新人不愿意学习SAS,造成了好的SAS Programmer青黄不接。

R的突飞猛进,一个方面因为它是开源的,学习起来很方便,不像SAS要考虑买许可证或者满世界找盗版。想用什么package,敲几个指令就行了。另外一个方面是因为原来制约R发展的内存瓶颈消失了。像Matlab和R这样的矩阵语言,里面的garbage collector不能像通用型编程语言(Java,Python等等)那样快的清空物件,所以内存很容易不够用。现在是64位时代了,买个4G以上的内存不贵。流行的分布式计算(Map/Reduce, Hadoop, Hive)和云计算也帮助解决了这个矛盾。在Amazon,Facebook,Google的数据中心里面,很容易从几千台机器里面集中几T的内存,跑跑R没有问题。大胖猫用过Amazon的EC2服务,价格很公道,也不用掏钱买另外的机器。而SAS对于比较大的数据,则只有望洋兴叹了。

SAS每年的营业额大概是20亿美元,人数只有它1/3的Teradata的营业额也是这么多。要想提高营业额和利润,把注意力集中在电信,银行,保险,医药这些高端客户,是SAS必然的选择。SAS和Teradata都是历史悠久的老公司,SAS从60年代一个做田间统计的小软件发展到现在横跨各个领域的大家伙,的确不易;Teradata是关系型数据库的开创者,Oracle和Sun都是 这个领域的后起之秀。SAS和Teradata的确也有互补之处;也许未来两者合并,更加符合股东的利益。SAS正在开发的并行procedure就是为Teradata专门设计的。SAS的老板,Dr. Goodnight或者不愿意失去对SAS的控制权,但现实上现在的市场恐怕容不下专门的分析软件公司了。统计软件界另一个和Goodnight齐名的传奇人物,Dr. Nie,果断卖掉SPSS是一个正确的选择,借助IBM的国际影响力,SPSS在世界其他国家卖的还不错。将近七十岁的老聂看到R的潜力,重新创业,现在他的Revolution R看上去发展势头不错。如果他还呆在SPSS,现在的情况就很难说了。

由于SAS是行读入的,所以特别适合整数据,我经常没事到各个论坛找些题换几种做法做做,其实跟电脑游戏一样好玩。感谢SAS帮我学会了统计和编程,伴我度过异国他乡的漫漫长夜。虽然属于SAS的华丽时代不会再有,但我仍会纪念开创那个时代的伟大的SAS程序员。Old SAS programmers never die, they just fade away.

以下是来自中文SAS圈子的回复:http://saslist.net/

  • oloolo 2011-04-30 22:13
    胖猫写得不错哟
    我等老朽靠SAS还能吃个10年饭,以后只有进入管理层方没有被裁之忧虑。
    从比较优势的角度讲,有水平的人反而应该更多投入SAS开发新算法,特别是数据挖掘的新算法,毕竟这方面的SAS牛人没有R那边那么多。
  • shiyiming 2011-04-30 23:33
    同赞,与奥利奥持同样观点,吾辈老矣,但是还能靠SAS吃饭。尽快专管理吧。
  • superkuhasu 2011-05-01 14:46
    其实sas在扩展开发和辅助dll使用方面很方便。只不过大部分人不知道或者不用而已。凡是新算法,都是可以通过dll调用实现的,内部sas,其实很多proc也是如此结构。很多人觉得sas臃肿庞大,其实说白了,就是基础处理比R强,发展时间比R长的巨型R,而R和matlab在新算法方面很有优势,但是R在扩展应用和跨平台使用方面就相当差了。SPSS是因为竞争失败,才卖给IBM,因为IBM之前的Congo(似乎是这个名字),效果比较差,而且SPSS的商业解决方案比较完全。Revolution从一开始成立的时候就没少给我发邮件,但是真东西我现在还没见,所以这方面实在无法判断。而就大数据来看,集群服务器和云计算的东西,sas在gnu这方面比较差,还是与算法相关的,matlab的即便支持,其实也是有条件的,R在这方面比较菜,而大数据方面,显然sas的地位没有任何动摇。
  • superkuhasu 2011-05-01 14:47
    另外sas的最大问题就是开放性差,相当差,而且总部并无开放的意思。
    比如一个neural proc,他就是不开放下,搞得像把拟合统计量改改都不行~
  • superkuhasu 2011-05-01 14:54
    对了,你们有没有感觉时代的进步在放慢?甚至有停滞不前的倾向?
  • yatming 2011-05-01 21:43
    最近有幸和一位Teradata的架构师聊起,不得不承认,从后台DB/Server节点部署到ETL的开发到OLAP的内部机制模式,一套solution确实是很有实力的,不过一旦提到前端的Miner,这位仁兄还是感叹了一下:还是用SAS/ACCESS Teradata吧。
    其实扩展性方向,虽然这方面不是很了解统计软件,但对于数据处理的ETL工具而言,大多数工具的Mapping也基本提供了面向dll和jar的扩展开发。比如DataStage,INFA等。
  • yatming 2011-05-01 21:50
    superkuhasu: 其实sas在扩展开发和辅助dll使用方面很方便。只不过大部分人不知道或者不用而已。凡是新算法,都是可以通过dll调用实现的,内部sas,其实很多proc也是如此结构。很多人

    嗯,没错,Cognos在olap界属于比较流行的工具了,多维数据库的机理也比较前沿。一般Olap工具的Miner及Analysis的功能都比较有限,这次和SPSS的整合,利用其统计分析的基础,期待在前端这方面能有一个较全面完整的应用。

  • dapangmao 2011-05-01 23:04
    呵呵,表态的都是奋斗在SAS一线的老战士。一篇小拙文,bug很多,内部交流好了,请大侠们多多斧正。
  • shiyiming 2011-05-01 23:41
    dapangmao: 呵呵,表态的都是奋斗在SAS一线的老战士。一篇小拙文,bug很多,内部交流好了,请大侠们多多斧正。

    都是各位战友的肺腑之言,字字珠玑句句有声。我个人觉得SAS公司内部高层需要新生代的改革,的确很多年的变化不大。

  • jingju11 2011-05-02 03:54
    我很喜欢阅读此类的对于SAS作出横向的软件之间的对比以及纵向的回顾和预测性的文章,虽然其准确性和客观性本身往往很可能存在巨大之争议。从我个人的知识和经验来看,有几点也许需要澄清。
    第一,        什么是SAS程序员?我把其简单地对译为英语里的SAS programmer。找了几年的工作,对于这个单词差不多耳熟能详或许刻骨铭心(有爱也有恨)。因为自己专业的限制,我只是简单地关心统计相关里的SAS programmer。据我所知,无论是银行,科研,医疗还是其他的类似机构等等,SAS programmer们其实只是在被动地使用SAS(一些技巧也只是小聪明而已哦),和开发根本沾不上边。而这部分人里,大多数人根本谈不上精通SAS(从统计意义上讲或许有人精通,你很难去精通一门本身往往有很多地方不通的语言。学统计的不在乎,因为其自身的编程逻辑往往是受赐于作为第一门语言SAS),因为使用充其量只是皮的部分,而且也只是皮的某个局部而已。而SAS“很简单”的理论也是从这部分人里有声或者无声发出的。因为他们正在触摸SAS最柔软光滑而令人倍感舒适的部分。从这个层面来讲,SAS programmer和类似的C programmer根本不可混为一谈。准确地讲,定义为SAS user应该更加准确一些。也是因为是使用者,我们反而具备了更大的灵活性,从而无虞于和SAS公司同命运。因为我们差不多在某种程度上都兼备了解EXCEL, R/SPLUS, SPSS, STATA等等软件的能力和基础。说白了,从SAS转到其他的统计软件大概只是月余而已(虽然还是不精通)。这是我的SAS工具论。
    第二,        SAS的奇迹绽放与统计学的发展密不可分。统计经历了从‘因为不理解而忽视’发展到了‘即使不理解也采用’的阶段。举个例子:医学杂志。现在很难发现一家发表医学文章而不要求提供统计方法的杂志。十年以前可是迥然不同。Statistical Editor是个蛮崭新的职位。直到现在它的设立也存在着很大的争议。从直观上讲,概率的意义已经变得很容易理解而且深入人心,虽然常常充满在某种程度上的误读。一个事实是,现在没有人会幼稚到去反驳任何的成功都带有偶然性的说法。在中国,即使是一个农民,也不再宣扬真命天子一类的宿命学说。他们知道了只要有所行,就有可能会成功或者改变自己的命运。好的医学发现,或者说值得推广的发现,得经得起统计的验证。从这一点来讲,对于一个实验来说,意味着什么?需要更多的老鼠,病人,需要更准确的对问题的定义和设计,需要更精准的统计方法。正是基于对于统计过程的要求和追求,造就了SAS和一大批类似的软件的产生发展并存(有一种主席的百花齐放的意味,虽然在我们中国从来没有真正意义上的鸣放。但是在西方这一点,无论是政治上还是科学上,都做的比我们要好。咱们中国最相信阶层论。最典型的是城市对农村的歧视。有一点值得注意的是曾饱受歧视的农村孩子一旦入了市,就义无反顾地加入继续歧视父亲的大军。题外话)。从这一点来讲,SAS有其存在的合理性了。这是我的SAS存在论。
    第三,        SAS对于其他统计软件的优势。不谈劣处。首先是SAS不仅仅是统计软件。因为我不懂所以我不谈。只局限于统计方面的好处。SAS是现在市面上至于人的能动性和被动性结合的比较好的软件之一。比较SPSS,SAS有更多的灵活性而不是规范;比较R,SAS提供的东西显得成熟稳固。斯坦福的TIBSHIRANI 是北美统计上的领军人物(其实‘领军’这样的词汇是我中国式思维和话语的产物。北美的科学霸权是比较柔和的。会议之前我看到Robert TIB一个人,手里端着咖啡,背后的背包塞了满满的东西,然后坐在一个长凳上整理讲稿。其实TB在统计上很有名。想一想BOOTSTRAP, GAM MODEL, DATA MINING, etc)。他讲LASSO理论。他说,他的LASSO算法的核心在R软件包里只是76行Fortran code。我听到旁边的一个听众嘀咕了一句,如果不理解他的理论的话,谁敢用他的程序?这差不多也放映出R的一个特点。譬如在文革贴大字报,据估计,清华在最高峰的三天之内大概贴出10万张大字报,可是从现在看,我们都很难读到一本关于大字报的系统整理和论述。人人都要贴,没有愿意阅读。人人都要有所建树,底层的东西却是甚少人有兴趣。所以在R里很难找到比拟于SAS里的proc means/summary那样的对基线连续变量的综合报告,在R里需要一系列的方程去综合,从使用的角度上说,不好。因此R的低端用户常常感到很沮丧:我要的是一盘菜填饱肚子,我不要自己操刀掌勺。在R我常有的疑惑的是,我的程序为什么没有错误?一切都是静悄悄的。当检查结果,或许会发现,结果的逻辑不对。不报告优化过程的优化结果总是令人将信将疑。我的设想的是,或者R更合适的角色应该灵敏度检验而不是常规的分析报告。对于SPSS我总是记住某个将讲师的一句话,Just Click Click Click(SPSS当然不止于此。我看到许多医学院的学生都用SPSS,但是聊聊感觉是他们常常不很清楚自己在做什么)。
    第四,        总而言之我要说,如果是统计为主业的,SAS只是工具。SAS不存在了,还有ASS,ASS1, Big ASS, small ASS。。。(当然不可避免的是每一个都会有漏洞)。我们对SAS的依赖性其实并不很大。依赖性大的是SAS的雇员(true SAS programmer)。最他们来说,他们丢失的是一个谋生的平台(这是我新近舶来的新词汇),对于我们来说,只是,只是一把椅子吧。我们要做的是从这把椅子换到另外的一把(但愿不会是更好更舒适的沙发(平台)啊)。另外统计很难学。如果我说(其实是别人说的)即使是一流的科学杂志里的文章的统计方法有一半以上都存在着说不去的错误(低级),你或许会看出统计的重要性,以及由于缺乏常规训练而导致的统计人才的缺乏。从SAS看统计,只是数字而已。而统计本身,是一种理念。这种理念的培养是知识和应用的结合。也是对二者的调和。而数学嘛,是单调的前者,蹇涩而又艰辛。又扯远了。。。
    京剧
  • dapangmao 2011-05-02 07:24

    感谢京剧兄回复。我最喜欢京剧兄的文章了,每次都那么细致,有条理。建议施站加精收藏。

    首先申明一下,本猫是铁杆SAS programmer,这么多年来对SAS是痴心不改,从没变心过。写这篇小破文,也是因为最近有两件事,有感而发。Mysas里面都是自己人,关起门聊聊吧。

    第一件事源自跟SAS里面的一个朋友的几次通信聊天。该朋友是SAS/IML项目的一个头,某藤校PhD毕业,SAS里面工作了好多年,对IML爱的是不得了。我有次对他说9.3就要来了,Proc FCMP是不是会加强一点,俺用它做矩阵运算做的好辛苦。此公大怒,说要做矩阵运算,肯定是IML,别的想都不用想。我说,大哥,好多地方的机器没有装SAS/IML,很多网管都没听说过IML,我写了也没法用啊。Proc FCMP虽然挫,但是属于SAS/BASE里面的,装SAS的机器都会有,至少可以用啊。另外,有点奇怪的是,他坚信所有的SAS程序员都会用IML。本猫虽然是IML的三角猫,但也算会一丁点,见过很多SAS programmer都不会用了。我对他说,你们SAS应该改改吧,把Proc IML 放到Base或者STAT里面,卖SAS/IML许可证的那点钱不赚也罢,否则再过几年会SAS/IML的programmer就绝种了。他说,这个问题要向晚安同学(Jim Goodnight, SAS的老板)汇报。现在还没消息,估计没戏了。还有一次,我说,SAS IML Studio不兼容R2.12.0以后的版本,是不是出了问题。他说查查。过了几天,他说,找到了,里面的几个DLL出了问题,组里正在抢修,9.3肯定能兼容R2.12.0。我倒。。。。我机器现在跑的是R2.13.0,那不是要等到SAS9.4以后了,大胖猫估计那时已经老死了。

    第二件事是跟Revolution R打的几次交道。Revolution R是老聂同学(Norman Nie, SPSS的前老板)开的一个卖R商业版本的公司。他们的小秘不知道怎么找到我的电话,说能不能跟我找几个他们公司的工程师聊聊技术上的需要,正好我那段时间闲的蛋痛,就说,行啊,聊就聊呗。好家伙,他们拉了好几个工程师,一聊就聊一下午,每次讲的我口水都干了。虽然胖猫在一个白天没啥鸟事,晚上鸟没啥事的小破地方上班,但也禁不住他们轮番轰炸啊。最后一次,我跟那个哥们说,哥们,你们硅谷创业型公司,不是据说都是一天干10个小时以上的英雄好汉吗,怎么跟俺一样闲啊;俺就一做SAS的马仔,你再跟我怎么说,我也不能掏钱买你们的软件。那哥们说,这是他们老板逼的,再忙也一定要了解潜在客户的需要。钱没有问题,老聂把卖SPSS的钱都压在上面了,就是要在闭眼之前灭了SAS。我说,得,哥们,俺没时间再给你扯了,再扯俺这破饭碗也端不住了。另外,我感觉,R阵营比较开放一点,比如俺最近的一篇关于如何用SAS调用R做图的博文,就被Revolution R的宣传官David Smith放在他们公司的官方博客上面。相对而言,SAS就没有那么关心客户的需要了,对用户社区的建设也不太给力。可能公司历史太悠久了,某些制度就僵化了,不如小的,新的公司有活力了。

    我很赞同京剧兄的观点,什么软件都是工具,重要的是统计方法。但大胖猫不能像oloolo和施站这样已经升到管理层的大牛可以坐看云卷云舒花开花落,还是得关注一下技术的发展,让简历的卖相好一点。所以写这篇文章跟大侠们讨论讨论,希望有点收获。

  • superkuhasu 2011-05-02 12:22
    SAS的支持其实很好,只不过之前都是sas使用者自发的,现在人们都慢慢忙自己的事情,不少稍微复杂点儿的问题,以前的老鸟也是没时间,没精力,没热情那么考虑。而sas,其实是一直对其用户提供相当不错的服务的。
    反正我觉得,sas多了竞争对手,尤其R和Revolution,都是相当好的。内部估计9.3已经出来了,但是很多之前的牛人都退休了,导致sas的使用越来越被逼的得自己开发些东西才够用,而且有时候相关调用比较麻烦,得靠sas外解决。而在机器学习相关算法方面,sas比matlab,根本没法儿比,所有算法如果sas想用,必须转换代码,而sas对内存的控制,matlab又没法儿比,这两方面R都有问题,而且R在模型代码生成方面,相当弱。
  • oloolo 2011-05-02 20:24
    听说SAS内部政治斗争很厉害,各人抓一个PROC,而且一般如果有较大改动就偏好重新上新的PROC,比如HPMIXED和MIXED。胖猫能不能去打听一下。
  • yugao1986 2011-05-02 22:37
    jingju提到SAS与统计,今天遇到国内统计一老牛(吴喜之),像他老人家
    等级做统计的很多选择了R,究其原因因为R更灵活,随其心。反过来想,SAS
    还有做灵活的空间。
  • jingju11 2011-05-02 23:08
    灵活本就是双刃的东西。Rcode本身未必灵活,但是R提供更多的选择而已。而太多的选择就造成了两个影响:1.和工作中的规范相抵触2.人人都学得好的错觉。
  • superkuhasu 2011-05-03 19:57
    oloolo: 听说SAS内部政治斗争很厉害,各人抓一个PROC,而且一般如果有较大改动就偏好重新上新的PROC,比如HPMIXED和MIXED。胖猫能不能去打听一下。

    SAS毕竟是商业产品,不同模块要考虑客户的问题,以及产品整合的问题。这种一个人/一个组负责一个模块/几个模块的模式,并不是公司的内部斗争,只是初衷为更好的方便客户跟进和debug。HP类的与普通类的,其实是两类产品,而就文件来讲,是不同的dll。

  • sxlion 2011-05-04 01:09
    技术是不断的在进步和发展。SAS软件本身的诟病一直都有,并且改进速度很慢。但是当看到其他一些SAS同类型的软件在飞快的进步时,作为一个普通的SASor难免有SAS失去优势的担心。SAS公司的高福利和稳定,使得它成为这几年最受员工欢迎的公司,其实任何事情都有两面。高福利和稳定意味着缺少人事变革和危机感。面对现在技术发展如此快速,老同志们很稳很安心,但难免跟不上时代的步伐;年轻人得不到重要职位和决定权,带有领先和风险的新技术不会立刻上马实现。双刃剑效应在这个年代被加倍放大。
    随着新型网络产品的出现,数据分析人员需求增加,要求也在提高。作为一个数据分析或挖掘人员,相比之下,明显的切身感觉到SAS进步速度缓慢,不免产生忧患感。尽管R目前不能撼动SAS在商业领域的地位,但R在新需求下绽放出来的勃勃生机和无限可能性;在加上最近SAS的一个老对手SPSS委身嫁入豪门的事实。种种对比下来,于是这种负面情绪更是得到助长,SASor们难免有些悲观。转向学习R和其他相关软件成为SASor们求得安全感手段之一,当然,有管理才能的也想尽快从技术岗位升级为管理岗位,也是求得安全感的手段之二了。
    因此尽管上面客观的技术问题是老生常谈的话题,但是那种谈话中SASor的优越感不如以往那么强烈,或者说是渐渐丧失。我突然想到一个不是很恰当的比喻:如果说SAS是一个帝国,那么SASors就是广大通过付出辛勤劳动而得到帝国惠泽的屁民们。皮之不存﹐毛将安傅 !也许现在只是暂时的PK失势,大家不可妄自菲薄。
  • superkuhasu 2011-05-04 11:43
    sxlion: 技术是不断的在进步和发展。SAS软件本身的诟病一直都有,并且改进速度很慢。但是当看到其他一些SAS同类型的软件在飞快的进步时,作为一个普通的SASor难免有SAS失去优

    没那么夸张,金融业现在还是sas是老大。只不过是我们要求太高,走的太快而已~

  • jingju11 2011-05-05 00:07
    我把越来越多的时间花在R上。没有办法,他们要求旧问题新思路新方法。sas这一点不灵。“SAS公司的高福利和稳定,使得它成为这几年最受员工欢迎的公司,其实任何事情都有两面。。”几年以前,沃尔玛也是全球第一受员工欢迎的公司。可是想一想他们的员工的80%以上获取最底层的工资,让人好奇这个头衔是怎么来的。没有好的公司只有好的岗位;没有好的岗位,只有你到底有多幸福。
  • oloolo 2011-05-05 12:08
    jingju11: 我把越来越多的时间花在R上。没有办法,他们要求旧问题新思路新方法。sas这一点不灵。“SAS公司的高福利和稳定,使得它成为这几年最受员工欢迎的公司,其实任何事情都

    要发论文,还是R最好,没有版权问题,新方法一大把,做应用很方便。在公司做,最怕有风险,还是SAS稳妥。

    PS:说起最佳雇主这个东西,似乎98年的时候克莱斯勒是最佳雇主之一,10年后烂得跟屎一样。这种公司还是工程师来当领导最好。福特原来是个会计去当了CEO,结果也是烂得跟屎一样了,只要成本低,别的啥都不要,好么,屎了;董事会后来请来波音的老总来当CEO,立马不一样了,2年出了好几款世界品质的新发动机;新野马BOSS版就算是硬轴肌肉车在赛道上也跟宝马M3不分高低,当真士别三日当刮目相待。好么,又跑题了。

以下评论来自新浪微博http://saslist.net/
  • 波顿余安:感觉既不客观,也不深入。。。不过可能是属于缅怀性文章。。。就算了。。。
  • @吃桃的猫:不明白为什么会有这样论点。建议作者起码搞清2个问题:1. 若从模块宽度来比较,作者只是仅仅基于自身对有限几个SAS模块的认识来比较,有点盲人摸象。SAS的作用岂会仅限于STAT/ETS/OR等基础模块,实际在,它在风控、市场、财务上都有一整套解决方案,建议作者全面进行比较。2. 从应用深度来说,大部分SAS模块无论从功能和应用上都博大精深,比如常见的做几个回归、聚类模型这些各家都能做的以外,高端决策所用的精算、市场可持续发展设计等,建议作者也应该再仔细进行比较。
  • sxlion 回复@iDustbin: SAS在商业地位暂时还是无人可及的。这一点可以放心,现在是广大SASor居安思危的阶段。(5月5日 13:06) // iDustbin 时代在进步,再没有常青树!希望SAS的华丽退去的慢一点,虽然现在很少用,但还是希望它依然强大//@康涅狄格州xieliang:转发!(5月5日 13:02)
  • 庖丁的刀:R 语言【特点】1.基于库的形式调用组件。2.开源【结论】逐步代替SAS
以下评论来自统计之都http://saslist.net/
  • dengyishuo:R最大的竞争对手SAS已经遥遥欲坠了,如果R与SAS之间有一场战争,那么SAS的角色是袁绍,R是曹操。后者铁定要统一天下,只是时间问题。
  • ruikoeln:瞻仰大牛呢,,,怎么读起来有点悲凉的意思。本人是用R的,梦想就是在2年后开发出自己的package. SAS的今天缘于它的垄断和封闭,虽然现在它仍然是行业的金标准。但是,生命力远不如R.大概不远我们就可以看到R的真正繁荣了。人气啊,还是人气!!!SAS的市场必定在未来收到挑战,就像谷歌挑战微软一样的,GNU才是大势所趋。

 

原创文章: ”一篇SAS评论引发的思考 by sxlion“,转载请注明: 转自SAS资源资讯列表

本文链接地址: http://saslist.net/archives/128


Reader's Comments

  1.    

    SAS太死板了,不是所有分析方法都有固定模式的,灵活便捷非常重要。

    Reply to this comment
    •    

      我的感觉是,开始很多情况下,因为自己对SAS了解有限,功夫修炼不到家,才会感到SAS不方便。后来慢慢深入学习SAS后,才发现SAS不是一般的灵活。所谓方便快捷,完全看个人 的SAS修炼水平了。这个对于很多软件也是一样的,熟能生巧。

      SAS软件本身确实提供了各种灵活的可能性,越学越发现SAS的博大精深。

      Reply to this comment
      •    

        可能主要是因为SAS的语法不是那么主流(C、Python、Matlab、R等),学起来觉得怪怪的,要绕个弯子;这个门槛让很多像我这样的初学者不大喜欢。

        Reply to this comment
        •    

          恩,SAS有自己的一套语法规则,76年就开始了,可谓是古老的语言。当然,她一直在发展,老树发新芽。但毕竟他是商业软件,要求不同版本间的代码具有向上兼容性。形成这样新老语言混搭风格,简直是程序语言界的一朵”奇葩“(非褒义,哈哈)!

          SAS语言种族多(很多语言种族相互独立),并且各种族语言深度不一,发展进化程度也差距很大,各语言入门门槛不一(见文SAS语言管窥),这种客观存在的原因导致各模块语言的成熟度和难度差距很大。

          而作为一个一般的SAS程序员根本无法全面掌握SAS,并且SAS语言程序员们的层次水平相差巨大。常常看到新手哭诉SAS有多么难,多么坑爹,而同时SAS论坛(这里说的是中文)的学习氛围不那么好,比如有人问没人答,有人答没人懂。

          不是人人都可以学好SAS的,因为这些东西都要靠自己摸索总结。很多SAS程序员的博客曲高和寡,也是因为看得懂的人不多。

          有句老话,就做会者不难,难者不会。喜不喜欢,看个人口味吧。

          Reply to this comment
  2.    

    举例?

    Reply to this comment
  3.    

    大部分人都是从统计学的角度谈SAS和R,而且对统计也不太熟。你一小伙子和我这50多岁的老头相比,我当然不如你灵活,可是在职业上我会比你值钱的多。年轻人喜欢宝马的驾驶感,有身份的人喜欢劳斯莱斯的庄重,他们之间是不可替代的。SAS上百种产品岂是一个R能比得了的?Nie就是做梦。做SPSS 40多年也没做出什么名堂,他自身的思路有问题,Revolution根本就救不了他。如果比较SAS和R,就是美国和中国。美国现在变化慢,经济增长慢;中国快。美国人感到了压力:美国真笨,看中国变化多块,多有钱。如果一项一项来比,中国80%不如美国,教育,军事,社保体系,文化,环境……。中国能威胁到美国什么?SAS的领导头脑很清晰,晚安同学就是SAS创新的推动力,SAS R&D的头可不是好当的,压力很大。社会上任何风吹草动,马上就有评论出来,也就一天到两天的反应时间。学院派的有很多特殊情况,他们用什么都是可以理解的,毕竟玩错了,再玩一遍就是了。

    Reply to this comment
  4.    

    大家都以为SAS变化慢,或没有新东西。其实是客户不希望变化大,就像有的人说的,20年前的知识,也一样使用SAS。科学的东西有定势,不会有大的变化。另外,比起算法来,SAS更关注高速计算,系统的稳定等大的方面。新算法解决问题的能力如何还要看,什么也不是越全越好。很多评论者其实是学院派的背景较浓,希望SAS包括他们了解的新算法。作为商业客户,对此不是那么关注。SAS是两个人的公司。这两个人都是关注技术胜于任何方面的人。利润不是他们的关注点。公司300英亩的园区,各种设施齐全,就像一个小社会。这些都是那些上市公司无法比的。华尔街的大佬们(真正的老板)是不会让他们养那么多的服务人员的。SAS员工不存在没有动力,养老的思维,否则也不会站住行业的最前列。SAS接下来的战役就是对IBM,可以说是生死决战。

    Reply to this comment

Leave a Comment