msgbartop
List for SAS fans and programmer
msgbarbottom

12 1月 14 SAS与R优缺点讨论:从工业界到学界


SAS与R的优缺点讨论:从工业界到学界

翻译 by JosephYX  校对 by sxlion  原文链接

导读:尽管这个话题已经讨论过很多次,但是这个翻译是比较系统的总结了一下两个软件的优缺点,值得一看。PS: 此话题已老,推荐新人看,另见以前一篇SAS评论引发的思考 by sxlion

摘要

尽管在工业界还是被 SAS 所统治,但是 R 在学术界却得到广泛的应用,因为其免费、开源的属性使得用户们可以编写和分享他们自己的应用。然而,许多正在获得数据分析相关学位的学生们由于缺乏 SAS 经验的情况而在找工作的路上困难重重,与此同时,他们要面对从学校熟悉的 R向 SAS 转型的痛苦。理想情况是,你需要知道所有可能的编程语言,工作的时候使用与工作情况最匹配的那个,当然这个基本上是痴人说梦。我们的目的就是展示这两种差异巨大的语言各自优点,并且共同发挥他们的优势,我们同时还要指出那些不使用 SAS 好多年的、现在正在使用 R语言的人们的一些误解和偏见,因为他们已经很少关注 SAS 的发展和进步了。

 前言

我们选取 SAS 和 R 的原因是因为他们是目前在统计领域中最有统治地位的两个编程语言。 现在我们注意到一个不好的现象,就是在学术界重度使用R的用户认为R在被SAS霸占的工业界有具有相当优势的,然而熟练掌握这两个软件对于想在数据分析领域取得小有成就的年轻人来说很关键。教授误解加上对某个软件的偏好往往对学生有着不利的引导,因此需要在这里指出:教授们,别偷懒了,对某种语言的主观偏好将会影响学生的钱途。

SAS经常有一些更新(有点慢,sxlion注),非SAS程序员由于没有技术跟进往往并不知情。SAS绘图模块就是一个快速发展并成长的例子,然而许多人并不注意到这些升级以至于他们仍然固执的使用 R画图。SAS另一个不广为人知的例子是SAS可以轻松自定义函数,这正是 R 的强项。这个SAS过程步(PROC)有全面的语法检查、翔实的文档和技术支持;然而一个新的使用者很可能不知道这些工具可用,或者根本不知道它们的存在。另外,SAS 还拥有卓越的培训课程,网络及用户组分享资源,不同相关主题的大量书籍。知道并合理的使用这些技术以及工具 有助于减少使用 SAS的畏惧之心。

 相关问题讨论

本文就在我们学院碰到的一些共同误解的地方,在此对比列出两种语言的优缺点。当然还有更多的争论在进行中,但是本文汇中我们将选取最为普遍的来进行讨论。我们希望能够消除误解,并且尽可能地为那些不能及时跟进R或SAS的分析人士提供新的信息。

统计方法的新进展

SAS

  • Ÿ  优点:SAS 的软件及算法都是经过检验的,SAS 有技术支持去快速解决用户的需求。 如果需要的话,SAS  会尝试在已存在的步骤中嵌入新的方法,例如增加一个选项或者新增一个语句(statement),因此用户不需要学习另外一个过程步。SAS也 会发布最新通讯来详细说明软件的更新。
  • Ÿ   缺点:更新升级较慢。

R

  • 优点:用户可以快速实施新方法,或者寻找已经存在的软件包。很容易学习和理解新方法,因为学生们可以看到代码中的函数。
  • 缺点:R 文档的更新都是通过用户进行的,所以新的方法并没有被很好调试和检验。 开发者们散布于各地,而并没有在一起来进行团队合作的开发。

在这个问题上,SAS 和 R 的优缺点是互补的。对于 R,有人认为它的代码是开放的,可以看到 R 是如何工作的,这对于拥有相关背景的人是比较容易理解的。然而对于 SAS,它的过程步是预装的,文件中对不同的语句(Statement)及选项( Option) 存储了大量的数学公式。如果用户真的想看到底层程序,这个也是很容易实现的。对两种语言的使用着者来说,不管是学生还是其它用户,只是运行代码的话对于两种语言是没有什么不同的。你运行SAS,不需要知道它在干什么,类似的是,你运行R时,也不需要知道它在后台调用的函数。你所做的就是按章操作而已。

 画图 (更多…)

原创文章: ”SAS与R优缺点讨论:从工业界到学界“,转载请注明: 转自SAS资源资讯列表

本文链接地址: http://saslist.net/archives/370


12 5月 11 一篇SAS评论引发的思考 by sxlion


在2009年初,江堂的一篇博文“R与SAS之争:一个导读”描述了国外一家主流媒体纽约时报的一篇报道Data Analysts Captivated by R’s Power引起国外SAS社区和R社区的粉丝们的大讨论。报社记者写报道嘛,肯定会找些社会矛盾点,专业称“焦点”来引起不同人群的注意。为了达到吸引眼球的效果,适当的添油加醋(专业称“润色”)也未尝不可。当然,也不能否定记者的对社会趋势发展的职业敏感性。就这样一场偶然或必然的口水战拉开了。然而,那时并没有引起国内的R粉和SAS粉们注意。

而在2010年4月胡江堂的另一篇在统计之都的博文Think SAS(一)则为了突出SAS,把其他统计软件进行了对比。尽管是客观的对比,不过放在R粉汇集到地方,难免争议。尽管江堂表示了担心,但是还是不可避免地引起广大中文社区的SAS粉和R粉们的罕见的大PK。同为统计分析软件,毕竟R作为后起的免费工具,还是受到很多人的拥护的,并且R作为开源软件允许个人自由发布R包所带来的成就感吸引了很多学院派的亲睐。显然R粉的优越感天然的要强于SAS粉,毕竟大多用盗版SAS的总不如正大光明用R的有底气。

最近(2011年5月)dapangmao在SAS圈子一篇关于SAS软件的评论”SAS, 一个华丽时代的结束(原创by dapangmao)” (经作者同意,转载如下)引起了众多SASor们的讨论,这篇文章很多转载,并且在微博上也很受关注。从正文和众多跟贴来看, SAS软件发展似乎不能跟上目前这个时代快速发展的潮流, 很多SAS粉们纷纷表示出一种担忧, 当然更多的是出于自身职场的考虑。而R粉们则表现出一种旁观的心态,可能缺乏对SAS的了解,更有可能的是他们走的是学术研究的那条学院派道路,和工业界的职场派没有利益冲突。

这次SAS粉们集体唱衰,并不代表SAS处于弱势,只是表达对SAS软件发展较慢而不能有所作为的一种无力感。因为在商业上,纯R无法和SAS较量(在这个时代,个人始终不是团队的对手),即使是可能对SAS造成威胁的R商业版本Revolution, 现在还处于襁褓中,它以后将遇到和SAS同样要面临的商业化所带来的问题。http://saslist.net/

另外,这三篇评论都是SASor作者主导的,说明SAS粉们对SAS软件及公司的思考,也说明SAS粉一般对SAS和R软件都熟悉的。从跟贴看来,R阵营还不够SAS阵营成熟,至少在自我反思方面还不够。面对网络信息的海量暴增和各种新型的商业需求,也许有更新型的数据分析软件来满足数据分析人员的需求。

在这里我们没必要通过比较SAS与R之间的优劣来选择他们中的任意一个,因为这些优劣总是暂时的。因此,我们不如祛噪取精,从正文和回复中了解这两种软件具体在各个细节方面上的长处,以便以后灵活运用。对于数据分析人员来说,他们只是工具的一种。与其花时间犹豫该学那种软件,不如都修炼一番,以便日后业务处理上能够随心所欲,不受工具之困。
 
点击阅读更多 (更多…)

原创文章: ”一篇SAS评论引发的思考 by sxlion“,转载请注明: 转自SAS资源资讯列表

本文链接地址: http://saslist.net/archives/128