msgbartop
List for SAS fans and programmer
msgbarbottom

30 11月 12 SAS公司发展史 by 刘政

导读:本文节选自SAS中国公司总经理刘政先生于2012年底受邀到全国各大高校所做的学术报告ppt,这部分介绍SAS公司历史及科技发展史,对SAS公司感兴趣的同学可以看看。

 

 

(更多…)

28 11月 12 SAS高性能数据分析 by 刘政

导读:本文节选自SAS中国公司总经理刘政先生于2012年底受邀到全国各大高校所做的学术报告ppt,报告共分为两个部分:1,SAS公司历史及简介;2,大数据与SAS高性能数据分析。为了突出重点,本站于2012年11月28日选择第2部分发布。

 

(更多…)

14 11月 12 SAS公司历史全知道一

SAS公司历史全知道一

by sxlion 

2011年美国最大的计算机专业杂志PCMAG杂志列出了科技界领袖的专属富豪榜中,SAS公司联合创始人兼CEO James Goodnight(硬翻译成“晚安”) 以69亿美元位居富豪榜第八。 如果不是因为使用SAS软件的原因,我相信大多数人不知道Goodnight这个人,他绝对够低调。另外,他也是美国北卡罗来纳州首富。

在上个世纪,SPSS,BMDP和SAS被称为国际三大统计软件,后来BMDP被 SPSS收购,SPSS今年又被IBM收购。SPSS收了BMDP以后就晾一边,晾没了,如今连域名bmdp.com处于待售状态。SPSS前老板老聂Norman Nie把SPSS卖给IBM后,自己捣腾个做R商业版本的公司Revolution R,看来老聂把BMDP和SPSS整垮了,还不甘心。不过看不出Revolution有什么前途,如今只剩下晚安老头孤独求败了。 from: http://saslist.net

图1.  Goodnight和他收藏的岩石、矿石、化石和陨石

        (更多…)

19 10月 12 SAS资讯 from 新浪微博 – 2012-10-03

SAS资源资讯  第 26 期 微博汇
 
秋天这么美,你还在电脑前面跑SAS吗?
  最新资讯
  1. 转发微博//@中国统计网: 【新闻:IBM宣布收购英国数据分析公司Butterfly】9月25日消息,据国外媒体报道,IBM收购了英国软件公司Butterfly Software。这个收购交易的金融条款没有披露。Butterfly是一家私营数据分析与迁移软件公司,总部位于英格兰的梅登黑德。全文:http://t.cn/zlLf4vv  [09/25/2012 10:52:23]
  2. //@SAS杨旭: 介绍很详细。 //@粄1394:Dremel主要特点:它是一个大规模系统,是MR交互式查询能力不足的补充,其数据模型是嵌套(nested)的,数据是用列式存储的,结合了Web搜索 和并行DBMS的技术。//@yankay: Google Dremel 原理 – 如何能3秒分析1PB http://t.cn/zWEC68v [09/18/2012 21:51:58]
SAS招聘
  1. SASor 招聘//@Kevin猎头: 数据分析师(杭州、上海)1)5~10年数据相关工作的从业经验,至少3年及以上商业智能分析工作的从业经验;2)熟悉#数据挖掘#的常用算法; 3)熟悉常用商业分析工具,如SAS、spss、 matlab;4)熟悉常用报表开发工具,如BO、COGNUS、BIEE等;5)熟悉PL/SQL,了解主流数据库oracle、 mysql;欢迎推荐! [09/26/2012 15:59:07]
  2. SASor 招聘 (更多…)

17 10月 12 SASor界吐槽若干

没事就爱在微博上搜“SAS”关键词,据不完全统计,发现与SAS有关的95%微博都是SASor对SAS的各种吐槽。精选其中一部分,分享各种欢乐 ! SASlist.net

纯文字版

1, 学SAS才发现,智商是硬伤。

点评:我看别人学SAS,也有同样的发现。 by oloolo

 

2,  一天一夜,只为下个SAS。。。  by 寒月里

点评:你值得拥有!  You  deserve it !

 

3,  sas课实在太难,大家都拿着手机对着屏幕拍照,希望能捕捉到老师写的代码,此起彼伏的咔嚓咔嚓声,让我有种置身发布会现场的错觉。 by 暴君小邹

点评:SAS耍的就是大牌。 http://SASlist.net

 

4, 这里是SAS课,台上老师突然问:“现在是2013年对吧?” “…….”  数統的都是些神。 by 朱珣碧是强大的变形金刚微博达人

点评:你的老师肯定是用的盗版软件! http://SASlist.net

 

5, 妹的SAS,我电脑和你有仇!为毛同一个安装文件,同一道程序,就我的不行! 是我太爱你了嘛?!!  by chenyA玲

点评: 论坛月经贴,微博日经贴。 http://SASlist.net

 

配图版 (更多…)

18 9月 12 SAS资讯 from 新浪微博 – 2012-09-03

SAS资源资讯  第 25 期 微博汇
SAS软件将逐步对国内高校免费
别犹豫了,赶紧让你们的系主任申请吧!!!
最新资讯
  1. Big news: 2012年8月,SAS公司对中国部分大学开放免费使用SAS软件,第一批免费使用的高校是北大和人大。出处:http://t.cn/zWj9AMd 目前进展情况是:北大,人大已经安装使用,上财正在申请中。[08/13/2012 00:07:31]
  2. //@innovate511: 不愧是大数据技术霸主//@云计算_行业七彩云://@马伟民_:转发微博//@雷锋网: 【Google Dremel让大数据不再“恐怖”】Hadoop是“大数据”时代的核心,但它需几分钟或几个小时才能执行完任务,而Google新开发的Dremel技术则是专门为即时查询而生,它能同时执行多个查询操作,且时间极短,可以说Dremel的出现让大数据变得“渺小”了起来。http://t.cn/zWnfz1o 也将开辟一个新时代。 [08/26/2012 12:01:56]
  3. 数据分析人员的未来角色。//@数据分析精选: 谷歌的首席经济学家Hal Varian多次强调,下一个十年将出现一类新的专业人才:数据科学家。数据可视化工程师是其中一种,他们既懂得数据分析的科学,又精通构图的艺术,集讲故事的能力和艺术家的特质于一身,是大数据时代的导航员。这样的人才,去哪里找?如何培养? (更多…)

03 9月 12 SAS函数精选三 翻译

系列:  SAS函数精选一           SAS函数精选二

 

CATS和CATX函数

         这两个函数用于连接字符串。函数CATS首先去掉每个要连接字符串的首尾空格。CATX也会去掉首尾的空格,并且还会在每个字符串之间插入分隔符(CATX函数的第一个语句)。

         这些函数需要非常注意的点是结果的存储长度,如果没有预先定义,默认是长度200。而你使用连接符号(||或!!)只是这些连接字符串长度之和。

         如果你有一系列的变量如Base1-Basen,你可以在列表前使用关键词‘OF’。最后,列表中的值可以是字母,也可以说数字。如果一些语句是数字,SAS将会把数字当作字母对待,并且不会在SAS log里面出现转换信息。

         下面的例子示意这些函数字母操作去掉空格,函数CATX字母插入分隔符。

程序17

1
2
3
4
5
6
7
8
data join_up;
length Cats $ 6 Catx $ 13;
String1 = 'ABC ';
String2 = ' XYZ ';
String3 = '12345';
Cats = cats(String1,string2);
Catx = catx('-',of String1-String3);
run;

图17:程序17的输出结果

Cats         Catx

ABCXYZ    ABC-XYZ-12345

COUNT和COUNTC函数

         SAS有两个计数函数,COUNT和COUNTC。它们之间的区别就像FIND和FINDC。COUNT计算一个子字符串在一个字符串中出现的次数,COUNTC计算单独字母在字符串中出现的次数。这些函数的语句和FIND和FINDC一样。第一个语句是你想要搜索的字符串,第二个语句是子字符串(COUNT)或一列字母(COUNTC)。最后你可以在第三个语句中使用可选的修饰符,其中修饰符‘i’(忽略大小写)最有用了。 (更多…)

03 9月 12 SAS函数精选二 翻译

系列:  SAS函数精选一              SAS函数精选三 

 

SUBSTR函数

         如果你需要从一个字符串中提取一个子字符串,你需要SUBSTR函数。需要提醒一下的是,有个函数SUBSTRN非常像SUBSTR,就是多了一些额外的特征。我不知道这些特征是否经常被需要,因此本文选择描述稍微简单的函数SUBSTR。

         此函数的第一个语句是输入字符串,第二个语句是你想要提取字符串的开始位置,第三个是,可选语句,设定子字符串的长度。如果你忽略第三个语句,函数将提取输入字符串中最后一个非空字母,也就是说,它忽略输入字符串的后面的空格(这个特征非常有用)。

         在我们继续例子之前,理解默认长度这个概念非常重要。比如说,在下一个程序中,如果你没有写LENGTH语句,SAS将仍然需要设置一个长度给State。对于这个函数,默认长度等于函数第一个语句的长度。你不能使得从字符串提取的子字符串长于字符串本身。很多其他的SAS字符函数默认长度为200。需要保证的是,具有这个功能的函数需要在DATA步中包含LENGTH语句。最好是包含LENGTH语句,即使是不需要,这样是没有风险的。http://saslist.net/

         下面是一个使用SUBSTR函数的简单例子。

程序9

1
2
3
4
5
6
7
8
9
data pieces_parts;
input Id $9.;
length State $ 2;
State = substr(Id,3,2);
Num = input(substr(Id,5),4.);
datalines;
XYNY123
XYNJ1234
;

         这里是你想要提取州号码(从位置3开始,一共两位),ID的数字部分从位置5开始。注意你忽略数值提取中的第三个语句。这个非常有用,因为有的数字是3个字符长,有的是4个字符长。这个例子中,你使用INPUT函数将字符转化为数值。

         图9,程序9的输出结果

    Id       State     Num

 XYNY123      NY       123

 XYNJ1234     NJ      1234

使用等号在左边的SUBSTR函数

         在早期学SAS的时候,等号在左边的SUBSTR函数被称为是SUBSTR假函数。据我所知,这是SAS唯一等号在左边的函数。下面是它的用途:

         允许你用新的字符来替代已有字符串中的字符。这个听起来挺复杂的,但是你通过下面的程序看到,这实际上是很直接的方式。下面的程序使用SUBSTR函数(等号在左边的)来遮住帐号的前五个字符。 (更多…)

01 9月 12 SAS函数精选一 翻译

下面是Dr. Ron Cody的一篇关于SAS函数的文章,非常好的函数介绍文章。曾经在2009年SAS公司(上海)举办的一次SASor聚会上,我做了一次关于SAS函数的presentation分享,见 ppt正文,我发现竟然有部分内容重合。 我个人非常喜欢SAS系统提供的函数,建议老手新手都可以读读下面的文章,祝都有所获!

最有用的一些SAS函数
A Survey of Some of the Most Useful SAS Functions

by Dr. Ron Cody   翻译 sxlion

摘要:

     SAS函数为你的数据步(DATA step)编程提供惊人的能力。有一部分SAS函数是精华,能够帮助你节省大量不必要的代码。这篇文章内容覆盖其中最有用的一些SAS函数。有些函数可能对你来说有些陌生,然后她们将会改变你的编程方式,并助你轻松完成日常的编程任务。

 介绍:

         本文写到的大部分函数都与字符数据有关,这些函数的功能包括搜索字符串,查找和替代字符串,或连接字符串,还有些函数能测量两个字符串之间的距离(这对于“模糊”配对非常有用)。一些最新和最叹为观止的函数还以Call例程的形式存在。你知道怎么用函数在同一个观察值进行排序吗?你知道你不仅可以定位一列变量中极大或极小值,而且可以定位到第二位、第三位最大或最小的值? 如果你觉得上面的介绍能够吸引你的兴趣,请继续往下读! http://saslist.net

SAS是怎样存储字符值的?

 在我们讨论字符函数之前,了解SAS怎样存储函数值非常重要。为了帮助讨论,你首先需要理解两个重要的字符函数:LENGTHN和 LENGTHC。

LENGTHN和 LENGTHC

        这两个函数返回字符值的长度信息,其中LENGTHN返回未计算后缀空格语句的长度。LENGTHC返回字符变量的存储长度。你也许对旧的SAS函数LENGTH比较熟悉,大部分情况下函数LENGTH和LENGTHC返回同样的值。有一个例外的是,当语句里是缺失值时,LENGTH函数返回的是1,而LENGTHN返回0。有一些新函数看起来是在旧函数后面加个字母“n”,这里的“n”代表“空字符串”(“null string”)。在SAS9中,长度为0的字符串概念被引进。在大多数情况下,如果你看到一个你似曾相识的新函数(比如说新函数TRIMN, (更多…)

01 8月 12 SAS资讯 from 新浪微博 – 2012-08-01

SAS资源资讯 第 24 期微博汇
周末,心情最重要,上图 !
新美国梦——美国西部,感谢 @沈浩老师  的美图。[07/30/2012 22:27:33]
行业前沿资讯
  1. 高质量的大数据人才更缺。//@大数据: SAS软件总经理刘政在第二届@大数据 论坛表示:大数据人才短缺,欧美公司也在中国寻找人才,但他们不知道中国本身大数据人才更匮乏。将来一个国家的竞争力很大程度上决定于分析人员,要通过数据分析结果做决策。所以分析人员的水平对于国家和企业的竞争力来说都是非常重要的。重要补充:刘总本次演讲全文(点击)。 [07/18/2012 21:40:33]
  2. 第一代国产CDO诞生。//@datathinking: 欢迎和创新哥多多讨论这方面,收益很多//@innovate511: 数据进入高层,算第一步吧,其实要知道CDO凭什么进入高层,估计很多朋友还没想明白, (更多…)