《SAS编程演义》推荐语
by sxlion
作者抱着朴素的助人初衷和与大家分享SAS编程经验的愿望,开始了写书历程,并保持着高昂的写作热情直到本书完成。据我所知,准备或部分完成SAS书稿的SASor(SAS爱好者的代称)不少,其中包括像我这样的鸡血分子,但是能够忍受重复编辑文字代码过程数日长时间的枯燥和保持追求更好一点的耐心,坚持到出版那一刻的SASor却屈指可数。纵览全书,作者在分析了市场上已有SAS参考书籍特点的基础上,给了本书一个较好的定位,填补了当前SAS实用编程书籍的较大缺口。本书章节内容丰富、编制合理,各章节富有层次和逻辑感,从各要点的选择与偏重就可见一斑。以绘图章节为例,中文SAS书籍基本上缺失了画图编程内容,即使有也是粗略的介绍,并无实质参考性。本书画图章节首先全面介绍SAS三种绘图功能模块,然后选择功能较强、上手较为容易的ODS(Output Delivery System)图形系统作实例绘图实现方式,运用逐步提问的方式,展示各类系列图形编程示例,举例丰富、又有一定的深度,较为全面的讲解了各种绘图编程方法。内容上安排匠心独具,实用性参考性很强。
显然,任何一本书,都不可能解决学习工作中的方案设计、数据收集、整理、分析及绘图展示等数据方面的所有问题,但是本书所叙内容对于SAS编程要素的解读、数据操作与管理、基于数据的绘图与制表等等均有实用参考功能和启发引导作用。因此,此书可作为不同编程水平层级的SASor案头常备书。
再次为作者的勤奋和诚意点赞!
邵小龙
原创文章: ”《SAS编程演义》推荐语“,转载请注明: 转自SAS资源资讯列表
本文链接地址: http://saslist.net/archives/442
2013已至,春节将至,本博距上次更新已经有两个月了。一个不成熟的观点一直在酝酿,到现在为止,还不大成熟。不过有些事情,现在不写,以后恐怕就也没有机会写了。
大数据,皇帝新装
这几天,终于可以闲下来了,翻翻了给俺家闺女准备的童话读物——《安徒生童话》,于是重新温故了下小时候读过的《皇帝的新装》。读完感觉:经典就是经典,这个世界有时候就是那么简单的重复着,故事老套,几百年都可以不变,情节都可以一样。 记得2000年左右上大学那会,一句“21世纪,是生物学的世纪” ,害得多少莘莘学子挤破脑袋去抢报生物专业。四年后,要么毕业去卖假药,比如“鳖精”、“红桃k”,“太阳神”等等;要么一条道读到黑——从硕士,博士,圣斗士,到烈士。现在不知多少“受害学子”在追问是谁不负责任的乱说 (注:这里不是埋汰学生物的人,这些都是学生物的同学跟我的吐槽)。类似的“21世纪是XX的世纪”可多了,什么“计算机的世纪”,“互联网的世纪”,“厨师的世纪”,最近还出了个“大数据的时代”。不扯远了, 还是谈谈童话吧, 皇帝爱衣服, 要新装;大臣爱皇帝,要皇帝开心;百姓爱大臣,要维护大臣;骗子爱金子,要卖衣服给皇帝。 于是生意就这么成交了,大家都开心了。本来新装游行都是这么顺利地,成功地进行,也是值得庆祝的。最讨厌的是安徒生, 偏偏安排个小朋友,说了那么一句不和谐的话,搞得这则童话变笑话,一直流传到现在。 想想,大数据,不就是这么回事么。 这个世界需要创新(未考证), 政府们需要业绩(真的), 科学家们需要拿课题(真的),厂家们需要卖硬件/软件(千真万确!!!,看看SAS的HPA和SAP的HANA硬件需求)。就这样,新的一场新装游行开始了,奥巴马的“新能源”不吸引人了,赶紧上新货——“大数据”,哄选民很重要。于是政府点头,科学家们牵头开会, 硬件软件厂商搭台,各方互动开始,大家有兴趣,可以看看我2012年收集的微博资讯——会议信息。 http://saslist.net
原创文章: ”2013评点——怎么才能成为数据分析专家“,转载请注明: 转自SAS资源资讯列表
本文链接地址: http://saslist.net/archives/310
原创文章: ”SAS资讯 from 新浪微博 – 2012-10-03“,转载请注明: 转自SAS资源资讯列表
本文链接地址: http://saslist.net/archives/290
原创文章: ”SAS资讯 from 新浪微博 – 2012-09-03“,转载请注明: 转自SAS资源资讯列表
本文链接地址: http://saslist.net/archives/285
CATS和CATX函数
这两个函数用于连接字符串。函数CATS首先去掉每个要连接字符串的首尾空格。CATX也会去掉首尾的空格,并且还会在每个字符串之间插入分隔符(CATX函数的第一个语句)。
这些函数需要非常注意的点是结果的存储长度,如果没有预先定义,默认是长度200。而你使用连接符号(||或!!)只是这些连接字符串长度之和。
如果你有一系列的变量如Base1-Basen,你可以在列表前使用关键词‘OF’。最后,列表中的值可以是字母,也可以说数字。如果一些语句是数字,SAS将会把数字当作字母对待,并且不会在SAS log里面出现转换信息。
下面的例子示意这些函数字母操作去掉空格,函数CATX字母插入分隔符。
程序17
1 2 3 4 5 6 7 8 | data join_up; length Cats $ 6 Catx $ 13; String1 = 'ABC '; String2 = ' XYZ '; String3 = '12345'; Cats = cats(String1,string2); Catx = catx('-',of String1-String3); run; |
图17:程序17的输出结果
Cats Catx
ABCXYZ ABC-XYZ-12345
COUNT和COUNTC函数
SAS有两个计数函数,COUNT和COUNTC。它们之间的区别就像FIND和FINDC。COUNT计算一个子字符串在一个字符串中出现的次数,COUNTC计算单独字母在字符串中出现的次数。这些函数的语句和FIND和FINDC一样。第一个语句是你想要搜索的字符串,第二个语句是子字符串(COUNT)或一列字母(COUNTC)。最后你可以在第三个语句中使用可选的修饰符,其中修饰符‘i’(忽略大小写)最有用了。 (更多…)
原创文章: ”SAS函数精选三 翻译“,转载请注明: 转自SAS资源资讯列表
本文链接地址: http://saslist.net/archives/284
下面是Dr. Ron Cody的一篇关于SAS函数的文章,非常好的函数介绍文章。曾经在2009年SAS公司(上海)举办的一次SASor聚会上,我做了一次关于SAS函数的presentation分享,见 ppt和正文,我发现竟然有部分内容重合。 我个人非常喜欢SAS系统提供的函数,建议老手新手都可以读读下面的文章,祝都有所获!
by Dr. Ron Cody 翻译 sxlion
摘要:
SAS函数为你的数据步(DATA step)编程提供惊人的能力。有一部分SAS函数是精华,能够帮助你节省大量不必要的代码。这篇文章内容覆盖其中最有用的一些SAS函数。有些函数可能对你来说有些陌生,然后她们将会改变你的编程方式,并助你轻松完成日常的编程任务。
介绍:
本文写到的大部分函数都与字符数据有关,这些函数的功能包括搜索字符串,查找和替代字符串,或连接字符串,还有些函数能测量两个字符串之间的距离(这对于“模糊”配对非常有用)。一些最新和最叹为观止的函数还以Call例程的形式存在。你知道怎么用函数在同一个观察值进行排序吗?你知道你不仅可以定位一列变量中极大或极小值,而且可以定位到第二位、第三位最大或最小的值? 如果你觉得上面的介绍能够吸引你的兴趣,请继续往下读! http://saslist.net
SAS是怎样存储字符值的?
在我们讨论字符函数之前,了解SAS怎样存储函数值非常重要。为了帮助讨论,你首先需要理解两个重要的字符函数:LENGTHN和 LENGTHC。
LENGTHN和 LENGTHC
这两个函数返回字符值的长度信息,其中LENGTHN返回未计算后缀空格语句的长度。LENGTHC返回字符变量的存储长度。你也许对旧的SAS函数LENGTH比较熟悉,大部分情况下函数LENGTH和LENGTHC返回同样的值。有一个例外的是,当语句里是缺失值时,LENGTH函数返回的是1,而LENGTHN返回0。有一些新函数看起来是在旧函数后面加个字母“n”,这里的“n”代表“空字符串”(“null string”)。在SAS9中,长度为0的字符串概念被引进。在大多数情况下,如果你看到一个你似曾相识的新函数(比如说新函数TRIMN, (更多…)
原创文章: ”SAS函数精选一 翻译“,转载请注明: 转自SAS资源资讯列表
本文链接地址: http://saslist.net/archives/282
这是一份迟来的面经,本来是2011年3月就发布到SASlist,鉴于作者当时刚到SAS公司工作, 为避免不必要的问题,一年后经作者本人同意后再次发布出来,与大家分享。里面有很多真实的公司面试场景和问题,以及一些作者本人非常实用的建议,值得木有任何经验的在校生一读。另外从本站的几份求职面经看来,积极主动是每一个成功求职者的必备特质。当然,混论坛,QQ群,微薄很重要啊,信息时代获取工作信息的新途径。
SAS公司面经 for 在校生
by Chris.zhang
————前言
从口头offer到现在已经过了两天了,答应了自己要写一篇详细的面经。与其说是面经,倒不如说是自己在这条路上是怎样的成长,不求这篇胡思乱想脱口而出之文能给大家多少借鉴,只愿成为同为大四的各位在求职慢慢长路中的一盏明灯,指向你我心中的理想。互勉!
与其他人比起来,我的求职路似乎非常非常短暂,算多了就那么2个月,而投简历方式更像传说中的非主流。招聘网站的网申基本全军覆没,招聘会更是一次比一次惨。不过在一次次的惨败后吸取经验,总结技巧,最终追求到自己梦寐以求的公司的录取通知。
地球人都知道我是一个懒鬼,十分讨厌做重复无效率的工作,故甚少网申。幸运的是知道我是懒鬼的人包括自己,深知对于懒鬼这个种族来说笨鸟先飞是如此的重要,所以早在大四前的暑假自己就开始制作中英简历。(简历在面经之后我会写下一些自己的见解)。由于早早就定了找工作的方向,应聘的时候就更加有针对性了。http://saslist.net/
与SAS中国的相遇非常非常偶然,从来没想过自己有机会能进SAS公司,最多也只是希望能够在医药,金融行业能找到一份与SAS有关系的工作就不错了。为什么?一是SAS中国的招聘要求比较苛刻,基本上都属于社招的,要工作经验不说还需要master or above的学历,二是在很多都是招研发类的,虽然说自己的SAS技能还算可以,但可是上帝要给人机会,你挡也挡不住的。还记得那是星期五的早上,刚电面完一家上海招SAS数据挖掘的公司,由于感觉不好心情也就一般般,郁闷地对着电脑屏幕反省下自己。这时有猎头在SAS的QQ群发布招聘信息,是关于SAS中国招聘技术支持的,这条信息我记得在mysas那里看过,由于要求那里标明4-8年工作经验把我直接秒杀掉,所以没多理会。不过机会来到自己的眼前,不是应该去争取吗?便联系上猎头。 http://saslist.net/
我:你好,请问您是替SAS公司招人还是招SAS Programmer呢?
猎头:替SAS公司招人,你有兴趣么?
我:有,不过我只是本科,而且还没有毕业。
猎头:你能不能把CV发给我看一下呢?
原创文章: ”心有多远,你就能走多远~loves in SAS“,转载请注明: 转自SAS资源资讯列表
本文链接地址: http://saslist.net/archives/274
由于本科专业是生物信息(可以理解为生物统计学或者与基因数据相关的数据挖掘学科), 所以那时已经开始接触数据挖掘,对统计也算有一定的基础。记得大二的时候,我便开始学用 matlab,然后玩弄SVM,神经网络之类的机器学习算法做一些分析和实验。现在想想那时候可能连这些算法的基本概念都不是很清晰,算是皮毛都不懂。但有一点就是,让我对这类算法不怎么畏惧,甚至于非常感兴趣。本科的时候,发现自己对生物兴趣不大,倒是对编程颇以为是,所以读研又改学了计算机。虽然换了专业,但我对数据挖掘仍然兴趣不减。在研究生阶段,涉及数据挖掘,机器学习, 高级数据库之类的课程我的成绩都是 90+,这至少说明我很用心。总之,读研这几年我也在不断地规划着自己的数据挖掘之路。然而,数据挖掘是门交叉学科,涉及的内容很多,而且还需要理论联系实际,要掌握起来其 实是非常困难的。我曾经非常幼稚地认为,数据挖掘无所不能,适用于各行各业,却忽视了数据挖掘非常难以掌握的一面。首先,要构建完整的数据挖掘理论知识体系;其次,要能够 深入到具体的行业或市场进行具体项目的实战。至于学习数据挖掘的前景,推荐看看一篇博客, 扒一扒这个数据挖掘行业,黄油和面包。这篇文章算是资深人士对数据挖掘行业一点点小小的爆料,感觉对于我这样的初学者来说,有着高屋建瓴的作用。http://saslist.net
学习SAS 源于我当初想去金融行业做分析师的想法,而这个想法又是源自于自己的 MBTi 测试的结论。算起来开始学sas 应该是 10 年下半年的时候,我先是买了一本《SAS 编程与数 据挖掘商业案例》,后是看了《The little SAS book (3rd)》电子版,还有 SAS 认证考试 样题-123 题。我还在 saslist 上建立起了博客,分享了一些学习心得,还有找实习的一些经历。而我对 sas 的学习经历,也就集中在 10 年的下半年这段时间了。后来到了11 年初, 偶然间看到统计之都上,举办第一届数据挖掘挑战赛的信息。我便花了 1 个多月去参加比赛, 再后来便去找实习。到现在不知道自己还会不会继续学习 sas,但 saslist 确实对我的数据 挖掘之路,起着承上启下的作用。在这里很容易让你融入一个学习数据分析,数据挖掘的圈子,很多前辈们的精彩博文都对自己起着极大的鼓舞作用。
原创文章: ”我的数据挖掘之路 by wrchow“,转载请注明: 转自SAS资源资讯列表
本文链接地址: http://saslist.net/archives/252
2011年网站年末盘点
2012农历新年马上就要到了,看着湖南卫视的小年夜春晚,不禁想着给自己的博客网站做个盘点,这个想法其实在大家年会的时候就想做了,趁奥尼尔还没出场,赶紧把这个盘点给整了,有些事现在不做,以后永远就不会做了。
自从2010年9月3日开始至今天(2012.1.17),本博客网站共发布了60篇博文,其中2010年16篇,2011年42篇,2012年是2篇,累计访问IP近2W,PV近10W(因为用插件统计,所以有一定的水分,需要打折下)。因为没有类似的博客网站数据和其他类型网站的数据(都没有公布),所以无法横向和纵向比较。大家也随便看看,消遣一下吧,反正有水分。
本站文章包括自己原创评论、网络资源整理、工作信息、书籍点评推荐、转载文章和外文翻译等等内容,下面对本站博文的内容分类和精选才是最真才实料的干货。
史上最强悍的十篇SAS资源整理博文
原创文章: ”SAS资讯 from 新浪微博 – 2011-07-15“,转载请注明: 转自SAS资源资讯列表
本文链接地址: http://saslist.net/archives/147