有时候数据分析的时候,总是需要把数据颠来倒去,从不同的角度分析N遍,SAS不但提供彪悍的统计分析程序,还提供了整理数据的辅助语句,每次都能把数据整理有条有理的。众所周知,SAS在清洗整理数据方面(ETL)的能力强大无比。很多SASor在垂涎和试用R语言提供新奇的分析和绘图模块时,不忘了先在SAS里面把数据整得服服帖帖的。
下面把自己遇到几个不那么常规的矩阵转置收集一下,它们都用到了增加辅助变量这一小技巧,尽管简单,其实都非常实用。
例1, 最近遇到一个需要对数据集进行操作的小问题,在SAS帮助proc transpose里面没找到例子,数据形式如下:

[05/02/2012 14:40:47]
[04/28/2012 13:04:43]由于本科专业是生物信息(可以理解为生物统计学或者与基因数据相关的数据挖掘学科), 所以那时已经开始接触数据挖掘,对统计也算有一定的基础。记得大二的时候,我便开始学用 matlab,然后玩弄SVM,神经网络之类的机器学习算法做一些分析和实验。现在想想那时候可能连这些算法的基本概念都不是很清晰,算是皮毛都不懂。但有一点就是,让我对这类算法不怎么畏惧,甚至于非常感兴趣。本科的时候,发现自己对生物兴趣不大,倒是对编程颇以为是,所以读研又改学了计算机。虽然换了专业,但我对数据挖掘仍然兴趣不减。在研究生阶段,涉及数据挖掘,机器学习, 高级数据库之类的课程我的成绩都是 90+,这至少说明我很用心。总之,读研这几年我也在不断地规划着自己的数据挖掘之路。然而,数据挖掘是门交叉学科,涉及的内容很多,而且还需要理论联系实际,要掌握起来其 实是非常困难的。我曾经非常幼稚地认为,数据挖掘无所不能,适用于各行各业,却忽视了数据挖掘非常难以掌握的一面。首先,要构建完整的数据挖掘理论知识体系;其次,要能够 深入到具体的行业或市场进行具体项目的实战。至于学习数据挖掘的前景,推荐看看一篇博客, 扒一扒这个数据挖掘行业,黄油和面包。这篇文章算是资深人士对数据挖掘行业一点点小小的爆料,感觉对于我这样的初学者来说,有着高屋建瓴的作用。http://saslist.net
学习SAS 源于我当初想去金融行业做分析师的想法,而这个想法又是源自于自己的 MBTi 测试的结论。算起来开始学sas 应该是 10 年下半年的时候,我先是买了一本《SAS 编程与数 据挖掘商业案例》,后是看了《The little SAS book (3rd)》电子版,还有 SAS 认证考试 样题-123 题。我还在 saslist 上建立起了博客,分享了一些学习心得,还有找实习的一些经历。而我对 sas 的学习经历,也就集中在 10 年的下半年这段时间了。后来到了11 年初, 偶然间看到统计之都上,举办第一届数据挖掘挑战赛的信息。我便花了 1 个多月去参加比赛, 再后来便去找实习。到现在不知道自己还会不会继续学习 sas,但 saslist 确实对我的数据 挖掘之路,起着承上启下的作用。在这里很容易让你融入一个学习数据分析,数据挖掘的圈子,很多前辈们的精彩博文都对自己起着极大的鼓舞作用。
[03/28/2012 11:58:07]
[03/21/2012 08:54:38]Map charting, so easy ! 以后再也不担心画地图了。
图1,世界地图 (去掉南极)
美国版以大西洋为中心
图2,世界地图 (去掉南极)
中国版 以太平洋为中心
图3, 亚洲地图
图4,中国地图

前几天oloolo在微薄上推荐一篇文章:SAS CEO Jim Goodnight: Not The Retiring Type,我觉得这篇与我年前一篇SAS评论文章“SAS离免费有多远?” 有一定的关联性。前一篇告诉你SAS使用者现在所困惑的问题,这篇文章则表明SAS官方的观点以及其未来所要关注问题。因此把这篇文章翻译成中文,这样可以增加新手对SAS客观认识,少浪费一点时间来选择统计软件——选择SAS,没错 !
SAS公司CEO——Jim Goodnight先生:永不退休
这一年里,有一些知名的CEO离开了科技工业界。有些人的去向是可预知的,像Sam Palmisano将会今年年底离任IBM的CEO职位,下放担任公司主席;而有些人是令人惋惜的,像Steve Jobs的离世;还有一些人是不体面的,像惠普的Leo Apotheker短期任职的结束。然而,SAS公司的共同创办人兼现任CEO Jim Goodnight先生,今年68岁,仍一如既往并坚定地致力于SAS公司的成功。如同以往,Jim Goodnight从来都直言不讳,保持一直以来的智慧,也不担心被视为保守派。
云计算?“我认为它被过分炒作了。” 近期在他曼哈顿的办公室接受采访时,他说道,“在1970年时,买一台计算机需要花费300万美元,当时计算时间共享是很有意义的,而在今天,计算机是大宗商品,谁都可以买得起。” 他提到因特尔Westmere芯片的计算性能和廉价性,并详述了核心个数、线程,以及能同时进行并行计算。 当然,像IBM、甲骨文和微软等公司加入亚马逊的公共云竞争中,难道那样的处理能力不是足够便宜和满足需求么? “你可以花500美元买一台服务器,放到你桌上,不是一样么?”Goodnight回应道。
SAS2012年1月公布的公司统计数据
SAS是全球商业分析软件与服务领袖,是商业智能市场的最大独立供应商。全球50,000多家企业都在通过SAS软件对数据进行深入挖掘,帮助企业更快、更准确地进行业务决策。自1976年以来,SAS一直向全球客户提供” THE POWER TO KNOW® ”的品牌服务。
客户统计数据
图一,1976年-2011年SAS公司的营业收入曲线图 (来源见原页面链接)
2011年网站年末盘点
2012农历新年马上就要到了,看着湖南卫视的小年夜春晚,不禁想着给自己的博客网站做个盘点,这个想法其实在大家年会的时候就想做了,趁奥尼尔还没出场,赶紧把这个盘点给整了,有些事现在不做,以后永远就不会做了。
自从2010年9月3日开始至今天(2012.1.17),本博客网站共发布了60篇博文,其中2010年16篇,2011年42篇,2012年是2篇,累计访问IP近2W,PV近10W(因为用插件统计,所以有一定的水分,需要打折下)。因为没有类似的博客网站数据和其他类型网站的数据(都没有公布),所以无法横向和纵向比较。大家也随便看看,消遣一下吧,反正有水分。
本站文章包括自己原创评论、网络资源整理、工作信息、书籍点评推荐、转载文章和外文翻译等等内容,下面对本站博文的内容分类和精选才是最真才实料的干货。
史上最强悍的十篇SAS资源整理博文