SASor论坛回忆录
by sxlion
论坛,也叫BBS,是一种伴随互联网络初期出现的古老技术交流系统。尽管现在各种现代化的社交媒体如博客、微博等出现,仍然没有一种技术来替代它。话说学SAS编程技术,有人在大学课堂和机房里学的,有人在公司里学的,有人是在蓝翔学的(未经考证),但是大部分人都是自学的。在学习初期不管是SAS软件、资料,还是遇到各种学习问题,基本上都是找论坛解决的,因为没有吊丝买得起软件和SAS公司推出的各种官方培训课程。http://saslist.net
说起学SAS编程技术,中国那家论坛强?老SASor(即SAS编程爱好者的自称)也许能如数家珍地说出以下几个论坛:国内的有SASor论坛,SAS中文论坛,统计之都论坛SAS版,人大经济论坛SAS版等等,国外的有UGA大学邮件列表SAS-L,末名空间统计版,SAS社区论坛等等。作为一个混论坛出生的SAS编程爱好者,我和普通的SASor初学者一样,为了解决问题和资料,2003年开始混迹各大论坛。http://saslist.net
有一天,我的小小世界观被SASor论坛上SAS_Dream的两篇《关于SAS的零碎印象》和《SAS语言管窥》文章震撼了。在这之前,我曾天真地认为会熟练使用几个统计过程步就是SAS高手,因为至少在我当时的圈子里,就是这么定义“高手”的。后来认真拜读了偶像SAS_Dream每个帖子,帖帖都是经典。很多帖子都是不明觉厉,从帖子中感觉偶像对计算机语言和操作系统了解很深,都不是一般的功力(你要是不服,看看这个历史帖子:何种方式最有效地得到数据表的观测数?)。所谓人外有人,天外有天。从他的一个回帖中意外发现偶像也有偶像,id为“data _null_;”。 光看这个id,就觉得这个绝对是SAS骨粉。这位神级老前辈现在还在UGA的SAS_L上经常出现,异常活跃,回帖中看似轻描淡写,实则高深莫测,深度广度远在SAS HELP之上。http://saslist.net
大家如果现在去网上寻找偶像SAS_Dream的帖子的话,你会发现除了上面的两篇文章因为被转载而流传下来外,没有其他足迹留下。SASor论坛(最早网址:www.sasor.com)也在2010 年左右由蓝色色调改成红色色调以后,不久就在网上烟消云散了,只剩下一个域名广告页sasor.feoh.net。某年有幸在微博上碰到SASor论坛的网站站长imoen,简单的交流了一下,只知道网站临时换了个地方。在以前站记里面了解到,当年imoen凭个人兴趣维护一个技术论坛花费许多精力,需要持久的热情和奉献。“SASOR论坛:SAS爱好者网站,为SAS爱好者提供一个信息交流平台,使大家有个互通有无之地。”简单一句话,做起来不易。作为一个长期在编程语言排行榜上排名20名(国外排名,国内没数据)左右徘徊的古老语言SAS的中文论坛,人气可以用青黄不接来形容。http://saslist.net
尽管如此,野百合也有春天,SASor论坛里面也有很多话题高潮起伏的时段。记得有一段是在2005年左右,一群SASor为了解决一个个实际问题,在里面用代码论战,各种精彩分层。藏龙卧虎,高手辈出,不分年龄,毋论出身,有时还会引来一些美女SASor来调剂气氛,巾帼不让须眉,代码也都是有声有色。论坛里没有虚伪奉承和利益冲突,也没有人生公鸡,只有一段段自鸣得意的代码。可惜美好的时光不长久,春去秋来,草长莺飞。论坛id后面一个个现实生活中的SASor,或结婚生子,或迁徙他乡,或跳槽转行,人生变幻,几度春秋,论坛里新人经常有,故人不常在。美好时光,竞成稀缺的回忆。作为另一个专门的中文SAS论坛——SAS中文论坛,与SASor论坛互为兄弟论坛,境况类似,特别是这几年在尝试社交圈子和改版后,人气暴跌。和站长shiyiming有个几次聚会见面,谈到过往,不禁唏嘘。除了这两个论坛外,国内还有些综合性论坛下面有SAS版块,大多忙着交换资料和软件下载安装信息,为入门者提供了些许方便。但是大多都是好贴不常有,高手不常在,无法形成当年的氛围。http://saslist.net
网络技术发展很快,建设论坛技术到傻瓜自动的程度。然而,曾经几时,我也想着做一个SASor论坛,大家可以互通有无、交流切磋SAS编程技术。可惜无法忍受着人气凄凉的预期,于是就开了个人博客网站,写着些自娱自乐的技术文章。
原创文章: ”SASor论坛回忆录“,转载请注明: 转自SAS资源资讯列表
本文链接地址: http://saslist.net/archives/391
2013已至,春节将至,本博距上次更新已经有两个月了。一个不成熟的观点一直在酝酿,到现在为止,还不大成熟。不过有些事情,现在不写,以后恐怕就也没有机会写了。
大数据,皇帝新装
这几天,终于可以闲下来了,翻翻了给俺家闺女准备的童话读物——《安徒生童话》,于是重新温故了下小时候读过的《皇帝的新装》。读完感觉:经典就是经典,这个世界有时候就是那么简单的重复着,故事老套,几百年都可以不变,情节都可以一样。 记得2000年左右上大学那会,一句“21世纪,是生物学的世纪” ,害得多少莘莘学子挤破脑袋去抢报生物专业。四年后,要么毕业去卖假药,比如“鳖精”、“红桃k”,“太阳神”等等;要么一条道读到黑——从硕士,博士,圣斗士,到烈士。现在不知多少“受害学子”在追问是谁不负责任的乱说 (注:这里不是埋汰学生物的人,这些都是学生物的同学跟我的吐槽)。类似的“21世纪是XX的世纪”可多了,什么“计算机的世纪”,“互联网的世纪”,“厨师的世纪”,最近还出了个“大数据的时代”。不扯远了, 还是谈谈童话吧, 皇帝爱衣服, 要新装;大臣爱皇帝,要皇帝开心;百姓爱大臣,要维护大臣;骗子爱金子,要卖衣服给皇帝。 于是生意就这么成交了,大家都开心了。本来新装游行都是这么顺利地,成功地进行,也是值得庆祝的。最讨厌的是安徒生, 偏偏安排个小朋友,说了那么一句不和谐的话,搞得这则童话变笑话,一直流传到现在。 想想,大数据,不就是这么回事么。 这个世界需要创新(未考证), 政府们需要业绩(真的), 科学家们需要拿课题(真的),厂家们需要卖硬件/软件(千真万确!!!,看看SAS的HPA和SAP的HANA硬件需求)。就这样,新的一场新装游行开始了,奥巴马的“新能源”不吸引人了,赶紧上新货——“大数据”,哄选民很重要。于是政府点头,科学家们牵头开会, 硬件软件厂商搭台,各方互动开始,大家有兴趣,可以看看我2012年收集的微博资讯——会议信息。 http://saslist.net
原创文章: ”2013评点——怎么才能成为数据分析专家“,转载请注明: 转自SAS资源资讯列表
本文链接地址: http://saslist.net/archives/310
这是一份迟来的面经,本来是2011年3月就发布到SASlist,鉴于作者当时刚到SAS公司工作, 为避免不必要的问题,一年后经作者本人同意后再次发布出来,与大家分享。里面有很多真实的公司面试场景和问题,以及一些作者本人非常实用的建议,值得木有任何经验的在校生一读。另外从本站的几份求职面经看来,积极主动是每一个成功求职者的必备特质。当然,混论坛,QQ群,微薄很重要啊,信息时代获取工作信息的新途径。
SAS公司面经 for 在校生
by Chris.zhang
————前言
从口头offer到现在已经过了两天了,答应了自己要写一篇详细的面经。与其说是面经,倒不如说是自己在这条路上是怎样的成长,不求这篇胡思乱想脱口而出之文能给大家多少借鉴,只愿成为同为大四的各位在求职慢慢长路中的一盏明灯,指向你我心中的理想。互勉!
与其他人比起来,我的求职路似乎非常非常短暂,算多了就那么2个月,而投简历方式更像传说中的非主流。招聘网站的网申基本全军覆没,招聘会更是一次比一次惨。不过在一次次的惨败后吸取经验,总结技巧,最终追求到自己梦寐以求的公司的录取通知。
地球人都知道我是一个懒鬼,十分讨厌做重复无效率的工作,故甚少网申。幸运的是知道我是懒鬼的人包括自己,深知对于懒鬼这个种族来说笨鸟先飞是如此的重要,所以早在大四前的暑假自己就开始制作中英简历。(简历在面经之后我会写下一些自己的见解)。由于早早就定了找工作的方向,应聘的时候就更加有针对性了。http://saslist.net/
与SAS中国的相遇非常非常偶然,从来没想过自己有机会能进SAS公司,最多也只是希望能够在医药,金融行业能找到一份与SAS有关系的工作就不错了。为什么?一是SAS中国的招聘要求比较苛刻,基本上都属于社招的,要工作经验不说还需要master or above的学历,二是在很多都是招研发类的,虽然说自己的SAS技能还算可以,但可是上帝要给人机会,你挡也挡不住的。还记得那是星期五的早上,刚电面完一家上海招SAS数据挖掘的公司,由于感觉不好心情也就一般般,郁闷地对着电脑屏幕反省下自己。这时有猎头在SAS的QQ群发布招聘信息,是关于SAS中国招聘技术支持的,这条信息我记得在mysas那里看过,由于要求那里标明4-8年工作经验把我直接秒杀掉,所以没多理会。不过机会来到自己的眼前,不是应该去争取吗?便联系上猎头。 http://saslist.net/
我:你好,请问您是替SAS公司招人还是招SAS Programmer呢?
猎头:替SAS公司招人,你有兴趣么?
我:有,不过我只是本科,而且还没有毕业。
猎头:你能不能把CV发给我看一下呢?
原创文章: ”心有多远,你就能走多远~loves in SAS“,转载请注明: 转自SAS资源资讯列表
本文链接地址: http://saslist.net/archives/274
由于本科专业是生物信息(可以理解为生物统计学或者与基因数据相关的数据挖掘学科), 所以那时已经开始接触数据挖掘,对统计也算有一定的基础。记得大二的时候,我便开始学用 matlab,然后玩弄SVM,神经网络之类的机器学习算法做一些分析和实验。现在想想那时候可能连这些算法的基本概念都不是很清晰,算是皮毛都不懂。但有一点就是,让我对这类算法不怎么畏惧,甚至于非常感兴趣。本科的时候,发现自己对生物兴趣不大,倒是对编程颇以为是,所以读研又改学了计算机。虽然换了专业,但我对数据挖掘仍然兴趣不减。在研究生阶段,涉及数据挖掘,机器学习, 高级数据库之类的课程我的成绩都是 90+,这至少说明我很用心。总之,读研这几年我也在不断地规划着自己的数据挖掘之路。然而,数据挖掘是门交叉学科,涉及的内容很多,而且还需要理论联系实际,要掌握起来其 实是非常困难的。我曾经非常幼稚地认为,数据挖掘无所不能,适用于各行各业,却忽视了数据挖掘非常难以掌握的一面。首先,要构建完整的数据挖掘理论知识体系;其次,要能够 深入到具体的行业或市场进行具体项目的实战。至于学习数据挖掘的前景,推荐看看一篇博客, 扒一扒这个数据挖掘行业,黄油和面包。这篇文章算是资深人士对数据挖掘行业一点点小小的爆料,感觉对于我这样的初学者来说,有着高屋建瓴的作用。http://saslist.net
学习SAS 源于我当初想去金融行业做分析师的想法,而这个想法又是源自于自己的 MBTi 测试的结论。算起来开始学sas 应该是 10 年下半年的时候,我先是买了一本《SAS 编程与数 据挖掘商业案例》,后是看了《The little SAS book (3rd)》电子版,还有 SAS 认证考试 样题-123 题。我还在 saslist 上建立起了博客,分享了一些学习心得,还有找实习的一些经历。而我对 sas 的学习经历,也就集中在 10 年的下半年这段时间了。后来到了11 年初, 偶然间看到统计之都上,举办第一届数据挖掘挑战赛的信息。我便花了 1 个多月去参加比赛, 再后来便去找实习。到现在不知道自己还会不会继续学习 sas,但 saslist 确实对我的数据 挖掘之路,起着承上启下的作用。在这里很容易让你融入一个学习数据分析,数据挖掘的圈子,很多前辈们的精彩博文都对自己起着极大的鼓舞作用。
原创文章: ”我的数据挖掘之路 by wrchow“,转载请注明: 转自SAS资源资讯列表
本文链接地址: http://saslist.net/archives/252
导读: 与其说是统计学习那些事,不如说是非统计专业博士毕业的那些事。这篇文章不光内容比较好玩,可读性强,还有很大的参考价值,因此推荐广大SASor读一读,在以后的工作和科研中会用得到的。
香港科技大学 电子与计算机工程系 eeyang
在港科大拿到 PhD,做的是 Bioinformatics 方面的东西。Bioinformatics 这个领域很乱,从业者水平参差不齐,但随着相关技术(比如 Microarray, Genotyping)的进步,这个领域一直风风光光。 因为我本科是学计算机电子技术方面的,对这些技术本身并没有多大的兴趣,支持我一路走过来的一个重要原因是我感受到统计学习(Statistical learning)的魅力。正如本科时代看过的一本网络小说《悟空传》所写的:“你不觉得天边的晚霞很美吗?只有看着她,我才能坚持向西走。”
离校前闲来无事,觉得应该把自己的一些感受写下来,和更多的爱好者分享。
先介绍一下我是如何发现这个领域的。我本科学自动化,大四时接触到一点智能控制的东西,比如模糊系统,神经网络。研究生阶段除了做点小硬件和小软件,主要的时间花在研究模糊系统上。一个偶然的机会,发现了王立新老师的《模糊系统与模糊控制教材》。我至今依然认为这是有关模糊系统的最好的书,逻辑性非常强。它解答了我当年的很多困惑,然而真正令我心潮澎湃的是这本书的序言,读起来有一种“飞”的感觉。后来我终于有机会来到港科大,成为立新老师的 PhD 学生,时长一年半(因为立新老师离开港科大投身产业界了)。立新老师对我的指导很少,总结起来可能就一句话:“你应该去看一下Breiman 和 Friedman 的文章。”立新老师在我心目中的位置是高高在上的,于是我就忠实地执行了他的话。那一年半的时间里,我几乎把他们的文章看了好几遍。开始不怎么懂,后来才慢慢懂了,甚至有些痴迷。于是,我把与他们经常合作的一些学者的大部分文章也拿来看了,当时很傻很天真,就是瞎看,后来才知道他们的鼎鼎大名,Hastie, Tibshirani, Efron等。文章看得差不多了,就反复看他们的那本书“The Elements of Statistical learning”(以下简称ESL)。说实话,不容易看明白,也没有人指导,我只好把文章和书一起反复看,就这样来来回回折腾。比如为看懂 Efron 的“Least angle regression”,我一个人前前后后折腾了一年时间(个人资质太差)。
当时国内还有人翻译了这本书(2006 年),把名字翻译为“统计学习基础”。我的神啦,这也叫“基础”!还要不要人学啊!难道绝世武功真的要练三五十年?其实正确的翻译应该叫“精要”。在我看来,这本书所记载的是绝世武功的要义,强调的是整体的理解,联系和把握,绝世武功的细节在他们的文章里。
导读:本文作者hssnow现为中南大学统计系大四本科生,刚刚结束了在一家国际知名药厂做SAS程序员的实习,下面是他与SAS的故事,与大家分享。一共两篇,本文是第二篇,第一篇是学习篇 。
寻找实习
整个寻找实习的过程算是有点曲折吧。大三下学期想在长沙本地找个SAS相关实习,可后来发现这是有多么的不现实,长沙基本没有用SAS的企业。这样,就只能准备暑期去外面找了,SAS相关的工作机会基本在北上广,我的目标是北京或上海。
中南大学,不太出名,而且地处长沙。一阵搜索网投之后,收到的回复基本是:“我们暂不考虑本科”,“我们目前只考虑本地学生”,“你XX时间过来面试吧,我们暂不提供电话面试”,基本是诸如此类的答复。学校这边的期末考试也没结束,在没有一定可能性的情况下我也真的没办法直接跑去北京或上海,有点郁闷。终于,淘宝那边有个机会,电面了30分钟多,呵呵,最后接到通知,还是相比研究生竞争力不足,不过后来交流,那边也给了我些指导和建议,非常感谢。
而后,求助于jth(胡江堂)有没有什么SAS相关的机会,随后得到消息他们公司Sanofi Pasteur Biometry China(赛诺菲巴斯德—中国生物统计及数据管理中心)那正好有需求,可以给我个机会。然后发了简历,过来几天部门经理(Mr Tian)打来了面试电话。
原创文章: ”一个SAS菜鸟的故事 实习篇“,转载请注明: 转自SAS资源资讯列表
本文链接地址: http://saslist.net/archives/202
导读:本文作者hssnow现为中南大学统计系大四本科生,刚刚结束了在一家国际知名药厂做SAS程序员的实习,下面是他与SAS的故事,与大家分享。一共两篇,本文是学习篇,还有一篇是实习篇 。
2011年7月1日至2011年9月9日,在Sanofi Pasteur Biometry China(赛诺菲巴斯德—中国生物统计及数据管理中心)做了10周的统计编程实习生。这是我第一次SAS相关的实习,各方面收获很大,期间的经历也很难忘,而最让我难忘的一点是,在这实习及以前的学习之中受到了很多前辈、大哥大姐们的热情帮助和热心关怀。所以,我也应当要尝试着看能否帮助帮助他人。再有sxlion的鼓励,今天遂写下这些文字,分享自己这一点点弱弱的经历,希望会有一点点作用、能够帮助到他人,也将感受到的温暖传播开去。
开始前先自报下家门(希望能给大伙更多的参考性):中南大学,数学院,统计学2008级,本科。这里想多啰嗦两句,因为大家对中南大学实在太陌生了,要么没听过,要么反应成“东南大学”,每次俺心里都是眼泪哗哗的,希望大伙对中南可以多去了解点啊,呵呵。
百度百科中南大学见这里:http://baike.baidu.com/view/3522.htm
(更多…)
原创文章: ”一个SAS菜鸟的故事 学习篇“,转载请注明: 转自SAS资源资讯列表
本文链接地址: http://saslist.net/archives/200
前言:这是一个读者互动文,问题来源于指向本站的搜索引擎查询,问题回答尽量短。
目的: 当你辛辛苦苦的通过Google或百度找到本站,以为答案就在这里,结果发现什么也没有,一无所获。因为并不是所有的答案都可以在本站找到,所以让你白白进来,什么也没有解决,这不合适,所以我就回答一下。当然如果收集起来,让其他人也看看,对SAS的普及也很有帮助的。
065,Teradata SAS 哪个更有前景 ?
A:Teradata是偏重数据库的,SAS偏重数据分析的。两个结合起来最有前景,实际上两家是合作的。
064,jmp enterprise miner 哪个好?
A: 东西千万不要用好坏来衡量,太抽象。 各有做长,用偏重比较好。EM是专门用来做挖掘的,JMP可以用来做挖掘。
063, sas 提交运行 快捷键
A: F3即可。
062, SAS 大小写 快捷
A: SAS目前还没有大小写转换快捷键。
061, sas tinv 函数
A:计算T检验值,代替查表。 如0.05的水平,574的自由度的T值为:data _null_; x1=tinv(.95,574); /*单尾*/ x2=tinv(.975,574); /*双尾*/ put x1 x2 best12.; run;
060,kuhasu sas 分析师
A:kuhasu是搞金融的。
059,sas考证学生半价 code?
A:需要拿自己学生证扫描件去邮件申请,详细介绍。
058,有没有人翻译The Little SAS Book
A:没有。
057,kuhasu 写书
A:Super K,有粉丝等你写书。
056, sas 怎么定义函数 ?
A:用proc fcmp语句来自定义。
055,sas 证件有有效期吗?
A:没有时间限制,一直有效。以前官方是有效期这一说法的,现在改了。
054,little sas有没有中文版 ?
A:没有。
053,sas9.2 计算速度瓶颈 硬盘 cpu?
A:硬件有内存,硬盘和cpu决定,SAS9.2提供了很多option来优化速度。
052,关于大内存做虚拟硬盘的好处?
A:提高数据读入读出速度,降低硬盘的IO瓶颈压力。
051, oloolo sas blogs ?
A:博客地址见 http://sas-programming.blogspot.com/
原创文章: ”Over 1,000 questions about SAS by sxlion (持续收集中)“,转载请注明: 转自SAS资源资讯列表
本文链接地址: http://saslist.net/archives/178
本次将有五本《Excel图表之道》书可供兑换,分别需要1000、1500、2000、2500、3000金币。
不了解本书到可以去看看本书作者博客 http://excelpro.blog.sohu.com/,本书介绍见词条Excel图表之道,好书不坑爹。
这次活动的原则是:活动期间金币加倍,坚持每天编写一个词条,一个月你就获得赠书一本。
本次活动地址见 SAS维基网站活动。
具体活动细则如下:
原创文章: ”互动活动: 写SAS维基词条,免费得Excel图表之道 !“,转载请注明: 转自SAS资源资讯列表
本文链接地址: http://saslist.net/archives/174
今天收到一个新鲜SASor的来信,我也做了一个回复,我觉得他是很有准备的一个人,对QA稍作修改,问和答见下面,希望给有同样问题的新手有个参考。
from: www.saslist.net
Q:
sxlion **:您好!冒昧来信,恳请见谅,个人现在处于SAS学习的初级阶段,关于SAS学习及行业应用有一些问题,想向前辈请教一下,十分感谢您能抽空阅读一下我邮件,谢谢!
首先,简单的介绍下我的相关信息 :-):
我叫***,现在就读于**大学,是统计系2008级的学生。2009年底接触SAS,2010后半年投入SAS的学习中,开始关注SAS方面的一些论坛、博客及工作信息。2010年10月至12月学习完成了SAS Base和Adv的考试,算是刚刚有一点入门吧。英语方面应该还算过得去吧,口语交流有待提高。计算机其他软件方面的能力比较欠缺,如C++等。
我近期初步的规划是:大四毕业的时候,能以SAS为工具技术,找到一份与统计相关的工作。
下面有几点希望前辈能给予一些指导与建议:
—————– from: www.saslist.net ————————
A:
hi, ***, 谢谢信任。 你是一个有准备的人,比我们这些老的好多了 – : )。
OK,差不多,你需要的我知道的都在上面。
原创文章: ”读者来信一 请教一些关于SAS学习及工作前景的一些问题“,转载请注明: 转自SAS资源资讯列表
本文链接地址: http://saslist.net/archives/100