msgbartop
List for SAS fans and programmer
msgbarbottom

20 9月 10 SAS数据集操作常见问题

1,怎么新建一个空数据集,即新建一个有数据结构但是没有值的数据集

2,怎么删掉一个数据集

3,怎么去掉一个数据集中有重复的记录或观察值

4,怎么得到一个数据集的所有观察值或记录的条数/个数

5,怎么对一个数据集按一个或几个变量进行排序

以上5个问题,每个问题,请给出10个或以上的不同的SAS代码来解决。

09 9月 10 我与SAS的故事 胡良平2008

在Google上搜索了一下,没有发现有这个故事。
这个是根据2008年 一次小型SAS聚会的资料整理而来,不算原创,但是重新整理,以示读者。
每一代人有每一代人的经历,这个是老一辈SASor们在那个资料匮乏年代学习SAS的经历。如今资料论坛上遍地都是,你是怎么学习SAS,你有自己的故事吗?你也可以写出来,和大家分享!

我与SAS的故事

胡良平

军事医学科学院 生物医学统计学咨询中心

整理于2007年11月07日SAS爱好者北京聚会

1,认识SAS之前

我1982年初从安徽蚌埠医学院到北京军事医学院来攻读流行病与卫生统计学专业硕士研究生,当时,统计学教研室有一台老式计算机,但是没有统计分析软件。从82年到89年,几乎都是用BASIC语言编写简单的统计分析程序,有时,也用FORTRAN语言编写程序或到我院计算中心去使用小型计算机上的BMDP软件包。

但基本上都是“小农经济”,比使用技巧及稍微强一点。尤其是用BASIC语言编写常用统计分析程序,花费了大量的时间,现在想起来,真是在浪费自己的光阴和生命!

2,幸运之神悄然而至

就在1990年的一次计算机方面的学术活动上我偶然地结识使我终生受益的SAS软件。报告者只是简单地讲了SAS软件怎么了不起,介绍了如何进入SAS系统,至于SAS究竟有多少内容,如何使用,却只字未提。 幸运的是有人带来了一本油印讲义——SAS入门读物。www.saslist.net

3,巧的SAS如获至宝

大约在1990年底,以为从事计算机工作的朋友送我给一套DOS环境下的6.03版SAS软件,我如获至宝。如何使用它,每天都要研究到深夜。因为当时没有参考书,没有互联网,只能将软件中的帮助信息全部打印出来学习。当时,由于本分缺乏计算机和软件方面的基本思想、概念和知识,很难理解SAS语言和一些语法规制,有时,一段很简单的SAS程序要花几个小时才能弄明白。www.saslist.net

4,工夫不负苦心人

经过半年的不懈努力,我由生以来的第一部专著《医学统计方法与SAS应用技巧》于1991年5月由中国科技出版社正式出版了。《医学统计方法与SAS应用技巧》这本书虽然很小,但它诞生得比较早,当时在国内统计界产生了颇大的反响。通过它我认识了很多人。

5,漫长的岁月练内功

在随后的5年中,我一边学习SAS,一边学习统计学,用SAS软件为科研人员解决了大量的统计分析问题,积累了丰富的经验和科研资料,为我撰写第二部统计学专著奠定了良好的学术基础。直到1996年,我充满自信地主编并出版了第二部统计学专著,即《现代统计学与SAS应用》,这部专著因其“含金量”较高,在国内引起了较大的反响。www.saslist.net

于1999年和2000年又相继出版了两部统计学专著,书名分别为:《医学统计应用错误的诊断与释疑》,1999;《医学统计学内容概要、考题精选与考题详解》,2000.

6,Windows 版SAS给了我新的推动力

Windows版的SAS6.12和8.0像助推器,给了我新的推动力,于20001年出版了《Windows SAS6.12&8.0使用统计分析教程》。

7,再接再厉

自2002年以来的7年中,随着SAS软件的不断发展和日臻完善,在我的同事和研究生的帮助下,我又主编了八部以SAS作为计算工具的统计学专著。(8部专著书名略)

8, 正在编写的SAS统计分析书

笔者正在主编一部大型SAS统计分析教程,尽可能包括SAS语言和过程基础知识、统计分析从简单到复杂的SAS实现和用SAS实现各种多因素实验设计《SAS统计分析——从入门到精通》。这部专著的参编者来自全国十多所高等院校和研究机构。www.saslist.net

9, SAS给我带来的好处

SAS帮助我和我的教研室获得多项科研成果和教学成果,发表了一百多篇统计学方面的学生论文;面向全国作统计学培训,举办规模不等的统计学及SAS软件培训班数十期;编制出来便于学习者快速调用的SAS软件的SAS引导程序,名为SASPAL,提供了教学质量。www.saslist.net

10, 我对SAS的期盼

SAS功能十分强大,这一点无可置疑。但如何提供其智能化水平、如何提高解决统计学上常见棘手问题的能力,这是有待SAS公司高层技术人员关注的现实问题。期待SAS能早日实现这两个目标。

09 9月 10 关于SAS的零碎印象 SAS_Dream 2004-03-26

SAS_Dream大侠的《关于SAS的零碎印象》,可谓是给我们启蒙SAS的盘古般的大作。大作2004-03-26 17:26首发于sasor.feoh.net,虽然很多人用SAS很多年,但是读了这篇之后,才渐渐识得SAS的庐山真面目。尽管这篇文章已经问世六载,我也看了很多遍,每次读来都倍感有收获,因此仍完整地转载于此,以饲读者。

关于SAS的零碎印象

注:SAS_Dream于 2004-03-26 17:26发表 在论坛sasor.feoh.net

不管你以何种方式接触SAS,不管你接触SAS已经多久,“SAS是什么”,始终是一个几乎无法回答的问题。

不同应用领域的人使用的SAS特性差异,可以大到像不同公司的产品。所以,SAS交流大会,经常听到的惊呼是“啊,SAS还可以这样做”,而发出这样惊呼的人,不乏很多资深者。

因此有种说法是“SAS博大精深”,可是事实上似乎不是SAS本身而是SAS涉足的领域博大精深。去考察一下SAS产品和方案模块的各个细分市场,几乎每个都是竞争对手强悍,业内知识浩繁;再去考察SAS的各种成功案例,主要的成分往往都是使用者的智慧积累而非产品功能,与同业软件并无大异,很多时候案例的吸引力是决策分析领域相对于其它领域的吸引力,不是产品本身的吸引力。其实,公平的说法好像应该是,使用SAS的人,往往是愿意在决策分析方向上不断思考的人,他们会通过SAS产品,在决策分析领域进行深入实践,最终形成一个博大精深的气候。

很多情况下,SAS用户所做的事情已经让SAS厂家感到非常惊异,所以说“SASOR博大精深”仿佛更贴切些。

从SAS发展的功能范围,时间跨度和地域差异上去思考一下,也许可以离“SAS是什么”的回答更近一些。

SAS的功能范围,大致上是从专业统计分析到企业级应用,从工具销售到解决方案销售逐渐演进的。从90年代初开始,也就是SAS V6系列的产品起,SAS加大了企业应用类模块的开发和推广,主要是数据存储管理,复杂报表工具,大型分析套件,前端应用开发工具,企业应用系统管理工具,还有针对性更强的特定应用套件,2000年以后,更是把专业咨询服务作为发展重点,所谓的解决方案,就是定制的系列产品线+特定内容的咨询服务的收费组合。十几年的发展,按照现在国内软件企业的流行说法,已经形成了“几横几纵”的格局,横指的就是从数据管理,分析建模到前端展现各个环节的工具层,纵指的是金融、电信等行业和细分行业的针对性方案,组合了各种工具和服务。这种变化带来了积极的影响,但是也同样也遭遇了更多的强劲对手,更遭遇到了企业级应用领域的诸多难题,客观的讲,SAS在这些问题的解决上并不明显比对手好。到目前为止SAS在企业应用领域的声誉并没有超过在专业统计分析领域的声誉,即便是革新时期声名鹊起的代表作Enterprise Miner,在很大程度上也是借助了经典统计算法的扎实基础。所以,很多关于“SAS好还是不好”的争论,放在不同的应用层面,结论会大有不同。

个人看法是,SAS具备“两强一有”的特点,就是分析强,处理强,企业级应用的大体功能环节都有。SAS的分析功能,综合考虑其深度和广度,至今还是业界最高地位,其它产品如S-Plus,SPSS等,综合比较很难占到上风,当然,反过来说SAS的优势也不是绝对的;

处理功能说起来有点像一滩浑水,因为处理的范畴很大,但是通常讲,把数据从原始状态转换成适合于各种分析的状态,不考虑回滚、事务等特征,SAS在语言功能上的丰富性是有优势的,它的分析对手尤其是强调免编程的对手,在这方面功能不免捉襟见肘,它的处理对手尤其是数据库系的对手,在针对分析的变换上也是心有余而力不足,其实在很多情况下,这个优势比分析优势还大,只不过这个领域比较模糊,不容易形成明确印象罢了;至于说到企业级的应用,不论从数据仓库工具,OLAP工具,报表工具,到风险管理方案,市场营销分析方案,大大小小SAS还都有,和其它厂家一样,这年头也是言必称CRM,数据仓库和Java。就是这“两强一有”,让SAS在决策分析领域有独特的地位。

关于“SAS是不是好用”的问题,一种说法是“SAS是架钢琴”,上手不容易,但是可以玩到至高境界,而其它竞争对手如S-Plus和SPSS则像“电子琴”,上手容易,想玩儿的很深很灵活比较难;的确,SAS的学习曲线初期是比较长,不仅对用户,甚至对工程师内部学习都是这样,而真正事倍功半的境界需要较长的积累;不过现在的事实是,SAS和竞争对手都在向“合成器”这个方向上使力,做成傻瓜加专家都适用,“演奏”都可以登得厅堂的产品,所以SAS开始发力前端,甚至Java架构不离口,但是在这方面,毕竟是晚生后辈,而其它竞争对手也是全力以赴,或加强后端,或收购合并,像SPSS收购了ISL的Clementine,在数据挖掘上从易用性到功能上对SAS形成了极大冲击,要知道ISL是业界最早以产品化思路研发数据挖掘的公司之一,功能设计上的功力也非同一般;目前,SAS这架钢琴的学习曲线尚未明显缩短,而以Clementine、QuadStone为代表的产品在功能深度上的迫近却是咄咄逼人,SAS的排位也因此变得微妙。

另一种解决易用性的方法是加入向导服务,也就是,“SAS的人教你弹钢琴”,是SAS卖服务的思路,存在的问题是:“造钢琴和保养钢琴的知识不代表能弹好琴,或者教好琴”,很多决策分析应用服务的成熟性和重用性都相对不高,连达到ERP的规范级别都难,要想用好不仅仅是看懂语法那么简单,“钢琴教师”需要懂产品,懂行业,可以举一反三,还要有传授知识的方法,这些往往靠多年的专业服务经验积累。SAS的服务经验多来自参与项目人员的自发经验积累,水平高低往往看各人的造化,以商务模式有组织的发展专业服务,SAS公司自身也需要一个积累学习的过程,并不像商务宣传口号那般简单;所以,在很多场合下,“SAS是不是好用”,还要看用户自身的水准,以及与产品服务的沟通。

从公司发展的时间阶段来说,SAS公司的策略也如其它厂家一样,在各个阶段有明显变化,特别是从2000年以后,SAS在推广策略上进入了大转型阶段,从公司CI,到产品组织,都不断地变化着。这一点从SAS网站上可以明显看出。很多时候,SAS在新版本的更新中,不是在开发新的功能,而是重新拆分和合并模块组合,改变宣传口径,有些换汤不换药的感觉,同时,在过渡期,也造成了相应的混乱;常有的情形是,看到一个神奇的名称,仔细一打听原来是几个老模块改了个名字,或者是,老用户突然在新版本找不到自己熟悉的模块调用了;V9很多变化是这种重组的结果,相对来说算是一个总结,但是这种架构是否稳定到下一版本,也很难说。所以考察SAS方案,不仅要听其言,还要观其形,更要摸摸它的模块……

对于SAS功能和发展方向的转型,各个地域消化并不均衡,有些时候,不同SAS分公司的对于SAS的推广,也让人有天壤之别的感觉。比如历来SAS有北美和欧洲两大强势阵营的划分,北美阵营以工具销售为主,强调软件的通用功能和强壮性,而希望用户及推广伙伴去开发针对性应用,欧洲阵营重视开发有针对性的应用,强调根据具体应用特点自己主动进行二次开发,认为对用户的适用性比软件的绝对性能重要,结果经常是欧洲开发了一些应用,反响比较好的,拿回北美总部去做引擎整合。因此,看欧洲和北美的客户案例,感觉不一样。再看亚太区,日本是传统的统计分析工具式的销售仍占主导,单纯的Base 或加上STAT的组合销量很旺,用户的应用是扎实稳健,但是技术的发展有些滞后;台湾是在V6的时候重点推广了QC和针对性OLAP应用,一时成为亚太的亮点;韩国则是骤然加速,在电信流失分析和制造行业管理分析上成为领头羊;说到中国,则像现在很多领域的发展一样,有的方面很前卫,有的方面又滞后得多,有极强的动态性。所以,如果有机会去亚太转转,不同人讲的SAS故事会让你想“这是一家公司的产品吗”……

08 9月 10 行业会议:9月15号,上海,CDISC Interchange China

  • 主题Topic:CDISC中国年会(CDISC Interchange China 2010)
  • 时间:2010年9月13日-17日 开放式会议是在15日(星期三),其余为培训。
  • 地点:上海 复旦大学枫林校区(原上海医科大学)明道楼
  • 所属行业:医药CRO
  • 官方通知:http://www.cdisc.org/interchange?a=2329#2329
  • 公交: 50路 712路 218路 49路 世博29路路 932路

简介CDISC,以及SAS的关系:

CDISC,中文名称临床数据交换标准协会(CDISC – the Clinical Data Interchange Standards Consortium)已经就如何收集数据、收集什么类型的数据以及如何将数据提交给负责审批新药的机构建立起了一套标准。CDISC将合格证书授予经过注册的解决方案提供者,即那些它认为是合格的、具有足够知识和经验来执行各种CDISC标准的咨询者、系统集成者以及学科专家。临床数据交换标准协会(CDISC)是一个开放的、包括各种学科的非盈利性机构。协会致力于开发行业标准,为医学和生物制药产品的开发提供临床实验数据和元数据的取得、交换、提交以及存档的电子手段。

SAS积极参与制定国际CDISC标准并支持这一标准的落实,这对于从事CRO的SAS 编程人员十分有利。例如,数据可根据“proc cdisc”有效地转换为CDISC传送格式。同时,SAS还通过集成式数据管理解决方案支持CDISC数据模型。

过期会议:

2010年9月4日 北京数据管理与生物统计论坛(BBF) 主办的“临床试验SAS编程研讨会”

title list:

  1. SAS 程序编写规范 李友 (赛诺菲安万特)
  2. Proc SQL 在临床试验中的应用 吴崇胜(RPS)
  3. PROC FCMP介绍 覃龙 (SAS)
  4. 让SAS作图变得更容易:%GraphLineplt 李华丹(赛诺菲安万特)
  5. 一些SAS 小技巧 于文博 (诺和诺德)
  6. 医药行业SAS程序员职业发展探讨 邓亚中(科文斯)

06 9月 10 学习和提高SAS编程和应用的好出处——博客资源

博客资源 (随机排序)

我所订阅到SAS博客

http://blogs.sas.com/sasdummy/ SAS公司员工博客

主要是将EG模块的。博客作者曾经写过一本初级的SAS书《SAS for Dummies

http://sxlion.spaces.live.com/default.aspx 一个SASor的技术空间

一个SAS爱好者用SAS编程解决各种数据清理,数据整理和解决各种实际问题。

http://sxlion.blog.sohu.com/ 一个SASor的图表空间

和上面是同一个作者,这个博客宣称用SAS画出所能看到的所有数据图形,主要侧重于商业,学术和工业图表,里面有用SAS模仿商业周刊风格的精美图表。

http://sas-programming.blogspot.com SAS Programming for Data Mining Applications

oloolo的个人技术博客,专注于用BASE,STAT等等编程模块实现与EM同等功能的各种数据挖掘功能的算法,相当强大,SAS主办的2010年数据挖掘大会上作为官方推荐资源。博客提供了许多用BASE编的挖掘算法, 可惜国内看不到,需翻墙。

http://sugiclub.blogspot.com/ SUGI CLUB — SAS User Group International Club

这个博客,文章是博主挑出各SUG(SAS用户组,在网页资源有解释)的一些文章进行翻译,做少量补充,内容涉及范围较广。但是需要翻墙。

下面是几个停止更新的博客:

http://statcompute.spaces.live.com/default.aspx

博主刘文穗 WenSui Liu,现在在ebay。 曾经是最勤劳的SAS博主,产量非常大,博客文章很值得一读,都是关于市场,经济等等方面的。2010年5月后停止更新。

http://blog.csdn.net/anyjack/

博主单名一个:风    各种SAS技术,偏IT,2009年停止更新。

04 9月 10 学习SAS编程技术的好出处——网页资源

WWW网页

1, 很真诚地说,SAS自带的help帮助是最好的学SAS的资料,通常来说每个版本的SAS帮助有两种形式,一种就是随SAS软件安装一起存在于被安装电脑中的.chm格式文件;还有一种就是在SAS公司网站在线的帮助文件,提供pdf格式下载和html格式的阅读。

地址在:http://support.sas.com/documentation/

上面两种形式的帮助文件存在一定的差别,主要在1,online的帮助会经常更新,一些新的模块里面常常出现小错误(比如代码等)。有时你会发现自带的帮助里面的代码有时候运行出错,去网站找到同样问题的代码,你会发现运行很好,原因就是online可以实时更新。2,online版帮助可谓是号称史上最全的SAS帮助文档,22个开头字母一字排开,很有气场,里面有的模块也许一辈子也不会接触。相比而言,随机的chm文件只提供和安装介质相应的help文档。当然随机的chm文件还是有些优点的,比如查找问题起来很方便,速度快,还无需上网。个人认为大多数人还是倾向用随机的help,优点有二:一个是够用,一个是够快。

2,http://support.sas.com/notes/index.html

SAS公司提供一些编程小技巧,以前在support.sas.com/sassamples/quicktips/(已失效)里面,现在已经更新了。 上面经常会有一些实用的小代码出现,特别是一些新模块的代码举例。

3,http://support.sas.com/documentation/onlinedoc/code.samples.html

大家都知道,SAS公司出版的书籍非常昂贵,全是美金做单位,还不打折。但是与书对应的代码却是免费的。如果你想学习SAS的某个内容或者感觉自己学习SAS没有进展,那就到这里来读SAS代码吧,全部免费,可以下载打印出来慢慢品味。

4,http://www.lexjansen.com/

世界各地有个叫SAS  users group (SUG)的组织,不能的地方的SUG就加个代表该地区的缩写以示区别,比如说美国的一些SUG及简称:Southeast SAS Users Group (SESUG),MidWest SAS Users Group (MWSUG) ,Western Users of SAS Software (WUSS),South Central SAS Users Group (SCSUG) ,NorthEast SAS Users Group (NESUG)。 这些组织不是组织SAS程序员看电影,旅游参观等等活动,他们是组织当地的SAS程序员交流SAS使用经验,每次会议都有大量的论文投稿,其中不乏高质量的代码和应用论文,并且几乎所有论文都可以从上面提供的地址下载到。这些论文往往是SAS程序员在实际应用SAS经验的总结,并且各种难度级别和应用领域的文章都用,非常值得一看,特别是对于SAS高级技术进阶人员来说。随便说一下,在SAS公司的全球usergroup的列表里面只有日本,韩国,新加坡,其中日本从00年开始都连续搞了10年了。

5,http://saslist.net/

以上资源都是免费的,几乎包括一切你需要学习和能够用到的。但是你会发现为什么没有中文的,全是英文的。本博就是为发布最新的最全面的中文资源资讯而建立的。

03 9月 10 学习和讨论SAS技术的好出处——论坛资源

BBS论坛 (按人气和知名度综合排行)

SAS中文论坛 http://www.mysas.net/forum/index.php
目前人气最足的SAS中文论坛

人大经济论坛 SAS专版 http://www.pinggu.org/bbs/index.asp?boardid=68
在校学生比例高,资源多,不过需要论坛币。

SASor论坛 http://sasor.feoh.net/
最早的中文SAS论坛,可惜后来人气越来越低,不过底蕴深厚,可以翻翻老底。

Mitbbs未名空间 统计版 http://www.mitbbs.com/mitbbs_bbsdoc.php?board=statistics
多为国外华人集聚的空间,里面有非常多讨论SAS的精彩主题,可惜需要翻墙。

当然还有一些其他的有关SAS的论坛,都不如上面专业和回答及时。