msgbartop
List for SAS fans and programmer
msgbarbottom

01 9月 12 SAS函数精选一 翻译


下面是Dr. Ron Cody的一篇关于SAS函数的文章,非常好的函数介绍文章。曾经在2009年SAS公司(上海)举办的一次SASor聚会上,我做了一次关于SAS函数的presentation分享,见 ppt正文,我发现竟然有部分内容重合。 我个人非常喜欢SAS系统提供的函数,建议老手新手都可以读读下面的文章,祝都有所获!

最有用的一些SAS函数
A Survey of Some of the Most Useful SAS Functions

by Dr. Ron Cody   翻译 sxlion

摘要:

     SAS函数为你的数据步(DATA step)编程提供惊人的能力。有一部分SAS函数是精华,能够帮助你节省大量不必要的代码。这篇文章内容覆盖其中最有用的一些SAS函数。有些函数可能对你来说有些陌生,然后她们将会改变你的编程方式,并助你轻松完成日常的编程任务。

 介绍:

         本文写到的大部分函数都与字符数据有关,这些函数的功能包括搜索字符串,查找和替代字符串,或连接字符串,还有些函数能测量两个字符串之间的距离(这对于“模糊”配对非常有用)。一些最新和最叹为观止的函数还以Call例程的形式存在。你知道怎么用函数在同一个观察值进行排序吗?你知道你不仅可以定位一列变量中极大或极小值,而且可以定位到第二位、第三位最大或最小的值? 如果你觉得上面的介绍能够吸引你的兴趣,请继续往下读! http://saslist.net

SAS是怎样存储字符值的?

 在我们讨论字符函数之前,了解SAS怎样存储函数值非常重要。为了帮助讨论,你首先需要理解两个重要的字符函数:LENGTHN和 LENGTHC。

LENGTHN和 LENGTHC

        这两个函数返回字符值的长度信息,其中LENGTHN返回未计算后缀空格语句的长度。LENGTHC返回字符变量的存储长度。你也许对旧的SAS函数LENGTH比较熟悉,大部分情况下函数LENGTH和LENGTHC返回同样的值。有一个例外的是,当语句里是缺失值时,LENGTH函数返回的是1,而LENGTHN返回0。有一些新函数看起来是在旧函数后面加个字母“n”,这里的“n”代表“空字符串”(“null string”)。在SAS9中,长度为0的字符串概念被引进。在大多数情况下,如果你看到一个你似曾相识的新函数(比如说新函数TRIMN, (更多…)

原创文章: ”SAS函数精选一 翻译“,转载请注明: 转自SAS资源资讯列表

本文链接地址: http://saslist.net/archives/282


27 7月 12 SAS十大性能优化技术 翻译


这是2012年SAS全球用户大会的一篇文章,主要讲编程时注意哪些问题,才能提高SAS程序的执行效率,很显然,一篇文章很难讲全SAS代码优化的全部技术,这里只是作者本人和他调查周围的程序员的一些经验总结,有很多方面并没有考虑到,如硬件情况。但是作为一篇入门级的SAS代码优化文章来读,还是很不错的。 原文链接:http://support.sas.com/resources/papers/proceedings12/357-2012.pdf

SAS十大性能优化技术

翻译 by 空谷幽兰 修改 by sxlion

摘要

SAS/BASE模块为用户读取、处理、分析、整理和生成高质量的数据和结果提供了多种选择。部分由于SAS软件提供的功能和数据源规模的原因,许多应用开发员和最终用户都需要更高效的用户指南。本篇文章列举了我个人认为SASor实施开发应用过程中最重要的前十种性能优化和编程技术。参加者学习DATA和PROC步语句和选项将有助于完成涉及数据整理,排序,分组,合并和汇总相关任务,并同时节省CPU, I/O,数据存储空间和内存资源。

引言

在编写SAS代码和/或应用程序时,代码的高效性不总是受到开发者的重视,尤其是在开发的初期阶段。应用程序的执行情况极大地受系统性能影响。理解应用程序和系统性能需求对于活跃开发员的非常重要。

应该注意每一个程序单元以使其符合高效性能评估准则。了解用户的期望(最好在应用程序开发过程的初期阶段)往往有助于开发更有效的应用程序。这样,在应用程序接近完工时提高程序效率的难度往往是最小的。本文列举了使用SAS软件时可以提高应用程序性能的几个重要方面。

Efficiency Objectives 效率导向

(更多…)

原创文章: ”SAS十大性能优化技术 翻译“,转载请注明: 转自SAS资源资讯列表

本文链接地址: http://saslist.net/archives/276


16 5月 12 SAS转置技巧 — 辅助变量


有时候数据分析的时候,总是需要把数据颠来倒去,从不同的角度分析N遍,SAS不但提供彪悍的统计分析程序,还提供了整理数据的辅助语句,每次都能把数据整理有条有理的。众所周知,SAS在清洗整理数据方面(ETL)的能力强大无比。很多SASor在垂涎和试用R语言提供新奇的分析和绘图模块时,不忘了先在SAS里面把数据整得服服帖帖的。

下面把自己遇到几个不那么常规的矩阵转置收集一下,它们都用到了增加辅助变量这一小技巧,尽管简单,其实都非常实用。

例1, 最近遇到一个需要对数据集进行操作的小问题,在SAS帮助proc transpose里面没找到例子,数据形式如下:

数据如下 (更多…)

原创文章: ”SAS转置技巧 — 辅助变量“,转载请注明: 转自SAS资源资讯列表

本文链接地址: http://saslist.net/archives/255


20 9月 10 SAS中文书籍清单 1991-2010年


目前在中国出版的1991至2010年出版的SAS中文书籍(部分列表)

序 号 出版年份 题 名 著 者

1 2010 SAS统计分析标准教程 杜强

2 2010 SAS统计分析与应用从入门到精通 汪海波

3 2010 SAS编程与数据挖掘商业案例 姚志勇

4 2010 SAS统计分析教程 胡良平

5 2010 SAS实验设计与统计分析 胡良平

6 2009 SAS统计分析从入门到精通 阮敬

7 2009 多层统计分析模型:SAS与应用 王济川,谢海义,Fisher.J.

8 2009 金融计量学: 基于SAS的金融实证研究 宋军

9 2009 时间序列分析与SAS应用 肖枝洪

10 2009 SAS与现代经济统计分析 岳朝龙

11 2009 SAS软件实用教程 张瑛

12 2008 社会统计分析及SAS应用教程 蔡建瓴

13 2008 SAS数据分析系统教程 陈颖

14 2008 SAS统计分析应用 董大钧

15 2008 统计分析系统SAS与SPSS 何宁

16 2008 多元统计及SAS应用 余家林

17 2008 SAS数据分析范例 范金城

18 2008 SAS数据挖掘与分析 周爽

19 2007 SAS与统计分析 胡希远

20 2007 经验会计与财务研究方法: 原理、应用及SAS实现 鲁桂华

21 2007 SAS软件与统计应用教程 汪远征

22 2007 医学统计学及SAS应用 王炳顺

23 2007 概率统计及SAS应用 余家林

24 2007 金融计算与建模: 理论、算法与SAS程序 朱世武

25 2007 SAS统计软件 周仁郁

26 2006 SAS8.2统计软件应用教程 贺佳,陆健

27 2006 SAS社会统计应用教程 蔡建琼,朱志海,朱秀萍,阮桂海

28 2006 SAS应用统计实验 邵建利

29 2006 SAS统计分析教程 唐燕琼

30 2006 医用SAS统计分析 金丕焕,苏炳华,贺佳

31 2006 SAS社会统计实用教程 蔡建平

32 2006 数据分析方法和SAS系统 邓祖新

33 2006 SAS统计分析及应用 黄燕

34 2006 统计软件教程: SAS系统与S语言 李东风

35 2006 管理统计学和SAS软件应用 刘顺忠

36 2006 SAS社会统计应用教程 阮桂海

37 2005 统计分析系统SAS 何宁

38 2005 计量经济分析软件: EViews SAS简明上机指南 潘省初

39 2005 统计分析与SAS软件 黄平,梁满发

40 2005 SAS统计分析 沈其君

41 2004 SAS for Windows (v8) 统计分析系统教程新编 洪楠

42 2004 统计分析方法: SAS实例精选 曲庆云

43 2004 SAS 8.2统计应用教程 薛富波

44 2004 重复测量资料分析方法与SAS程序 余松林

45 2004 中医临床研究设计与SAS编程统计分析 胡立胜,周强

46 2004 基于SAS系统的金融计算 朱世武

47 2003 SAS8.X经济统计 樊欣,邵谦谦

48 2003 医学统计学习题与SAS实验 郭秀花

49 2003 SAS统计分析实用大全 阮桂海

50 2003 统计分析应用教程: SPSS, LISREL&SAS实例精选 阮桂海

51 2003 SAS系统与经济统计分析 岳朝龙

52 2003 SAS编程技术与金融数据处理 朱世武

53 2002 分类数据的统计分析及SAS编程 刘勤,金丕焕

54 2002 SAS系统和数据分析 邓祖新

55 2002 社会经济定量研究与SPSS和SAS的应用 骆克任

56 2002 SAS程序设计 王惠群

57 2002 统计应用软件: EXCEL和SAS 朱建中

58 2001 SAS系统•Base_SAS软件使用手册 高惠璇

59 2001 SAS基础及统计实例教程 胡小平,王长发

60 2001 实用统计方法与SAS系统 高惠璇

61 2001 Windows SAS 6.12 & 8.0实用统计分析教程 胡良平

62 2001 SAS统计分析 沈其君

63 2000 SAS软件与应用统计 王吉利,张尧庭

64 2000 世界统计与分析全才SAS系统应用开发指南 彭昭英

65 2000 现代统计学与SAS应用 胡良平

66 1999 多元统计分析与软件SAS 朱道元等

67 1998 SAS系统SAS/ETS软件使用手册 高惠璇

68 1998 SAS最优化软件速成 倪勤

69 1998 SAS及应用 裴喜春

70 1997 SAS系统BaseSAS软件使用手册 高惠璇

71 1997 SAS系统. SAS/STAT软件使用手册 高惠璇

72 1997 SAS基础教程 美国SAS软件研究所

73 1996 统计分析系统SAS软件实用教程 惠大丰

74 1996 SAS/PC统计分析软件实用技术 卢纹岱,金水高

75 1996 现代统计学与SAS应用 胡良平

76 1996 SAS应用程式之资料处理 梁德馨

77 1995 SAS系统与基础统计分析 高惠璇

78 1995 SAS/PC统计分析与实务应用 林秀娟

79 1995 SAS for Windows统计分析入门: SAS/ASSIST自动程式产生的视窗 张绍勋

80 1995 SAS for Windows统计分析: 高等统计 张绍勋

81 1995 SAS for Windows程序语法 张绍勋

82 1995 SAS For Windows统计分析: 初等统计 张绍勋

83 1993 SAS–统计分析软件应用指南 董大钧

84 1992 SAS统计过程指导 (美)SAS研究所

85 1991 医学统计方法与SAS应用技巧 胡良平

以上列出来部分1991年至2010年中国出版的SAS中文书籍目录,一共85本。上面的书,大部分在国内学SAS的人估计都读过一两本,我有幸见过一部分的书,质量不好评论,但在内容上感觉统计应用比例非常高,且雷同的颇多。通览这个目录,我有如下的几个大致印象:
  • 纯编程仅仅是那本2002年台湾作者王惠群的《SAS程式设计》,大陆名为《SAS程序设计》的那本。1996年的梁德馨《 SAS应用程式之资料处理》,应该也是台湾作者,无缘看到真本,从名字推算应该也属于纯SAS编程。《SAS程序设计》有关SAS编程,内容较浅显,适合初学者学习使用。
  • 最新和2010年出版的姚志勇《 SAS编程与数据挖掘商业案例 》也算得上是一本介绍SAS编程的书,后几章结合实际讲了商业案例内容。
  • 涉及到SAS编程知识比例较高的有2003年出版的朱世武编著的《 SAS编程技术与金融数据处理》和他的其他几本书,所有内容都是围绕金融数据展开的,学金融的不要错过;
  • 1998年倪勤编著科学出版社出版的《SAS最优化软件速成》介绍OR优化模块,里面是倪勤论文的一部分,对于搞优化的人是本难得到好书;
  • 其他多为涉及到SAS/STAT模块,着重于用于多元统计分析在各行各业中应用,这部分书籍尽管有很多雷同部分,但也不乏好书,比如作者黄燕2006年出版的 《SAS统计分析及应用 》,2008余家林出版的《多元统计及SAS应用 》,和胡良平老师的几本书讲到用SAS如何进行统计分析应用,如果你正好需要学习这方面的知识,这几本书是非常值得推荐。老的书如高惠璇编著的几本恐怕是国内SAS统计早期启蒙书了,很经典,可惜太老了,不容易得到。

从目前SAS中文书籍来说,如果你想做一名SAS程序员或者以SAS编程作为你的职业的话,仅仅看中文书是远远不够的,熟读外文书是不可避免的(外文书籍介绍推荐将在后面给出)。因此对于英文不是很好的人来说,学SAS确实是件痛苦的事情。

2011年8月26日补充:  84 1992 SAS统计过程指导 (美)SAS研究所 这本书就是 《SAS User‘s Guide:Statistics》原版的部分翻译。

原创文章: ”SAS中文书籍清单 1991-2010年“,转载请注明: 转自SAS资源资讯列表

本文链接地址: http://saslist.net/archives/79


06 9月 10 学习和提高SAS编程和应用的好出处——博客资源


博客资源 (随机排序)

我所订阅到SAS博客

http://blogs.sas.com/sasdummy/ SAS公司员工博客

主要是将EG模块的。博客作者曾经写过一本初级的SAS书《SAS for Dummies

http://sxlion.spaces.live.com/default.aspx 一个SASor的技术空间

一个SAS爱好者用SAS编程解决各种数据清理,数据整理和解决各种实际问题。

http://sxlion.blog.sohu.com/ 一个SASor的图表空间

和上面是同一个作者,这个博客宣称用SAS画出所能看到的所有数据图形,主要侧重于商业,学术和工业图表,里面有用SAS模仿商业周刊风格的精美图表。

http://sas-programming.blogspot.com SAS Programming for Data Mining Applications

oloolo的个人技术博客,专注于用BASE,STAT等等编程模块实现与EM同等功能的各种数据挖掘功能的算法,相当强大,SAS主办的2010年数据挖掘大会上作为官方推荐资源。博客提供了许多用BASE编的挖掘算法, 可惜国内看不到,需翻墙。

http://sugiclub.blogspot.com/ SUGI CLUB — SAS User Group International Club

这个博客,文章是博主挑出各SUG(SAS用户组,在网页资源有解释)的一些文章进行翻译,做少量补充,内容涉及范围较广。但是需要翻墙。

下面是几个停止更新的博客:

http://statcompute.spaces.live.com/default.aspx

博主刘文穗 WenSui Liu,现在在ebay。 曾经是最勤劳的SAS博主,产量非常大,博客文章很值得一读,都是关于市场,经济等等方面的。2010年5月后停止更新。

http://blog.csdn.net/anyjack/

博主单名一个:风    各种SAS技术,偏IT,2009年停止更新。

原创文章: ”学习和提高SAS编程和应用的好出处——博客资源“,转载请注明: 转自SAS资源资讯列表

本文链接地址: http://saslist.net/archives/59