msgbartop
List for SAS fans and programmer
msgbarbottom

25 10月 10 2010年10月近期SAS职位招聘列表


接近年尾,各家大公司纷纷放出职位以储备人员,导致招聘信息爆发。

从学生到有工作经验人士,从本科到博士,从马上急需到年底各种需求一应俱全,地点分布主要在北京,上海,杭州等地。

以下均为最近发布消息由急到缓和信息完整程度排列职位:

1,SAS中国公司

职位:技术支持 售前客户分析

工作地点:北京

猎头联系方式:231650869@qq.com

有SAS基础,英文口语好,懂数据库、操作系统就行。

2,公司:东南融通

联系方式:zbvcnet@yahoo.com.cn

analysts needed(urgent) 急需

BS/MS in math/stat/econ/cs,

2-5 yrs of SAS experience,

preferrably in banking industry.

For currently employed,need to join Longtop(NYSE:LFT),

For graduating students,can start as interns.

First assignment in Shenzhen for a bank for a few months.

Longtop will train you to be risk analyts prior to and after this assignment.

salary:

junior 6k to 10k/mo, senior up to 15k.

Location:

Beijing or Shanghai.

3,ebay 贝宝

工作地点:上海
有效期:2010年底之前
联系人:shiyiming#bigfoot.com
来源:mysas.net
Business Analysis Manager, Customer Analytics
Job Responsibilities
Analytics support to measure customer value, predict customer lifetime value and optimize business initiatives to drive customer value.
Analytics support to Consumer Marketing initiatives and projects.
Collaborate with business teams across the world and champion Custom Lifecycle Value/CRM framework and findings.
Communicate insights and support executives in taking business decision.
Provide technical expertise in data mining, measuring business performance and running research using advance mathematical, statistical and experimental approach.
Manage ad-hoc projects, collaborate with global teams and take part in international projects.
Job Requirements
Graduate degree in quantitative fields such as statistics, economics, mathematics, computer science, operations research or MBA.
8 years of marketing and business analytics experience.
Good understanding of ecommerce, marketing, tracking and program measurement.
Great business sense and superior analytical skills with the ability of understanding business problems and developing innovative and practical solutions to solve complex problems and execute on solutions.
Proficient in SAS, SQL, VBA and Microsoft Office.
Working knowledge of advanced data mining tools such as SAS Enterprise Miner.
Extensive experience with large data sets and data manipulation.
Ability to manage, lead, and mentor junior data analysts to maximize productivity and deliver results.
Strong oral and written communication skills in both English and Mandarin.
Strong project management skills.
Ability to multi-task, handle multiple projects with demonstrated follow-through.
Able to handle ambiguous work environment and operate with little supervision.
A sense of humor, personal integrity, and an appreciation for team-work.

Senior Business Analyst, Internet Marketing Analytics
Job Responsibilities
Work with business partner to support global Internet Marketing tracking on measurement building, performance reporting and business insight.
Lead ad-hoc data request, issue fixing and business analysis to support international business partner.
Communicate insights and support executives in taking business decision.
Support on the analytic platform construction, maintaining and enhancing.
Develop and maintain the analytic tools and automation process to improve the consistency and efficiency.
Quality control and assurance.
Develop and document mitigation processes.
Job Requirements
Graduate degree in quantitative fields such as statistics, economics, mathematics, computer science, operations research or MBA.
5 years of marketing and business analytics experience.
Great business sense and superior analytical skills with the ability of understanding business problems and developing innovative and practical solutions to solve complex problems and execute on solutions.
Proficient in SAS, SQL, VBA, UNIX, Java programming and Microsoft Office. Working knowledge of advanced data mining tools such as SAS Enterprise Miner is a plus.
Extensive experience with large data sets and data manipulation.
Strong oral and written communication skills in both English and Mandarin.
Strong project management skills.
Ability to multi-task, handle multiple projects with demonstrated follow-through.
Able to handle ambiguous work environment and operate with little supervision.
A sense of humor, personal integrity, and an appreciation for team-work.

4,支付宝高薪招聘数据分析师

联系Email:flyeykof(@)163.com 或AlipayKDD(@)gmail.com

来源:中国统计论坛 http://bbs.itongji.cn/thread-6503-1-1.html

公司名称: 阿里巴巴旗下支付宝
岗位名称: 数据分析 数据挖掘工程师
工作类型: 全职
招聘人数: 10
工作地点: 杭州
工作年限: 2
专 业: 统计学 数学 计算机信息管理
学 历: 本科 硕士 博士

A. 工作职位 高级数据分析师
城市:杭州
子公司:支付宝
学历要求:硕士
工作经验:三年以上
职位描述:
1、根据对行业、竞争环境以及公司业务的了解,独自承担复杂分析任务,并形成分析报告

2、相关分析方向包括:重要产品相关、用户行为相关,业务逻辑相关;
职位要求:
1、3年以上数据分析领域相关工作经验;
2、硕士及以上学历;
3、具有深厚的数学、统计学和计算机相关知识,熟悉数据仓库和数据挖掘的相关技术,能
够够熟练使用SQL;精通office和至少一种以上的数据分析工具;具有良好的分析报告撰写
能力,能制作专业分析报告;
4、较强的学习及人际技巧、影响说服能力,能在一定压力下工作;

B. 工作职位 资深数据分析师
城市:杭州
子公司:支付宝
学历要求:硕士
工作经验:五年以上
职位描述:
1、 对海量业务数据进行分析挖掘,产出有效的模型供业务部门数据化运营使用;
2、 相关方向包括:用户行为和生命周期相关,风险控制相关,模型架构相关。
职位要求:
1、5年以上数据分析和挖掘领域相关工作经验;
2、数学、统计、计算机等相关专业硕士及以上学历;
3、具有深厚的统计学、数学、数据挖掘等相关知识,熟悉数据仓库和数据挖掘的相关技术
,能够熟练使用SQL;
4、精通一种及以上数据挖掘工具(精通开源数据挖掘软件者优先),具有海量数据挖掘、
分析相关项目实施经验,参加过完整的数据挖掘项目并有成功案例;有网站用户行为研究
和文本挖掘经验尤佳;
5、思维敏捷,良好的逻辑分析能力、良好的沟通及组织能力,能在一定压力下工作
***************************************************************************

上面工作岗位及职能仅做参考,走内部推荐,工作岗位及要求如下:

首先说明,这次主要招聘四种人士
a. 偏技术类并有数据分析倾向人士:精通SQL语言,熟悉数据仓库并有这方面的工作经验
,有往数据分析这个方向发展倾向的人士。
b. 曾从事业务分析人士:通过数据发现业务问题,并可得出结论形成分析报告,有从事类
似职业的人士。
c. 曾从事数据挖掘人士:有从事数据挖掘工作,具备建模能力,有过相关项目成果人士。
d. 特殊领域人士(对以上三种并不精通的特殊领域人士):在金融服务领域、电子商务领
域工作人士,若对以上三种职业并不精通,但对自身所在领域相当熟悉,也将从优考虑。
工作职位 数据分析师(对所有数据分析师的统称,目前内部并未划分高级或资深的职称概
念)
工作地点 杭州
学历要求 本科及本科以上(内部推荐不会有硕士学历的硬性要求,以能力为主)
工作经验 两年及以上(内部推荐的工作经验硬性要求较低,依然能力为主;当然同等条件
下经验越多者优先)
招聘人数 10人

职位描述
1、 对海量业务数据进行分析挖掘,产出有效的模型供业务部门数据化运营使用;
2、 通过业务数据分析,发现业务问题,并可得出结论形成分析报告;
职位要求
1、两年以上数据分析和挖掘领域相关工作经验(b、c类人士必须具备);
2、数学、统计、计算机等相关专业本科及以上学历(b、c类人士必须具备);
3、具有深厚的统计学、数学、数据挖掘等相关知识,熟悉数据仓库和数据挖掘的相关技术
,能够熟练使用SQL(b、c类人士必须具备);
4、精通一种及以上数据挖掘工具(精通开源数据挖掘软件者优先),具有海量数据挖掘、
分析相关项目实施经验,参加过完整的数据挖掘项目并有成功案例;有网站用户行为研究
和文本挖掘经验尤佳(b、c类人士必须具备);
5、思维敏捷,良好的逻辑分析能力、良好的沟通及组织能力,能在一定压力下工作
另外,本次也招聘1-2位市场研究专员,主要从事市场调研工作,需要有相关经验的人士。

5, SAS临床程序员

联系方式: MSN:selin04940@hotmail.com
也可以直接将简历发至:csh04940@sina.com

来源:mysas.net
工作地点在北京
要求:
1. 流行病卫生统计、计算机应用、数学等相关专业2010年毕业生
2. 有过SAS使用经验
3. 优秀的沟通能力和学习能力
4. 英文能基本交流即可

6 招聘SAS工程师

有兴趣的请发送简历到我的邮箱yyivani1984@hotmail.com。

根据零售业务发展和分析需要,对零售客户、产品和渠道进行分析,响应各项业务分析需求

,配合营销活动开展,统计相关绩效指标,配合系统项目开发。

负责团队报表平台,支持常规报表的自动化统计和输出;

负责及时响应业务需求,按需定制各种业务报表;

整合同一客户名下的各种基本属性、产品、帐户、接触记录等信息,生成各类客户分析报告;

配合业务的开展,对重点产品生成业务分析和跟踪报告;

统计绩效指标,生成绩效考核报表,支持有效卡的考核工作;

配合CRM系统项目的开发,参与项目的设计和开发过程;

开发模型并建立风险政策和程序;

通过分段,建立追踪机制去监控新在册客户信贷质量;

验证资产组合行为参数以确保其合适性及与资产组合策略一致;

利用冠军/挑战者方法,协助模型的实施,包括监控、分析测试结果,并在测试阶段提出下一步的建议。

任职要求:

掌握数据分析相关原理知识、掌握零售银行业务、产品、营销等综合知识.

掌握常用的数据挖掘建模方法,如Logistic回归、决策树、神经网络、聚类、关联等,并能通过SAS等数据挖掘软件实现。

很强的统计和分析能力,较强的协调沟通能力,扎实的计算机能力,熟练使用Excel, Word and PowerPoint.

有以下一项以上的工作知识: SAS, SPSS, Minitab.

良好的学习能力,强烈的责任心和解决问题的能力,以及良好的商业敏感性.

7 急招高级SAS分析员
联系方式:hr.interecruit@gmail.com
来源:mysas.net
***新成立数据服务事业部,急需SAS分析员若干。
部门雇员遍布北京、纽约、旧金山、芝加哥,同时还与银行、金融、风险管理、市场、
零售等业界的国内外专家保持密切合作。
我们的定位是成为国内领先,国际先进的智能营销方案提供商,从数据到研究进而到营销计划最终达到
多方获利,为顾客和社会创造更多价值。欢迎你加入成为我们一员。
公司地址: 北京市CBD燕莎商区 (交通便捷)
岗位职责:
对实际业务数据进行分析以及统计建模
与客户会谈沟通以了解项目需要
表现优秀者有机会短期获得管理经验
岗位要求:
本科及以上学历,理工科/统计专业优先
一年以上工作经验,金融背景优先
熟练使用Server和PC版SAS,包括数据处理,宏命令,统计建模,树, enterprise miner
具备敏锐的市场洞察能力,良好的逻辑分析能力,书面及口头表达能力
良好工作态度,优秀团队精神

8 某世界500强医药公司招SAS Programmer

来源:mysas.net

有意者请尽快发简历至:125366522@qq.com,并注明在SAS中文论坛中看到招聘,谢谢!

Job Title: SAS Programmer

Location: Beijing
KEY ACCOUNTABILITIES:
1.Provide timely programming support to data review report and patient profiles by using SAS,

develop and execute validation plans
2.Provide primary programming support for the development of efficient data processing and analysis tools
3.Provide programming support for the implementation of data review plans
4.Provide programming support on phase I study PK analysis.
Experience & knowledge:
Good SAS programming, and other computer programming skill required

Core competencies:
1.Effective English verbal and written communication skills in relating to colleagues and

associates both inside and outside the organization control approach to work.
2.Ability to work effectively in a multi-cultural context as a good team member.
Salary: negotiable

原创文章: ”2010年10月近期SAS职位招聘列表“,转载请注明: 转自SAS资源资讯列表

本文链接地址: http://saslist.net/archives/91


08 10月 10 2010年美国百佳雇主公司


这列表里面中熟悉的公司不多,有google,卡西欧,微软排51,没找到apple,没有IBM,也没有惠普。当然,这只能是反映某一个方面的问题,不能代表公司全部。尽管SAS公司总是被评为100佳雇主,跳槽率很低,但是还是会有人跳槽,说明公司就算提供了非常好的环境待遇,也不能满足所有人愿望。

排名100的最佳雇主列表:

排名 公司名称 2010年增加岗位 美国员工人数
1 SAS 2% 5,487
2 Edward Jones 8% 37,079
3 Wegmans Food Markets 0% 36,770
4 Google N.A.% N.A.
5 Nugget Market -16% 1,342
6 DreamWorks Animation SKG 13% 1,825
7 NetApp 0% 5,033
8 Boston Consulting Group 3% 1,737
9 Qualcomm 3% 12,255
10 Camden Property Trust -6% 1,743
11 Robert W. Baird & Co. 6% 2,286
12 Bingham McCutchen -7% 1,859
13 W. L. Gore & Associates 5% 5,764
14 Recreational Equipment -6% 8,640
15 Zappos.com -21% 1,300
16 Cisco 0% 37,276
17 Methodist Hospital System 6% 11,145
18 Whole Foods Market -9% 47,478
19 Genentech 2% 11,146
20 Devon Energy 4% 3,912
21 NuStar Energy 4% 1,375
22 Johnson Financial Group 1% 1,316
23 Umpqua Bank 8% 1,836
24 Goldman Sachs Group -13% 12,243
25 Novo Nordisk 10% 3,360
26 CHG Healthcare Services -12% 1,142
27 Scottrade 22% 2,409
28 JM Family Enterprises -18% 3,772
29 Quicken Loans 0% 2,893
30 Alston & Bird 7% 1,842
31 PCL Construction Enterprises -10% 3,970
32 Baptist Health South Florida 11% 11,729
33 Shared Technologies -21% 1,243
34 Chesapeake Energy 20% 7,720
35 American Fidelity Assurance Co. -1% 1,502
36 Container Store -9% 3,233
37 Aflac -3% 4,353
38 Scooter Store 51% 2,173
39 TDIndustries 7% 1,588
40 Scripps Health 15% 11,444
41 QuikTrip 5% 10,311
42 Adobe Systems -4% 4,065
43 Salesforce.com 21% 2,361
44 Ernst & Young -4% 24,815
45 USAA -1% 21,999
46 OhioHealth 3% 12,128
47 J. M. Smucker 44% 4,521
48 FactSet Research Systems 9% 1,322
49 Mercedes-Benz USA 0% 1,612
50 King’s Daughters Medical Center 7% 3,263
51 Microsoft 2% 54,923
52 Booz Allen Hamilton 13% 21,303
53 Nordstrom -8% 45,853
54 Paychex 2% 12,456
55 Mayo Clinic 0% 41,839
56 CarMax -16% 13,030
57 DPR Construction -2% 1,142
58 Four Seasons Hotels -9% 12,345
59 Monsanto 5% 10,772
60 Indiana Regional Medical Center 3% 1,200
61 Brocade Communications Systems 39% 2,873
62 Kimley-Horn -19% 1,808
63 Southern Ohio Medical Center 8% 2,286
64 Stew Leonard’s -6% 2,037
65 Arnold & Porter 1% 1,295
66 Plante & Moran 1% 1,547
67 EOG Resources -4% 1,725
68 Men’s Wearhouse -9% 14,764
69 MITRE 2% 6,572
70 Deloitte 1% 39,065
71 PricewaterhouseCoopers 1% 29,387
72 McCormick and Company 2% 2,799
73 American Express -10% 27,265
74 Children’s Healthcare of Atlanta 13% 6,536
75 Perkins Coie -3% 1,680
76 Balfour Beatty Construction -12% 1,514
77 Baker Donelson -1% 1,127
78 Mattel -9% 5,293
79 Meridian Health 12% 7,099
80 Build-A-Bear Workshop -14% 4,588
81 Atlantic Health 2% 7,114
82 Marriott International -10% 110,091
83 S. C. Johnson & Son 0% 3,343
84 Accenture -7% 30,000
85 Arkansas Children’s Hospital 8% 3,733
86 Publix Super Markets 2% 139,578
87 National Instruments 2% 2,568
88 KPMG -7% 20,972
89 Bright Horizons 0% 14,497
90 General Mills -2% 16,681
91 FedEx -4% 218,770
92 Gilbane -11% 1,934
93 Starbucks Coffee -27% 116,357
94 Intuit -7% 6,710
95 Orrick Herrington & Sutcliffe -8% 1,481
96 LifeBridge Health 5% 6,350
97 Herman Miller -8% 5,186
98 Intel 0% 43,905
99 Winchester Hospital 4% 2,027
100 Colgate-Palmolive 2% 5,366

在美国地图上分布情况,发现很明显东部居多。目前看来,美国的公司的在经济、工作环境上也存在地域性不均衡现象。

前100公司分布

注:《财富》杂志的年度“百佳雇主”由《财富》杂志联合Great Place to Work Institute(理想工作场所协会)对美国工商企业界进行了大量的员工调查。公司得分的三分之二基于该协会的“信任指数”(Trust Index)调查结果,该调查的问卷被发送给从各企业随机抽选出来的员工。问卷问题涉及员工对管理层的信誉、工作满意度及同事关系的态度。公司得分的余下三分之一基于企业对该协会的“文化调查”(Culture Audit)问卷的回答,该调查包括有关员工薪酬和福利计划的详细问题以及一系列有关员工聘用、沟通及多样化的开放性问题。

来源:CNN: http://money.cnn.com/magazines/fortune/bestcompanies/2010/full_list/

科技资讯网http://www.cnetnews.com.cn/2010/0204/1624623.shtml

原创文章: ”2010年美国百佳雇主公司“,转载请注明: 转自SAS资源资讯列表

本文链接地址: http://saslist.net/archives/89


07 10月 10 七个SAS公司员工博客


尽管目前大型博客站点纷纷倒闭,但是博客这种非常个性化的形式,不会过时,还是非常适合技术人员来分享技术。我觉得很多大型综合性的博客站不容易个性化,不好定位而导致关门,而个人博客如果定位某一门技术,也许受众很小,但也是能提高所在行业知名度的。当然写博客是件辛苦的事情,大部分都是义务劳动,汗水换荣誉。不过这次推出的是有公司给博主付费的博客,那就是SAS公司。                http:// saslist.net

SAS公司博客最近新增了两位员工博客,一个是关于IML主题,一个是关于JMP主题。毫无疑问,他们是日常工作就是与这些内容打交道,通俗点,他们就是专门干这个的,当然他们的技术博客也值得订阅学习,也可以在博客留言问问题交流,提供技术支持本来就是他们的工作一部分。下面除了给出新开了两个博客,我另外挑选了5个技术性非常强的博客,一个7个,如下:                             http://saslist.net

Rick Wicklin 新开博客

IML模块/studio开发者  Statistical Programming with SAS/IML Software 作者  http://blogs.sas.com/iml/

JMP 新开博客
有关JMP软件 数据展现、six sigma、实验设计及统计            http://blogs.sas.com/jmp/
负责support.sas.com更新                        http://blogs.sas.com/supportnews/
内容为Enterprise Guide, 微软办公 Add-In 和EM. SAS for Dummies作者 http://blogs.sas.com/sasdummy/
SAS用户全球论坛  http://blogs.sas.com/sgf/
SAS培训、认证,一些技巧建议 http://blogs.sas.com/sastraining/
文本挖掘,非结构性文本 团体博客 http://blogs.sas.com/text-mining/
————————————————
SAS公司陆续推出员工博客,值得我们关注。

原创文章: ”七个SAS公司员工博客“,转载请注明: 转自SAS资源资讯列表

本文链接地址: http://saslist.net/archives/88


04 10月 10 SAS语言管窥 SAS_Dream 2004


这个文章最早见于2004年的sasor论坛,现在读来,仍然感觉经典。

尽管SAS经过这么多年发展,并且现在版本更新越来快,新模块和新功能如雨后春笋般冒出来,但是经典的文章仍值得再读一遍,哪怕是你读过很多遍。前一文转载了SAS的零碎印象一文,这两文每次读来都感到自己见识局限。因此,“精通“一词不管用于形容一个人的SAS技术,还是用来作为书名,值得谨慎考虑,再此,重读一些这些经典文章来提醒自己。因此,本博虽崇尚原创,并且网上的转载无数到连作者和出处都变更无数或者干脆没有,但是这里仍推荐大家重读一次经典。          saslist.net

另外,我很迷惑一点,为什么时隔五六年,还没有超过这两篇的关于SAS的中文评论出现,是没有像SAS_DREAM这样的技术高手,还是技术高手很忙?

附:

SAS语言管窥

由 SAS_Dream » 2004-3月-28 00:15

感觉SAS语言体系是庞杂多于宏大。因为很多可以称得上宏大的语系例如微软系或者现在的Java系,多是先有一个比较周全的架构,通过有序的新生、继承和变异,逐渐扩展膨胀的,语言元素之间有比较规范的关联。而SAS的语系虽有局部的架构,但就全局而言,主要是自发形成,也就是20多年的堆积和承袭。其实这也自然,SAS的应用领域靠近最终用户,模式千变万化,很难现有周全架构,只要有可行解就行了,而很多有组织的语系比较靠近系统底层,实际范畴比较集中,比较容易研究出架构。

因此,SASOR们的武艺和兵器往往是门派繁多,千变万化,但是很难有那种18般兵刃样样精通的武林宗师(如果那位知道有,麻烦通知一下,我们好沐浴焚香去拜)。

粗浅的印象是,SAS语系可以大致如下划分:

国语:Base语系

这是SASOR们不分阶级不分贫富都可以讲的话,里面就包含了常说的Data Step,Proc Step和Macro。SAS的基础语言元素主要是在这里演进而来。这个语言可以说是七十和八十年代面向过程处理语言的扛鼎之作,甚至还带有浓郁的非结构化色彩;难得的是SAS公司作为偏重技术的私人公司,二十多年以继承发展而非不断否定的方式打造Base,使得一些二十多岁“高龄”的函数和过程历久弥新,在如今面向对象的强势群体中仍以面向过程的独特魅力占有一席之地。

Data Step为处理与数据存储引擎的交互提供了规范,可以处理大量复杂的数据操作和变量操作,Data Step的底层是用C语言开发的。而Proc Step的出现则具有两重含义,一是将一些常用的过程组合归整为固定的过程调用,在语言书写上或处理效率上起到提升作用;二是确定了今后很多SAS模块语言的规范,比如PROC 的调用格式,CLASS, VAR, BY等语句,被广泛地应用在统计模块(如Proc Reg),数据访问模块(如Proc DBLoad),多维模块(Proc MDDB),数据共享模块(如Proc Server)以及很多GUI驱动的模块的shell命令(如EM中的Proc Neural)。Proc Step用Data Step和C语言结合开发而成。

Macro是Base中增强程序流程控制的语言机制。Macro并不是函数封装的概念,它的核心思路是文本替换,同操作系统shell脚本的机制相似。因此,macro的执行是依据macro定义首先进行文本替换,得出最终程序语句后再解释执行。所以在内存分配中,并不像其它语言中那样形成函数调用堆栈。所以在Macro开发中,不能像函数调用那样实现调用现场退栈式的参数传递。虽然这种机制不像函数调用那样带来更多的编程灵活性,但是由于文本替换不涉及复杂的内存分配管理,所以即使用很复杂的macro,替换的效率也很高,同时出现内存管理错误的概率也较小。由于Macro的设计含有大量的非结构性元素,所以编程的流程管理要多加注意,否则很容易造成程序可读性差的现象(事实上,看到%就想吐的现象是普遍存在的)。

Base中有一个过程值得单独加以考察,就是Proc SQL。事实上,它实现了对SQL的兼容,给很多熟悉SQL的编程者多了一个选择。截至V8系列,Proc SQL使用的SQL是基于SQL92标准的SAS SQL超集,有很多SAS特点的语法。关于同样的处理是使用SQL还是Data / Proc Step效率高的问题可以另行讨论,简单的说,从设计思路上,SQL是基于集合的语言,而SAS是基于记录的语言;SAS的开发在SQL和Data / Proc Step上并不是协调一致的,在V6的SAS中,很多SQL操作明显比Data / Proc Step低效,在V8中,SQL有了明显改善,有些情况下会超过Data / Proc Step,但是也需具体情况具体分析,随着数据量的增长,Proc SQL不如Data / Proc Step内存管理稳定的现象会渐渐明显,效率会有较大差距;在V9开发中,SQL的势力进一步增强,提升幅度也会比以前大。

Base语言的技能和思路是SAS的基本功,也是进入至高境界的重要途径。对于初入江湖的少侠,Base语言像马步冲拳非连不可,而到了“手中无剑,心中有剑”境界的大侠,也往往只用SAS摆平一切,代码思路之惊艳让人叹为观止。

官方语言:分析语系

分析语系是以PROC STEP架构扩展一些分析模块的语言,包括STAT,OR,QC,ETS,Insight和EM的shell过程,还有用于算法扩展的IML等。

分析语言有些贵族,因为需要有相应的背景特别是统计背景的人才能讲好。换句话说,SAS的贵族气质,主要也是靠分析语言表达。

经典统计语言STAT是名门望族的常用语,每个过程都是多年的功力积累,所以即便是极为常见的过程,也是在性能、精度特别是边界条件处理上表现出众,任何一个竞争对手,如果有机会去看到STAT开发组的豪华阵容和深厚积淀,都应该知道想要技术上超越STAT要承受的压力。

经济时间序列语言ETS也是在一个专门领域练透内功的产物,支持的算法种类和可定制性十分突出。

QC和OR语言是在专门学科应用领域的力作,尤其QC,是大型分析套件中,位置十分突出,不过这个领域里竞争对手的研究也很深入,做到关键功能不逊于SAS的也有。

Insight的语言主体是PROC Insight,可以以后台批量方式完成Insight操作。

EM的语言是针对EM中的各个处理节点,提供相应的PROC集合,例如PROC DMDB来生成数据挖掘数据库,PROC TREE实现决策树,PROC NEURAL实现神经元网络,等等;这种语言扩展有很重要的意义,很多厂家在炒“in database mining”的概念,实质上就是可以用一些挖掘语言直接对数据库进行挖掘操作,而EM语言与SAS数据引擎和其它SAS语言本身就是浑然天成,优势独到。

IML是针对矩阵定义和运算的语言扩展,有些另类,但是用好了可以写出很多复杂的算法。并不是所有的人都能或者都需要学好分析语言,而且把所有分析语言都精通和熟练也非易事,但是结合实际问题和统计知识,多理解一些对于思路的发展益处多多。其实数据库领域本身是非常适合统计知识的应用的,经常为数据库管理所累的设计开发者,借助SAS实地操练一些统计知识,会发现另外一片天地,比如数据库的查询命中率优化和结果数估算,数据量推算,数据仓库里的数据质量评估和提升,数据库厂家的很多方法知识含量少得可怜,用上SAS的分析语言,往往是迎刃而解。

形体语言:Graph

SAS Graph的强项不在于免编程的易用性,而在编程语句的完备。真正掌握了Graph编程会获得极大的自由,尤其是会熟练运用Annotate之后。有两大类方向上可以施展Graph功力,一是统计分析,当年SAS的数据挖掘大师Will Potts(现在在Data-miners,与Gordon Linoff等大师共事)讲解神经元网络的时候,就是自如运用Graph语句观看效果,辅助分析,熟稔程度令人叹为观止;一是应用展示,Graph对于图形种类的支持、定制的变化、比例的调配、边界条件的处理以及大数据量绘图的优化处理上均有不俗表现,很多时候Graph结果会给应用展示增添耀眼的亮点。

Graph技能出色的SASOR,像是轻功超卓的大侠,挥洒之间,偶像感十足。

时尚语言:SCL(AF)

SCL隶属于AF模块,是SAS语言中具有面向对象特征的开发语言。它的主创人之一据说是在SAS总部的一位台湾设计师,而且是OOP里还算开始比较早的开发语言。SAS一度想利用SCL与业界的流行开发语言体系接轨,其间加大投入,但是由于这个领域自身变幻莫测,SAS又不是领头羊,因而SCL在最近版本中具有极强的“时尚色彩”,所谓“时尚”,就是容易张扬也容易过气。SCL的名字也经历着变化,原先叫Screen Control Language,老老实实地想做GUI,后来叫SAS Component Language,俨然一副改天换地挑大梁的架势。而现在,Java在研发中的呼声很高,SCL的前景就很微妙,因为新派的Java系开发者对SCL和Base知道得相对较少,而传统的了解Base的SCL开发者转型Java也并非易事,SCL逐渐从前台退到后台,甚至重点集中到了通信接口层。因此,SCL是否会就此过气,很多人在怀疑中… ….

个人的观点是,SCL还是一套很漂亮的开发语言,自己建立了一套变量规范和流控体系,特别是OOP的体系,虽然C或者Java的熟手会看着怪怪的,但是实用性和效率上还是有自己的特点。SCL中的最重要的数据结构是SCL List,这是一种类似于Java数组的树形数据结构,这是一个兼顾灵活性和处理效率的设计,整个对象体系在这个结构上做文章,核心思路简明精炼;同时在与SAS数据引擎的交互上有突出的便利性。

至于SCL中的一些可视控件,也就是众多的FRAME元素,虽然在某些方面有特点,但总体上是乏善可陈。

SCL的使用主要集中在应用开发特别是一些前端开发上,但是AF,以及利用AF开发的EIS等模块都有些前景未卜,到底如何投入精力去掌握SCL,是个值得思考的问题。

劳工号子:引擎类语言MDDB和SPDS

这里没有丝毫贬义,因为使用多维引擎MDDB或者并行引擎SPDS的开发者,多是责任多于成就感,劳累多于飘逸的苦行者。

SAS MDDB是SAS用于多维处理的模块,现在有更时髦的名字SAS OLAP Server,后台的核心语言元素是Proc MDDB,这是个处理多维存储的功能强大的过程,想充分发挥SAS多维引擎优势的开发者,不妨着力修炼一下这个过程步。

SPDS是SAS用于并行处理的数据引擎,其实是SAS的数据引擎宗师Ami自创的一套独立的并行数据库,和Base SAS特点迥异。Base SAS对于SPDS的处理就像连接Oracle等外部数据库,Base语法用于SPDS很大程度是为了程序书写形式的兼容,而要想真正发挥SPDS的并行优势,需要掌握一套基于SPDS的SQL,和SQL Pass Through的连接语法。SPDS的名气不是很大,但在有经验的设计师调配之下,它发挥的性能是惊人的。

但是这两个语言的问题是,当劳工渐渐转变为白领以后,劳工号子就可能变了… …OLAP和SPDS是SAS V9和以后版本表面封装的重点,语法变化和依附性变化都会很大,所以旧船票是否能登上明天的客船还是一个谜… …

外地语言 Connect / Share和外语Access

Connect和Share是本地SAS调用远程SAS进程的通讯机制,SAS的C/S架构使用对等主机的概念,SAS主机之间可以通过Connect语言中的Rsubmit块、Proc Upload/Proc Download等语言元素互相提交任务,反馈结果。Share语言的主体是Proc Server,通过这个过程,将SAS数据和计算共享给远程SAS主机或是ODBC,JDBC接口。

ACCESS模块的功能是使SAS可以和很多异构数据库进行双向透明的交互。V8以后的ACCESS可以通过Base语言中Libname的扩展节省编程语句的复杂度,但是在必要的时候,仍可以通过ACCESS、DBLoad等过程来处理灵活复杂的要求。

其它边远地区的方言

还有很多模块可以通过Proc Step扩展或SAS函数的形式拓展SAS语系的范围。这里不再赘述。

原创文章: ”SAS语言管窥 SAS_Dream 2004“,转载请注明: 转自SAS资源资讯列表

本文链接地址: http://saslist.net/archives/87


02 10月 10 一本得不到的SAS书


书名为: Professional SAS Programming Shortcuts – Over 1,000 Ways To Improve Your SAS Programs

这本书是老少通吃的书,不管你是新手,还是多年的老手程序员,这本书都是书架必备,不可多得的。但是这本书在大陆没有买的,网上不可求的。中国大陆图书馆没有收藏,香港中文大学和香港大学图书馆有藏; 台湾国立成功大学和台湾中原大学图书馆有藏。saslist.net

Amazon上的作者摘要和图书信息

Summary:
In just three years, Professional SAS Programming Shortcuts became SAS programmers’ favorite book of tips, techniques, and algorithms. The new 2nd edition is updated and redesigned to provide quicker access to how-to instruction and thousands of examples of common data processing techniques done in SAS, including many not described in any other book.

Author : Rick Aster
Binding : Paperback
BISAC Subject : COMPUTERS / Programming Languages / General
Book Type : NON-FICTION
Dewey : 005
Edition : 2 Updated
Language : English
LCCN : oc2007025008
Library Subject : SAS (Computer file)
Pages : 448, 448 p. :
Publication Date : 04/30/2005

下面是书的目录清单:对SAS BASE部分有非常详细细节讲解。saslist.net

Lists
12 (1)
Introduction 13 (2)
The Log
15 (8)
Running a SAS Program
Messages and Debugging
Program Files
23 (4)
Startup
27 (6)
Batch Mode
Interactive Mode
Special Modes
SAS Processes
System Options
33 (12)
Setting System Options
Obtaining Values of System Options
Libraries
45 (4)
Dataset Options
49 (4)
Selecting Data
Other Uses for Dataset Options
Errors
Indexes
53 (4)
Actions on SAS Datasets
57 (10)
Creating
Describing
Changing
Copying
Deleting
Data Type and Length
67 (6)
Data Type
Length
Setting Data Type and Length
Using Data Types
Determining Lengths for Variables
Text Data Files
73 (6)
Filerefs
Input Text Data
Output Text Data
Data Fields
79 (8)
Scientific Notation
Signed Numerals
Implied Decimal Points
Measured Strings
Variable Number of Fields
Continuation Character
Delimited Files
87 (6)
Hierarchical Files
93 (6)
Input
Output
Binary Files
99 (6)
Binary Files
Binary Fields
Binhex
Value Formats
105 (4)
Value Informats
109 (4)
Picture Formats for Numbers
113 (4)
Format Catalogs and Control Datasets
117 (10)
Format Catalogs
Control Datasets
Time
127 (6)
Informats and Formats for Time
133 (4)
International Date Formats
137 (2)
Picture Formats for Time
139 (4)
Validation
143 (10)
Informats and Error Controls
Validation Logic and Exception Reporting
Integrity Constraints
Strings
153 (14)
Testing Strings
String Transformations
Substrings
Translation and Encoding
Measuring Strings
Advanced String Processing
Parsing
167 (4)
Variable-Length Strings
171 (4)
Terminated Strings
Measured Strings
Pascal Strings
Foreign Data Types
175 (8)
Binary Integers
Union
Structure
Pseudo-Array
Set of Characters
Codes
183 (10)
Code I/O
Digit Strings as Packed Hexadecimal
Punctuation
Parts of Codes
Conversions
Serial Numbers
Check Digits
Text Encryption
193 (4)
Character Substitution
Transposition
Discrete Binary Encoding
197 (6)
Bitfields
203 (6)
Bit Testing
Numeric Bitfields
Numeric Bit Testing
Bitwise Functions
Numeric Effects
209 (6)
Rounding
Range Effects
Percents
Testing Numbers
Missing Values
215 (6)
Boolean Values
221 (8)
Financial Calculations
229 (6)
Time Conversions
235 (10)
Points in Time
Duration
Clock Issues
Spherical Coordinates
Time Arithmetic
245 (8)
Extending the Observation Loop
253 (4)
Comparisons
Rounding
Time Loops
Time Interval Arithmetic
Age
Loops
257 (6)
Character Loops
263 (6)
Subsetting and Sampling
269 (8)
Subsetting
Sampling
SQL
277 (4)
Sorting
281 (8)
Groups
289 (8)
By Groups in Proc Steps
Formatted Grouping
Class Groups
Processing Groups in a Data Step
Incomplete Data
297 (6)
Key Combinations and Sequences
Interpolation
Transposing
303 (8)
Transposing in a Data Step
The Transpose Proc
Frequency Tables
311 (10)
Descriptive Statistics
321 (8)
Creating Summary Data
Degrees of Freedom, Weights, and the Variance Divisor
Summary Statistics in Computations
329 (4)
Type Conversion
333 (4)
Automatic Type Conversion
Functions for Type Conversion
Changing the Data Type of a Variable
Combining Data
337 (6)
Table Lookup
343 (6)
Boolean Lookup
Comparison Lookup
Lookup Based on Index Value
Lookup Functions
Table Lookup From SAS Data Files
349 (8)
Indexed Lookup
Lookup Based on Observation Numbers
Sort-Merge
Other Lookup Techniques
Value Formats for Table Lookup
357 (6)
Validation
Control Dataset
Multiple Variables
Calendars
363 (10)
Multiple Text Files
373 (8)
Input
Output
Single-Step Techniques for Input
Print Files
381 (10)
Print Files in the SAS Environment
Title and Footnote Lines
Print Output in Data Steps
Print Output in Proc Steps
Table Reports
391 (10)
Data Step Report Programming
401 (10)
Data Step Views
411 (4)
Macro Variables
415 (6)
Assigning Values
Obtaining Values
Macros
421 (10)
Parameters
Macro Control Flow
Managing Macros
Macro Programming
431 (6)
Macro Expressions
Macro Functions
Macro Statements
Avoiding Errors in Macro Programming
Program Parameters
437 (4)
Generating Program Statements
441 (6)
Control Reports
447 (4)
Cleaning Up a Program
451 (8)
Macro Cleanup
459 (4)
Efficiency
463 (14)
Priorities
Run Time
Memory
Sorting
Saving Storage Space
477 (8)
Observation Length
Number of Observations
Saving and Deleting Data
Compression
485 (4)
Porting Files and Data
489 (6)
Porting SAS Programs
495 (6)
Dependencies
Isolating Nonportable Code
Translating Programs
501 (8)
Translating to C
Translating From Other Languages to SAS
Style
509 (4)
Data Step Windows
513 (12)
Defining a Window
Displaying a Window
Fields
Interaction
Data Entry and Editing
Status Dialog
Animated Progress Bar
Macro Windows
525 (4)
Interactive Line Mode
529 (2)
Menu Bars
531 (8)
Command Processing
539 (2)
Text Processing
541 (12)
Text Expressions
Names and Alphabetic Keys
Words
Name Matching
Text Analysis
553 (6)
Random Numbers
559 (4)
Random Number Generators, Streams, and Seeds
Random Number Functions and Call Routine
Distributions for Random Numbers
Simulations
563 (6)
Legacy Systems
569 (6)
Data Center Files
Y2K
Other SAS Versions
Database Applications
575 (4)
Database Design
Database Programming
Metadata
Client-Server Design
579 (4)
SAS/Connect
Control Level
Classic Problems
583 (8)
Prime Number Sieve
Life
Global Distances
Afterword 591 (2)
Index 593

需要说明的是,这本书是2005年出的,那时候只有SAS9,随着新的SAS版本9.1,9.2的推出,很多功能在新版本里面有更容易简单的做法,期待此本书新版并且在中国大陆可以购买。saslist.net

原创文章: ”一本得不到的SAS书“,转载请注明: 转自SAS资源资讯列表

本文链接地址: http://saslist.net/archives/84