人的一生要经历无数个圈子,亲戚圈、邻居圈、同学圈、朋友圈、同事圈、户外圈、旅游圈、亲子圈、家长圈、相亲圈 …… 现在有了网络,各种新的圈子诞生,BBS论坛、Email列表、聊天工具qq/msn,SNS,微薄都是建立新圈子的工具等等。根据社交网络的理论,关系圈分强关系圈和弱关系圈。强关系是指你关注或加入的好友都是认识的人,基本上你只与熟悉的人在网络中产生互动;弱关系是指通过一些共同爱好建立关系的陌生人。saslist.net
说到圈子,市面上有本很火的书叫《圈子圈套》1,2,3,据说作者王强曾在SAS公司工作过,这本书讲的是与数据分析软件公司之间的故事,但都是关于销售职场的事情,基本上和软件编程关系不大。我也有很多同学做销售,据说很开眼界,很刺激,不是俺们这些死宅程序猿们能体验感受到的。有兴趣的可以看看,不同的世界。
因为自学SAS,我在网络上加入了很多SAS相关的圈子,比如网站,邮件列表,BBS论坛,聊天群,博客,SNS,微博。因为共同爱好SAS,所以结识了不少SAS圈子里的朋友,有不少还私底下聚会或单独见面过。可是人生都是有聚有散的,在人生的不同阶段经历了不同的见面与分别。因为是兴趣使然,所以话题离不开SAS。可惜有很多精彩的话题,没有以文字的形式保存下来。特别是在这种网络弱关系下,人聚散变得更快,话题多变而缺乏积累性。
今天翻看电脑文件,发现我保存了2010年-2011年间在老SAS圈子大家讨论的话题(已经Google不到了,新版SAS圈子地址:http://mysas.net/sns),当时那里差不多聚集了一批很活跃的SASor(有很多是高手),大家讨论着些SAS的问题。这里和大家分享一下(仅部分话题),尽管当时参与的人不多,但是很有氛围。这些问题也许对SAS新手有些帮助。
1,大家是如何发音SAS的?~
大家是如何发音SAS的?~
突发奇想~ 法语发音SAS是念“萨斯”,英语如果念“萨斯”就变成非典了吧 -0- ~ 所以觉得可能会读成“赛斯”~ 因为我开始接触SAS就是在法国的,所以也不知道国内和英语国家是如何发音,特发投票~~谢谢大家参与!~ ^^

- superkuhasu 那个第三个选项,实在是~~~路飞那个菜鸟,足足喊了20多集的艾斯,最后把艾斯喊死了~~2011-07-19 14:08
- tianwild 当有人不晓得时就这么读了…2011-07-19 21:53
- uzoffy 沙士。。。香港人是这样念SARS的2011-07-20 15:12
- zhangzachary 香港人 -0- 应该教教他们平舌音~~2011-07-22 01:32
- sxlion 刚开始的时候,我不停的纠正别人SAS应该读“赛斯”,后来发现太辛苦了,干脆自己也读成“萨斯”了,否则还得向别人解释一通。 后来有天跟人提起SAS,念成“萨斯”,结果别人抓了半天脑袋,说“你说的是赛斯把,应该读赛斯”。 那时,我比较无语。2011-08-13 17:28
2,SAS9.2到底是用什么编的?saslist.net
SAS9.2到底是用什么编的?
(最多可选9项)
SAS9.2到底是用什么编的?
这种重量级语言,风格混搭到难以想象的系统是用什么开发的呢?
ps:SAS源码没公开
参考:http://en.wikipedia.org/wiki/SAS_System
https://groups.google.com/group/comp.soft-sys.sas/browse_thread/thread/8c8197344a8ab03c/2fcd5f9025bebdc5?lnk=gst&q=language#2fcd5f9025bebdc5

- sxlion:我觉得SAS9.2里面的JAVA痕迹很严重啊,怎么参考里面就没有提到呢? 2010-04-27 20:59
- shiyiming Windows版BASE SAS应该是C写的。Web Application都是Java的。2010-04-28 07:24
- ahuige JAVA应该是近年的版本才使用作开发的吧,早期版本比JAVA出来得还早。所以不是从JAVA发家来的。其实用什么语言开发不重要,重要是用户体验怎么样。其实BASE的语法里面,还有宏,和C还有UNIX SHELL的一些特性很相近2010-04-28 10:25
- jthu SAS系统由C、Java等语言写成,还有一个可能会被忽略的就是,SAS的一些产品也用SAS本身来编写。2010-06-09 21:52
- oloolo SAS最近在JSM招人,只要求C 2010-08-07 10:57
- superkuhasu 从观察和查壳来看,基本是c,c++以及java 2011-02-11 13:38
3,你使用过SAS的快捷键么?
写下你经常使用的快捷键吧。
- sxlion 经常用F3,注释和消除注释等。2010-11-21 09:38
- tianwild 最常用F8..2010-11-21 22:43
- sassslr F8 啊2011-02-26 15:21
4,用SAS对数据集中观察值或字段的操作…
- shiyiming data step太强大了,proc step就是封装的data step。2011-01-28 13:58
- sxlion IT背景的人,可能比较喜欢用sql 2011-01-28 14:01
- tianwild sql只是特别需求的时候弥补data步 2011-01-28 14:24
- ahuige 以列为方向的操作可多用SQL。以行为方向的是DATA STEP。2011-01-28 17:28
- sxlion 哈哈,终于有一个不同的选择了, 2011-01-30 10:56
- jeozu 我似乎也是分析用数据一般data step,如果记录操作一般用sql, 有时候干脆就execute ()by oracle 了。2011-02-18 18:47
- sxlion 哈哈,你就选个sql吧。我只是有点好奇,有点公司爱sql,有的公司爱data步。2011-02-18 23:03
5,SAS的“Call routine” 应该翻译成下面哪个?

- ahuige 我认为应该叫应召程序 2011-03-09 20:50
- shiyiming 的确很难翻译,哪个都感觉不合适。2011-03-09 21:45
- tianwild 就别翻译了 直上E文…2011-03-09 22:33
- sxlion 是啊,我也纠结了很久,确实不知道怎么定。以前我把它翻译成“call 例程”,有点台式风格,hujiangtang翻译成“call子程序”。2011-03-09 22:34
- sxlion “应召函数”不错,就怕那天天朝敏感了, 还得要改成“失足函数”。想来想去,干脆函数前面加个call吧,如果要区别就是“call函数”,不区别也还是叫函数。不知道这样怎么样 ?2011-03-09 22:40
- ahuige 不开玩笑了 按实际特点翻译成非直接返回值函数就行了2011-03-09 23:34
- ahuige 有的人学过那么多别的语言 void函数你们比我懂吧?2011-03-09 23:43
- superkuhasu 调用例程(台湾叫调用常式)因为如果routine就叫子程序,那么subroutine就没法搞了。具体情况,计算机专业术语里有,属于已经规范概念。2011-03-10 11:45
- jingju11 调入例程2011-03-11 11:16
- sxlion 不好意思,刚刚翻了下SAS的中文帮助,发现里面翻译成Call 例程。有点别扭,不过SAS语言风格向来就这么独特。2011-03-11 11:42 http://saslist.net
6,大家来预测一下“死猪头”是什么行业的?

- tianwild 老猪的帖子都变“…”了 猜有点难度了2009-12-28 22:07
- jingju11 零售业:卖肉的。2009-12-29 09:31
- superkuhasu hahahahahahaha2010-01-02 16:51
- collen 这个俺知道,就不投票拉,以前俺的一个表妹还是老兄那的人事主管呢,哈哈哈2010-01-03 16:26
- shiyiming 果然这个圈子小的很,时不时就会碰到熟人。2010-01-03 16:33
- raya 谁是死猪头啊?2010-01-04 18:20
- yajiezou 零售业:卖肉的2010-01-16 05:00
- alax_hou 我是打酱油的2010-01-22 14:29
- tianwild 不好意思 酱油已卖完 只有醋了2010-01-23 20:31
- ahuige 该人是最珍爱自己的代码的。发过就删。自我保护到了极点。。。2010-05-10 13:06
- shiyiming 他有贴身“保镖”hopewell,他的每段代码只要一贴出来,hopewell都会copy/paste下来。嘿嘿。2010-05-10 13:52
- oloolo 我最佩服hopewell的是丫极其勤奋,精力极度旺盛,羡煞我等老头子2010-08-07 10:58
7,对于这种数据挖掘,大家有什么建议 ?
Amazon的数百万图书,Netflix的10万部电影,淘宝的8亿件在线商品,以及数以亿万计用户的资料和行为记录……互联网公司最近十年的迅猛发展伴随着海量数据的积累。然而,在线用户常常面对过多的选择而显得无所适从。心理学研究证实这类情境下的用户有时做出放弃交易的决定,从而造成大量潜在的用户流失。统计技术的发展能够为在线服务商提供更有效的推荐算法,在帮助用户走出信息过载困境、改善用户体验的同时,还能够挖掘商品长尾、提升企业价值。在今天,用户不再局限于通过搜索引擎来寻找感兴趣的信息,推荐系统无所不在地为我们发现自己的潜在需求。
推荐在社交网络中的应用同样受到业界重视,本届统计建模竞赛的目标是为某个以婚恋为目的的大型交友网站提供会员推荐的智能算法,改善会员推荐的精度,增加网站黏度。
网址:http://www.statmodelingcompetition.com/index.html
评论 (17 个评论)
- hssnow 我们准备参加呢…不过无从下手啊2011-03-18 21:13
- shiyiming 我觉得有商业应用价值,不错的。想出这个主意的R都也算是三赢了。2011-03-18 21:24
- tianwild 会被认为作弊么,要是有时间也想弄弄完 貌似非学生不好..2011-03-18 21:27
- nobodyknows 呃,这个是我同学组织的……上周的时候在北京就有一个recommender system 的大会,不知道圈子里有人去了没,感觉现在尤其是电子商务网站非常看重这块2011-03-18 21:37
- sxlion 施主也嗅到了商业价值哈。讨论只是交流看法,离真正实施还差很远啊。再说有价值的东西,懂的人不一定会说的。2011-03-18 21:44
- tianwild 其实俺第一次上这类型网站就想到 他们是怎么推荐的 假如用DM来要怎么做.. 2011-03-18 22:04
- shiyiming 讨论只是交流看法,离真正实施还差很远啊。再说有价值的东西,懂的人不一定会说的。我们公司里我领导的其中一个组就是做类似算法的2011-03-18 22:09
- shiyiming 核心算法其实很简单,我手下其中一个组就是干这个的,因为是商业的应用,所以不能说太细。最主要的问题是降维,否则算1年也算不完。我看了题目只有4个变量,大概10种交友状态,860万条数据,6万名客户,虽说有一定的商业价值,但是还是太简单,只能算加强版的实验室应用。我们的实际商业情况是几千个变量,几百种状态,30亿条数据,2千万客户。常规的统计算法根本不适用。2011-03-18 22:17
- tianwild 施主说的很在理,实践中才能遇到这样的问题,有实践才能出真知,能有这样的机会来实践是很重要的2011-03-18 23:53
- oloolo their problem is similar to this year’s KDD, Yahoo Music It is actually a hard problem in the opposite direction: how to leverage as much information as possible out of the 4 variables? Taking the observation wise correlation into consideration might help, IMHO 2011-03-19 00:14
- oloolo we have exactly a similar question on our MYSAS FORUM: http://www.mysas.net/forum/viewtopic.php?f=4&t=7411 I just feel there are unprecedented opportunities in Business Analytics in China (include simple RFM to extremely sophisticated machine learning algorithms and many more). The career future for professionals in this area is ulimited, simply put.2011-03-19 00:18
- shiyiming 真的诺,惊人的相似,怎么各公司都在埋头搞相同的东西2011-03-19 00:22
- tianwild 如果是一家小的B2C网站,在这块以及分析上的经济性会不会就没这么高呢,相比ROI就很低…2011-03-19 00:44
- oloolo they have very similar business problems, and they found out that someone already dealt with very similar problems years ago and it was effective, then all ppl converge. I don’t think companies have any interests to invent new algorithms but apply effective methods to their specific business cases. In my world, a quick simple but not so accurate model is way better than one that is more sophisticated yet needs 6 more months to develop and pain-in-the-ass implementation thereafter. TIME IS MONEY, and I need money!2011-03-19 03:03
- sxlion 已经想到两种方法了,不过测试数据没出来,暂时不能测试,有点担心速度问题。我发现数学是门通用的语言,各个学科之间虽然背景和要解决的问题不同,但是归结到底数学问题是一样的。2011-03-19 23:44 saslist.net
哈哈 看着圈子里这些老话题甚是情切啊!