msgbartop
List for SAS fans and programmer
msgbarbottom

30 1月 13 2013评点——怎么才能成为数据分析专家


2013已至,春节将至,本博距上次更新已经有两个月了。一个不成熟的观点一直在酝酿,到现在为止,还不大成熟。不过有些事情,现在不写,以后恐怕就也没有机会写了。

大数据,皇帝新装

这几天,终于可以闲下来了,翻翻了给俺家闺女准备的童话读物——《安徒生童话》,于是重新温故了下小时候读过的《皇帝的新装》。读完感觉:经典就是经典,这个世界有时候就是那么简单的重复着,故事老套,几百年都可以不变,情节都可以一样。 记得2000年左右上大学那会,一句“21世纪,是生物学的世纪” ,害得多少莘莘学子挤破脑袋去抢报生物专业。四年后,要么毕业去卖假药,比如“鳖精”、“红桃k”,“太阳神”等等;要么一条道读到黑——从硕士,博士,圣斗士,到烈士。现在不知多少“受害学子”在追问是谁不负责任的乱说 (注:这里不是埋汰学生物的人,这些都是学生物的同学跟我的吐槽)。类似的“21世纪是XX的世纪”可多了,什么“计算机的世纪”,“互联网的世纪”,“厨师的世纪”,最近还出了个“大数据的时代”。不扯远了, 还是谈谈童话吧, 皇帝爱衣服, 要新装;大臣爱皇帝,要皇帝开心;百姓爱大臣,要维护大臣;骗子爱金子,要卖衣服给皇帝。 于是生意就这么成交了,大家都开心了。本来新装游行都是这么顺利地,成功地进行,也是值得庆祝的。最讨厌的是安徒生, 偏偏安排个小朋友,说了那么一句不和谐的话,搞得这则童话变笑话,一直流传到现在。 想想,大数据,不就是这么回事么。 这个世界需要创新(未考证), 政府们需要业绩(真的), 科学家们需要拿课题(真的),厂家们需要卖硬件/软件(千真万确!!!,看看SAS的HPA和SAP的HANA硬件需求)。就这样,新的一场新装游行开始了,奥巴马的“新能源”不吸引人了,赶紧上新货——“大数据”,哄选民很重要。于是政府点头,科学家们牵头开会, 硬件软件厂商搭台,各方互动开始,大家有兴趣,可以看看我2012年收集的微博资讯——会议信息。 http://saslist.net

务实吧,准专家们!

什么叫务实,我觉得是用现存的工具马上解决问题叫务实。UC Berkeley和Twitter联袂推出的公开课《Analyzing Big Data With Twitter》中提到:“务实的不从机器学习,而是着重从软件方法的角度来谈解决大数据的问题”。 作为SAS粉,不得不有时候踏踏实实感到SAS/HELP文档的深度和厚重,还有其系统性,其他软件是没有可比的,深耕SAS各个模块的帮助文档,如果你真的下定决心学好统计软件的话。另外,SAS在中国大陆高校开始推行免费政策,人大,北大,华东师范等一些高校师生已经陆续用上了免费的SAS。这招挺务实的,比以前组织的不靠谱SASor聚会靠谱多了。

前两天,刚好到一个校友实验室参观了下,面积不大,不到70平,不过做出来的产品只有一种,但用途很广,能替代同领域的任何厂家的产品。重点的是,他们是正向开发,不是拆机山寨模仿。他还讲了一个故事,有一家公司的设备某部件出问题,以前找一单位帮忙搞定,人家派出了一支十余人的庞大团队,问题最终没有解决。后来偶然机会找到了他,他一个人前往,很快解决。虽然别人不大相信他能做到,但是他确实精通别人十人团队各个角色的业务。这年头,“专家”无用,所谓的“团队合作”,只能提高体力之类工作的效率。真正的专家其实都是通才。说到数据分析这个行业吧,你也必须什么都懂,理论,工具和业务,一个都不能少。http://saslist.net

后来,和校友聊天才知道,博士毕业后,选定了这个方向后,投入了5,6年,才做出今天这样的产品,其他方面的事什么都没干。前段时间,微薄上流行个“一万小时天才理论”,尽管这个说法有点成功学的味道(因为天才和成功都是无法界定的,虚的。),但是却扎扎实实地道出了要成为某一个领域的专家,练习实践不可缺少的事实。比如说SAS编程技能吧,SAS语法这么晦涩难懂古老, 没个三五年,很难熟练使用。业务嘛,每行的水都很深,少不了几年的行业浸润。要成为专家,投入还是挺巨大的。

当然也不乏风险,他提到他选的这个方向是他自己选的,和他导师建议的不一样。后来证明他是对的,产品高端,又不失市场。虽说,我觉得大数据是虚的,但是数据分析却是正儿八经的实在。这类职业,不光是在国内,美国和加拿大的需求也很旺盛。数据科学家(DS)的概念也挺靠谱的,以后可作为数据分析的主攻方向。http://saslist.net

 新手建议

一个小插曲:前几天一位QQ群新朋友, 问的是简单的编程问题,有关数据清理的,却口口声声说是她主要是搞算法的,我建议她直接用SAS/EM点点就行了,偏不! 非要体验下SAS编程的感觉,哈哈哈哈… 。我好心建议她从从基础学起,讲了半天,无果。我这里不想在重复了,在本博读者互动栏,有关于SAS学习及工作前景的一些问题,还有几位朋友的经历可以参考下:一个SAS菜鸟的故事我的数据挖掘之路

注:本来常规的微博汇总每月一次,无奈,微博里的有效信息量大减,继续汇总没有意义,停了。

原创文章: ”2013评点——怎么才能成为数据分析专家“,转载请注明: 转自SAS资源资讯列表

本文链接地址: http://saslist.net/archives/310


Reader's Comments

  1.    

    做个合格的数据分析师一定要先打基础,统计要学透,数据挖掘方法,线性代数,运筹学,计量经济学等。别听别人瞎说会个软件就能做数据分析,那就跟没计算机基础编程一样,貌似是个程序,其实全是bug。如果做简单的工作,整理数据,跑软件,报表软件都包了,不学也凑和。这些都是基础,另外还要有深厚的行业知识。

    Reply to this comment

Leave a Comment