导读: 与其说是统计学习那些事,不如说是非统计专业博士毕业的那些事。这篇文章不光内容比较好玩,可读性强,还有很大的参考价值,因此推荐广大SASor读一读,在以后的工作和科研中会用得到的。
香港科技大学 电子与计算机工程系 eeyang
在港科大拿到 PhD,做的是 Bioinformatics 方面的东西。Bioinformatics 这个领域很乱,从业者水平参差不齐,但随着相关技术(比如 Microarray, Genotyping)的进步,这个领域一直风风光光。 因为我本科是学计算机电子技术方面的,对这些技术本身并没有多大的兴趣,支持我一路走过来的一个重要原因是我感受到统计学习(Statistical learning)的魅力。正如本科时代看过的一本网络小说《悟空传》所写的:“你不觉得天边的晚霞很美吗?只有看着她,我才能坚持向西走。”
离校前闲来无事,觉得应该把自己的一些感受写下来,和更多的爱好者分享。
先介绍一下我是如何发现这个领域的。我本科学自动化,大四时接触到一点智能控制的东西,比如模糊系统,神经网络。研究生阶段除了做点小硬件和小软件,主要的时间花在研究模糊系统上。一个偶然的机会,发现了王立新老师的《模糊系统与模糊控制教材》。我至今依然认为这是有关模糊系统的最好的书,逻辑性非常强。它解答了我当年的很多困惑,然而真正令我心潮澎湃的是这本书的序言,读起来有一种“飞”的感觉。后来我终于有机会来到港科大,成为立新老师的 PhD 学生,时长一年半(因为立新老师离开港科大投身产业界了)。立新老师对我的指导很少,总结起来可能就一句话:“你应该去看一下Breiman 和 Friedman 的文章。”立新老师在我心目中的位置是高高在上的,于是我就忠实地执行了他的话。那一年半的时间里,我几乎把他们的文章看了好几遍。开始不怎么懂,后来才慢慢懂了,甚至有些痴迷。于是,我把与他们经常合作的一些学者的大部分文章也拿来看了,当时很傻很天真,就是瞎看,后来才知道他们的鼎鼎大名,Hastie, Tibshirani, Efron等。文章看得差不多了,就反复看他们的那本书“The Elements of Statistical learning”(以下简称ESL)。说实话,不容易看明白,也没有人指导,我只好把文章和书一起反复看,就这样来来回回折腾。比如为看懂 Efron 的“Least angle regression”,我一个人前前后后折腾了一年时间(个人资质太差)。
当时国内还有人翻译了这本书(2006 年),把名字翻译为“统计学习基础”。我的神啦,这也叫“基础”!还要不要人学啊!难道绝世武功真的要练三五十年?其实正确的翻译应该叫“精要”。在我看来,这本书所记载的是绝世武功的要义,强调的是整体的理解,联系和把握,绝世武功的细节在他们的文章里。
Rick Aster, 也许知道这个名字的人不多,不过,如果说他是《Professional SAS Programming Shortcuts:Over 1,000 ways to improve your SAS programs》(2005年第二版)的作者,恐怕大家都知道了。这本书是本好书,大家都在论坛里面求了很久了都没求到,本博以前有专门文章介绍过。好好看这本书一段时间后,我的感觉是非常全面实用、经典书籍,但是新功能部分介绍不足。05年已经是SAS9.0了,但是对当时的SAS9.0的新功能介绍缺乏,更不用说现在SAS9.1,9.2,9.3版的放出了(Rick后来在个人主页上就这点做出了说明)。
这篇文章的主题就是说说为什么大家求不到这本书?
Rick Aster在linkedin的自我介绍是一名经济学家,在一家银行工作。 其实他写了不止这一本书,从1994年开始起写了很多关于SAS 编程的书籍,包括
原创文章: ”Rick Aster和他的私人出版社“,转载请注明: 转自SAS资源资讯列表
本文链接地址: http://saslist.net/archives/214
原创文章: ”SAS资讯 from 新浪微博- 2011-12-03“,转载请注明: 转自SAS资源资讯列表
本文链接地址: http://saslist.net/archives/213