msgbartop
List for SAS fans and programmer
msgbarbottom

15 5月 11 SAS资讯 from 新浪微博-2011-05-15


整理从5月1日到5月15日的新浪微博上有关SAS和数据分析挖掘的资讯资料。这段时间讨论的话题都非常让人感兴趣,本期的亮点在:1,电子商务公司发展迅猛,很多公司开始招数据分析员,这对广大数据分析人员是好消息;2,一篇SAS评论引起的大讨论 ; 3,有很多漂亮的图表展示,值得一学。

包括下面五部分:

第一部分  最新的消息,如行业发展、招聘、会议、悬赏竞赛,不要错过哦

第二部分  SAS大讨论如行业信息,软件安装,基础知识 和数据挖掘遇到的问题讨论

第三部分 各种漂亮的图表展示形式欣赏  和较差图表的评点—— 当然,这是我个人的观点,大家可以讨论的

第四部分  基础统计分析知识、,数学理论应用和数学文化 —— 基础知识越扎实,以后才能在数据分析道路走能更远

第五部分  微博知识、文化、机遇、商业化杂谈 —— 微博作为一个有前途的新兴事物,看看大家都谈些什么

大家可以加我的新浪微博来同步获得这些信息。

第一部分    前沿信息抢先看

数据分析人员大有可为 —— 看看这些讨论的前沿话题吧

  1. 转发微博。//@数学文化: 彭博商业周刊大谈硅谷研发海量数据http://t.cn/hrOeu7 该领域先驱数学天才Hammelbacher是Facebook的第一批员工。该年轻人的队伍钻研海量数据分析并以此提高广告的精确性。后为了更能发挥才华他自起炉灶自立公司Cloudera,专作数据分析软件。文章展现数学高手们逐鹿硅谷的历史 [05/12/2011 11:22:01]
  2. 什么时候都不晚,国内发展有延迟的//@数据元素:大趋势是这样,看好数据分析领域的行业微细分,游戏,电商,移动互联网都是不错的,可惜起步有点晚了,愿意分享的大师太少了//@小蚊子乐园:还是那句话:数据分析有前途 // @sxlion :新的数据分析公司诞生了,果然是需求决定的。 // @波波头一头 :[猪头]//@36氪: 电商社交数据挖掘应用Claritics 获得150万美元投资: 随着互联网数据的规模不断增大,专业的数据分析、挖掘创业公司也开始越来越多。成立于2010年并专注于社交挖掘、分析的创业公司Claritics 就刚刚从C http://t.cn/he7dzs[05/13/2011 08:30:22]
  3. //@张栋_机器学习:很高兴看到 SEM 带来订单量是最多的;我最近正在写一篇 SEM 的文章, 准备发表出来,和大家分享!//@mrbrand龚文祥: 分享一个每天800个订单B2C网站的内部数据。这个网站的亮点是靠发卡(各种各样的卡、券,线上发为主)“一招鲜”做起来(其他EDM/BD/淘宝/分销等手段都没有做起来)。携程也是发卡发上市的。(本人电商界交友广泛,很多创业者愿意和我分享,数据绝对真实有效,但所发数据我绝不会透露网站名字)
    [05/06/2011 23:07:53]
  4. 回复@Quaikie: 可以关注下实习信息先。通过实习积累信息,是非常好的一种手段。 //@Quaikie:你好,我想问一下,对于没有工作经验,但考SAS BASE和ADVANCE认证的,应该如何入手找工作?因为基本上数据工作都要工作经验。 //@sxlion:好工作啊,好机会啊!SASor们可以考虑一下!//@淘宝量子统计: #淘宝招聘#“21世纪的核心竞争是数据竞争,谁拥有数据,谁就拥有未来!”(马云)有一个机会,你可以零距离接触淘宝海量数据,亲手打造覆盖数百万用户的数据产品。淘宝量子统计团队,正在寻找#开发工程师##数据产品经理##运营专员#还在等什么?数据未来,不参与,就落伍!招聘详情http://t.cn/hga3SG [05/05/2011 21:54:08]

 

各大公司的SAS相关招聘职位信息发布 ——  好多啊,SASor们快来看啊

  1. SAS相关职位1:数据分析总监 杭州 年薪20-40万 2011-04-28日发布 //@小蚊子乐园:高级【数据分析职位】传说的CAO//回复@康涅狄格州xieliang: 应该是阿里或其旗下的网站,可能是阿里金融,支付宝之类的分公司,他们公司最近一直在重金招兵买马,据说人才难找啊。因为腾讯,百度什么的也在抢人,你可以关注下。如果哪个公司给房就回,哈哈。 //@康涅狄格州xieliang:不知道俺够格不?现在回国没房似乎比较惨啊//@kate-in人和: 猎头网戚杜娟发布了猎头职位:数据分析总监 – 广告和搜索中心(国内某知名IT公司),职位年薪:20-40万,查看猎头职位详情:http://t.cn/hdgcvy[05/06/2011 10:34:29]
  2. SAS相关招聘职位2:SAS公司 职位:NLP研究员或工程师 地点:北京 年薪:未知 联系方式: x96001@gmail.com //@SAS杨旭:回复 @Chen_1st:对,目前我们主要专注文本挖掘这一块。 //@Chen_1st:SAS在国内不是主要做咨询吗,现在参与研发了?//@SAS杨旭:回复 @高峰在线-:我对我们团队的定位是高端研发,这可能和SAS中国以前的定位不太一样吧。 //@高峰在线-:兄弟我在SAS的时候还没听说哦,现在中国区似乎以卖软件为荣,做研究为耻,为什么反而招起科学家来了呢?@SAS杨旭:回复@高峰在线V:该职位对应于总部的科学家,只面象博士及以上学历。 //@高峰在线V:SAS有研究员职务招聘?在中国?新事情哦?//@SAS杨旭: SAS招聘NLP研发工程师和研究员若干名,有意者请发送简历到。 [05/09/2011 20:05:55]//@张磊IDMer:有兴趣的朋友可以看看。//@SAS杨旭: SAS招聘NLP研发工程师和研究员若干名,有意者请发送简历到x96001@gmail.com。 [05/05/2011 22:09:21]
  3. SAS相关职位3:公司未知 职位:数据分析师 年薪未知 地点未知(可能在上海) 联系方式:tinajiang@ruiguangtech.com //回复@aqua_tian: 哈哈,也许网络泡沫开始了,需要分析师们来识别泡沫。分析师赶上好时机了。[嘻嘻] //@aqua_tian:今天怎么这么多招分析的…[吃惊] //@校园招聘信息: #校园招聘信息#【招聘】数据分析师http://t.cn/hgaAoQ [05/05/2011 22:18:39]
  4. SAS相关职位4:腾讯公司 年薪未知 地点未知 联系方式:68738017@qq.com 福利有美女同事//@康涅狄格州xieliang:PS部分是亮点啊,这个要转 //@郑来轶:/*运营分析岗位*/最后一条很诱惑//回复@aqua_tian:就是啊,sina,支付宝,腾讯等等都在抢人啊。数据分析朋友们,利好消息啊! //@aqua_tian:回复@sxlion:恩 今天一猎头说支付宝也在招 很急的样子.. //@修修的小乖: 【腾讯拍拍数据分析招聘】爱电子商务,爱数据分析,爱Excel,爱SPSS,也爱SAS。我们习惯用数据思考,擅长运营分析。并把电子商务作为生命的一部分来经营。欢迎对数据分析和电子商务有兴趣的你加入我们。有意者可将简历发送至68738017@qq.com。P.S.本组目前三个美女,男士优先! [05/06/2011 23:33:07]
  5. SAS相关职务5:数据分析员 公司新浪 地点北京 年薪未知 联系方式见下面//@小蚊子乐园:【数据分析职位】//@新浪招聘: 新浪诚招数据分析专员(北京),只要您本科以上,有一年以上数据分析经验者,能进行流量分析和第三方数据分析,请发简历至chenyan3@staff.sina.com.cn @念旧小兔子 [05/06/2011 23:13:29]
  6. SAS相关招聘职位6:数据挖掘工程师 公司:淘宝 待遇:面议 地点:可能在杭州 联系方式:bida@taobao.com //@波波头一头:应该转发 //@玄了个澄的:铛铛铛~~~[来]//@齐小七: 淘宝-数据产品部招聘数据挖掘攻城师!待遇、机会都不是问题,只要你足够优秀!欢迎大家转发! [05/06/2011 23:17:07]
  7. SAS 相关职位7://@郑来轶 :#招聘信息#58同城招聘高级数据分析工程师2名(北京),月薪5-15K不等,要求2年以上互联网网站统计分析、数据挖掘相关工作经验等,联系方式ericyaocn#qq.com,详见http://t.cn/hguvea [原文地址:http://t.cn/hguwA2 ] [05/09/2011 21:39:22]
  8. SAS相关职位8:地点上海 某游戏公司 年薪不祥 联系:jinxiaohuat@hotmail.com 要求:1 统计学、应用数学、社会学等相关专业,本科及以上学历 2 熟练掌握多种统计和挖掘方法,熟练使用SPSS、SAS等相关数据分析软件 3四年以上数据分析工作经验,有互联网行业、游戏从业经验者优先 来源 http://t.cn/he7Gwb [05/12/2011 23:05:13]
  9. 回复@aqua_tian:SAS相关职位9:对这个职位感兴趣的可以给 @aqua_tian 发私信的。 //@aqua_tian:招商信诺也在招数据挖掘,感兴趣的童鞋私信我,可帮忙推荐,对工作经验有一定要求,职位:客户价值主管,优秀者可适当放宽要求。//@修修的小乖: 【腾讯拍拍数据分析招聘】爱电子商务,爱数据分析,爱Excel,爱SPSS,也爱SAS。我们习惯用数据思考,擅长运营分析。并把电子商务作为生命的一部分来经营。欢迎对数据分析和电子商务有兴趣的你加入我们。有意者可将简历发送至68738017@qq.com。P.S.本组目前三个美女,男士优先! [05/14/2011 00:13:28]

统计软件有关会议交流和竞赛信息 —— 最新的国内外信息 方便的可以参加

  1. @cloud_wei 第四届中国R会议北京会场报名时间暂定于2011年5月28日。如果演讲报告较多,会议将顺延至29日上午9:00 地点中国人民大学(具体待定) 建议主题:统计计算和统计模拟;统计图形及可视分析;数据挖掘与机器学习;生物信息、医学统计;R高级编程及与其他语言交互;社会网络、推荐系统及网络传媒 具体信息见: http://t.cn/hdkEWj// [05/03/2011 17:30:24]
  2. 正式通知。//@SSI学术机构: 《社会网络分析与传播研究方法》论坛与研讨会将于2011年5月27日、28日俩天在中国传媒大学MBA学院召开。为了确保您能够正常参会,也便于我们工作协调,请您务必收到邮件阅读附件后回复您的参会意向(参加27日、28日还是两日都参加),将以此回复作为您的报名确认。报名确认截止日期为5月12日。 [05/11/2011 11:57:31]
  3. Revolution R 开始发力了啊, 大家可以试试商业版的R。//@康涅狄格州xieliang: RevolutionR: .@Kaggle Competitors: 注册参加目前正在进行的The Heritage Health Prize数据挖掘竞赛(300万美元大奖),就可以免费下载 RevolutionR Enterprise 版本,具体参见http://t.cn/hgpWIR 。哎,多好的机会,SAS怎么就没反应呢? [05/06/2011 23:03:10]

 

第二部分  SAS大讨论如行业信息,软件安装,基础知识

和数据挖掘遇到的问题讨论

一篇SAS评论引起的广大SASor们热烈大讨论 —— 在SAS圈子引发的大讨论

  1. 回复@康涅狄格州xieliang: 哈哈,公司有公司的考虑,以前想钱看啊,既然有这个手笔投资肯定是认为能够赚回来的。买这么多pc license,是不是又要招人了? //@康涅狄格州xieliang:金融医药这边利润高,舍得出大价钱。除了服务器版的,最近我们部门刚刚又买了100个PC SAS的license,一个license一年算250//回复@康涅狄格州xieliang:瓦萨,辉瑞pfizer,默克merck,北美银行。广告里是金融和医药行业,这不明摆着和SAS抢生意吗 ? //@康涅狄格州xieliang:他们公司网址:http://t.cn/hgKprG//@sxlion: SAS中国圈子热议话题:“SAS, 一个华丽时代的结束(原创by dapangmao)” 激起众多SASor们的争议和共鸣! 不是吵架哦! 大家可以去围观哈!http://t.cn/hgUV59 [05/06/2011 10:39:00]
  2. 回复@iDustbin: SAS在商业地位暂时还是无人可及的。这一点可以放心,现在是广大SASor居安思危的阶段。 //@iDustbin:时代在进步,再没有常青树!希望SAS的华丽退去的慢一点,虽然现在很少用,但还是希望它依然强大//@康涅狄格州xieliang:转发!//@sxlion: SAS中国圈子热议话题:“SAS, 一个华丽时代的结束(原创by dapangmao)” 激起众多SASor们的争议和共鸣! 不是吵架哦! 大家可以去围观哈!http://t.cn/hgUV59 [05/05/2011 13:06:50]
  3. 由”SAS, 一个华丽时代的结束” 引起的持续讨论, 见拙文”三篇SAS评论引发的思考 by sxlion”. http://t.cn/he7wKU 在2009年初,江堂的一篇博文“R与SAS之争:一个导读”描述了国外一家主流媒体纽约时报的一篇报道Data Analysts Captivated by R’s Power引起国外SAS社区和R社区的粉丝们的大讨论… [05/12/2011 22:41:16]

数据挖掘讨论 —— 看看大家在数据挖掘中遇到些的什么问题吧

  1. 特别是对于复杂的数据和多重的转换分析来说,Excel,SPSS菜单式的操作很辛苦,而SAS用代码的方式则可以一劳永逸。这也是我喜欢SAS的原因。//@勾践XO: 我对分析快完成才发现源数据错误的同学建议是:如果数据是别人给的,切记动手前对数据进行校验。如果数据是自己取的,请检查、检查再检查。另外,建议利用可回溯的工具或技术进行数据处理,如利用sql、sas编程,这样可以保障即时数据源错了,过程还是可以被重用的,且易于检查数据处理过程中是否出错。 [05/06/2011 11:23:17]
  2. 回复@康涅狄格州xieliang: 哈哈,只能做到尽量,毕竟现实中的数据噪音很大。 //@康涅狄格州xieliang:所谓的GIGO,呵呵。不过在商业环境里,谁敢说自己的数据时100%正确?甚至95%正确? //@sxlion:保证原始数据的正确性,确实非常重要,数据分析之根本。//@数据挖掘与数据分析: 想起3年前在MR行业做数据分析时,QC交付数据时说,保证无错误,可最后那份分析报告反工3次,都是因原始数据错误,搞了几个通宵,伤!3年后的今天面对BI又是哭笑不得,数据逻辑小混乱,指标与维度交叉丰富(不该有的也有),布局小乱(不能快速找到想要的数据),前端展示不给力(图表手工打造),伤! [05/06/2011 10:35:36]
  3. 这就是为什么数据质量比算法什么的重要的原因。对于这种情况,写代码的方法最好,数据错了,再跑一遍就OK了。如果是窗口菜单式的方法,就很辛苦了,非常辛苦。 //@数据化管理:感谢大家的支持,目前有98为朋友投票。排在第一位的是:分析完后才发现原始数据是错的,有74%的朋友遇到过这种情况//@数据化管理: 我发起了一个投票【数据分析人员的十大伤心事件调查,看看你有几项?】,地址:http://t.cn/hggEZr [05/11/2011 17:28:34]
    数据量太大,电脑直接死机: 85(48%)
    没有存盘,数据浮云了: 90(51%)
    对数据不敏感: 22(12%)
    数据源的有问题,飘忽不定: 96(54%)
    数据分析结果被“全国人民”耻笑: 14(8%)
    分析结果被老板臭骂: 16(9%)
    看不懂别人的分析报告: 10(6%)
    分析完成后才发现原始数据是错误的: 129(73%)
    被老板要求有目的的选择分析结论: 51(29%)
    只用专业的分析原件,不会自己开发分析模版: 19(11%)

    Ps:是可以多选的,其中数据质量是数据分析人员最伤的一环

  4. 哈哈,我们都是SAS控。//@郑来轶:数据准备和预处理很重要,否则都是浮云;AD:热衷于SAS,就因为其强大的数据处理能力和可重复性,欢迎其他SAS控们一起交流~//@数据化管理: 数据分析人员,如果不养成#数据预处理#的习惯,那你真是伤不起!辛苦分析完的数据最后才发现原始数据是错误的,砸电脑的心情都有!广义的数据预处理包含下图四个方面。狭义的数据预处理主要是指数据清理,可以通过极值,频率等方法来预处理,更多时候需要靠对数据的敏感度和极强的逻辑分析能力来判断[05/07/2011 09:26:00]
  5. //@康涅狄格州xieliang:回复@车品觉: BI的任务就是大规模深入分析高维数据,建立起可解释,可执行的客户行为模型,再帮助业务伙伴有针对性地设计细化的营销策略和客服系统,为高层提供战略性的建议 //@车品觉:支付宝BI 欢迎各路数据爱好者加入, Join the Winning Team。有兴趣者私信我。//@支付宝: 【Q到爆[欢欢] 支付宝数据视频】不看后悔死你~~ 广告要都拍成这样,播30分钟都愿意看 http://t.cn/hGI1yq [05/05/2011 21:57:37]
  6. //@张磊IDMer:我前段时间用一家保险公司的呼叫中心投诉文本做了个文本挖掘的demo,效果还不错。只是客户的数据需要保密,无法公开。这两天正在找些合适的中文文本语料,计划做个demo给大家看看。 //@郭曦2010:Text Miner应当中文分析的效果怎样?有什么成功案例吗?英文分析的强大倒是有所了解//@张磊IDMer: 前段时间看了“Getting Started with SAS Text Miner”,里面用了个例子-疫苗不良反应报告系统中的文本挖掘。在不良反应报告中包含了大量的症状信息文本,通过运用文本挖掘技术,可以更准确地预测出症状会不会带来严重后果。这个例子用的是美国卫生和公众服务部的数据,不知道国内有没有类似需求? [05/05/2011 21:47:20]
  7. //@张磊IDMer :“数据质量稽核”是项目的一个分析专题。主要参考了RY Wang的“A framework for analysis of data quality research”。C4R数据质量度量法,包括完整性(Completeness)、正确性(Correctness)、当前性(Currency)、一致性(Consistency)和相关性(Relevance)。 [05/13/2011 10:08:25]

 

SAS安装问题及解决方案 —— 大家都关心的问题,自己看吧

  1. 大多数人面临问题在于两点:1,安装环境的布置,这个按照说明来;2,license的问题,如果是正版的话,肯定很顺利;如果是盗版的话,存在安装介质和license过期的问题,这个可以通过调时间暂时解决。一般来说安装介质调一次时间就OK,然后使用网上流出的lic就不用总是调时间了//@sxlion: //@张磊IDMer :关于#SAS安装#:看到一些朋友在安装SAS时遇到困难,其实在SAS技术支持网站提供了大量帮助文档,有需要的朋友可以参考。另外,对于Windows平台上的安装,特别提醒的是:安装前一定把杀毒软件关闭,否则有可能会干扰安装过程,造成安装失败。 [原文地址:http://t.cn/hgJ6m9 ] [05/04/2011 22:04:56]
  2. //@张磊IDMer :关于#SAS安装#:看到一些朋友在安装SAS时遇到困难,其实在SAS技术支持网站提供了大量帮助文档,有需要的朋友可以参考。另外,对于Windows平台上的安装,特别提醒的是:安装前一定把杀毒软件关闭,否则有可能会干扰安装过程,造成安装失败。 [原文地址:http://t.cn/hgJ6m9 ] [05/04/2011 22:04:40]

 

SAS基础知识 —— SAS太博大精深了,从基础开始吧。

  1. SAS画图需要需要学习的基础知识。//@小蚊子乐园:【PPT配色】这个要转//@无忧PPT: #无忧PPT 敩系列# 0035–重量级的配色合集教程,PPT配色指南–超强合集!!!大家收吧 通过@微盘 , 欢迎大家猛击下载分享!http://t.cn/hezWl6
    [05/13/2011 10:37:47]
  2. 我好像以前也整理SAS连接数据库的一些方法,有空翻起来。 //@庖丁的刀:odbc 连接oracal//@郑来轶: SAS连接ORACLE数据库[图解],很多同学通过百度找到这篇文章,希望对你有所帮助。http://t.cn/hXZsd [05/07/2011 10:10:02]

 

SAS软件及公司最新信息 —— 最近的全球SAS用户会议和SAS公司官方新闻

  1. 回复@sxlion: SAS 除了免费送软件拉人气外,最近在开放性上也是动作频频。如打通SAS与R的障碍,还有增强自定义函数的功能等等。另外SAS9.3在图形上面也亮点颇多。 //@sxlion:回复@cloud_wei: 其实MATLAB还算便宜的啊,好像是一次购买,不限时间。另外MATLAB挺开放的,很多算法包都可以自己做,然后自由//@sxlion: SAS欲抢回学生人气,将发布云端SAS,并对学生免费。除此之外,还有更多新的亮点宣布如SAS9.3发布、增强ODS图形功能等。SASor们不要担心,以前的操心和担忧是多余的,SAS公司早就想过这些问题了[哈哈] 。具体见http://t.cn/he2Fnh。 [05/14/2011 11:03:06]
  2. 等江堂有空来,他也会讲讲这次SGF的见闻,据说这次展示SAS还是有很多创新的。//@康涅狄格州xieliang:集群时代也许SAS能够赶上,那几个高性能分析的PROC根据从SGF回来的同事聊,似乎还是有点意思。如果有时间考虑把NUMERICAL RECIPE里面的常用数值计算routine都用FCMP搬到SAS里面去。//@sxlion: 由”SAS, 一个华丽时代的结束” 引起的持续讨论, 见拙文”三篇SAS评论引发的思考 by sxlion”. http://t.cn/he7wKU 在2009年初,江堂的一篇博文“R与SAS之争:一个导读”描述了国外一家主流媒体纽约时报的一篇报道Data Analysts Captivated by R’s Power引起国外SAS社区和R社区的粉丝们的大讨论… [05/13/2011 10:03:18]
  3. 回复@cloud_wei: 其实MATLAB还算便宜的啊,好像是一次购买,不限时间。另外MATLAB挺开放的,很多算法包都可以自己做,然后自由发布,卖钱的也是允许的。相对而言,SAS则显得封闭得多了。 正是由于Matlab的开放性,抑制同类型的开源软件的发展。 //@cloud_wei:MATLAB也很贵,但在高校、学术界还是很受欢//@sxlion: SAS欲抢回学生人气,将发布云端SAS,并对学生免费。除此之外,还有更多新的亮点宣布如SAS9.3发布、增强ODS图形功能等。SASor们不要担心,以前的操心和担忧是多余的,SAS公司早就想过这些问题了[哈哈] 。具体见http://t.cn/he2Fnh。 [05/14/2011 10:58:55]//系统云来了,SAS浮云什么时候到来?//@麻省理工科技创业: 谷歌推“铬操作系统” 挑战战微软苹果http://t.cn/hez8VL 美国谷歌公司11日推出使用“铬(C hrom e)操作系统”的笔记本电脑(简称“铬”电脑),“铬操作系统”是基于互联网应用的云计算#操作系统#,它最大的特点是“一切只为网络”,突出网络浏览及应用功能。 [05/13/2011 10:45:23]
  4. SAS欲抢回学生人气,将发布云端SAS,并对学生免费。除此之外,还有更多新的亮点宣布如SAS9.3发布、增强ODS图形功能等。SASor们不要担心,以前的操心和担忧是多余的,SAS公司早就想过这些问题了[哈哈] 。具体见http://t.cn/he2Fnh。 [05/14/2011 02:22:57]
  5. 回复@鱼在在藻:国内暂时还没有的。以前有SAS公司或个别SASor自发组织,不过现在这两年都没有了。 //@鱼在在藻:有没有sas相关的会议啊 //@sxlion:回复@康涅狄格州xieliang: SAS其实是很好的学习辅助软件。关键是很多老师都不懂SAS,对于非统计专业的人来说,还是SPSS上手快。我学SAS和大胖猫所描述的那//回复@康涅狄格州xieliang: SAS其实是很好的学习辅助软件。关键是很多老师都不懂SAS,对于非统计专业的人来说,还是SPSS上手快。我学SAS和大胖猫所描述的那样,为了发表文章而学习SAS数据处理。 //@康涅狄格州xieliang:回复@sxlion:对于标准的应用统计分析,我个人觉得SAS很不错。
  6. 转发微博。//@SAS软件: 【韩国现代证券用SAS驱动客户营销】韩国最大的金融机构之一现代证券将以SAS客户智能解决方案为基础,建立客户细分系统,用以支持全公司的客户营销,帮助设计VIP客户管理方案以及新客户发展方案。http://t.cn/hgCOrc [05/06/2011 23:24:38]
  7. 转发微博。//@SAS软件: 【SAS用户反馈奖】在2011年SAS全球用户论坛上,加拿大统计局的信息技术顾问Tom Kari荣获“用户反馈奖”。Tom为改进各种SAS产品的功能和质量提供了卓越的反馈和建议。他说:“能够提供有帮助的反馈当然令人激动。谁不愿意自己的建议被采用,来帮助使伟大的软件变得更好呢?”http://t.cn/hgCR8k [05/06/2011 23:23:07]
  8. 转发微博。//@SAS软件: 【商业分析的五种风格】SAS全球技术顾问总监Mark Torr认为,商业分析在风格上可归纳为五种:经典商业分析、带数据质量功能的经典商业分析、带反馈回路的商业分析、实时商业分析和业务活动监测分析。无论您目前是哪种风格,都需要在规划架构时考虑其他风格http://t.cn/hgDQ1w [05/11/2011 17:43:35]
  9. 狼来啦,小心R revolution来抢生意!//@SAS软件: 【2010年的商业智能和绩效管理市场超过100亿美元】Gartner的调查研究称,世界范围内的商业智能(BI)平台、分析系统和绩效管理(PM)软件收益在2010年已达到105亿美元,与2009年93亿美元的收益相比增涨幅度超过了13%。在分析系统市场上,SAS占据主导地位。http://t.cn/hgNLoq [05/06/2011 23:18:25]

 

第三部分 各种漂亮的图表展示形式欣赏和较差图表的评点

信息丰富和展示效果俱佳的图表欣赏 ——  漂亮的图表展示越来越多的,一大趋势啊,大家都喜欢看

  1. 一种有视觉冲击的仪表盘图表展现方式, 这里总结了五个要点。//@图表汇: 『Infographics,信息图表』”有趣的信息图表”,其中提到(1)放大字体的强调效果;(2)不同图表样式带来不同的视觉效果(以常规饼图与倾斜条形图的对比);(3)地图式图表的概括效用;(4)人形图标示意图的概念;(5)3D图表因为看起来比较复杂而使数据显得更加可信(这一点个人并不赞同)。
    [05/04/2011 06:29:49]
  2. 发现是亮点,提示也是亮点。//@秋叶语录:纯为长长见识的路过!友情提示在PPT制作中做类似的精美图表,有两个前提比较合适:【1】听众都能理解图表的妙处;【2】听众都不能理解图表的妙处但会发自内心佩服制作图表的人的大牛之处。 //@小蚊子乐园:皇冠图,你这么一说还真像 //@sxlion:好漂亮的皇冠图!//@经济学人中文网: 【 2100年的世界人口】据联合国最新预测,世界人口将在10月底达到70亿。到2085年,全球人口将超过100亿。[05/15/2011 11:48:34]
  3. 现在数据展示都要美的表现方式,是不是被苹果公司影响了,还是图表不吸引人,大家不喜欢看?//@车品觉:再支持一次//@程咬金2011: 寻找数据可视化设计高手:擅长设计,喜欢想象,了解数据,也懂得互联网。我们期待的是创造性设计美学和严谨的工程科学的卓越的结合——用极美丽的形式呈现可能非常沉闷繁冗的数据——我们把这一表现和创作过程称之为数据可视化艺术。对于视觉表现和数字都可以进行深入思考的高手,欢迎加盟!
    [05/07/2011 23:46:44]
  4. 很漂亮的图表,并且信息也很丰富。//@图表汇: 『Infographics,信息图表』“The Path to 10 Billion Tweets”,Tweeter的成长之路,截止2010年3月,Tweeter网站的总流量已经超过100亿“推”。[05/12/2011 18:45:51]
  5. 这个仪表盘做得不错,可以参考一下。@刘万祥ExcelPro:非常简洁、有科技感的仪表盘式界面,值得学习借鉴//@麻省理工科技创业: 本·拉登死了,网络流量长了多少? http://t.cn/hgtHmx 谷歌趋势(#Google Trends#)将关键字“奥萨马·本·拉登死亡”等级定为“火山爆发式的”,即热门话题的最高等级。虽然这一事件推动网络流量大幅增长,但尚未进入该公司按页面浏览量计算的十大新闻事件排名。
  6. [05/03/2011 16:23:00]
  7. 求职简历开始流行BI的仪表盘风格了。//@秋叶语录: 15份【一页纸简历】和【PPT简历模板】分享,包括文案提炼,排版构思的过程点评,欢迎转发给有需要参考的朋友:http://t.cn/hg6mmx
    [05/05/2011 11:12:34]
  8. 这种图表形式不错。//@图表汇: 『Infographics,信息图表』数据揭秘Box.net。
    [05/10/2011 09:11:04]

比较差的图表展示及点评 ——  这些是有创意的图表,不过有些缺陷,看看大家怎么点评的吧

  1. 恩,同意蚊兄的看法。背景有些杂乱,而字太小。信噪比不高啊。 //@小蚊子乐园:字可以再大些,背景可以模糊些。。。。//@图表汇: 『Infographics,信息图表』信息图表达人Jose Duarte的一组实物图表,这个创意是否吸引你的眼球呢?@刘万祥ExcelPro @cnsns @演绎生动Excel图表 @小蚊子乐园
    [05/06/2011 11:42:58]
  2. 我觉得既要简单明了也要重点突出。左边不直观,不好用;右边直观,如果右边把具体数据换成百分比就更Ok了。这样既能表达亏损占整个公司的比例,也能突出亏损程度。这里“绝对”其实也是在一定的前提下的,也是相对的。图表要求一眼就看出效果。//康涅狄格州xieliang 回复@因为依恋所以蔓延:第一,两图表达的数据含量和重点是不一样的;其次,先解释左图的 -77%是怎么来的。//@sxlion这个图还需要转个弯才能看懂(即简单的情况用二次图表来表达,有点过了),需要解释才行,觉得不好。可视化讲究的就是一目了然。右边的柱形图多么好的表达这一点呀。//@刘万祥ExcelPro 我的观点是有负数时不能用饼图,这个是绝对的。欢迎讨论。//@Excel技巧网官方微博: 刘万祥的《Excel图表之道》认为,饼图不能用来说明负值,最好使用条形图。这个说法有点绝对。下面两个图,饼图的表现应该更好些,而背离式条形图则无法很好地表达出西部地区严重亏损对整个市场盈利的影响程度。 [05/08/2011 21:54:32]

第四部分  基础统计分析知识、,数学理论应用和数学文化

统计分析基础知识学习 —— 这里很多例子和老师们深入浅出的分析,多看看,慢慢积累多了。

  1. 文彤老师的这个例子和总结不错! //@文彤老师:你这个说法不妥当,让统计描述的工作情何以堪呀。比如我希望了解月球上有多少只蚊子,好决定将来登月的时候带多少盘蚊香过去,这事情有什么对比吗?数据分析的本质,应当是信息汇总和变异发现。//@小蚊子乐园: 【数据分析】知道数据分析基本原理是神马吗?它就是对比分析,大家想想是不是这样的?对比无处不在,无对比就无法得知好坏,不是吗?http://t.cn/brjUn
    [05/05/2011 10:49:45]
  2. 新手基础入门用挺好。当然老手也可以用来温故知新,查缺补漏用。 //@小蚊子乐园 :【数据分析】《谁说菜鸟不会数据分析》目录抢先看 http://t.cn/hgR9PC @夏之朝露 @朝阳小魔 @数据挖掘与数据分析 @郑来轶 @刘万祥ExcelPro @数据化管理 @龙之中原王 @sxlion [原文地址:http://t.cn/hg3eKu ]
    [05/10/2011 09:55:12]
  3. 蚊兄,有木有精美样章先睹为快啊 ? 可以培养饥饿市场先。//@小蚊子乐园: 【数据分析】你还在为如何学习数据分析而烦恼吗?不要紧,现在蚊子给你《数据分析技能提升十大建议》,希望对大家有帮助。 http://t.cn/hg5VTH  [05/03/2011 10:25:23]
  4. 属于分析时考虑不周全,遗漏了被击中而未返回的飞机样本。 //@小蚊子乐园:【数据分析案例】[嘻嘻]//@糗事百科王坚: 二战时英国空军为了降低飞机的损失,决定给飞机的机身进行装甲加固。限于条件,只能用装甲加固飞机上的少数部位。对执行完轰炸任务返航的飞机进行仔细的观察分析后发现大多数的弹孔都集中在机翼上,从数据上说加固机翼的性价比最高。但实际情况是应该加固驾驶舱,驾驶舱被击中的飞机几乎都没飞回来。 [05/05/2011 22:07:21]
  5. 新手可以学习下,老手温故而知新。//@数据挖掘与数据分析: 数据分析思路,有条理,不凌乱!转自:@邮政数据应用中心 [05/09/2011 21:15:17]
  6. 从今天起,认真收集各位大师的经典语录,一般来说,满足下面几个特点:1,对统计分析人员有益处的;2,多年积累的前辈经验,3;简短而信息量高密度;4,具有经典性,即可能现在读了没感觉,以后遇到困惑或迷茫时,读读感觉茅塞顿开的。暂存于此:http://t.cn/hg6DnJ 以后汇总定时发布。立此存照 [05/05/2011 11:35:47]
  7. 转发微博。//@数据挖掘与数据分析: 神马是AAA评测模型?晚上看到的,就整理了一下,供大家学习了解,分享是快乐的!@百度统计 http://t.cn/hguac3 [05/10/2011 09:19:13]
  8. 仅供参考。//@小蚊子乐园:再细些就好了//@ETwise: 经营分析、数据分析人士请关注:经营分析常用指标体系,请大家指正 [05/10/2011 09:14:40]

 

基础数理统计理论和应用 ——  听汤老师讲课数学知识,接受文化熏陶

  1. //@数学文化:更多的贝叶斯应用! //@金佶:强大的贝叶斯概率论不仅被应用于过滤垃圾邮件等IT领域,在经济学”博弈论”中也有经典的应用,如”贝氏纳什均衡”等.@黄雪斌:之前谷歌黑板报也曾介绍过不少谷歌产品中使用的数学知识。那么多博士不是白招的//@数学文化: 《科学美国人》5月文章:贝叶斯公式在谷歌的无人驾驶汽车中研究中发挥巨大作用。 谷歌说无人车项目用贝氏定理处理大量的收集数据并用其来不断更新概率估计。 之前无人车车队在加州街道行驶千里, 但没有碰行人,没冲红灯,也没迷路。贝氏定理还有其它现代应用,比如抗击垃圾邮件 http://t.cn/hgQBle [05/09/2011 09:21:11]
  2. 回复@Chen_1st:学习 //@Chen_1st:再次强调一下需要分清Naive Bayes Classifier和Bayes公式。Naive Bayes Classifier是一种generative learning方法(更广泛的叫法是generative model),多数情况下性能差于discriminative learning方法,比如maxent. 但Bayes公式只是描述了先验后验的关系,并不只用于gen//@张栋_机器学习:还有第三道: 如果这个假设不成立, 我们用什么模型? //@张栋_机器学习:”贝叶斯定理” 基本上是我面试 研究工程师 (research engineer / intern) 问的第一道题; 第二道面试题是: 基于 贝叶斯定理 的 Naive Bayes model 的基本假设是什么?
  3. //@算文解字_马建强:Naive bayesian最重要的假设可能是元素间的独立假设吧。不行的话用信道-噪音模型(还是贝叶斯)来结合语言模型?还是不行再用更复杂的给基于特征的方法,MaxEnt之类? //@张栋_机器学习:还有第三道: 如果这个假设不成立, 我们用什么模型?//@数学文化: 《科学美国人》5月文章:贝叶斯公式在谷歌的无人驾驶汽车中研究中发挥巨大作用。 谷歌说无人车项目用贝氏定理处理大量的收集数据并用其来不断更新概率估计。 之前无人车车队在加州街道行驶千里, 但没有碰行人,没冲红灯,也没迷路。贝氏定理还有其它现代应用,比如抗击垃圾邮件 http://t.cn/hgQBle[05/09/2011 09:14:15]
  4. //@算文解字_马建强:回复@张栋_机器学习:谢谢:) 感觉神奇的贝叶斯至少在自然语言出里方面无处不在啊,最基本的HMM词性标注,到早期的语音识别模型、和早期的机器翻译模型,还有简单的文本分类,多少东西都是从贝叶斯公式过来的… //@张栋_机器学习:回复@算文解字_马建强: 您的解释很好 :-)//@算文解字_马建强:回复@张栋_机器学习:请教一下,现在实际商业系统中用这一类方法还多么?准确度上feature-based一般而言更胜一筹。不过也许实用系统还要综合考虑效率、稳定性? //@张栋_机器学习:回复@算文解字_马建强: 是的,贝叶斯公式简单但神奇//@数学文化: 《科学美国人》5月文章:贝叶斯公式在谷歌的无人驾驶汽车中研究中发挥巨大作用。 谷歌说无人车项目用贝氏定理处理大量的收集数据并用其来不断更新概率估计。 之前无人车车队在加州街道行驶千里, 但没有碰行人,没冲红灯,也没迷路。贝氏定理还有其它现代应用,比如抗击垃圾邮件 http://t.cn/hgQBle [05/09/2011 09:13:41]
  5. //@算文解字_马建强:回复@张栋_机器学习:也是。多谢!而且如果是针对web的话,有时候precision/recall低一点也许问题不大,只要能scalability到web,网页里的信息冗余总会把目标的信息给召回。 //@张栋_机器学习:回复@算文解字_马建强: 还挺多,因为简单稳定, 易实现 :-)//@数学文化: 《科学美国人》5月文章:贝叶斯公式在谷歌的无人驾驶汽车中研究中发挥巨大作用。 谷歌说无人车项目用贝氏定理处理大量的收集数据并用其来不断更新概率估计。 之前无人车车队在加州街道行驶千里, 但没有碰行人,没冲红灯,也没迷路。贝氏定理还有其它现代应用,比如抗击垃圾邮件 http://t.cn/hgQBle[05/09/2011 09:13:28]
  6. //@算文解字_马建强:回复@Chen_1st:没错,maxent就是logistic regression。你的强调是对的,Bayesian更像个框架,神马东西都可以套到这个框架下来, 不仅仅限于generative method的范畴。 //@Chen_1st:maxent是信息论的说法,概率论里其实就是logistic回归。如果参数加个先验概率,就变成regularized//@数学文化: 《科学美国人》5月文章:贝叶斯公式在谷歌的无人驾驶汽车中研究中发挥巨大作用。 谷歌说无人车项目用贝氏定理处理大量的收集数据并用其来不断更新概率估计。 之前无人车车队在加州街道行驶千里, 但没有碰行人,没冲红灯,也没迷路。贝氏定理还有其它现代应用,比如抗击垃圾邮件 http://t.cn/hgQBle[05/09/2011 09:10:07]
  7. 转发微博。//@数学文化: 《科学美国人》5月号文章探讨了数据库。哈佛-谷歌数据库对谷歌近年扫描的500万本书中出现40次以上的单词进行研究,显示它可提供文字演变史:哪些词变得常用,哪些趋于衰落,甚至用词可看出牛人名气的兴衰。库中出现的数字和日常生活中出现的数字也有关联。结论:数据库将是研究语言和文化的有力工具。
    [05/09/2011 09:08:25]
  8. 这个要好好学习! 资源不错。//@数学文化: 布朗大学应用数学系著名学者,计算数学国际领军人物舒其望教授http://t.cn/hgT1zx 昨天在香港给学生用普通话讲了一天“计算方法”。全部视频两个月后上网。先放点片断和网友分享(手机效果不好;最后剪辑上网的是专业机器制作的) http://t.cn/hgT1zM [05/08/2011 13:22:57]

 

第五部分  微博知识、文化、机遇、商业化杂谈

—— 微博作为一个有前途的新兴事物,看看大家都谈些什么

  1. 微博的弊端和意义//@刘挺Thomas:推荐此文,有独到见解。互联网创新的更迭速度加快,或许过不了多久就会有更好的社会化媒体形态,或者别的什么出现。//@饭饱先: 微博的弊端和它的真正意义: http://t.cn/hgElfg [05/11/2011 17:53:49]
  2. 关注微博对象越多意味着可接受的信息量越大;但是关注对象太多会造成阅读时间增加,思考时间比例减少。微博信息的噪音很大,信噪比低,因此选择合适的关注对象及数量非常重要。把新浪微博的关注对象控制100以内(目前我的关注对象稳定在88个)。 [05/11/2011 21:54:03]
  3. 转发微博。@ICTCLAS张华平博士:今天跟一个团队负责人交流,得知他们在微博采集方面有所突破,准备跟我们合作进行后续的分析,感觉很振奋。窃以为信息处理与挖掘的科研与产业的下一个机会就在微博;目前针对常规新闻、BBS和博客的分析挖掘会逐步成为浮云。
  4. sxlion 我是发现微博能够实实在在的带来很多以前网络产品不能带来的东西。既然微博产品18月开始盈利,大家是否可以考虑做点什么。//@清泉的味道:微博产品将在18个月后盈利…..现在中国,几乎每个人的手机都和互联网打通了关系,这是革命性的事件,这件事所产生的生命力是目前无法估量的(5月3日 23:05)//kigg 新浪开始做微博时,股票价格为30美元,现在则达到120美元,不到6个月时间提升了400%,比任何风险投资收益都高。薛蛮子说,这正说明了大部分投资者普遍认为微博盈利是一个走得通的模式。他认为目前最热门的投资项目是移动互联网以及所有其它跟微博有关的方面。他认为,投资者看到的应该是一个方向// 薛蛮子:微博产品将在18个月后盈利 http://t.cn/hgVuAZ
  5. //@张栋_机器学习:(合理) “搜索变现” 系统 就是一个良性生态圈的例子: 搜索变现系统越有效, 用户点击(主意力)分配的就会越合理;用户点击分配越合理,下游网站自身变现就越强;下游网站变现越强,搜索投放就会增加,搜索收入就会提高, “用户,下游网站,搜索引擎” 三者都得益//@张栋_机器学习: 今天和朋友吃饭,又谈到微博的盈利问题。我想:有了用户的注意力,有了用户的时间,知道了用户的兴趣,好友关系 等,很容易变现的。重点是在微薄盈利的同时,如何同时维护好 “微博生态圈” 的问题, 让这个生态圈更加健康的发展。 [05/08/2011 20:28:56]
  6. 关注新的网络媒体形式//@淘宝量子统计: 随着SNS(社交网站)的高速发展,社会化分享也成为了推广的一个重要方式。bShare公布3月社会化分享量排行——QQ空间增加2个百分点以33.7%蝉联第一,新浪微博及人人网其次。腾讯微博上升一名,赶过开心列第4。前10名中,5个SNS,5个微博。
    [05/04/2011 20:50:49]

原创文章: ”SAS资讯 from 新浪微博-2011-05-15“,转载请注明: 转自SAS资源资讯列表

本文链接地址: http://saslist.net/archives/133


Leave a Comment