msgbartop
List for SAS fans and programmer
msgbarbottom

15 4月 11 SAS资讯 from 新浪微博-2011-04-15


下面是从2011年4月1日到4月15日的新浪微博信息,信息果然大,维数很多,需要大家慢慢品读。当然,我会继续努力,把微博信息整理得更加清晰有条理,便于大家阅读。这两个星期,大家的关注点在下面几个部分:

1,会议交流信息:SAS全球论坛会议、国内SASor聚会信息和其他的一些国内会议交流活动

2,数据挖掘实际应用和中文数据挖掘工具,以及对新兴社交媒体数据如BBS、博客、微博等新媒体信息如何分析的讨论;

3,数据可视化的一些应用;

4,其他一些SAS相关话题及产品信息。

详细如下:

第一部分 聚会、论坛、讲习班

SAS全球论坛( SAS Global Forum) 美国 拉斯维加斯  2011 4月4日-7日

SAS2011的全球用户论坛会议情况的实时流水报道(胡江堂写的,中文),快去围观下,看看能不能获取有价值的信息//@hucius: SASGF11流水帐(一):4月3号-5号 http://t.cn/hBH5hf [04/06/2011 17:24:18]

国内SASor及数据分析工作者的网友聚会 杭州  2011年4月16日

sxlion://@小蚊子乐园:杭州的朋友注意咯 //@庖丁的刀:#数据分析小聚# 【地点】杭州 西湖 杨公堤 品润茶楼【时间】2011-04-16 17:00【说明】 茶楼提供主食;有免费停车位。【联系人】勾践XO【注意】杨公堤的南入口是太子湾,北入口是植物园,周六16:00以后会非常拥堵,请大家合理安排行程。 @二叔的马甲 @数据挖掘与数据分析:本周末打算去杭州玩玩,求杭州的朋友安排行程(预计三天)

2011年北京数据管理与生物统计论坛(BBF) 北京  2011年4月23日

药厂和CRO的SAS同行盛会!//@sxlion: 2011年北京数据管理与生物统计论坛(BBF)第一次聚会时间13:00–17:00Apr23 地点北京大学医学部逸夫楼209厅(海淀区学院路38号)部分主题1 Styles & Template Procedure;2 Skills for Report Procedure;3 Programming Tips of Using PROC FORMAT in SAS REPORT;4 Inline Format and RTF Control Word [04/12/2011 12:57:16]

《社会网络分析与传播研究方法》讲习班 北京  中国传媒大学  2011年5月27、28日

沈浩老师:谢谢大家关注@SSI学术机构 论坛和讲习班!因为报名比较多,我们需要根据人数调整会场!本次论坛拟邀请传播学、微博营销、社会网络、复杂网络相关专家,讲习班希望给大家介绍更多软件和分析技术,谢谢大家支持!@SSI学术机构:报名非常踊跃!请参加SSI于5月27日、28日《社会网络分析与传播研究方法》论坛和讲习班的朋友持续关注 @SSI学术机构 ,通过发私信报名,注明姓名、单位、类别、联系方式等基本信息!我们将根据报名情况调整安排会场,本次讲习免费或非盈利!我们欢迎媒体或机构合作!具体见沈老师博客:http://shenhaolaoshi.blog.sohu.com/170881787.html


第二部分 数据挖掘工具讨论汇总

数据挖掘实战讨论

  1. //@吃桃的猫:宝钢在建设ERP和MES时,从来都是同时建立数据分析、思考、挖掘的环境以不断改善ERP和MES的运作,进一步提高经营水平和效益 //@陈果IBM:回复@思考的犄角_刘颖: 宝钢在很多业务环节做高级分析,我听说过的有炼钢模型分析(不知是不是你说的生产系统分析)、供应链需求模型、供应链交付模型//@思考的犄角_刘颖: @陈果IBM 厚四薄三什么意思?求解 [04/13/2011 10:29:33]
  2. //@kuhasu:那个东西解决方案不管什么用,一般性而已。我以前做过的,效果不错,现在还可以德州扑克。 //@张磊IDMer:SAS就有博彩行业的分析解决方案,具体内容我没仔细看,因为在内地看来用不上//@数据挖掘与数据分析: #数据说话#澳门博彩监察协调局的数据显示,2010年,澳门博彩收益达1883亿澳门元,较2009年增幅高达57.8%,而入境的2500万游客中,53%来自中国内地,30%来自香港,构成了这个收入的主要贡献者。何鸿燊于是又有了另外一句话:“澳门博彩业突飞猛进和澳门社会繁荣稳定,与祖国的支持息息相关。” [04/04/2011 11:31:52]
  3. @张磊IDMer:呵呵,我看到SAS在国外倒是的确有文本挖掘方面的成功案例,通过对呼叫中心记录的客户反馈信息找出客户关注的热点和对产品的正面负面评价。我对微博的挖掘挺有兴趣,现在还是时间不够用,有对此有兴趣的同行欢迎一起来研究。//@张磊IDMer:我读博士时研究的就是文本挖掘,看了一些NLP(自然语言处理)、计算语言学、IR(信息检索)等方面的文献。印象很深刻的是北大计算语言研究所的一位同行说的一句话:NLP的研究,会发现再过几十年,研究的还是同样的内容。由于人类语言的博大精深,如果纠结于语义语法词法,估计很难出成果。//@高峰在线V:就我多年前的经验和学习看来,SAS的文本挖掘实践效果不明显,有些概念流于形式。但是我离开SAS已经9年,相信SAS又有长足的变化。有没有人拿SAS的文本挖掘技术到微博上挖掘一把,做些实际的分析应用,让我们都可以学习一番?@张磊IDMer:文本信息作为典型的非结构化数据,人们一直希望能够从散乱的文本中发现有意义的东西。文本分析的典型应用比较多,包括信息检索、信息分发、信息抽取、自动摘要、文本分类与聚类等等。SAS的Text Miner支持中文的文本挖掘。而Google搜索引擎则是信息检索的典型应用。//@数据挖掘与数据分析: 文本的数据称为非结构化的数据,也就是BBS、客户反馈、评论、发布微博的这种也算吧,如何从用户的描述中找出有用的信息?比如支撑产品、支撑运营?结构话的数据,相对处理简单一些。非结构化的一直都是‘纯手工整理’,大家有没有这方面的软件或者高效的方式?@沈浩老师 @小蚊子乐园 @张夏天_机器学习 [04/03/2011 07:47:24]
  4. //@张磊IDMer:回复@小来同学:还没仔细研究,不过相信会融合信息抽取、主题词分析、热点趋势、社会网络分析、Web分析以及在商业上已经成熟应用的分析型客户关系管理、目标营销等多方面的分析应用 //@小来同学:微博内容的挖掘,还是一些趋势得挖掘分析?

物流模块的数据分析体系

//@小蚊子乐园:数据分析在物流行业的应用,与业务紧密结合,非常好//@NoKDD: 数据分析的描述、监控、挖掘。[04/09/2011 12:52:25]

  • 业务问题与数据挖掘算法间的关系

    这个是SAS公司做广告用的吧? //@SAS中文论坛:都看过 //@bonniewinds:这张是SAS公司关于数据挖掘的PDF文件里的吧,我看过,一模一样的。呵呵。//@数据挖掘与数据分析: 这张图,你见过几次?聚类、关联、序列、决策树………. [04/13/2011 21:10:11]


    中文数据挖掘工具及比较

    1. 学习了解 @张磊IDMer:回复@欧秋斌:不会啊,我在2007年用SAS Text Miner v3.1时,就做过中文文本自动分类的例子。目前我用的是最新版本SAS Text Miner v4.2。不知道你在sas9.1联机帮助的什么地方看到“不支持中文”?@欧秋斌:回复@张磊IDMer:你用哪个版本SAS Text Miner,我看到sas 9.1版本帮助里面说不支持中文 //@张磊IDMer:回复@数据挖掘与数据分析:哈哈,这个你要问SPSS的顾问啦。我所知道的是,SPSS的确还不支持中文的文本挖掘。 //@数据挖掘与数据分析:clementine里面为何不支持中文呢?技术还是?//@Xiu-xiu:可以挖掘中文文本,给你的clementine装上 text mining插件试试~//@张磊IDMer:回复@Xiu-xiu:呵呵,你确定?我可是和IBM软件部专门负责SPSS的咨询顾问确认过的;-) 确认结果是Clementine目前还不支持中文的文本挖掘。//@张磊IDMer:回复@kuhasu:呵呵,kuhasu厉害,这种内幕的消息都知道……没错,的确是这样的 //@kuhasu:SPSS的文本分析有两种,一种是TA,调查问卷解决方案,另一种是Clementine的,并不原生支持中文,而是利用CAT计算机辅助翻译,把中文变成英文,所以不能算是中文文本挖掘。[04/13/2011 22:05:05]
    2. 这个你最有发言权@张磊IDMer:易用性是“仁者见仁智者见智”,客观说起来,两者都容易上手,Clementine看起来更简单可能是因为EM提供了更多参数设置。至于速度方面,个人电脑上的体验难以说明问题,对比一下SAS和SPSS官方网站上列出的成功案例数目,就容易发现SAS在企业级应用的广泛性是SPSS难以企及的//@sxlion 尽管我用Clementine和EM不多,但是觉得Clementine易用性和速度都超EM。 //@沈浩老师:我比较喜欢用Clementine,早期我把SAS的案例用Clementine跑效果一样!易用性上Clementine好些,SAS最新EM版本没用过,不是非常了解!
    3. @沈浩老师:目前中文非结构化数据处理是一个难题,英文处理相对成熟些!目前方法基本上是非结构化数据的结构化或半结构化——大部分非结构化数据处理技术还是社会网络和Link Analysis思想,当然舆情好像还是靠手工:好、中立、差等——autonomy是一种思路!@icecile:现在应该还不能支持中文文本挖掘吧?//@数据挖掘与数据分析: 文本的数据称为非结构化的数据,也就是BBS、客户反馈、评论、发布微博的这种也算吧,如何从用户的描述中找出有用的信息?比如支撑产品、支撑运营?结构话的数据,相对处理简单一些。非结构化的一直都是‘纯手工整理’,大家有没有这方面的软件或者高效的方式?@沈浩老师 @小蚊子乐园 @张夏天_机器学习 [04/03/2011 07:47:01]

    SAS 中文EM界面实例

    @张磊IDMer:SAS提供的数据挖掘集成环境是SAS Enterprise Miner,目前最新版本是6.2,已经被广泛使用,流程图式的操作界面比较容易上手,但要熟练掌握肯定还是需要您对算法有所了解 //@张磊IDMer: SAS#文本挖掘#截图:

    1. 例1.导入SAS的文本数据
    2. 例2//@张磊IDMer: SAS#文本挖掘#截图:2.挖掘流程示例[04/14/2011 10:12:57]
    3. 例3//@张磊IDMer: SAS#文本挖掘#截图:3.MBR文本自动分类效果示例[04/14/2011 10:13:16]

     

    学习数据挖掘入门建议

    回复@粄1394:我想学习数据挖掘,应该用什么来做入门材料呢?数据挖掘的范围有点广,国内目前还没有合适的书。学习最好能依据一门工具软件,边学边实践。sxlion: 推荐@沈浩老师 的博客http://t.cn/h4kHXG和@张磊IDMer 的博客http://t.cn/h4u1nH,非常好的博客。 //@张磊IDMer:我个人比较喜欢的教材是“数据挖掘:概念与技术”和“构建面向CRM的数据挖掘应用”。如果希望学习数据挖掘软件SAS Enterprise Miner的使用,最佳的方式是上SAS的培训课,比如AAEM等,通过上机操作能尽快上手。

     

    第三部分 数据可视化

    应用例子

    1. 真pp,有空,用SAS仿一个出来玩玩。 //@刘万祥ExcelPro:非常漂亮的教程。想请教coredraw也是根据数据绘图吧,那么数据刷新图应该也可以更新啊//@图表汇: 『Infographics,信息图表』”使用Excel/CorelDraw绘制”滑珠图””。附教程:http://t.cn/hraf6m [04/14/2011 10:32:11]
    2. //@刘万祥ExcelPro:信息图表infographic和商务图表biz chart的领域不同,并不宜简单复制运用,得看场合、受众。否则自己做得累不说,还会得不到认同 //@小田_PPT顾问:左侧适用于报告,右侧适用与宣讲演示,目的受众场合都不同 //@薛凯_Logicdesign:视觉化的信息设计的简单案例。//@Logicdesign官方: #Created by Logicdesign# “有诚意”的数据设计,首先要筛选出最关键的数据,无情的抛弃对最终观点支持不大的辅助信息——而这个前提必须要拥有对数据深入理解和对于最终观点的强力判断提炼力。其次就是让数据更加灵动,传统的饼图柱状图终究会审美疲劳,为什么不可以更有趣一些?在不费事的情况下。 [04/07/2011 14:45:57]

     

    第四部分 其他杂项

    博客信息

    1. 微博的信息量好大啊!短时间就有很多条SAS相关信息,这些信息具有实时性,都是最新资讯。尽管如此,微博信息量巨大,并且杂而乱,因此我将定时整理微博上的信息,使之更有条理和清晰,便于大家阅读。点击和订阅SAS资源资讯列表博客“微博资讯”, 以后还会加评论,希望各位留言。 [04/01/2011 08:10:05]
    2. 学习和提高SAS编程和应用的好出处——博客资源(2011扩充版):本博去年2010年9月6日收集了几个有关SAS编程和应用的博客,这里进行扩充,并且增加了微博这种新的博客形式。 博客和微博都是以一种个人发布的形式传播信息。 http://t.cn/hBSh0M [04/03/2011 09:31:42]
    3. 这个原文来源于胡江堂的博客http://t.cn/hBoJds,不知道有没有注明出处。 //@张磊IDMer:嗯,这个不错//@spss论坛: SAS程序员的十大技巧 | SUGI27(2002)有一篇被广泛引用的文 ,就两页纸,Doug Zirbel的10 Things Experienced SAS® Programmers Don’t Know – But Should(“SAS程序员不知道但必须知道的10件事”),题目挺拉风,讲的是 http://t.cn/hBSuqV [04/03/2011 15:28:54]
    4. 作为同类统计软件,SAS和R之间经常有争议,不过很多时候大家觉得R和SAS可以互补,因此同时会SAS和R的人不少。博文《SAS JMP9和IML/Studio3.2开始兼容R》http://t.cn/hrZN5A中提过SAS里面可以直接调用R,避免两软件切换的麻烦。至于SAS兼容R到底表现如何呢? 见http://t.cn/hrZN52 [04/10/2011 08:53:14]

    SAS公司消息

    1. 原版SAS书100本,只要29.95dollar!电子书,内容为最新版 SAS9.2在线文档,100多本,揽括30多个SAS产品,这也拿出来卖钱!SAS公司还真是个诗人公司,小气啊。不过如果你是大公司的话,还是合算的,因为他允许你内部distribution,正版哦! https://support.sas.com/pubscat/bookdetails.jsp?pc=64457。 [04/01/2011 17:21:31]
    2. //@张磊IDMer:呵呵,目前还看不到被收购的迹象,因为SAS至今仍未上市,还是全球最大的私有软件公司。大老板Jim Goodnight先生不太喜欢别人对他的企业指手画脚,而这种管理方式也是SAS能成为2010年全美最佳雇主的重要原因//@pure3d: @张磊IDMer ,SPSS被IBM收购后,SAS也是早晚的事,SAP抓紧吧 [04/03/2011 15:32:23]

    学习基础理论知识

    1. 很多自然科学的统计分析都基于正态分布的,惯性思维需改进。 //@沈浩老师:我的目的:知道自然界和社会有这么多幂律现象,我们考虑事情的时候就不能再用简单的平均思维去考察或解释!——特别是社会现象不完全是正态分布!//@沈浩老师: 服从幂律分布现象:1)演员合作网 2)奥斯卡奖项数 3)唱片或书籍销量 4)论文数 5)论文引用次数 6)计算机文件大小 7)机场航班 8)战争规模 9)语言单词频率 10)姓氏分布 11)生物物种数 12)地震强度 13)互联网网页点击 14)手机话费 15)个人收入 16)GDP大小 17)微博粉丝数——请大家补充! [04/14/2011 11:11:17]
    2. 转发微博。//@数学文化: 当今复杂的统计数据,经常在忽悠人们;学一点统计方法很必要。《统计陷阱》是著名统计学家哈夫的名著。该书半个世纪来多次重印并被译成多种语言。原名《如何利用统计说谎》由于具有误导性,遂改名《统计陷阱》,中文新版改回接近原名的《统计数字会撒谎》。本书通俗易懂,可当行骗宝典,也可成防骗宝典 [04/09/2011 20:22:13]    ps:这本书可以换个名字,叫《如何做一名专家》,哈哈,特色。

    原创文章: ”SAS资讯 from 新浪微博-2011-04-15“,转载请注明: 转自SAS资源资讯列表

    本文链接地址: http://saslist.net/archives/120


    Reader's Comments

    1.    

      楼主很用心的收集整理,很棒,赞一个

      Reply to this comment
    2.    

      这一整理,还真像那么回事。虽然过程麻烦点,但有模有样了。
      当然还有很多不妥的地方,希望大家指出。

      Reply to this comment

    Leave a Comment

    此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据