内存计算in-memory-computing :
数据处理过程中有很多硬盘数据的读进读出操作(IO),这个相当浪费时间,如果放到内存,则相当于少了一个环节,大大节省了时间,不过对内存大小是个考验。SAS里面使用option可设置内存计算,即设置虚拟硬盘,在定义libname的时候,使用SAS的选项MEMLIB和MEMCACHE即可(例 libname inmemory “g:\memlib” memlib;),数据量大时小心内存不足。 //@沈浩老师:内存计算,in-memory-computing 将极大提升海量数据计算能力,IT界已经等不及数据从硬盘调入内存的时间了!//@
SAP中国: 目前SAP正致力于基于内存计算的探索。这种技术充分利用了多核处理器和并行计算的优点,可实时提供关键性的商业信息。结合现有的各种技术,充分利用多核中央处理器的功能,列式存储可以创建高效的内存数据库,将整个应用软件,而不仅仅是数据,置于内存中,进而显著改善性能,最终实现数据的实时分析。 [09/13/2011 13:26:04]

会议信息:
- 转发微博。//@SAS中国公司: 【SAS论文征集】SAS Global Forum是SAS规模最大的用户大会,每年都会吸引全球数千名用户参加,论文演讲是其分享专业知识、促进SAS社交活动的重要组成部分。2012大会将于明年4月在美国奥兰多举办,论文征集活动现在已经正式开始,欢迎大家投稿,详情如下:http://t.cn/arPpMF
[09/15/2011 10:22:47]
- 2011年11月12日~13日,12日全天为专题报告,13日上午为报告和基础培训,会议于上午正式结束。13日下午为自由讨论,视人数多寡决定是在校园草地或者附近的咖啡馆进行交流和讨论。//@统计之都: 第四届中国R语言会议(上海会场)通知 http://t.cn/aBspCd [09/14/2011 11:40:23]
- 网络会议 @SAS中国公司 : 【如何通过数据整合提升信息资产的投资回报?】精准的业务决策依赖清晰、明确的数据依据,但是识别、验证、收集、操作、交付正确的数据是一个花费巨大且不稳定的过程。SAS数据整合技术网络研讨会将于9月22日14:00-15:30召开,只需电脑及网络支持,诚邀您注册参加。http://t.cn/adUbdS
- 行业会议: 大数据时代 时间 2011.9.15, 14:00 – 17:00 地址 创智天地2号(KIC2)2楼衡山会议厅(上海市淞沪路252 号,江湾体育场边) 联系方式 (86-21)60951100-2948//@大数据:关注&期待..//@EMC中国-云计算: #活动召集# 9月15日14:00 – 17:00上海Big Data与Hadoop开发者聚会,EMC Greenplum Hadoop部门资深产品经理和开发总监、EMC中国研究院资深专家将到场,分享Hadoop产品技术,探讨和分析Hadoop与Big Data前沿研发项目。请关注Hadoop 及 Hive, HBase, Pig的达人们转起来。报名链接:http://t.cn/a3XSSU 。
[09/06/2011 22:24:18]
招聘信息:
- SAS北京公司招人,高手速联系。 //@SAS_Kansun: 老实说,一想到要在年底前增加将近十名新成员,并可能更多,就多少有些压力。因为,请不到"英雄",纵使眼前有多少有意义的工作,也只好罢手。@SAS_Kansun : 要在一个团队中增加两个ETL工程师和一名SAS Admin, 并要考虑继续扩大零售业解决方案项目的实施团队。这年代这个世界,不是英雄无用武之地,而是无用武之英雄。
推荐SAS博文
- 很详细的随机抽样SAS代码实现方法 见xiaofeng1982博文 利用SAS进行随机抽样 在构建数据挖掘模型过程中,有时我们无法对所有的整体进行全面研究,有时我们希望将整体划分为训练集、验证集、测试集三份用于不同目的的数据集,甚至在K-折交叉验证中,我们需要把样本随机的划分为K份数据子集。本文介绍SAS的SURVEYSELECT过程和RANUNI函数在随机抽样方面的应用。
- 治愈系文章:SAS 认证考试全面解析(beta版) SAS认证考试的问题在很多论坛上差不多每天的都有人问,在这里做一个列表,希望能治愈大部分的考试认证问题帖。http://t.cn/arSfuz
SAS词条:
- @sxlion: T检验,为什么要计算F值? TTEST程序用来执行T检验(即平均值的假设检验)和计算参数的区间估计,针对单个样本、配对观察值、两个独立样品和AB/BA型的交叉设计实验。 http://t.cn/aBjtJV [09/12/2011 18:39:43]
- //@沈浩老师:回复@yawei張雅薇:对不起,你提到的EDA,是原文中的探索性分析,DM一定是探索性分析的主要方法!EDA在电信企业也是一个专有分析业务名词! //@yawei張雅薇:请问沈老师, datamining可以算是EDA的一个研究方法吗?//@沈浩老师:EDA是企业级数据分析,多指企业数据分析规范和体系,比如电信行业都建设有经营分析规范手册,内含EDA规范,主要描述企业数据经营分析架构和分析主题方法,包括数据层、元数据、应用层,分析层等,有了EDA就知道哪些信息应该去做那些分析支持什么决策等,甚至包括软硬件建设!//@MurphyLin:在电信领域,EDA定义是Enterprise Data Architecture。呵,探索性数据分析,很多种解释咯。//回复@沈浩老师: 尽管60年代提出的,现在和未来的数据越来越大和存在规律的未知性,使得EDA的重要性增加,这种应用将越来越多。 //@沈浩老师:传统的统计分析,主要是写Paper类的论文,一定强调实证和证实性,在理论指导下的实证研究,要求有假设!随着海量数据和数据易得性,特别是数据挖掘拓展了统计学//@sxlion: 定义 所谓探索性数据分析(Exploratory Data Analysis,以下简称EDA),是指对已有的数据(特别是调查或观察得来的原始数据)在尽量少的先验假定下进行探索,通过作图、制表、方程拟合、计算特征量等手段探索数据的结构和规律的一种数据分析方法。… http://t.cn/a1ZbPX [09/04/2011 22:13:09]
图表评论
- //@刘万祥ExcelPro:从原图标题看,作者的意图是想说:大银行大幅削减了xxx,如果原图改按类别分组、按年份并列,就很好了,也就是1号图。原图外观已经不错,但图例去掉了常见的色块,反而需要读者想会。2号图可以,但一般读者不熟悉,3号图不合适。//@演绎生动Excel图表: 【#E图E评V#】一个关于银行页的分组柱形图,原始图表要读取信息实在是令人有些费劲。图表是帮助数据比较的有力工具,不能有效的进行视觉比较就是浮云。看看①②③三个重新扑腾的图表,你更喜欢哪一个,来踩一脚,转一转,评一评,秀一秀。
[09/07/2011 12:55:42]
图表应用:
- 工业数据仪表盘,没有商业仪表盘那么炫,但是实用。//@麻省理工科技创业: 云彩影响太阳能发电 http://t.cn/a142Qp 17个#太阳能测量#站靠近夏威夷#檀香山# #瓦胡岛#国际机场,每秒同时收集一次数据,全年进行测量。
[09/05/2011 17:17:34]
- 漏斗图,变体应用。//@郑来轶: #小1推荐#互联网行业的30/10/10黄金比,你能够把几个人变成忠实顾客?>>http://t.cn/aEFKak
[09/14/2011 12:46:15]
- 滑珠图,谁爱这个 ?//@图表汇:『信息图表』//@经济学人中文网: 今日图表反映了多国大学毕业生和研究生中,女生所占的比例。其中,经合组织国家的平均比例已接近六成,而日本的这一比例则相对较低。http://t.cn/aBgH8w
[09/14/2011 12:09:24]
- 我爱雷达图。//@199IT-互联网数据中心: 中国互联网城邦竞争力报告:百度、腾讯、淘宝、新浪和奇虎360五大关键指标对比。—来自:@商业价值杂志
[09/14/2011 11:57:32]
- 我爱饼图。//@麻省理工科技创业: 数据#电子医疗#:完美风暴 http://t.cn/aBsIjt 医疗保健服务并没有高自动化,因此自动搜集与处理医疗信息对医院和软件公司来说仍是一个巨大的机会。 但部分信息属于隐私,而且容易遗失,如果是你,你愿意在网上预订一次手术或者放疗吗?
[09/14/2011 11:42:23]
- 累积或堆积曲线图的应用。//@图表汇: 『信息图表』图表显示(英)皇家海军自1990年就开始逐年消减规模,包括驱逐舰、护卫舰、攻击型潜艇、两栖舰艇、航母、核潜艇等。http://t.cn/a1CIC2
[09/07/2011 10:19:58]
- mekko图,市场细分份额图及应用//@图表汇: 『信息图表』”Obama’s 2012 Budget Proposal: How $3.7 Trillion Is Spent”,奥巴马政府的2012年预算。市场细分矩阵图的矩形面积对应用于各个领域的经费总额,信息还包括较上一年的增减幅度,以及平均到家庭的费用。http://t.cn/h5x88N
[09/05/2011 08:22:32]
- 柱形图//@199IT-互联网数据中心: Hitwise:2011年2月的调研发现,受过高等教育,以及未来高等教育潜在群体是Quora用户的重要人群,将近16%来自主要的大学城市,9.69%来自富人区。http://t.cn/a1E7Ah
[09/08/2011 10:30:31]
- 柱形图//@199IT-互联网数据中心: eMarketer:预计47%的美国互联网用户,大约为8820万人,会使用在线优惠券。http://t.cn/a1RIl9
[09/08/2011 09:36:26]
SAS公司官方微博
- 转发微博。//@SAS中国公司: #SAS 35岁啦#【致力于企业可持续发展二】除了员工参与以外,从健康护理到扩展的工作机会,SAS在减小其环境足迹方面都取得了很大的进展。例如,位于SAS全球总部的1兆瓦太阳能电池阵列就在源源不断地向当地电网输送使用清洁、可再生能源产生的电力。图为SAS全球总部的太阳能发电场。
[09/05/2011 09:59:26]
- 转发微博。//@SAS中国公司: 【SAS名列保险业商业智能、分析和绩效管理软件市场榜首】SAS在Gartner最新《市场趋势:2011 年保险业不可缺少的商业智能分析》硏究报告中位列2010年软件市场首位。Gartner 报告显示,2010年SAS的市场占有率高达25%,总收入为1.387亿美元。http://t.cn/aBEhaz [09/13/2011 13:30:11]
- 转发微博。//@SAS中国公司: #SAS 35岁啦#【SAS庆祝35年分析软件创新历程】SAS以独特的方式帮助全球客户实现变革:保护白犀牛、北极熊、鲸鱼和孟加拉虎等濒危物种,识别潜在生物恐怖威胁、减少贫困和饥饿,加快风湿性关节炎等疾病的药物发现,提高儿童癌症生存率、防控HIV/艾滋、疟疾及其他疾病,降低儿童死亡率http://t.cn/a1F9Be [09/09/2011 11:07:06]
- 转发微博。//@SAS中国公司: #SAS 35岁啦#【致力于企业可持续发展三】SAS位于全球各地办事处的建设项目都采用了低环境影响的原则。另外,SAS正在为其全球总部的一个新会议中心和一个新云计算中心接受LEED认证。 [09/08/2011 09:36:34]
- 回复@SAS软件JMP事业部: 原来是一种互补作用,不过JMP出了高级专业版,看起来真的很强大,基本上够用了。 //@SAS软件JMP事业部:回复 @sxlion:JMP的特点在于数据分析的交互性,可视化和易用性,而SAS的最大优势是分析能力强大,拥有很多高级算法。二者的结合可以很好地提高分析效率。比如,可以把JMP作//@SAS软件JMP事业部: JMP和SAS的结合使用已越来越紧密,Serasa Experian,美国以外全球最大的credit bureau,正结合使用SAS和JMP Pro来分析、理解和预测消费者行为。 [09/07/2011 18:43:32]
社交网络
- 点开,有丰富的图表内容。//@199IT-互联网数据中心: InSites Consulting:2011年全球社交媒体报告 – 在对全球35个国家9027名15岁以上消费者进行调查报告显示,目前全球有超过10亿人在使用社交网络,占网民人数的大约70%。新推出的社交网路较难成功,60%受访者表示不想要任何新社交网络,93%对自己目前使用的社交网络满意。 http://t.cn/arVImH
[09/15/2011 20:10:05]
- 转发微博。//@199IT-互联网数据中心: Ipsos OTX Media CT:男性社交分享推荐行为数据研究 http://t.cn/arUack
[09/15/2011 09:05:17]
- 转发微博。//@199IT-互联网数据中心: NIelsen报告,美国人1/4的线上时间花在了社会化站点上,美国互联网用户在社会化媒体上花费的时间是在线游戏的2倍多 http://t.cn/aBuxiz
[09/13/2011 15:07:03]
学点数学吧,让你变得更强大
- 数学真是门利器。//@沈浩老师:余弦定理在市场应用:如果夹角是锐角说明两个对象(产品或品牌)是相似品牌、竞争品牌,替换品牌;夹角越小越相似,越大越有差异,品牌概念图!//@泰安纳斯:复杂有效算法往往基于简单数学原理//@数学文化: 谷歌新闻归类用余弦定理!Google 的新闻是自动分类和整理的。计算机读不懂新闻,但能快速计算。这就要设计算法算出任意两篇新闻的相似性。比如词汇表有六万四千个词,组成一个64,000维的向量。如两篇新闻的向量相近,即夹角接近零,则对应的新闻应归在一类,反之亦然。余弦定理正好可以计算向量夹角!
[09/03/2011 20:47:37]
- 转发微博。//@数学文化: #神秘的数学常数#1:圆周率 pi ≈ 3.1415926535897932… 不管圆有多大,其周长与直径的比值总是一个固定的数,就是圆周率。对它的研究甚至可追溯到公元以前;几千年后的1761 年,德国数学家Lambert 才证明了它是无理数。它还常出现在与几何无关的场合。如任取两个正整数,则它们互质的概率为 6 / pi^2 [09/15/2011 17:42:12]
- 自然底数e 工程学上也经常用到。//@数学文化: #神秘的数学常数#2:自然底数e≈2.7182818… 瑞士数学家伯努利注意到:当x越大时(1 + 1/x)^x 将会越接近某个固定的数。如(1 + 1/1000)^1000≈2.71692 ,而(1 + 1/10000)^10000≈2.71815。欧拉第一个用字母e来表示这个极限值,并算出了e的近似值,还证明了它是无理数。可以说e是微积分中最重要的常数!
[09/15/2011 17:41:31]
- 转发微博。//@数学文化: 生命成长发育的数学定律是什么呢?目前还没有哪种模型或方程象牛顿力学可以被称为精确的数学定律.生物成长是一复杂的化学反应过程,其中可能有非常多的化学物质参加反应。但在生物体某一局部的反应,可能主要是少数几种化学成分起决定性作用。在这种局部的情形,数学模型或方程今天已被许多科学家认可. //好厉害啊,动态方程。//@数学文化: 1952年,阿兰• 图灵发表了题为《生物形态的化学基础》的论文提出了反应扩散方程组作为生物形态的基本化学反应模型,并指出这一方程组可以有非常数的平衡解,即两种化学物质最后的分布状态可以是非均匀的.图灵认为这种非常数解恰好说明生物在生长历程中为什么形态各异,甚至隐含 了细胞结构分裂的过程 [09/05/2011 11:43:14]
回复@数学文化: 这从感性认识上升到数学模型,数学的力量。http://t.cn/a1USFl //@数学文化:回复@Proof舒畅QED:http://t.cn/a1USFl//@数学文化: 为什么有些动物身上有斑点条纹,而有些就是单色呢?非线性反应扩散方程组一般是找不出解的,但图灵方法可给出解函数与动物身长和腰围的渐进关系.通过对余弦函数这些初等函数的分析,可得结论:蛇的表皮一般总是条纹状,很少斑点状;世界上只有条纹尾巴和斑点身体的动物,而没有条纹身体、斑点尾巴的动物 [09/05/2011 12:47:59]
- 世上最伟大的十个公式,薛定谔方程排名第六,质能方程排名第五.英国科学期刊《物理世界》曾让读者投票评选了“最伟大的公式”,最终榜上有名的十个公式既有无人不知的1+1=2,又有著名的E=mc2;既有简单的-圆周公式,又有复杂的欧拉公式.http://t.cn/a1Rzja [09/09/2011 15:29:50]
Leave a Comment