如果说21世纪还有什么可以使生活更便利,那数据分析的影响一定当仁不让,不信看看双十一各大电商平台的商品推送,也许你会感叹它可能比你父母都了解自己,但在这背后,不管是谁,都必须承认数据分析正在重塑未来,勾勒美好生活的样子。
在SAS 2018全球分析领袖峰会(Analytics Experience 2018)上,“好奇心”与“创新”成为了出现频率最高的词汇。
从对事物的好奇到产生质变的创新,这一过程是我们的思维火花与数据分析方法碰撞的结果。站在上个世纪,我们可能无法知道现在网络的流行和移动通讯的发展让我们天涯若比邻,若时间放的再远一点,我们甚至会武断地认为翱翔宇宙是人类最不靠谱的泡沫幻想。而这一切,都在人类的创新革命中实现了。如今,数据分析正在激发未来无限的潜能。
SAS公司执行副总裁兼首席运营官及首席技术官 Oliver Schabenberger 对于人工智能的过去、现在和未来提出了自己的看法。“对于人工智能,我们还处于起始阶段,所有未来的发展都基于我们的想象。好比工业时代蒸汽动力取代传统畜力,电气时代的电力又取代了蒸汽动力,时代更替时会有许多从前想象不到的职业涌现出来,就像现在很多大型投资公司雇佣的的软件工程师数量已经比金融交易员多了。”他认为,未来,具有通用人工智能(AGI)的硬件和软件技术将成功地执行任何人类可以完成的智力任务,并且能够从失败中学习。“30%~60%的工作将交给人工智能和自动化,比如卡车司机和出租车司机的工作。如果能够实现完全的自动驾驶,为什么必须要有人坐在驾驶员座位上?那些需要运用同情心、爱心、逻辑和创造力的工作才需要由人类担当,剩下的高频多次的简单工作完全可以交给机器。” 提取数据价值
作为全球最大的�件公司之一,SAS公司40多年来一直专注于高端商业智能和商业数据分析,在金融行业高级商业数据分析领域占据了极高的市场份额――目前,全球前100家银行中就有99家正使用SAS数据分析软件来强化他们的数据分析能力。
除了金融,还有政府、专业服务、电信、制造等行业的一些专业数据分析和统计方案的标准算法,都出自SAS之手。澳大利亚几乎所有的政府部门都有用到SAS的解决方案。由此可见SAS至少在金融、政府这两大领域影响的不止是某一家知名公司,而是整个行业。据IDC的统计,如今SAS占据了全球高级分析和预测分析市场30.5%的份额,是第二名的两倍以上。
40多年来,SAS的整体营收保持了持续的增长。即使在开源软件大行其道的今天,略显昂贵的SAS依然是全球多数金融、医疗机构、甚至政府的首选数据分析软件。
经历了数据写在纸上的时代,到大数据、云存储,再到今天的机器学习、人工智能,SAS尽管经历了多次技术探索方向的变更,作为一家专注“分析”40余年的老牌公司,其在行业内积累的丰富数据和业务经验鲜有匹敌者。而在算法和模型愈加“自动化”的今天,这些宝贵的行业知识积累显然比技术更难复制。
SAS成立四十年来,最强的其实是算法,而不仅仅是普通意义上的BI商业智能,不仅仅是报表。
算法是什么?
算法是统计分析模型,其实就是建立在大量的数据基础之上,同时结合非常多的行业知识,来把一些普遍规律通过抽象的数据模型固化下来,从而进行分析和预测。事实上,SAS一直的主张就是提取数据价值。
在Analytics Experience 2018第一天的开场主题演讲中,COO兼CTO Oliver Schabenberger代替SAS创始人兼CEO James Goodnight出场,他强调SAS成立42年来,每年投入收入的25%用于研发,是行业平均水平的两倍,去年更是花费26%的收入用于数据管理、人工智能、机器学习、反欺诈、安全情报、风险管理等重点领域的研发。“我们重视统计学家和数据科学家,希望他们使用数据分析工具为政府和商业组织提供价值。但是当你观察他们的工作时会发现,这些高端人才每天需要花费大量时间来处理数据,一些数据科学家甚至会用80%的时间用于清洗数据的工作。”Oliver Schabenberger认为,运用人工智能以及机器学习可以使得科学家的工作更有效率,帮助他们进行数据管理并更具可重复性,更不易出错。数据科学家们可以将每天的时间花在更高价值的工作上,比如建立模型。 打造Viya云就绪分析平台
2017年4月,SAS推出了云就绪分析平台Viya的全线产品,包括一系列可视化分析平台,同时SAS Viya还提供了大量机器学习和人工智能功能,以满足当前日益增长的企业智能分析需求。
SAS Viya首先是一个开放平台(支持包括REST API、SAS语言、Python、Java、R和Lua等方式的数据操控和分析开发),同时也是一个支持多租户云部署的内存计算平台(可部署在AWS、Azure等云平台上,同时可以用公有云、私有云和混合云方式部署),具有可治理和管理复杂模型的统一分析模型库,为企业开发、部署和管理所有分析需求提供一个单一、开放和统一的分析环境。
1980年,北卡罗来纳州威克县还只有30多万居民。而到2016年,人口就超过了100万。在这个曾经的农业大县,随着人口的快速增长,房地产市场规模不断扩大,房产价值不断上扬。威克县税务局负责评估15个城镇以及其他管辖区域的房产税,每个辖区都有自己独特的供需趋势。
每个月,威克县都有3000多套房产交易,即使是最简单的公寓交易也需要对超过25个变量进行分析。最近一次评估开始于2016年初,评估的房产数量比上期增加了近2万套。要想在更短的周期内完成精准评估工作,就需要大批业务熟练的评估人员和支持人员,大量短缺的人员需要进行快速的招聘及培训,但是这是一项不可能完成的任务。 最终,威克县借助SAS Viya平台,来确定每套房产每天的市场行情。SAS为威克县建立了基于云服务的模型。该模型通过分析数百个因素和每日房地产销售情况,提供及时、客观、精准的市场预测。系统根据最近的销售数据,独立预测每套房产到2020年1月1日的市场价值。许多因素都会影响房产价值,例如地点、面积和装修等等。该模型使用决策树,根据一系列的决策来估算销售价格,例如房屋包含多少取暖面积、使用了乙烯基墙板还是砖墙等等。通过对每次房屋销售的统计分析,使模型�得更加完善,更加精确。 人工智能的SAS
威克县的税收评估模型由SAS 可视化数据挖掘和机器学习(SAS Visual Data Mining and Machine Learning)套件的人工智能提供支持。SAS 可视化数据挖掘和机器学习具有全面的可视化(和编程)接口,可处理从数据到发现再到部署的分析生命周期的所有任务,支持端到端的数据挖掘和机器学习。
实际上,无论是SAS Viya还是SAS 9都开始提供大量的机器学习和人工智能功能。
众所周知,人工智能三要素中就包括算法、数据、计算力。精于算法的SAS一直身处其中。当然,人工智能也不是今天才提出的,经过了几十年的演化,今天的人工智能与过去的人工智能相比,最主要的突破在于数据无处不在,而不仅仅集中于SAS传统擅长的金融和政府公共事业;同时,计算力的几何倍数提升,让算法可以通过机器学习的方式,实现快速迭代优化。
在Oliver Schabenberge看来,今天由于计算力的提升,数据分析、商业智能和人工智能,都从以往相对割裂的事后分析和预测判断,通过机器学习演化成为一个闭环,从而加速了迭代周期。
在这样一个时代背景下,SAS要做的事情是充分发挥自身的优势,构建云分析的生态圈。这也是为什么SAS耗资10亿美金开发了面向云计算现代计算架构的云分析服务Viya的原因。“仅仅几年前,我们的行业用户还对云应用非常疑惑,但现在已经有了非常快速的转变以及强烈的上云意愿。当然,这些云上的应用程序仍然受到严格的监管,你必须能够解释决策过程的每一步。因为如果有一个步骤无法解释,就可能污染整个分析的逻辑。”Oliver Schabenberge坚持认为,人工智能不应该成为独立于分析战略之外的黑盒子,这也是为什么SAS将人工智能嵌入SAS Viya平台的原因。
在战略驱动下,在正确时间使用正确的战术,是获得成功的关键。SAS一贯以来的信条,是在任何产生数据的地方都进行数据分析。而对于同样数据,在同一平台内整合传统数据挖掘和最新机器学习方法的能力是其在当前市场的最大竞争优势。“SAS的高级分析功能已经将人工智能嵌入了Viya平台,可以支持端到端的整个分析生命周期,周密设计并能完整实施的分析战略,帮助企业创造更多更高价值的应用,未来我们可以达到大规模地毫秒级别的分析决策。”Oliver Schabenberge同时不忘提醒,即使有云计算、人工智能、机器学习各种先进技术的加持,IT也并不完美,“你可能拥有优雅的、可信赖的系统,但永远不会有百分之百完美的模型,因为数据每天都在变化。”
写评论