大数据 精分析

来源 :中国计算机报 | 被引量 : 0次 | 上传用户:zkw_2209
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  “数据将成为一种战略性原料,每一个企业、科研团队和政府,都有责任有目的地搜集、处理、分析、索引数据。”电子科技大学互联网中心主任周涛号召企业投身大数据,对大数据怦然心动的企业也确实很多。但基于对全球95个国家、26个行业的1144名业务人员和IT专业人士的广泛调研,IBM发现,大多数企业都已经认识到‘大数据’改善决策流程和业务成效的潜能,但他们却不知道该如何入手。
  的确,在主动或被动迎接大数据时代之时,企业管理人员迫切需要在实干之前,明确很多问题的答案:3V之外大數据还具备何种属性?什么是大数据解决之道的要素?大数据实施是否有章可循?……
  以《分析:大数据在现实世界中的应用》白皮书为引子,IBM的大数据战略努力令企业的诸多疑惑迎刃而解。在此基础上,以“智慧的分析洞察”为核心的IBM大数据价值体系中的五大典型业务需求和对应的落地实践,形象化地展现了大数据如何驱动企业商业价值的增长。
  明确发力点
  在大数据和分析领域,IBM公认已经具备了充分的技术优势。IBM全球副总裁兼大中华区软件集团总经理胡世忠表示:“数据构成了智慧地球的三大元素:物联化(instrumented)、互连化(interconnected)和智能化(intelligent),而这三大元素又改变了数据来源、传送方式和利用方式,带来‘大数据’这场信息社会的变革。作为大数据领域的领导者,IBM正在利用领先方法论和全面大数据技术帮助企业重新思考已有的IT模式;助力企业进行基于这场信息革命的业务转型,获取竞争机遇和不可估量的商业价值。”
  要实现这一愿景,有必要知晓企业对应用大数据的认知程度和接受程度。IBM商业价值研究院和牛津大学赛德商学院联手实施了一项调研,并共同撰写发布了《分析:大数据在现实世界中的应用》白皮书。
  在该白皮书中,现阶段企业对大数据的观点得到全方位体现,它们着手实践大数据的方式被完整揭示,而它们在利用大数据获取商业价值增长方面的进展也被一一披露。
  基于翔实的广泛调研,IBM得出了数个颇具参考价值的结论:未明确大数据的定义是企业混淆大数据的最主要原因;企业对大数据的采用还处于初级阶段(大多数企业目前主要是理解概念(24%)或者定义与大数据相关的路线图(47%));以客户为中心是大数据的首要任务成为共识;内部数据是企业内大数据的主要来源但大量未开发的价值隐含在内部系统中;不确定性以及技能的缺失使得社交媒体等外部数据源未得到充分利用;缺乏先进的分析技能是从大数据中获得最大价值的主要障碍。
  德华安顾人寿董办主任王洪涛现身说法。长期耕耘于保险行业的他表示,大数据在保险行业的潜力巨大:保险行业使用大数据,现在还大多停留在“集约使用”阶段;保险公司拥有丰富的客户数据、交易数据和接触数据,但数据量的积累,往往导致“数据坟墓”"现象的发生;保险行业没有广泛培养出大数据智慧应用的意识和能力。他认为,保险行业利用大数据,一要集约地用,二要智慧地用。后者指的是利用数据挖掘,发现保险行业内的新知识,在这方面,保险行业仍然处于开拓期。
  为了进一步明确大数据定义,IBM首先完善了大数据的新属性:Veracity(真实性)。IBM全球企业咨询服务部业务分析与优化服务大中华区总经理段仰圣表示:“真实性是当前企业亟需考虑的重要维度,将促使他们利用数据融合和先进的数学方法进一步提升数据的质量,从而创造更高价值。”
  针对企业使用大数据的现状,IBM给出了五项关键建议,以期鼓励企业入手大数据:以客户为中心推动初始举措;制订整个企业的大数据蓝图;从现有数据开始,实现近期目标;根据业务优先级逐步建立分析能力;基于可衡量的指标制定业务投资回报分析。
  使能“智慧应用”
  “2010年开始,我在阳光保险集团主持建成了数据挖掘系统,这在保险行业是第一家。利用该系统,我们开展了许多保险大数据智慧应用的项目,获得了一些成果,并且培养出了国内保险行业的第一批数据挖掘师。”王洪涛是大数据最早的一批弄潮儿,他最看重的就是对大数据的“智慧使用”:“没有大数据的‘集约使用’,大数据的‘智慧使用’没有数据基础。而现阶段保险行业大数据在‘集约使用’之后,如果没有‘智慧使用’来指导,其副作用很大。”
  他举了一个利用与不利用数据结果相去甚远的例子:“淘宝现有一种运费保险,即淘宝买家退货时产生的退货运费原本由买家承担,如果买家购买了运费保险,退货运费由保险公司来承担。这种购买的结果是保险公司经营亏损很严重,直接导致它们不愿意再发展和扩大运费保险。”运费保险真的必然亏损吗?王洪涛的答案是No。他给出了避免陷入这种窘境的方法:“我为运费险做过一套大数据智慧应用的解决方案。因为退货发生的概率,跟买家的习惯、卖家的习惯、商品的品种、商品的价值、淘宝的促销活动等都有关系,所以,使用以上种种数据,应用数据挖掘的方法,建立退货发生的概率模型,植入系统就可以在每一笔交易发生的时候,给出不同的保险费率,使保险费的收取,与退货发生的概率相匹配,这样运费险就不会亏损了。在此基础上,保险公司才有可能通过运费险扩大客户覆盖面。”
  由严重亏损到成本控制得当并获取客户,靠的就是通过分析,挖掘大数据所提供的价值,吸引客户。这与IBM的大数据价值体系所倡导的“英雄所见略同”。
  胡世忠介绍道:“讲到大数据,IBM重点探讨客户智慧的分析能力。IBM考虑的是怎么参与,包括怎么充分利用IBM的产品咨询、服务软件,包括服务器、硬件,提供围绕‘智慧的分析洞察’的端到端解决方案。”分析能力包含技能和工具两部分,IBM大数据战略从这两个维度提升企业的大数据水平。
  IBM软件集团大中华区中间件集团总经理李红焰表示:“以往的IT更多是对现有企业中的数据进行搜集、整理、管理,形成了老的核心应用系统。尽管这些核心应用系统依然主宰企业IT,但如何让过去的资产发挥新的作用,由原来纯粹的结构化数据应用转变到动态地、多样化地来利用各种数据,并由原来只是利用内部数据到综合利用内外部数据?这意味着IT要进入新纪元,获得更多数据资源并挖掘其中的价值。所幸的是技术使这些成为可能。”   何谓以“智慧的分析洞察”为核心端到端的解决方案?李红焰解读了IBM大数据战略:从两个层次提供全面整合的结构:一是大数据的平台。二是大数据的分析。“这两者是相辅相成、缺一不可的,它们不有机地结合到一起,我们所感受到的就只是大数据领域里一个个孤立的点,而不会是形成体系的面。”
  对应总体构架图,李红焰指出在企业大数据的每一个层次,包括基础设施、分析、内控、决策,IBM都提供相应的解決方案,而且这些解决方案在技术上是无缝结合的,融合了IBM咨询、服务、软硬件的综合实力。
  周涛同样指出,大数据不是一个片断,也不是简单地具备一项技能,而是综合的,从理念层面延伸到技术、科学和管理。没有结合深入分析的大数据成为解决问题的万能钥匙,这种可能性基本不存在。
  大数据的市场正处于爆发前夜。按照IBM的理解,大数据市场大致分为四个阶段:一是教育,需要让大数据的重要性和必须性得到充分认识;二是探索,主要探索大数据到底怎么应用;三是接触,从实际的角度去思考怎么应用大数据;四是执行,真正把大数据结合到业务流程里去。段仰圣有信心,IBM提供的大数据产品服务会加速大数据市场走向执行阶段。
  在中国,“大数据给了一个大机会,使得中国能够更快地追赶英美等发达国家。之前我们一直讲中国创新主要是小规模的局部的创新,但在大数据领域,中国有很好的机会实现深度创新,实现大规模的交叉呼应的数据应用。”周涛希望中国企业抓住机会。
  北京先进数通信息技术股份公司专注于金融信息化领域,公司总裁林鸿很“庆幸自己选择了大数据领域”。“银行业务部门对大数据的需求越来越多,单凭我们自己无法全方位满足需求,因此,在IBM综合实力的支撑下,先进数通为推动大数据真正在银行广泛使用做出了贡献”。他表示,作为合作伙伴,先进数通将和IBM步伐一致,基于对银行业大数据的理解,在建设数据使用环境、实现金融经营管理分析等方面提供优秀的解决方案。
  为实施提供样板
  大数据智慧能起到多大作用?只有真实的应用才能给出答案,也才具有强大的说服力。“在实际案例中,我选取‘提升度’指标来评价,比较好地体现了保险大数据智慧应用的价值。(提升度=采用大数据智慧的结果/不采用大数据智慧的结果)。”王洪涛认为,应用场景能让企业获得对大数据价值的直观感受,以保险行业为例,典型的大数据智慧应用场景为客户细分、代理人甄选、营销响应、交叉销售和二次销售、欺诈监测、流失预警、客户挽留等。
  在与客户沟通的过程中,段仰圣也深刻地感受到了这种需求:“几乎每个客户都在问,我怎么运用大数据?应用场景的建立需要企业从企业战略本身出发,仔细考量大数据可以对企业运营产生什么效果。”
  IBM相信榜样的力量,致力于为行业提供广泛的实践参考,帮助客户的IT部门以及业务部门深入了解大数据技术在不同行业的应用场景,进而探究大数据将为其企业带来的商业价值。此次,IBM重点分享了五大业务需求和对应的大数据落地实践,以供企业在具体实施时有章可循,在有相似应用场景时可以预估收益。
  第一个场景为利用大数据探索实现信息库的充实。客户服务、保险、汽车、维修、医药等行业需要储备规模巨大的知识库,而庞大繁杂的解答手册和知识系统会造成重复查询,导致系统延迟和成本上升。IBM InfoSphere Data Explore使某全球航空制造商中的技师、支持人员和工程师能够即时通过单一访问点查看位于不同应用程序中的信息。部署第一年,该公司全天候支持的呼叫时间从过去的 50 分钟缩短为 15 分钟,每年节约 3600 万美元。
  第二个场景为利用增强360度全方位客户视图实现客户交互改进。电信、零售、旅游、金融服务和汽车等行业将“快速抓取客户信息从而了解客户需求”列为首要任务。通过部署IBM InfoSphere Data Explorer,某跨国快消产品制造商的员工能够更有效地搜索到最为相关的信息,加快决策过程,减少重复劳动。
  第三个场景为利用运营分析实现运营优化。制造、能源、公共事业、电信、旅行和运输等行业需要时刻关注突发事件、通过监控提升运营效率并预测潜在风险。巴基斯坦移动运营商Ufone部署了IBM大数据解决方案,通过实时识别用户行为,开展应对特定目标的营销活动,并使用预测分析来设计更好的营销活动和电话推广计划,有效降低了客户流失率。
  第四个场景为利用数据仓库扩充实现IT效率和规模效益提升。企业需要增强现有数据仓库基础架构,实现大数据传输、低时延、和查询的需求,确保有效利用预测分析和商业智能实现性能和扩展。某汽车制造商利用IBM InfoSphere BigInsights增强原有数据仓库,实现快速部署并且更易于管理。
  第五个场景为利用安全性和智能扩展实现犯罪防范。政府、保险等行业亟待利用大数据技术补充和加强传统的安全解决方案。秘密情报和监视传感器系统供应商TerraEchos通过部署IBM InfoSphere Streams,能够实时分析流式传输的声学数据并对其进行分类,并将实时捕获和分析275MB 声学数据所需的时间从数小时减少到十四分之一秒,同时大幅提升监控精确度。
其他文献
10年前,享有全球第一CEO称谓的杰克·韦尔奇先后来到中国,呼吁“惟有技术研发,中国别无选择”。自1999年成立以来,北京人大金仓信息技术股份有限公司(简称“人大金仓”)就站在中国数据库第一代创领人萨师煊教授和第二代传承人王珊教授的肩膀上,潜心研发技术和产品,承担“核高基”等重大科技专项,并得到了政府、金融、电信和电力等重点行业的认可和支持。然而,面对国际企业垂直一体化的整合趋势,人大金仓等国内软
我国已经进入中等收入偏上国家的行列。如何跨越中等收入陷阱,成为发达国家?信息化是实现这一跨越支撑点之一。  ——本报记者 何立中  岁末年初,各界人士都在为2013年的发展进言献策。刚刚闭幕的以创新、融合为主题的2012年信息产业经济年会,从IT产业角度探讨了我国信息产业未来的发展趋势。按照世界银行的标准,2010年我国人均国内生产总值达到4400美元,已经进入中等收入偏上国家的行列。如何跨越中等
现如今,数据中心“孤岛式”的IT系统运维、管理成本逐渐占到了企业成本的一大部分,在一定程度上加重了企业负担。所以,融合基础设施越来越受到厂商和用户的追捧。  据市场研究公司IDC预计,到2016年全球融合基础设施的总支出将达到178亿美元,将占存储、服务器、网络及软件总支出的12.8%,而在2012年估计为46亿美元,仅占总支出的3.9%。“融合基础设施的市场前景之大,是Nutanix诞生的主要原
环环相扣的计算机产业链上的多个企业,在同一个光荣使命的号召下,于10月19日第四次相约昆山,参加2012中国计算机产业发展峰会暨第四届“昆山杯”中国笔记本电脑设计评比大赛颁奖典礼。  工业和信息化部电子信息司领导莅临指导,昆山市政府大力支持,产业链上相关企业,如芯片企业、整机厂商、软件企业、工业设计公司积极参与,群策群力,践行“推动云端创新,加速产业转型”,以把握计算机产业发展趋势、创新机遇,昆山
本报讯 10月24日,中国互联网协会反网络病毒联盟、电信终端测试技术协会、电子认证服务产业联盟在京组织召开了移动互联网应用程序开发者第三方数字证书签名与验证试点宣介会。据参会专家介绍,当前制作移动互联网恶意程序的主要手段是在应用程序开发环节嵌入恶意代码,或通过再打包方式篡改正常应用程序并嵌入恶意代码。经篡改后的移动互联网恶意程序采用虚假签名,使得用户和监管部门难以辨识应用程序的真实开发者。  通过
继3月6日德国汉诺威英特尔至强E5发布会上,与DELL、HP等厂商同期推出新款服务器后,基于E5平台的华为Tecal V2服务器系列终于在北京正式亮相。在北京发布会上,华为展示了其涉及机架、刀片、数据中心的三大服务器系列以及应用加速解决方案。与同期其它厂商的发布不同,Tecal V2直指云端。  硬件创新,皆为云来  “我们和其它厂商在服务器市场的立足点不同,华为瞄准的不是服务器市场,而是云计算市
2013年7月17日,金山办公软件在北京中华世纪坛隆重举行了WPS Office 2013新品发布会。从1989年WPS 1.0诞生,已经历经了25个年头的WPS发布了难以计数的版本,其中不乏WPS 97、WPS2005 、KINGSOFT Office 2010繁体中文版等具有重要代表意义的产品。而WPS Office 2013代表了金山办公软件在多平台和协同高效办方面的新突破,体现出金山办公向
专注一体化数据管理  软硬件高度集成的一体机之所以流行,一个很重要的原因是它可以简化方案的部署与管理,降低成本。一体机的一个核心理念是一体化管理。其实,一体化管理的理念早已在软件领域得到了推广。CommVault公司立足于数据保护与管理市场的一件利器就是一体化管理。  软件架构要具有可伸缩性  CommVault致力于软件架构的创新,目的是在客户数据高速增长的情况下,继续保持其软件架构良好的伸缩性
为什么会有越来越多的行业用户愿意选择一体机?以前,用户在采购IT设备之前必须考虑自身的应用环境、网络环境等,事无巨细。现在,一体机将计算、存储、网络甚至软件全部集成在一起,并且在出厂前就完成了预配置,到用户现场后只要连上电源、插上网线,一体机就可以马上投入运行,大大减轻了用户部署、管理和使用IT设备的负担。一体机的易管理性和易用性是其逐渐流行的一个主要原因。  2012年底,北京初志科技有限公司(
尽管很多安全厂商都在跟进大数据安全,但是目前大多停留在扩大数据广度上,在数据挖掘的深度上往往有所欠缺。然而,光追求数据的量大而不去深挖数据背后的价值,并不能让企业获得更多收益,反而增加IT基础架构的负担。  近日,惠普宣布推出新产品ArcSight Express 4.0,将Autonomy与ArcSight进行集成,增强解决方案的大数据挖掘能力。这是惠普在大数据安全方面的最新成果。  整合Aut