中国移动集中化BI探索:数据仓库与Hadoop混搭

随着移动互联网、物联网/传感器等技术的发展,全球数据生产速度正在高速增长,信息已成为企业的战略资产。而运营商作为网络时代的数据交换中心,其网络管道、业务平台、支撑系统中每天都在产生大量有价值的数据,基于这些数据的商业智能(BI)应用为运营商带来了巨大机遇。

对此,中国移动研究院业务支撑所所长孙少陵日前在“Hadoop与大数据技术大会”上对于运营商的大数据商业智能探索进行了详细介绍。

机遇与挑战并存

如今不仅市场竞争和政策管制要求越来越多的数据被长期保存。对于企业而言,也越来越需要积累越来越多的信息资源。信息对其进行用户行为分析、市场研究等活动有着重要意义。

通过分析用户行为及偏好,可相应改善用户体验;通过分析流量、流向变化及网络日志,可优化网络质量;通过对业务、资源及财务等各类数据的综合分析,能快速准确确定公司管理和市场竞争策略;当然其更可刺激业务创新,在确保用户隐私不被侵犯的前提下,可对数据进行加工,对外提供信息服务,从而提升企业价值。“未来中国移动可能会基于这些信息推出一些新业务,形成运营商新的竞争力。” 孙少陵透露。

然而,大数据也给运营商的商业智能系统带来了诸多挑战。在此方面三家运营商的状况相差无几。

首先,商业智能系统为分散建设,而运营商一般为两级结构、甚至三级结构,分总部、省级、地市级。“比如经营分析、信令监测、综合网络分析、不良信息监测、上网日志留存等大数据系统分专业建设,而其中部分系统又分省建设。”孙少陵谈到,“如此分散的建设一方面造成资源重复建设及应用重复开发,一些科学家和分析专家的数据资源也无法形成共享。”

其次,数据分散存储,标准化程度比较低。目前不同系统的建设主体不尽相同,尽管集团有统一的数据模型标准,但最终在实施上总有一些差异。而数据模型的不统一,就造成了跨系统的综合分析困难。

再次,目前运营商大部分建有以数据仓库为核心的BI架构。这一传统数据仓库采用小机加盘阵高性能一体机建设,成本非常高。整体来看,运营商的商业智能是以处理传统的划单、日志等结构化数据来设计的。在上网日志等一些新型数据,包括图像等非结构化数据方面,目前的BI系统不具备能力处理。

此外,现今运营商的系统只对内部提供服务,大量数据未能有效进行商业利用。而在数据进行商业利用之前,运营商必须先解决好用户隐私保护问题。

集中化BI初步构想

针对此种形势,同时也考虑到未来商业智能系统将逐渐走向移动化,孙少陵认为,运营商可调整原来的两级架构为全网一级架构,构建数据集中、平台统一的商业智能系统。同时将各系统数据进行统一处理和存储,从而实现数据的标准化。

“通过数据集中化来实现各系统的综合分析,也有利于快速地进行数据分析和决策支持。目前很多数据存是在二级、省内或地市系统里,如果集团公司要进行数据分析和决策支持,往往需要省公司定期提供一些汇总数据。”孙少陵说。

但同时集中化商业智能也面临着海量数据处理和存储的压力,包括数据规模大、数据处理复杂、混合负载多样等多种挑战。此时传统的单一数据仓库技术已难以满足要求,大数据技术的引入势在必行。

经过综合比较数据仓库技术,Hadoop、NoSql、流式处理技术等各种大数据处理技术后,中移动研究院对于集中化的商业智能系统有了初步构想。

在技术路线方面,选择数据仓库与Hadoop混搭的方式,借鉴关系型数据仓库在传统应用支持方面以及在复杂查询和分析方面的快速响应能力,同时也借鉴了Hadoop的非结构化数据处理能力以及存储的低成本。

而为实现上层应用更便捷地进行下层数据使用,将考虑未来实现透明访问层。其将屏蔽Hadoop与数据仓库的使用细节,让用户在使用这些数据时尽量无感知;在数据的ETL采集预处理环节,尽量采用Hadoop与分布式ETL的方式,提高数据转换效率,同时降低成本。

另外,运营商庞大分散的组织架构公司对商业智能的需求也比较多。因此中国移动将云计算引入到大数据(“大云”项目),未来形成一个商业智能的 Pass平台。此平台会实现平台建设和数据存储的集中。而应用开发可以让各省公司和地市公司自行进行,再上载到平台上分析结果。如此能很好地解决平台集中化和应用需求分散化的矛盾。

转载于:https://www.cnblogs.com/dushu/archive/2013/01/05/2845336.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/409266.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

计算机管理器win8.1,没事折腾?Win8.1文件管理器设置几招

有人说玩系统的高端表现就是在保证运行的前提下上没事折腾,今天就支几招Win8.1文件管理器的设置技巧给大家。可能有些人对捣鼓系统感到不解,在他们看来这种举动就像是折腾,明明拿来就能用的东西非要动手改造一下。其实对于中高级用户来说&…

Linux下如何创建loop device

在Linux中,有一种特殊的块设备叫loop device,这种loop device设备是通过影射操作系统上的正常的文件而形成的虚拟块设备 。因为这种设备的存在,就为我们提供了一种创建一个存在于其他文件中的虚拟文件系统的机制.下面是一个示例: 第一步:用dd…

在职研究生和全日制研究生的区别_“在职研究生”与“全日制研究生”有什么区别?...

“硕士研究生”是介于本科与博士之间的一个学位,与本科教育相比,研究生教育更加注重培养学生研究问题和分析问题的能力。在我国, 研究生可以分为两种形式:在职研究生、全日制研究生。其中,报考“在职研究生”是社会工作…

计算机多媒体设计徽章,酷毙了:Hackaday将会议徽章设计成一台可编程的电脑

Hackaday徽章可以直接挂在你的脖子上,但看起来更像一台小型的掌机,这是Hackaday Superconference的徽章。参加会议的每个人都获得这种徽章,它具有320 x 240彩色显示屏,完整的qwerty键盘和无限的可编程潜力!内置的固件运…

后来的我们王俊凯王源机器人_王俊凯杨紫到底是什么关系

先说结论——中餐厅里的梳头姐弟之所以动人,是因为纯粹、纯净、真挚。 既和深厚等词不搭边,也不是cp。下面来分析。一先说最关注的,两人到底有没有情愫,是不是cp。如果有情愫的话,王俊凯对待杨紫会比对其他人优待。对比…

进程间通信管道进阶篇:linux下dup/dup2函数的用法

由于利用管道实现进程间通信,是通过创建两个文件描述符,但是描述符的初始化是通过随机的,就是从可用的文件描述符中取出,并将可用的文件描述符与file对象相关联,如果我们需要将管道的两头与其他的流相关时,…

浙江大学计算机博士申请考核,考博经验|2020年浙江大学博士申请考核经验分享...

原标题:考博经验|2020年浙江大学博士申请考核经验分享本文系"研海拾珠"公众号原创,获取更多考博资料考博经验请移步公众号平台。作者 |Domin ,浙江大学博士朝着目标坚定不移自我上学起,我爸妈就告诉我好好学…

python模拟购物车购物过程_Python 模拟购物车的实例讲解

1.功能简介此程序模拟用户登陆商城后购买商品操作。可实现用户登陆、商品购买、历史消费记查询、余额和消费信息更新等功能。首次登陆输入初始账户资金,后续登陆则从文件获取上次消费后的余额,每次购买商品后会扣除相应金额并更新余额信息,退…

西北大学计算机排行,世界排名领先,西北大学到底有多厉害?

原标题:世界排名领先,西北大学到底有多厉害?西北大学作为综排TOP9的美国名校,是许多留学生选择名校得最佳选择之一。那么作为世界排名领先的西北大学到底有多厉害?接下来立思辰留学云小编为你详细介绍。西北大学专业排…

Linux下的top命令

CSDN 阳光岛的文章: http://blog.csdn.net/sunboy_2050/article/details/6129177 最近使用了k命令杀死出bug的python进程(cpu占用100%,ubuntu10的bug)转载于:https://www.cnblogs.com/wolfsky/articles/2848702.html

是什么东西_隐形牙套附件是什么东西?

最近有一部分小宝贝收到牙套准备初佩戴啦!但是有些小宝贝有疑惑了:粘在牙齿上的小凸点是什么东西?为什么要在牙齿上粘这个东西?微微细细询问后,原来让围观群众和正在矫正的同学们一脸懵b的就是——附件。什么是附件&am…

PHP header的一些用法

<?php //PHP header()函数用法 /*** Function: PHP header() examples (PHP) */// fix 404 pages: header(HTTP/1.1 200 OK);// set 404 header: header(HTTP/1.1 404 Not Found);// set Moved Permanently header (good for redrictions) // use with location header hea…

手游服务器验证,手游登录流程

接入第三方渠道后的手游登录流程一、客户端登录渠道流程&#xff1a;1.玩家从客户端输入user_name和password2.登录成功后&#xff0c;返回一个token传入&#xff1a;app_id、app_key、user_name、password返回&#xff1a;token说明&#xff1a;app_id、app_key是由游戏制作方…

区块链是大数据生态圈技术之一_区块链技术再发力,携手智能制造构建产业生态圈...

原标题&#xff1a;区块链技术再发力&#xff0c;携手智能制造构建产业生态圈大数据时代的逐渐逼近&#xff0c;使得传统行业面临巨大的挑战。区块链技术是大数据时代备受关注的新星&#xff0c;在越来越多的领域进行试点应用&#xff0c;区块链技术也是大数据时代日益强盛的关…