戳蓝字“CSDN云计算”关注我们哦!
作者 | AlfredWu
来源 | Alfred数据室
高考出分了,又是一年一度各位考生和家长手忙脚乱开始填报志愿的时候了。很多考生和家长纷纷咨询Alfred:大数据现在不是很火吗?大数据专业怎么样呀?应该填选择哪个大学比较好?
即使他们本身对大数据也不怎么了解……
为了解答大家的问题,帮助对大数据有兴趣的同学更好地选择大数据相关的专业和学校,Alfred数据室推出了这篇SP,聊一聊什么是大数据、大数据相关的专业有哪些、大数据都学些什么、应该如何选择大学、大数据专业就业前景如何等等大家普遍关心的问题。
根据维基百科的定义:
大数据由巨型数据集组成,这些数据集大小常超出人类在可接受时间下的收集、存储、管理和处理能力。
高德纳咨询公司对大数据的定义是:大数据是大量、高速、多变的信息资产,它需要新型的处理方式去促成更强的决策能力、洞察力与最优化处理。
大数据需要特殊的技术以有效地处理大量的数据,必须借由计算机对数据进行统计、比对、解析方能得出客观结果。数据挖掘则是在探讨用以解析大数据的方法。
可能大家看完之后对于大数据及大数据技术是什么还是似懂非懂。举个例子可能更好理解:
假如你经营了一家小杂货店,你可以根据店内商品销售情况以及历史的进货数量等数据预测接下来哪些商品需要进货多少。这时候数据量很小,在几张纸上就可以完成数据的分析,并做出决策。
假如你的杂货店做大了,扩张成了一个超市,并且给每位顾客办理了会员卡。这时候你可以收集到更多的数据,也可以根据对这些数据的分析辅助更多的决策。比如说,你不仅可以分析商品销售,还可以根据顾客的购买记录,对顾客进行用户画像,把顾客分成低、中、高端等不同群体,再分别对这些群体做有区别的营销等。这时候每天的数据量在几千条以内,不是很大,借助数据管理和分析系统就可以完成分析。
假如你的超市做得更大了,并且转移到了网上做成了像京东一样大的平台。每时每刻都有几万乃至几十万的顾客通过手机浏览、下单、购物。这时候如何收集、存储、分析平台上产生的数据,就成了一个难题。比如说你想要根据每个顾客的商品浏览记录实时地给顾客推荐他感兴趣的商品,面临的问题是:如何同时收集、储存几十万顾客的浏览记录数据,如何实时地分析这么多数据,并且正确地给顾客推荐他真正感兴趣的商品。这就是大数据要做的事。
教育部从2015年开始新增了大数据相关专业的审批和备案。目前高校与大数据相关的专业主要分为三类:
一是数据科学与大数据技术专业,该专业是从2015年起教育部新增审批专业,也是目前最主流的大数据相关的专业。截止2018年,共有479所高校通过审批或备案。
根据北京大学数学科学院数据科学与大数据技术专业培养方案,该专业致力于培养掌握数学、计算机、统计等数据科学相关领域基础理论知识,以及数据建模、机器学习、并行与分布式计算、统计推断等方法和技术,从事数据建模、数据分析与挖掘算法等问题的研究和大数据系统开发的研究型和技术型人才。
二是大数据管理与应用专业,该专业是从2017年起教育部新增审批专业,截止2018年,共有30所高校通过审批或备案。
根据哈尔滨工业大学经济与管理学院大数据管理与应用专业培养方案,该专业致力于培养掌握经济管理基础理论和现代信息管理理论,掌握常用的大数据分析方法以及相关前沿理论知识,熟练使用量化分析工具和商业应用软件,具有良好的大数据管理能力和商业伦理道德观的经济管理创新人才。
三是各大学在其统计学、计算机科学等与大数据相关的学科基础下,划分出跟大数据相关的专业学习方向。比如说,四川大学数学学院统计学专业专门划分出了数据科学与大数据技术方向,培养具有扎实的数学基础以及面向大数据的专门理论和应用技术,熟练掌握数据建模、并行处理、统计推断的基本方法和基本技能的高级科技人才。
那么,数据科学与大数据技术专业和大数据管理与应用专业有什么不同呢?
数据科学与大数据技术专业更加注重数学和计算机基础,更注重工程实现的可行性,开发一系列的分布式计算、数据挖掘等方法,以求解决工程问题。毕业后,授予理学或者工学学士学位。而大数据管理与应用专业注重培养学生从复杂的商业环境中的业务问题出发去理解业务问题,并训练学生如何把这些问题转为可量化的管理问题,通过大数据技术解决这些问题。毕业后授予管理学学士学位。
大数据专业到底需要学习什么呢?我们可以结合下面的这张图来看。
刚刚说到,大数据面临的问题有:如何从各种数据源采集到大量的数据,如何储存大量的数据,如何快速对大数据进行处理得到干净的、易于分析的数据,如何对大数据进行分析和建模,并从中得到有价值的信息。
大数据需要学习的,就是解决这些问题的方法:数据采集、数据存储、数据处理、统计分析、数据可视化、数据挖掘等技术。
我们以中南大学计算机学院数据科学与大数据技术专业培养方案里的课程为例,给大家看看大数据专业主要课程有哪些。
计算机基础:由于大数据必须通过计算机进行处理,所以需要学习与计算机以及计算机语言相关的知识,比如说计算机组成原理、操作系统原理、计算机程序设计、Java语言、Linux等;
数据采集:有关于数据采集方面需要学习大数据采集与融合技术;
数据存储:需要学习数据库原理、大型数据库技术、数据仓库与数据挖掘等;
数据处理:需要学习Python数据处理,数据体量大的时候需要使用分布式系统与云计算;
统计分析:需要掌握概率论与数理统计知识,掌握如何使用Python、R语言进行数据分析
数据可视化:统计分析之后需要对数据进行可视化的展示,这就需要学习可视化技术;
数据挖掘:由于数据挖掘涉及到算法建模,这就需要拥有良好的数学基础。所以需要学习高等数学、线性代数、科学计算与数学建模等课程。另外,还需要学习对数据进行分类、回归、聚类、关联、预测等算法,这就需要学习机器学习、深度学习、算法设计等课程。
教育部从2015年开始便通过了数据科学与大数据技术专业的审批。从一开始的北大、对外经贸、中南大学三所,到2018年已审批和备案的高校已增加至479所。
(注:公众号后台回复“高校”,便可以获得所有开设大数据相关专业的高校名单。)
而大数据管理与应用专业,是从2017年开始经过教育部审批的专业。2017年有5家高校通过了审批,2018年有25家高校通过了备案。
其它高校通过划分学习方向设立的与大数据相关的专业,就需要考生个人去查找和比对了。
选择大学之前,需要先了解一些与大数据相关的信息:大数据相关专业是一门由数学、统计学、计算机科学等组成的、近几年开始设立的新专业;大数据相关技术正在不断更新、迭代和升级;大数据相关产业大多数分布在一线城市和新一线城市等经济发达的地区。
基于这些信息,在选择大学学习大数据相关专业的时候,最起码需要考量以下几个维度:
一是学校排名。学校排名越好,说明学校的师资力量、教学资金等综合实力就越强,可以提供给学生的学习资源越多,平台越大,这一方面估计不需要我赘述;
二是学校的数学、统计学、计算机科学等学科和院系的实力。由于大数据是一门由数学、统计学、计算机科学等组成的交叉学科,很多学校都是在数学学院、统计学学院、管理学院或者计算机学院下开设大数据相关专业,当然,教授这个专业的老师也是这些学院的老师。所以,这些学科和院系的实力越强,其开设的大数据专业教学质量就越有保证。如果学校没有这方面的专业积淀,专业申请在先,课程建设在后,很有可能出现课程体系混乱、师资力量不足等各种问题。
三是学校所在的城市。由于大数据相关的技术正在飞速更新迭代,导致工业上应用的最新技术很难快速地沉淀到大学书本上。而正在应用最新技术的大数据相关公司,基本上都聚集在一线城市和新一线城市。所以,如果学校的位置在这些城市,学生可以得到更好的实习锻炼机会,可以接触到更新的技术。这一点也是很重要的。
学完大数据相关的专业,出来可以做些什么呢?我们将拉勾网上正在招聘的与大数据有关的职位找了出来:数据分析师、数据可视化工程师、数据挖掘工程师、大数据开发工程师、大数据架构师、大数据运维工程师、数据产品经理、数据运营、商业数据分析等。总的来说,可以分成三类:
一是大数据开发方向:有大数据工程师、大数据开发工程师、大数据架构师等;
二是数据分析、挖掘、可视化方向:数据分析师、数据可视化工程师、数据挖掘工程师、商业数据分析师、机器学习工程师等;
三是大数据运维和云计算方向:有大数据运维工程师等。
大数据专业的工资与其人才需求有关。由于目前大数据方面的人才有一定的缺口,所以这些职位的工资水平会比平均工资高一些。但是,由于薪资待遇等因素的吸引,各行各业转行做大数据的人越来越多,比如有很多原来学习数学、计算机、物理、生物、市场等专业的同学,所学的课程与大数据具有重叠,开始转行或者寻求转行做大数据方面的工作。
另外,还有更多的同学通过各种培训机构速成班学习大数据方面的知识。所以,目前好的公司的大数据岗位,都是有一定竞争性的。当然,根据Alfred招聘大数据人才方面的经验,同一岗位竞争的人虽多,但是基础扎实、技术全面的大数据人才还是非常稀缺的。
不过,大学本科是四年制的,谁也说不准四年之后大数据相关专业的就业方向和工资水平是好是坏。比如2010年、2011年非常火爆电子商务专业,到现在已经面临被撤销的境地。所以各位同学一定要结合自身兴趣慎重做决定。
一是要结合自己的兴趣。由于大数据相关专业需要学习数学、统计学、计算机等相关的课程,这些课程一般都会比较不生动。而且大数据相关的技术的学习是需要个人沉下心来专注学习,才可以学得精通的,单靠学校老师教的知识,可能只能每一样都学得一些皮毛,到头来似懂非懂就毕业了。所以填报大数据专业前一定要考虑到自身的兴趣。兴趣是最好的老师。
二是填报具有大数据相关技术积淀的学校。比如说某学校计算机学院非常好,在其下开设的大数据相关专业就比较有保障。一些临时组建的大数据专业,很多老师都没有接触过工业界使用的大数据技术,也没有相应的工业实践,学生想要学得好,比较难。
三是如果你想要报考的大学没有开设大数据相关专业的话,可以考虑报考该学校的数学专业、统计学专业或者计算机科学专业。因为这些专业,都是大数据的基础。这些专业学得好,足以玩转大数据。
微信后台回复“高校”,即可获取所有开设大数据相关专业的高校名单。
福利
扫描添加小编微信,备注“姓名+公司职位”,加入【云计算学习交流群】,和志同道合的朋友们共同打卡学习!
推荐阅读:
屡试不爽的互联网架构三大马车!
2019年技术盘点容器篇(四):来自京东云的技术问答 | 程序员硬核评测
《长安十二时辰》科技梗揭秘!唐朝就能看到 5G 踪影?
天才程序员: "开发 CryptoKitties 难不难? 只需掌握这3点..."
教你如何用Python实现文本摘要模型(附教程)
微软 CTO 韦青:5G 与亚里士多德
什么限制了GNN的能力?首篇探究GNN普适性与局限性的论文出炉!