采集层:利用Flume采集电商服务器端用户行为数据,把数据处理后发送至HDFS。
存储层:用户行为数据采集上传至HDFS存储, 导入到数据仓库Hive进行计算处理,分析结果保存至MySql数据库中。
计算层:根据分析需求建立分析需求模型,利用HiveQL启动集群MapReduce任务对预先处理后用户行为数据进行分析处理,挖掘用户行为规律。
服务层:处于展示层和计算层之间,利用 Python 语 言编写程序,把计算层分析结果传送至展示层。
展示层:根据 MySql 中保存的计算结果,利用 pyecharts 可视化工具把用户行为数据以图表形式呈现,方便分析者快速理解和分析数据。