计算机毕业设计Python+Spark知识图谱酒店推荐系统 酒店评论情感分析 酒店价格预测系统 酒店可视化 酒店爬虫 neo4j知识图谱 深度学习

广东科技学院毕业设计(论文)开题报告

设计(论文)名称

民宿数据可视化分析系统的设计与实现

设计(论文)类型

C

指导教师

朱富裕

学 院

计算机学院

专    业

数据科学与大数据技术

姓 名

庄贵远

学 号

2020135232

班  级

20大数据本科2班

  • 选题依据(包括项目研究的背景、研究或应用的意义、国内外研究或应用现状,附主要参考文献)

(一)研究背景及意义

民宿起源于欧美乡村,而民宿在中国出现最早的是在台湾垦丁,并在台湾不断的发展兴盛,随着中国大陆经济以及旅游业的蓬勃发展,民宿的发展迅速[1]。随着民宿数量不断增加有些问题也随之而出,首先民宿行业准入机制不明确,导致一些不符合条件的机构或个人也进入民宿行业,他们往往缺乏专业的管理和运营能力,服务质量低下,用户体验差[2]。其次,民宿的监管机制不健全,导致一些民宿存在安全隐患、卫生问题、消防问题等,这些问题可能会对客人的生命财产安全造成威胁。此外,民宿的竞争激烈,一些民宿为了吸引客人,采用低价策略,导致整个行业的利润水平下降,这也会影响民宿的服务质量和用户体验[3]。

随着旅游业的快速发展和人们对于旅行体验的不断追求,民宿作为一种新的住宿选择方式,得到了越来越多人的喜爱。然而,随之而来的问题是如何更好地管理和分析民宿数据,提供相关的决策支持和可视化分析,以促进民宿行业的可持续发展,大数据技术的应用为民宿行业提供了更多的机会和挑战[4]。本研究旨在基于大数据技术设计并实现一个民宿数据可视化分析系统,以提供全面的数据分析和决策支持,让民宿的各个维度的数据指标更加全面生动的展示出来,帮助民宿经营者和旅游相关决策者更好地理解和分析民宿市场,提高民宿的运营效率和用户满意度。帮助消费者提前了解民宿的市场环境,对民宿的选择提供参考作用[5]。

(二)国内外研究现状

1、国外研究现状

国外民宿行业相较于中国起步较早,很早就进行民宿行业的研究。Jianzhuang等学者研究发现,民宿周围环境、经营者管理的情况和经营管理者与消费者之间的关系会影响消费者对民宿的选择倾向[6]。Dinesh等人用实验的方法探究房主特征对消费者信任的影响,发现房主的头像和声誉得分对消费者的选择倾向有显著影响,即会影响消费者是否选择体验其服务[7]。Adamia等人采用随机抽样的研究方法调查约翰内斯堡都市,以探究服务质量感知与客户期望之间的联系,其研究结果表明,为了提升服务质量,民宿经营者需在设施和环境管理上注重舒适性,并改变服务方式,这些举措不仅能够满足客户的期望,还能够提高客户对服务质量的感知[8]。

2、国内研究现状

在知网数据库中检索关键词“民宿”后利用知网的总体趋势分析功能得到自2014年后关于民宿的相关研究正在逐年线性递增。王春英和陈宏民将是否拥有厨房作为虚拟变量引入模型,得到厨房正向显著影响共享民宿的价格的结论,还提出地理位置因素影响房源定价[9]。张延宇通过文本分析和情感分析等技术探讨Airbnb网站评论信息中消费者的情感倾向,并利用多重线性回归的方法,分析了用户评论及房源的相关特征对共享民宿预订的影响[10]。王佳慧通过对大学生的旅游动机、旅游目的地的感知、旅游决策的分析,构建大学生旅游消费行为影响因素模型,最后得出月生活费是大学生旅游决策最大的影响因素[11]。

(三)参考文献

[1] 莫彩云. 阳朔民宿旅游发展调查研究[D].广西师范大学,2023.DOI:10.27036/d.cnki.ggxsu.2023.001684.

[2] 赵采云.北京市共享民宿销量的影响因素及空间格局差异性分析[D].东北财经大学,2023.DOl:10.27006/d.cnki.gdbcu.2022.000986.

[3] 穆敏杰.SD民宿社交媒体营销策略研究[D]云南财经大学,2023.DOl:10.27455/d.cnki.gycm c.2023.001050.

[4] 马妍.共享经济发展背景下民宿业发展对策研究[J].商业文化,2022(07):114-115.

[5] 文君.基于大数据分析的高端民宿消费行为研究[D],郑州大学,2022.DOl:10.27466/d.cnki.g zzdu.2021.003666.

[6] Jianzhuang Zheng,Lingyan Huang.Characterizing the Spatiotemporal Patterns and Key Determinantsof Homestay Industry Agglomeration in Rural China Using Multi Geospatial Datasets[J].Sustainability.2022,72(42).

[7] Dinesh VALLABH.Profiling Tourists in the Bed and Breakfast Establishments in Port Alfred, Eastern Cape[J].Journal of Tourism Intelligence and Smartness,2019,1(1).

[8] Adamiak,C.,2018,“Mapping Airbnb Supply in European Cities”,Annals of Tourism Research,Vol.71,PP67-71.

[9] 王春英,陈宏民.共享短租平台住宿价格及其影响因素研究一基于小猪短租网站相关数据的分析[J].价格理论与实践,2018,(6):14-17.

[10] 张延宇.共享经济背景下在线民宿预订评价影响因素分析[D].哈尔滨工业大学,2017.

[11] 王佳慧.大学生旅游消费行为现状分析[D].河北经贸大学,2018.

[12]张艳丽,吴淮北.Hive数据仓库在Hadoop大数据环境下数据的导入与应用[J].电脑编程技巧与维护,2022(12):97-99.DOI:10.16184/j.cnki.comprg.2022.12.006.

[13] 赵海国.Ajax技术支持下的ECharts动态数据实时刷新技术的实现[J].电子技术,2018,47(03):25-27+57.

  • 设计或研究内容、预期目标及拟解决的关键问题(此部分为重点阐述内容)。

(一)研究内容

本次研究主要是对某民宿租赁网站上的某城市的相关民宿数据进行获取、清洗、分析然后可视化的过程。数据获取将利用Python网络爬虫的Scrapy框架、Selenium、Xpath解析库等相关技术。民宿数据的清洗、存储、分析分别采用Hadoop的MapReduce、HDFS、Hive数据仓库,可以高效地处理大规模数据集,提高数据处理效率,并具有可扩展性、灵活性和可定制性等优点[12]。数据的分析展示使用ECharts图表库,根据需求设计各类图表,并提供交互式操作,使用户能够灵活地进行数据分析和展示[13]。首先利用Python编程语言,结合第三方爬虫Scrapy框架,编写爬虫程序,实现对民宿的民宿描述、位置、价格、面积、户数、类型、床数、宜住人数、评分、点评数等数据的定向抓取。获取数据后接下来进行数据的预处理操作,在Linux虚拟机上开启已经搭建好Hadoop集群的服务器并启动Hadoop集群,将爬取的数据以文件的形式上传至HDFS中,并编写MapReduce程序对爬取的数据实现数据清洗操作。接下来将已清洗的数据加载至Hive数据仓库中并使用Hive自带的类SQL语言对数据进行数据分析,例如描述性统计、区域对应民宿均价、区域对应民宿评分均值、区域对应民宿平均户数、用户评价关键词等词频统计等。最后引入ECharts图表库,使用HTML、CSS和JavaScript等前端技术,设计各类图表。该系统具有数据获取及时准确、存储高效、分析结果直观等特点,可为民宿行业决策者提供更准确的数据支持和分析结果。

  1. 用户登录

实现用户登录功能模块的设计,用户需要使用正确的账户密码才能登录到系统中,主要功能为用户的注册、登录、修改密码。

  1. 民宿基本属性分析

对某城市的民宿情况进行具体的分析、例如对民宿的价格、点评数、床位数、区域平均价格、区域平均评分、区域民宿数量等民宿的基本数据。

  1. 用户评价分析

对用户在民宿网站上的评价进行分析,对评价进行分析可以了解用户的需求和期望,从而改进服务质量和水平,提高用户满意度。其他用户可以通过评价了解民宿的设施、环境、服务、卫生等方面的具体情况,从而做出更明智的预订决策。

  1. 民宿特点分析

为了提高房源的知名度和曝光率、吸引用户消费,房东在房源网页上都会标注特征描述,对标注的数据进行提取分析,例如民宿的基本设施和特点、民宿的特色和个性化服务、民宿的质量和用户口碑。针对房东用什么服务、准备何种特殊设施、特殊地理位置等来吸引消费者进行分析。

  1. 民宿位置分析

民宿的选址往往取决于经济、交通、景点几个方面,对房源网页上爬取的交通、景点、餐饮、商超等位置信息进行分析,得出哪个位置的民宿密度较高,以及该区域的民宿分布特点.

  1. 可视化展示

把分析获得的数据利用可视化工具进行可视化操作结合前端页面实现展示效果。

(二)预期目标

提升客户体验:通过对民宿数据的分析可视化,可以了解客户评价、投诉情况等信息,从而及时发现问题并采取措施改进。此外,可以根据客户喜好和需求,提供个性化的服务和增值服务,提升客户体验。

提供决策参考:通过对民宿数据的分析可视化,可以为管理层提供决策依据。例如,可以根据数据分析结果,判断是否需要扩大或调整民宿的规模,选择合适的营销渠道,或者进行资源的合理配置。

(三)拟解决的关键问题

1、网站为了预防恶意爬虫都会布置反爬虫技术,这要求在使用爬虫技术时应该遵从法律规定,做到友好访问,不破坏、不妨碍网站的正常运行。

2、数据质量问题,民宿数据的准确性和完整性可能存在问题。解决方案是获得数据后对特殊的数据通过数据清洗和预处理提高数据质量。

3、系统性能问题,大数据量和复杂的计算可能导致系统性能下降。解决方案是通过系统优化和资源调度解决性能问题。

核心算法代码分享如下:

import requests
import time
from requests.packages.urllib3.exceptions import InsecureRequestWarning
requests.packages.urllib3.disable_warnings(InsecureRequestWarning)def getData(zb,zb_code,data):millis = int(round(time.time() * 1000))url = 'XXXXXX?m=QueryData&dbcode=fsnd&rowcode=reg&colcode=sj&wds=%5B%7B%22wdcode%22%3A%22zb%22%2C%22valuecode%22%3A%22{}%22%7D%5D&dfwds=%5B%7B%22wdcode%22%3A%22sj%22%2C%22valuecode%22%3A%22LAST20%22%7D%5D&k1={}'.format(zb_code,millis)headers = {'Connection': 'keep-alive','Cookie':'wzws_sessionid=oGQ6m6aAMTE5LjM5LjEzMy43N4JmYzVlZTGBMzVkYWQ3; JSESSIONID=CwqE7x_DL8afP48RRS0lnYUSPHymBClZKx0UKJjeYPtWpDSVZW0E!1171792879; u=6','Host':'data.stats.gov.cn','User-Agent':'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/112.0.0.0 Safari/537.36','X-Requested-With': 'XMLHttpRequest'}response = requests.get(url=url,headers=headers, verify=False)results = response.json()unit = results['returndata']['wdnodes'][0]['nodes'][0]['unit']area_code = {}for item in results['returndata']['wdnodes'][1]['nodes']:name = item['cname']code = item['code'] area_code[code] = namefor item in results['returndata']['datanodes']:value = item['data']['data']area = area_code[item['wds'][1]['valuecode']]updateTime = item['wds'][2]['valuecode']data.append([area,value,unit,zb,updateTime])def writeData(data):with open('./data/data_agriculture.csv','w+',encoding='utf-8') as fp:fp.write('\t'.join(['area','value','unit','zb','updateTime'])+'\n')for item in data:fp.write('\t'.join([str(_) for _ in item])+'\n')if __name__ == '__main__':zb_code_list = [{'zb':'夏收粮食产量','zb_code':'A0D0Q02'},{'zb':'秋收粮食产量','zb_code':'A0D0Q02'},{'zb':'夏收粮食播种面积','zb_code':'A0D0P03'},{'zb':'秋收粮食播种面积','zb_code':'A0D0P04'},{'zb':'受灾面积','zb_code':'A0D1801'},{'zb':'有效灌溉面积','zb_code':'A0D0H01'},{'zb':'农用化肥施用折纯量','zb_code':'A0D0H02'}]data = []for item in zb_code_list:zb = item['zb']zb_code = item['zb_code']getData(zb,zb_code,data)print('指标:{}数据采集完成!'.format(zb))time.sleep(3)writeData(data)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/837892.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Nginx 生产环境部署的最佳实践

你好呀,我是赵兴晨,文科程序员。 最近一段时间,我一直在和大家一起探讨Nginx的相关话题。期间,我收到了很多小伙伴的私信,他们好奇地问我:在生产环境中,Nginx应该如何配置? 他们在…

欧洲风景(地理)

1.尼斯湖 尼斯湖亦译内斯湖,位于英国苏格兰高原北部的大峡谷中,湖长39公里,宽2.4公里。面积并不大,却很深。传说这儿住着一只水怪,因此吸引了大量游客。 2.伦敦塔桥 伦敦塔桥是从英国伦敦泰晤士河口算起的第一座桥(泰…

【源码】Spring Data JPA原理解析之Repository的自动注入(一)

Spring Data JPA系列 1、SpringBoot集成JPA及基本使用 2、Spring Data JPA Criteria查询、部分字段查询 3、Spring Data JPA数据批量插入、批量更新真的用对了吗 4、Spring Data JPA的一对一、LazyInitializationException异常、一对多、多对多操作 5、Spring Data JPA自定…

SpringBoot解决CORS跨域——WebMvcConfigurationSupport

前端请求后端报错了。 状态码:403 返回错误:Invalid coRs request 增加配置类WebMvcConfig Configuration public class WebMvcConfig extends WebMvcConfigurationSupport {Overridepublic void addCorsMappings(CorsRegistry registry) {// 允许跨域…

Leetcode2105. 给植物浇水 II

Every day a Leetcode 题目来源:2105. 给植物浇水 II 解法1:双指针 设 Alice 当前下标为 i,初始化为 0,水量为 a,初始化为 capacityA;Bob 当前下标为 j,初始化为 n-1,水量为 b&am…

JeeSite Vue3:前端开发页面如何动态设置菜单展示模式?

推荐阅读: JeeSite Vue3:前端开发的未来之路(更新版) 随着技术的飞速发展,前端开发技术日新月异。在这个背景下,JeeSite Vue3 作为一个基于 Vue3、Vite、Ant-Design-Vue、TypeScript 和 Vue Vben Admin 的前端框架,引…

Java线程生命周期:Java线程生命周期全景解读

1. 线程生命周期概述:不仅仅是状态转换 在多线程编程中,理解线程的生命周期对于编写有效、高效的代码至关重要。线程生命周期通常描述了线程从创建到死亡的一系列状态变化过程,但其实不仅仅局限于这些状态的简单转换。线程生命周期的理解应该…

应急响应-Windows-挖矿病毒

随着虚拟货币市场的繁荣,挖矿病毒已成为网络安全领域一大挑战。该类病毒利用计算机资源进行加密货币的挖掘,给个人用户和企业网络带来了严重的安全风险。本文将针对挖矿病毒的应急响应和防范措施进行分析和总结。 一.判断挖矿病毒 服务器突然发现CPU资…

02-结构型设计模式(共7种)

1. Adapter(适配器模式) 适配器模式是一种结构型设计模式,它允许将一个类的接口转换成客户端所期望的另一个接口。这种模式通常用于解决接口不兼容的情况,使得原本由于接口不匹配而无法工作的类可以一起工作。 在 C 中,适配器模式可以通过类适…

Elasticsearch分词及其自定义

文章目录 分词发生的阶段写入数据阶段执行检索阶段 分词器的组成字符过滤文本切分为分词分词后再过滤 分词器的分类默认分词器其他典型分词器 特定业务场景的自定义分词案例实战问题拆解实现方案 分词发生的阶段 写入数据阶段 分词发生在数据写入阶段,也就是数据索…

AVL树、红黑树

数据结构、算法总述:数据结构/算法 C/C-CSDN博客 AVL树 定义 空二叉树是一个 AVL 树如果 T 是一棵 AVL 树,那么其左右子树也是 AVL 树,并且 ,h 是其左右子树的高度树高为 平衡因子:右子树高度 - 左子树高度 创建节点…

HBase无法给用户赋权的解决方案

建表之后,在赋权的时候,发现有错误 2.以开始以为语法有错误,不会啊,很简单的语法。经过测试几个命令发现,但凡和权限相关的命令,都失败了 百度到一些建议,需要检查参数,在确认下面…

用vue实现json模版编辑器

用vue实现json模版编辑器 控件区表单区配置项区 (还没写)业务逻辑 设想业务逻辑是拖拽控件生成表单 动手做了一个简单的demo 业务的原型图设想如下所示 其中使用的技术主要是vuedragger 控件区 做控件区的时候首先我们要有确定的配置项 其实也很简单 …

Github20K星开源团队协作工具:Zulip

Zulip:让团队协作的每一次交流,都精准高效。- 精选真开源,释放新价值。 概览 随着远程工作的兴起和团队协作的需求不断增加,群组聊天软件成为了日常工作中不可或缺的一部分。Zulip 是github上一个开源的团队协作工具,…

SpringBoot:缓存

点击查看SpringBoot缓存demo:LearnSpringBoot09Cache-Redis 技术摘要 注解版的 mybatisCacheConfigCacheableCachePut:既调用方法,又更新缓存数据;同步更新缓存CacheEvict:缓存清除Caching:定义复杂的缓存…

【运维自动化-配置平台】如何自动应用主机属性

主要用于配置主机属性的自动应用。当主机发生模块转移或模块新加入主机时,会根据目标模块配置的策略自动触发修改主机属性,比如主机负责人、主机状态。主机属性自动应用顾名思义是应用到主机上,而主机是必须在模块下的,所以有两种…

net 7部署到Linux并开启https

1.修改代码设置后台服务运行 安装nuget包 Install-Package Microsoft.Extensions.Hosting.WindowsServices Install-Package Microsoft.Extensions.Hosting.Systemd在Program代码中设置服务后台运行 var builder WebApplication.CreateBuilder(args);if (System.OperatingS…

【QuikGraph】C#调用第三方库计算有向图、无向图的连通分量

QuikGraph库 项目地址:https://github.com/KeRNeLith/QuikGraph 相关概念 图论、连通分量、强连通分量相关概念,可以从其他博客中复习: https://blog.csdn.net/weixin_50564032/article/details/123289611 https://zhuanlan.zhihu.com/p/3…

【LeetCode刷题】136.只出现一次的数字(Ⅰ)

【LeetCode刷题】136.只出现一次的数字(Ⅰ) 1. 题目:2.思路分析:思路1:一眼异或! 1. 题目: 2.思路分析: 思路1:一眼异或! 看到题目,如果有一定基…

Kafka学习-Java使用Kafka

文章目录 前言一、Kafka1、什么是消息队列offset 2、高性能topicpartition 3、高扩展broker 4、高可用replicas、leader、follower 5、持久化和过期策略6、消费者组7、Zookeeper8、架构图 二、安装Zookeeper三、安装Kafka四、Java中使用Kafka1、引入依赖2、生产者3、消费者4、运…