目录
- 前言
- 总体设计
- 系统整体结构图
- 系统流程图
- 运行环境
- 模块实现
- 1. 数据预处理
- 2. 模型训练及保存
- 3. 模型应用
- 系统测试
- 1. 训练准确率
- 2. 测试效果
- 3. 模型应用
- 相关其它博客
- 工程源代码下载
- 其它资料下载
前言
本项目以支持向量机(SVM)技术为核心,利用酒店评论数据集进行了情感分析模型的训练。通过使用Word2Vec生成词向量,该项目实现了一个打分推荐系统,其中服务器端提供数据,而客户端则查询数据。
首先,项目使用了酒店评论数据集,这些评论包括了来自不同用户的对酒店的评价。这些评论被用来训练情感分析模型,该模型能够分析文本并确定评论的情感极性,即正面、负面或中性。
其次,项目使用Word2Vec技术,将文本数据转换为词向量表示。这些词向量捕捉了不同词汇之间的语义关系,从而提高了文本分析的效果。这些词向量可以用于训练模型以进行情感分析。
在服务器端,项目提供了处理和存储酒店评论数据的功能。这意味着评论数据可以在服务器上进行管理、存储和更新。
在客户端,用户可以查询酒店评论数据,并获得关于特定酒店的情感分析结果。例如,用户可以输入酒店名称或位置,并获取该酒店的评论以及评论的情感分数,这有助于用户更好地了解其他人对酒店的评价。
总的来说,本项目基于SVM技术和Word2Vec词向量,提供了一个针对酒店评论情感的分析和打分推荐系统。这个系统可以帮助用户更好地了解酒店的口碑和评价,从而做出更明智的决策。
总体设计
本部分包括系统整体结构图和系统流程图。
系统整体结构图
系统整体结构如图所示。
系统流程图
系统流程如图所示。
运行环境
本部分包括Python环境、TensorFlow环境、 安装模块、MySQL数据库。
详见博客。
模块实现
本项目包括3个模块:数据预处理、模型训练及保存、模型测试,下面分别给出各模块的功能介绍及相关代码。
1. 数据预处理
详见博客。
2. 模型训练及保存
通过训练集训练数据得出模型,使模型进行情感分类。这里,使用训练集和测试集来拟合并保存模型。
详见博客。
3. 模型应用
详见博客。
系统测试
本部分包括训练准确率、测试效果及模型应用。
1. 训练准确率
测试准确率达到97%,意味着预测模型训练比较成功。通过调整惩罚系数©、核函数参数(gamma) 的值,在测试集上准确率达到85%,如图1和图2所示。
2. 测试效果
将网上爬取的酒店评论集经过处理后加载模型,按照一定规则得到最终的分数,如图所示。
数据库中存储的结果显示如图所示。
3. 模型应用
因为资源有限,无法将Django项目部署到云服务器,只能在本地运行程序,下载Django项目到本地进入view.py
页面,修改代码参数,连接到远程数据库。打开命令行窗口,进入文件所在的位置,输入命令:
python manage.py migrate
python manage.py runserver
打开浏览器界面,输入http://127.0.0.1:8000/search-post, 打开Python界面文件,如图所示。
界面中有一个输入框和一个查询按钮,结果在最下方输出,输入指定酒店的名称(数据库中存在),得到酒店的评分和评论,如图所示。
单击“查询’按钮,得到该酒店的评分,如图所示。
相关其它博客
基于SVM+TensorFlow+Django的酒店评论打分智能推荐系统——机器学习算法应用(含python工程源码)+数据集+模型(一)
基于SVM+TensorFlow+Django的酒店评论打分智能推荐系统——机器学习算法应用(含python工程源码)+数据集+模型(二)
工程源代码下载
详见本人博客资源下载页
其它资料下载
如果大家想继续了解人工智能相关学习路线和知识体系,欢迎大家翻阅我的另外一篇博客《重磅 | 完备的人工智能AI 学习——基础知识学习路线,所有资料免关注免套路直接网盘下载》
这篇博客参考了Github知名开源平台,AI技术平台以及相关领域专家:Datawhale,ApacheCN,AI有道和黄海广博士等约有近100G相关资料,希望能帮助到所有小伙伴们。