竞赛保研 基于情感分析的网络舆情热点分析系统

文章目录

  • 0 前言
  • 1 课题背景
  • 2 数据处理
  • 3 文本情感分析
    • 3.1 情感分析-词库搭建
    • 3.2 文本情感分析实现
    • 3.3 建立情感倾向性分析模型
  • 4 数据可视化工具
    • 4.1 django框架介绍
    • 4.2 ECharts
  • 5 Django使用echarts进行可视化展示
    • 5.1 修改setting.py连接mysql数据库
    • 5.2 导入数据
    • 5.3 使用echarts可视化展示
  • settings.py 文件
  • 6 实现效果
  • 7 最后

0 前言

🔥 优质竞赛项目系列,今天要分享的是

🚩 基于情感分析的网络舆情热点分析系统

该项目较为新颖,适合作为竞赛课题方向,学长非常推荐!

🥇学长这里给一个题目综合评分(每项满分5分)

  • 难度系数:3分
  • 工作量:5分
  • 创新点:3分
  • 界面美化:5分

🧿 更多资料, 项目分享:

https://gitee.com/dancheng-senior/postgraduate

1 课题背景

精神文明日益发展的今天, 出行旅游成为人们的主要休闲方式和社会经济活动, 旅游业不仅能推动多个产业的发展, 调节产业结构,
同时也满足了人们日益增长的文化需要。其越来越成为国民经济的重要支撑。相关数据显示,
疫情平稳期间的旅游人数仍然稳中有增。而与之相对应的是海量的无序化旅游数据日益激增。针对有效旅游数据进行准确分析、 合理预测有助于制定与旅游发展相关的规划,
同时能有效地帮助后续在旅游设施分配和资源调度等方面上制定明智的决策, 发挥旅游信息价值的最大化。由此可知, 旅游经济的发展与对数据的合理分析是密不可分的。

2 数据处理

采用Python爬虫技术对某大同市旅游景点数据进行采集,用Python中的Pandas库对采集到的数据进行整理,
首先将旅游数据转化成DataFrame格式, 再从多个维度和角度进行处理分析。使用isnull函数选取查看缺失值占总数据百分比大于90%的列名及其数值,
认为它在数据分析中提供极其有限信息, 所以直接删除。对缺失数据采用fillna函数根据数据的不同类型进行了固定值填充,
异常值(也称为离群值)检测是一个重要的部分, 用duplicated函数表示重复行的布尔系列值, 返回缺失总数后进行去重。
采用选择(loc)、 分组(groupby)、 连接(merge)、
汇总统计(mean)等方法进行数据的统计与处理。处理完后利用其自带接口将数据存入到mysql数据库中。

3 文本情感分析

3.1 情感分析-词库搭建

通过对大量中文文本及人物会话分析,发现文本情感的判定基本上通过对通篇的情感词、程度副词及否定词的统计分布来判别,因此,我们搭建了基于情感分析的情感词库以及其它辅助词表。如下图所示

在这里插入图片描述

3.2 文本情感分析实现

情感倾向性将文本分为正面、负面、中性三种情感属性,通常由正、负面,以及强弱程度来衡量。本文通过中文分词处理,基于情感词典构建情感表,为每一个分词打分,从而判断判别情感倾向,文本情感分析的流程如下图所示。

在这里插入图片描述

3.3 建立情感倾向性分析模型

通过建立以上基础情感词库作为分析基础,我们对采集的微博网友评论做情感倾向分析,我们将用户评论简单的分为三类

  • 正面情绪
  • 负面情绪
  • 中性

4 数据可视化工具

4.1 django框架介绍

数据可视化是数据处理中的重要部分

Django是一个基于Web的应用框架,由python编写。Web开发的基础是B/S架构,它通过前后端配合,将后台服务器的数据在浏览器上展现给前台用户的应用。Django本身是基于MVC模型,即Model(模型)+View(视图)+
Controller(控制器)设计模式,View模块和Template模块组成了它的视图部分,这种结构使动态的逻辑是剥离于静态页面处理的。
Django框架的Model层本质上是一套ORM系统,封装了大量的数据库操作API,开发人员不需要知道底层的数据库实现就可以对数据库进行增删改查等操作。Django强大的QuerySet设计能够实现非常复杂的数据库查询操作,且性能接近原生SQL语句。Django支持包括PostgreSQL、My
Sql、SQLite、Oracle在内的多种数据库。Django的路由层设计非常简洁,使得将控制层、模型层和页面模板独立开进行开发成为可能。基于Django的Web系统工程结构示意图如图所示。

在这里插入图片描述

从图中可以看到,一个完整的Django工程由数个分应用程序组成,每个分应用程序包括四个部分:

(1)urls路由层:决定Web系统路由结构,控制页面间的跳转和数据请求路径

在这里插入图片描述

(2)views视图层:业务层,主要进行逻辑操作和运算,是前端页面模板和后端数据库之间的桥梁。Django框架提供了大量的数据库操作API,开发人员甚至不需要使用SQL语句即可完成大部分的数据库操作。

在这里插入图片描述

(3)models模型层:Web应用连接底层数据库的关键部分,封装了数据库表结构和实现。开发人员可以在Model层按照Django的指令要求进行建表,无须使用SQL语句或者第三方建表工具进行建表。建表的过程类似于定义变量和抽象编程语言中的类,非常方便。

(4)templates模板层:HTML模板文件,后端数据会填充HTML模板,渲染之后返回给前端请求。考虑到项目周期尽可能小,尽快完成平台的搭建,项目决定采用开源的Django框架开发整个系统的Web应用层。

4.2 ECharts

ECharts(Enterprise
Charts)是百度开源的数据可视化工具,底层依赖轻量级Canvas库ZRender。兼容了几乎全部常用浏览器的特点,使它可广泛用于PC客户端和手机客户端。ECharts能辅助开发者整合用户数据,创新性的完成个性化设置可视化图表。支持折线图(区域图)、柱状图(条状图)、散点图(气泡图)、K线图、饼图(环形图)等,通过导入
js 库在 Java Web 项目上运行。

5 Django使用echarts进行可视化展示

5.1 修改setting.py连接mysql数据库

# settings.py 文件DATABASES = {'default': {'ENGINE': 'django.db.backends.sqlite3','NAME': BASE_DIR / 'db.sqlite3',}
}

5.2 导入数据

导入.sqlite3文件,也可以使用超级用户在 admin 管理页面中添加数据

import requestsfrom django.db import models# Create your models here.# 热点文章class HotArticle(models.Model):article_bid = models.CharField('文章BID', max_length=100)article_uid = models.CharField('文章UID', max_length=100)article_id = models.CharField('文章ID', max_length=100)screen_name = models.TextField('用户昵称')text = models.TextField('微博正文')topics = models.TextField('话题')publish_time = models.DateTimeField('发布时间')location= models.TextField('发布位置')comments_count = models.IntegerField('评论数')reposts_count = models.IntegerField('转发数')publish_tool = models.TextField('发布工具')class Meta:db_table = "hot_article"verbose_name = "热点文章"verbose_name_plural = verbose_nameordering = ('id',)# 用户评论class Comment(models.Model):article_uid = models.CharField('文章UID', max_length=100)article_id = models.CharField('文章ID', max_length=100)username = models.CharField('用户名', max_length=100)text = models.TextField('评论内容')publish_time = models.DateTimeField('发布时间')positive = models.BooleanField('是否积极', null=True, editable=False)prob = models.FloatField('积极估计概率', null=True, editable=False)def save(self, *args, **kwargs):from tools.nlpapi import sentimentif self.prob is None:prob = sentiment(self.text)self.prob = probself.positive = prob >= 0.5super(Comment, self).save(*args, **kwargs)class Meta:db_table = "comment"verbose_name = "用户评论"verbose_name_plural = verbose_name# unique_together = (#     ('article_uid', 'article_id'),# )ordering = ('id',)

5.3 使用echarts可视化展示

  • 设置静态文件目录(即 static 目录)

    settings.py 文件

    STATICFILES_DIRS=(os.path.join(BASE_DIR,'static'),)
    
  • 创建如下目录结构:

在这里插入图片描述

  • js 目录中为 echarts的 js 文件,大家可以在 echarts官网下载自己需要的版本,index.html 文件内容如下

    #部分代码,不完整
    DOCTYPE html>
    <html lang="en"><head><meta charset="UTF-8"><title>基于情感分析的网络舆情热点评估与分析系统title><link rel="stylesheet" href="/static/plugins/bootstrap-3.3.7-dist/css/bootstrap.css"><script type="text/javascript" src="/static/js/jquery.js">script>{% block mainHead %}{% endblock %}
    head>
    <body>
    {% load static %}<nav class="navbar navbar-inverse"><div class="container-fluid"><div class="navbar-header"><a class="navbar-brand" href="#"><img src="{% static 'images/logo.ico' %}" alt="logo" width=24 height=24>a><button type="button" class="navbar-toggle collapsed" data-toggle="collapse" data-target="#bs-example-navbar-collapse-1" aria-expanded="false"><span class="sr-only">Toggle navigationspan><span class="icon-bar">span><span class="icon-bar">span><span class="icon-bar">span>button><a class="navbar-brand" href="#">基于情感分析的网络舆情热点评估与分析系统a>div><div class="collapse navbar-collapse" id="bs-example-navbar-collapse-1"><ul class="nav navbar-nav"><li class="active"><a href="/">首页 <span class="sr-only">(current)span>a>li><li><a href="/weibo_hot_article/">微博热点文章a>li><li><a href="/weibo_comment/">用户评论情感分析a>li>ul><ul class="nav navbar-nav navbar-right"><li><a href="/admin/" target="_blank">前往后台a>li>ul>div>div>nav>{% block mainbody %}<p>originalp>{% endblock %}
    body>
    html>
    
  • 编写 views.py 文件,将数据库中的数据传到前端页面中

    import json
    from multiprocessing import connection
    from sqlite3.dbapi2 import IntegrityErrorfrom django.core import serializers
    from django.core.serializers.json import DjangoJSONEncoder
    from django.forms import model_to_dict
    from django.http import HttpResponse, JsonResponse
    from django.shortcuts import renderdef index(request):# print(request.method)  #获取请求方式GET或POSTreturn render(request, 'index.html')  # 回复一个页面
    

6 实现效果

使用的数据是处理好后已生成的.sqlite数据文件,现在,我们来看一下展示效果,运行


python manage.py runserver

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

7 最后

🧿 更多资料, 项目分享:

https://gitee.com/dancheng-senior/postgraduate

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/584072.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2023 楚慧杯 --- Crypto wp

文章目录 初赛so large e 决赛JIGE 初赛 so large e 题目&#xff1a; from Crypto.Util.number import * from Crypto.PublicKey import RSA from flag import flag import randomm bytes_to_long(flag)p getPrime(512) q getPrime(512) n p*q e random.getrandbits(1…

全新研发体系助力产品落地 传音控股成科技出海代表

一直以来&#xff0c;手机都被认为是所有新技术的最佳应用载体&#xff0c;尤其是在数字化、智能化时代&#xff0c;技术创新能力决定着手机厂商的生存与发展。 作为全球新兴市场手机行业的中坚力量之一&#xff0c;传音控股始终坚持以技术创新为驱动&#xff0c;围绕用户需求…

最大后验概率法

在贝叶斯统计中&#xff0c;最大后验概率&#xff08;maximum a posteriori, MAP&#xff09;估计是对后验分布的模的估计。MAP可根据经验数据获得未观测量的点估计。它与最大似然&#xff08;ML&#xff09;估计方法密切相关&#xff0c;但采用了一个包含先验分布的增强优化目…

【数据结构】七、图

一、概念 图&#xff1a;记为G(V,E) 有向图&#xff1a;每条边都有方向 无向图&#xff1a;边无方向 完全图&#xff1a;每个顶点都与剩下的所有顶点相连 完全有向图有n(n-1)条边&#xff1b;完全无向图有n(n-1)/2条边 带权图&#xff1a;边上标有数值的图 连通图&#…

使用 pytest 相关特性重构 appium_helloworld

一、前置说明 在 pytest 基础讲解 章节,介绍了 pytest 的特性和基本用法,现在我们可以使用 pytest 的一些机制,来重构 appium_helloworld 。 appium_helloworld 链接: 编写第一个APP自动化脚本 appium_helloworld ,将脚本跑起来 代码目录结构: pytest.ini 设置: [pyt…

Goby 漏洞发布| QNAP NAS authLogin.cgi 命令执行漏洞(CVE-2017-6361)

漏洞名称&#xff1a;QNAP NAS authLogin.cgi 命令执行漏洞&#xff08;CVE-2017-6361&#xff09; English Name&#xff1a;QNAP NAS authLogin.cgi command execution vulnerability (CVE-2017-6361) CVSS core: 9.8 影响资产数&#xff1a; 2637547 漏洞描述&#xff1…

pd工具箱 Parallels Toolbox

Parallels Toolbox是一款适用于Mac和PC的强大工具箱软件&#xff0c;集成了多种实用的工具和功能&#xff0c;旨在帮助用户提高工作效率和生产力。它提供了文件管理、截图、音频视频处理、清理工具等众多工具&#xff0c;使用户能够方便快捷地完成各种常见任务。Parallels Tool…

“踩坑”经验分享:Swift语言落地实践

作者 | 路涛、艳红 导读 Swift 是一种适用于iOS/macOS应用开发、服务器端的编程语言。自2014年苹果发布 Swift 语言以来&#xff0c;Swift5 实现了 ABI 稳定性、Module 稳定性和Library Evolution&#xff0c;与Objective-C&#xff08;下文简称“OC”&#xff09;相比&#xf…

PLC电机正反转控制程序示例

一、对于三相电源线的电动机&#xff0c;反转只需要任意的交换两根电源线即可 二、例如接通KM1对应正转的话&#xff0c;则接通KM2则对应反转 三、电机正转按钮及其对应的地址 四、电机反转按钮及其对应的地址 五、电机停止按钮及其对应的地址 六、正转的接触器线圈 七、反转的…

在VMware上安装Ubuntu:详细教程

关于VMware和Ubuntu VMware VMware 是一家全球领先的虚拟化和云基础架构解决方案提供商。它提供了多个产品和技术&#xff0c;用于管理和优化计算机资源的使用&#xff0c;实现虚拟化、云计算和数据中心自动化等功能。 以下是 VMware 公司提供的一些主要产品&#xff1a; V…

决心解开软光栅的心结

最近几天离职在家,是的,还没回老家.白天周中的时候写这个软光栅化渲染器.包括在上班的最后项目大家都不干活的时候我已经开始写了.到今天上午总算是有的看了.细节还差很多,下午把透视校正插值加上,下午加不完就元旦假期之后再说(元旦我要写pbrt的读书笔记).还有摄像机裁剪,背面…

《掌握需求管理,助你打造火爆产品》

作为一名产品经理&#xff0c;需求管理是你工作中最重要的部分之一。一个好的需求管理系统可以帮助你确保你的产品始终符合客户的需求和期望&#xff0c;并确保项目能够按时交付。下面是一些建议&#xff0c;帮助你成为一个更好的需求管理者。 建立清晰的需求管理流程 一个好的…

一文详解Cookie以及Selenium自动获取Cookie

前言 以后数据获取途径以及数据资产绝对会是未来核心要素生产工具和资源之一&#xff0c;每个大模型都离不开更加精细化数据的二次喂养训练。不过现在来看收集大量数据的方法还是有很多途径的&#xff0c;有些垂直领域的专业数据是很难获取得到的&#xff0c;靠人力去搜寻相当…

Arduino stm32 USB CDC虚拟串口使用示例

Arduino stm32 USB CDC虚拟串口使用示例 &#x1f4cd;相关篇《STM32F401RCT6基于Arduino框架点灯程序》&#x1f516;本开发环境基于VSCode PIO&#x1f33f;验证芯片&#xff1a;STM32F401RC⌛USB CDC引脚&#xff1a; PA11、 PA12&#x1f527;platformio.ini配置信息&…

【滑动窗口】【二分查找】C++算法:和至少为 K 的最短子数组

作者推荐 动态规划 多源路径 字典树 LeetCode2977:转换字符串的最小成本 本题涉及知识点 滑动窗口 有序向量 二分查找 LeetCode862:和至少为 K 的最短子数组 给你一个整数数组 nums 和一个整数 k &#xff0c;找出 nums 中和至少为 k 的 最短非空子数组 &#xff0c;并返回…

HCIA-Datacom题库(自己整理分类的)——ARP协议【完】

一、单选 1.ARP 属于哪一层协议&#xff1f; 数据链路层 网络层 物理层 传输层 2.ARP请求是____发送的 点播 广播 组播 单播 关于ARP报文的说法错误的是? ARP请求报文是广播发送的 ARP报文不能被转发到其他广播域 ARP应答报文是单播方发送的 任何链路层协议都需…

开放式蓝牙耳机学生党适合买哪些?平价好用的开放式耳机推荐

对于学生党来说&#xff0c;想要买一款既平价又好用的开放式蓝牙耳机&#xff0c;确实需要仔细挑选&#xff0c;那啥是开放式耳机呢&#xff1f;简单来说&#xff0c;开放式耳机就是那种不把耳朵全部封闭起来的耳机&#xff0c;声音可以流通&#xff0c;听起来更自然、舒适&…

LVM与磁盘配额

文章目录 LVM与磁盘配额一、LVM概述1、LVM概述2、LVM机制的基本概念2.1 PV&#xff08;Physical Volume&#xff0c;物理卷&#xff09;2.2 VG&#xff08;Logical Volume&#xff0c;逻辑卷&#xff09;2.3 LV&#xff08;Logical Volume&#xff0c;逻辑卷&#xff09; 二、L…

Android移动端超分辨率调研(未完成 目前自用)

作用 图片加载是目前几乎所有的APP都具备的基础能力&#xff0c;在节省服务商的传输带宽之外&#xff0c;也可以降低用户消费端流量的消耗&#xff0c;提升用户的加载速度。帮助每一个产品用更低的成本达到更好的图片加载效果。 效果 另一方面 用TensorFlow实现的图像极度压…

Nginx配置反向代理

代理通常用于在多个服务器之间分配负载&#xff0c;无缝显示来自不同网站的内容&#xff0c;或通过 HTTP 以外的协议将处理请求传递给应用程序服务器。 将请求传递到代理服务器 当 NGINX 代理请求时&#xff0c;它会将请求发送到指定的代理服务器&#xff0c;获取响应&#x…