文本预处理——文本数据分析

目录

  • 文本数据分析
  • 中文酒店评价语料
    • 获得训练集和验证集的标签数量分布
    • 获取训练集和验证集的句子长度分布
    • 获取训练集和验证集的正负样本长度散点分布
    • 获得训练集和验证集不同词汇总数统计
    • 获得训练集上正负的样本的高频形容词词云
    • 获得验证集上正负的样本的形容词词云

文本数据分析

在这里插入图片描述

中文酒店评价语料

在这里插入图片描述
在这里插入图片描述

获得训练集和验证集的标签数量分布

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

获取训练集和验证集的句子长度分布

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

获取训练集和验证集的正负样本长度散点分布

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

获得训练集和验证集不同词汇总数统计

在这里插入图片描述
在这里插入图片描述

获得训练集上正负的样本的高频形容词词云

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

获得验证集上正负的样本的形容词词云

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/9824.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

vue项目设计滚动条的第三方库

在Vue项目中,有几个可以用来实现自定义滚动条的第三方库。其中一些流行的库如下: 1.Vuescroll**:** Vuescroll 是一个功能丰富且高度可定制的滚动条解决方案,支持自定义滚动条样式和滚动行为。它可以应用于多种滚动场景&#xff0…

如何在APP开发中实现多平台兼容?

随着移动互联网的发展,各大 APP平台也如雨后春笋般崛起,现在市面上主流的 APP平台基本都已经支持 IOS、 Android、 WP等多个平台的开发,但对于一些只想专注于做一款 APP的企业来说,往往只能选择在一个平台开发一个 APP&#xff0c…

Kubernetes ConfigMap - Secret - 使用ConfigMap来配置 Redis

目录 ConfigMap : 参考文档:k8s -- ConfigMap - 简书 (jianshu.com) K8S ConfigMap使用 - 知乎 (zhihu.com) ConfigMap的作用类型: 可以作为卷的数据来源:使用 ConfigMap 来配置 Redis | Kubernetes 可以基于文件创建 Conf…

华为数通HCIP-ISIS高级

isis区域间的互访 1、L2区域 to L1区域 在L1区域发布的路由会以L1-LSP在L1区域内传递,到达L1-2路由器时,L1-2路由器会将该L1-LSP转换为L2-LSP在L2区域内传递; 因此L2区域的设备可以学习到L1区域的明细路由,进行访问;…

linux的一些基本指令第二期

rm rm -r 你要删除的目录名 加了-r 之后表示递归删除你要删除的目录 使用这个命名之后,他会一边递归到叶子节点,一边询问你是否要删除,然后会递归回来,在回来的途中删除: rm -rf 你要删除的目录名 强制执行删除操作…

TCP/IP网络编程 第二十三章:IOCP

通过重叠I/O理解IOCP 本章的IOCP(Input Output CompletionPort,输入输出完成端口)服务器端模型是很多Windows程序员关注的焦点。各位若急于求成而跳过了第21章的内容,建议大家最好回顾一下。因为第21章和第22章介绍了本章的背景知…

c++类和对象(拷贝构造、运算符重载、初始化列表、静态成员、友元等)

一、拷贝构造 拷贝构造函数的特征: 1、拷贝构造函数是构造函数的一个重载形式; 2、拷贝构造函数的参数只有一个且必须是同类类型对象的引用,使用传值方式编译器直接报错,因为会引发无穷递归调用。 在c中自定义类型传值传参的时…

微信批量删除好友怎么删除

微信好友太多想要批量删除不知道怎么删除,相信这个问题也困扰了不少人。那么怎样才能批量的删除微信好友?其实不难,可以通过新建标签删除的方式来实现批量删除好友。 怎么批量删除 微信批量删除好友的具体步骤如下: 1、新建标签 首…

CC1310F128系列 超低功耗低于1GHz射频 微控制器芯片

CC1310F128 是一款经济高效型超低功耗低于1GHz射频器件,凭借极低的有源射频和MCU电流消耗以及灵活的低功耗模式,CC1310F128可确保卓越的电池寿命,并能够在小型纽扣电池供电的情况下以及在能量采集应用中实现远距离工作。 改芯片有三个后缀&am…

【ArcGIS Pro微课1000例】0029:绘制全球海洋波纹荡漾效果图

本文讲解ArcGIS Pro3.0中,基于全球航洋面状矢量数据,绘制震撼全球海洋波纹荡漾效果图。 文章目录 一、效果预览二、效果制作三、参数详解一、效果预览 绘制好的海水波纹荡漾效果图如下: 下面我们来学习绘制过程。 二、效果制作 波纹荡漾效果需要在全局或者局部场景中制作…

第2章 逻辑分页、AutoFac注入、工作单元与仓储

1 CoreCms.Net.Model.ViewModels.Basics.IPageList<T> namespace CoreCms.Net.Model.ViewModels.Basics { ///<typeparam name"T">泛型类型实例(1个指定实体的类型实例)。</typeparam> /// <summary> /// 【逻辑分页列表--接口】 /// <…

阿里云部署 ChatGLM2-6B 与 langchain+ChatGLM

1.ChatGLM2-6B 部署 更新系统 apt-get update 安装git apt-get install git-lfs git init git lfs install 克隆 ChatGLM2-6B 源码 git clone https://github.com/THUDM/ChatGLM2-6B.git 克隆 chatglm2-6b 模型 #进入目录 cd ChatGLM2-6B #创建目录 mkdir model #进入目录 cd m…

python机器学习(五)逻辑回归、决策边界、代价函数、梯度下降法实现线性和非线性逻辑回归

线性回归所解决的问题是把数据集的特征传入到模型中&#xff0c;预测一个值使得误差最小&#xff0c;预测值无限接近于真实值。比如把房子的其他特征传入到模型中&#xff0c;预测出房价&#xff0c; 房价是一系列连续的数值&#xff0c;线性回归解决的是有监督的学习。有很多场…

opencv-23 图像几何变换02-翻转-cv2.flip()

在 OpenCV 中&#xff0c;图像的翻转采用函数 cv2.flip()实现 &#xff0c;该函数能够实现图像在水平方向翻转、垂直方向翻转、两个方向同时翻转&#xff0c;其语法结构为&#xff1a; dst cv2.flip( src, flipCode )式中&#xff1a;  dst 代表和原始图像具有同样大小、类…

vite+vue3 css scss PC移动布局自适应

1. 安装 postcss-pxtorem 和 autoprefixer npm install postcss-pxtorem autoprefixer --save2. vite.config.js引入并配置 import postCssPxToRem from postcss-pxtorem import autoprefixer from autoprefixerexport default defineConfig({base: ./,resolve: {alias},plug…

前端面试题 —— React (三)

目录 一、对componentWillReceiveProps 的理解 二、React.forwardRef是什么&#xff1f;它有什么作用&#xff1f; 三、可以使用TypeScript写React应用吗&#xff1f;怎么操作&#xff1f; &#xff08;1&#xff09;如果还未创建 Create React App 项目 &#xff08;2&am…

Linux搭建Promtail + Loki + Grafana 轻量日志监控系统

一、简介 日志监控告警系统&#xff0c;较为主流的是ELK&#xff08;Elasticsearch 、 Logstash和Kibana核心套件构成&#xff09;&#xff0c;虽然优点是功能丰富&#xff0c;允许复杂的操作。但是&#xff0c;这些方案往往规模复杂&#xff0c;资源占用高&#xff0c;操作苦…

用Python合并多个文件为一个文本文件的方法代码

用Python合并多个文件为一个文本文件的方法代码 Python文件处理操作方便快捷&#xff0c;本文为大家提供的是如何用Python合并多个文本文件的代码示例。要把多个txt或是其它类型文件合并成一个&#xff0c;手动操作费时费力&#xff0c;不如自己动手写一个python代码来完成&…

UE4/5C++多线程插件制作(十六、Coroutines协程封装)

目录 准备 MTPCoroutines.h MTPCoroutines.cpp 我们要对协程继续封装制作: 协程是一种计算机程序组件,它允许在某个位置暂停执行,然后在稍后的时间点恢复执行。与传统的函数调用不同,协程可以被多次调用并且能够保留其内部状态,从而允许程序在执行到一定点时暂停,执行…

java中判断list是否为空

java中判断list是否为空是日常代码中经常遇到的问题。最近发现一个Utils提供的方法可以一步判断。 废话不多说&#xff0c;直接上代码&#xff01; ArrayList<String> arrayList new ArrayList<>(); System.out.println("集合1&#xff1a;" Collecti…