python用pandas提取行列_python- pandas 不删除符合条件的行和列

我正在尝试建立一个回归模型,以便根据出现的单词来预测收视率(1-5)(回归本身并不一定表现良好,更多的是关于所采用的方法).

我使用以下代码创建了一个词频矩阵:

bow = df.Review2.str.split().apply(pd.Series.value_counts)

看起来像这样:

fd13c76881782285f0c2062a06f1dffa.png

我现在有兴趣删除在整个评论中很少出现的列(单词).此外,我只想迭代不具有NaN的Rating值的评论(行).

这是我的尝试:

# Delete row if Rating less than 1

for index, row in df.iterrows():

if (df.Rating[index] < 1):

bow.drop(bow.index[index], axis=0, inplace = True)

# Delete column if word occurs less than 50 times

sum1 = bow.sum(axis=0)

cntr = 0

for i in sum1:

if (i < 50):

bow.drop(bow.index[cntr], axis=1, inplace = True)

cntr += 1

这似乎没有用,因为它使单词只出现一次.

编辑:

这是我的稀疏 dataframe ,包含单词的出现.

Col->话;

行->句子(项目的评论)(我有1.5k项,因此有1.5k行)

hi this are just some random words I don t ... zing zingy zingzang

0 1.0 NaN 1.0 1.0 1.0 NaN NaN NaN NaN NaN ... NaN NaN NaN

1 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN

2 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN

3 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN

4 NaN NaN NaN NaN NaN NaN NaN NaN NaN 1.0 ... NaN NaN NaN

评分是我原始数据帧中的一列,其中包含[1,5]范围内的整数或NaN

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/303516.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

中国宜坚持发展自主操作系统

一直以来&#xff0c;我国IT产业存在“缺芯少魂”的问题&#xff0c;芯指的是芯片&#xff0c;魂指的是操作系统。操作系统是连接硬件和应用软件的媒介和桥梁。如果无法在操作系统方面实现安全可控&#xff0c;整个信息安全就无从谈起&#xff0c;而恰恰当下国内桌面操作系统市…

老板啥都懂,还天天套路我?!

今天我被老板叫到办公室进行了一场“推心置腹”的对话▼来源&#xff1a;特大号文章版权归原作者所有&#xff0c;转载仅供学习使用&#xff0c;不用于任何商业用途&#xff0c;如有侵权请留言联系删除&#xff0c;感谢合作。

如何提高电脑办公效能

其实你只要花一点点的时间&#xff0c;就可以使你的生活变得更好。在电脑办公上&#xff0c;记忆几个快捷键、安装一些实用的软件等绝对会让你的效率翻倍&#xff01; 在此弥缝分享几条我常常使用到的技巧和软件&#xff1a; 熟练一些快捷键 熟练的快捷键越多&#xff0c;做事越…

BeetleX.Http.Clients访问https服务

最近在做数据分析平台&#xff0c;那在做这个产品的时最需要的自然是测试数据&#xff0c;自己去构建行业测试数据比较麻烦&#xff0c;看到有同行产品的演示数据当然不能错过。由于采集过程中使用到BeetleX.Http.Clients去抓取第三方的Https接口数据&#xff0c;所以顺便记录一…

这一次,用数据解读玩家行为,用实力拿下预测大奖!

如今&#xff0c;大数据落地应用已十分广泛&#xff0c;除了政务、金融、医疗、旅游等传统行业外&#xff0c;在游戏行业中的应用也逐渐受人瞩目。那么&#xff0c;当大数据遇上游戏产业&#xff0c;会产生哪些变革和创新呢&#xff1f;众所周知&#xff0c;全球游戏市场规模庞…

如何在 C# 中使用隐式和显式操作符

C# 有一个鲜为人知的特性是通过定义 显式和隐式操作符 实现类型之间的转换&#xff0c;这篇文章我们将会讨论如何使用这些 显式 和 隐式 操作符。什么是显式&#xff0c;什么是隐式 隐式类型转换 它是运行时自动帮你完成的&#xff0c;言外之意就是你不需要人为干预&#xff0c…

SUSE10下配置FTP服务

SUSE10 liuux下配置FTP和SUSE9有不同之处&#xff0c;大家请注意。下面为SUSE10下ftp服务配置具体步骤。 Linux 系统安装完成后&#xff0c;默认不会开启FTP 服务&#xff0c;需要在yast界面下进行手动启动: 说明&#xff1a;如果未安装FTP 包&#xff0c;则需要先行安装FTP 软…

java gzip 解压文件_Java实现文件压缩与解压[zip格式,gzip格式]

原文&#xff1a;http://www.cnblogs.com/visec479/p/4112881.html#3069573Java实现ZIP的解压与压缩功能基本都是使用了Java的多肽和递归技术&#xff0c;可以对单个文件和任意级联文件夹进行压缩和解压&#xff0c;对于一些初学者来说是个很不错的实例。zip扮演着归档和压缩两…

java bouncycastle_java – 使用bouncycastle进行签名和验证签名的正确方法

我正在使用bcmail-jdk16-1.46.jar和bcprov-jdk16-1.46.jar(Bouncycastle库)来签名一个字符串&#xff0c;然后验证签名。这是我的代码来签字符串&#xff1a;package my.package;import java.io.FileInputStream;import java.security.Key;import java.security.KeyStore;impor…

来看一场 AI 重建的 3D 全息世界杯比赛!

世界杯来了&#xff01;央视名嘴白岩松调侃 “俄罗斯世界杯&#xff0c;中国除了足球队没去&#xff0c;其他的都去了”&#xff0c;这届世界杯&#xff0c;中国球迷购买球票的数量在所有国家中排名第 9&#xff0c;可见球迷对世界杯的热情。那么&#xff0c;除了准备好小龙虾在…

杨中科.NET5视频教程更新了:DI、配置系统、Logging、EF Core等

我的.NET5视频教程又更新了一些内容了&#xff0c;包含依赖注入、配置系统、日志系统以及部分Entity Framework Core的内容。Entity Framework Core还没全讲完&#xff0c;会继续更新。已经有.NET Core开发经验的朋友&#xff0c;可以直接看配置系统第4、5节&#xff0c;讲了自…

编译Linux 2.6内核

编译内核易如反掌。让人叹为观止的是&#xff0c;这实际上比编译和安装像glibc这样的系统级组伴还要简单。2.6内核提供了一套新工具&#xff0c;使编译内核更加容易&#xff0c;比早期发布的内核有了长足的进步。 2.3.1 配置内核 因为Linux源码随手可得&#xff0c;那就意味着在…

获取父线程 java_java子线程中获取父线程的threadLocal中的值

我们都知道线程本地变量表也就是ThreadLocal在我们做线程级的数据隔离时非常好用&#xff0c;但是有时候我们会想如何让子线程获取到父线程的ThreadLocal&#xff0c;其实在线程中除了ThreadLocal外还有InheritableThreadLocal&#xff0c;顾名思义&#xff0c;可继承的线程变量…

源码分享,送你一份Google Python class源码

几年前&#xff0c;Google推出Python课堂。Google Python课堂:https://developers.google.com/edu/python/小编也整理了一下Google Python课堂的源码&#xff0c;里面有四个例子。logpuzzle这个例子主要是利用urllib模块做一个图片拼接的小游戏,主要是从一大堆的网页里面解析分…

用YARP当网关

Yarp是微软开源的一个用.net实现的反向代理工具包&#xff0c;github库就叫reverse-proxy&#xff08;反向代理&#xff09;&#xff08;吐槽一下微软起名字233333&#xff09;nuget包preview9之前都叫Microsoft.ReverseProxy&#xff0c;preview10变成Yarp.ReverseProxy了放上…

nginx 反向代理+ip智能解析

ocation / { if ($request_uri ~ ^/refresh.do$) { proxy_pass http://edtnew; break; 一 } if ($request_method POST) { proxy_pass http://edtold; break; 二 …

yum java 1.7_centos通过yum安装jdk1.7或1.8

今天安装elasticsearch的时候提示which: no1、 检查系统是否自带有jdk[rootnetpc.com.cn software]# rpm -qa |grep java[rootnetpc.com.cn software]# rpm -qa |grep jdk[rootnetpc.com.cn software]# rpm -qa |grep gcj如果有信息输出则需要卸载掉原来的jdk版本&#xff0c;用…

从生物神经网络到人工神经网络

如今提及人工智能&#xff0c;大家期待的一定是某种可以“学习”的方法&#xff0c;这种方法使用数学模型从数据中获取模式的某种表示。在众多“学习”方法中&#xff0c;获得最多关注&#xff0c;承载最多期望的非“神经网络”莫属。既然我们将这种数学方法称作神经网络&#…

很遗憾,我们正在逐渐丧失专注阅读的能力

这是头哥侃码的第238篇原创最近生活没什么规律&#xff0c;睡得晚&#xff0c;起得早&#xff0c;似乎除了工作之外&#xff0c;其余所有的节奏都有点乱了。前几天去体检&#xff0c;没想到像我这样的 “老司机”&#xff0c;居然会忘记 “要空腹” 的规定&#xff0c;愣是在体…

socket案例一

编写一个网络应用程序&#xff0c;有客户端与服务器端&#xff1b;当客户端向服务器端发送请求时&#xff0c;客户端输出服务器端返回的字符串。 回顾下socket的开发步骤&#xff1a; 1) 建立Socket连接 2) 获得输入/输出流 3&#xff09;读/写数据 4) 关闭输入/输出流 5) 关闭…