python contains类似函数_01--实际工作中,python基础理念和数据处理

13b50c11f913113cdc717a624a75f0fe.png

1.工作中遇到的python坑

1.1 合并文件

问题:正常将文件依次读取并append时,莫名出现很多空行。

解决:在append前删除空行:

data_tmp 

1.2 重复数据行

问题: append多日文件时,由于人工误操作,容易存在重复数据行

解决: 去重并设序号:

data.drop_duplicates(keep='first',inplace='True')
data.reset_index(drop=True,inplace=True)

1.3 数字变形

问题: cargo_id较长,转为int32易出现变形

解决:转为int64或字符串格式:

data['cargo_id'].fillna(0).astype("int64")

1.4 转化为数字类型

问题: 转换为数字类型convert_objects从0.21.0已不推荐使用

解决:

pd.to_numeric(data['truck_length'], errors='coerce')

1.5 替换空格

问题: 替换空格,np.where(data.is_deal == ' ', 1, data.is_deal),出现invalid type comparison错误

解决:

data['is_deal'] = data['is_deal'].apply(lambda x: 1 if x == " " else x)

1.6 链式赋值

问题: 某列满足条件,另一列取值(出现链式赋值时,pandas不能够确定到底返回的是一个引用还是一个拷贝。所以遇到这种情况就干脆报warning):data['cargo_tag'][(data['tags_1'].str.contains('|'.join(invalid_reason)) == True)] = 'invalid',A value is trying to be set on a copy of a slice from a DataFrame

解决:

data.loc[data['tags_1'].str.contains('|'.join(invalid_reason)) == True,'cargo_tag'] ='invalid'

1.7 python建立数据表

问题: 建数据表Failed with exception java.io.IOException

解决:

1. csv分隔符是",",

2. hive -e 单引号

1.8 判断内容是否一致

问题: 判断两个list内容是否一致时,不能仅dataNew == dataOld。因为会有顺序不一致的情况

解决:

dataNew.sort()
dataOld.sort()

eval

2.把python中较难理解部分讲清楚的博客

2.1 python中的main函数意义

python main函数​www.cnblogs.com__main__ --- 顶层脚本环境 - Python 3.7.4 文档​docs.python.orgPython 中的 if __name__ == '__main__' 该如何理解​blog.konghy.cn

2.2 python中self的使用和意义

https://blog.csdn.net/CLHugh/article/details/75000104​blog.csdn.net一篇文章让你彻底搞清楚Python中self的含义 - jessonsh - 博客园​www.cnblogs.com大家是如何理解Python中的self?​www.zhihu.com

2.3 pycharm调试分享

大咪:新手必会,pycharm的调试功能(史上最详篇)​zhuanlan.zhihu.com
937441171193d3d38e28b23ef265cda1.png
https://www.bilibili.com/video/av40673678​www.bilibili.com

2.4 pycharm设置自动模板

Pycharm: 代码跳转回退​segmentfault.comhttps://blog.csdn.net/qq_32040767/article/details/78981528​blog.csdn.net人类身份验证 - SegmentFault​segmentfault.com

2.5 crontab定时任务

https://blog.csdn.net/m0_37886429/article/details/74178091​blog.csdn.netLinux Crontab 定时任务​www.runoob.com

2.6 pickle模块

https://blog.csdn.net/sxingming/article/details/52164249​blog.csdn.net

2.7 eval() 函数

Python eval() 函数​www.runoob.comhttps://blog.csdn.net/zhanh1218/article/details/37562167​blog.csdn.net

2.8 解决Pycharm无法导入包问题

https://blog.csdn.net/u014496330/article/details/55211398​blog.csdn.net

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/473067.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

小案例:利用Python实现图片上下、左右翻转

一、前言需求: 对图片进行操作,使图片上下、左右翻转 二、函数库: 使用Pillow模块提供的transpose()方法可以让图像翻转,上下翻转,或者左右翻转 三、操作说明: 原图如下: 图片上下翻转代码…

LeetCode 1736. 替换隐藏数字得到的最晚时间

文章目录1. 题目2. 解题1. 题目 给你一个字符串 time ,格式为 hh:mm(小时:分钟),其中某几位数字被隐藏(用 ? 表示)。 有效的时间为 00:00 到 23:59 之间的所有时间,包括 00:00 和…

【SSH进阶之路】一步步重构MVC实现Struts框架——封装业务逻辑和跳转路径(四)...

目录: 【SSH进阶之路】Struts基本原理 实现简单登录(二) 【SSH进阶之路】一步步重构MVC实现Struts框架——从一个简单MVC开始(三) 【SSH进阶之路】一步步重构MVC实现Struts框架——封装业务逻辑和跳转路径&#xff08…

实用工具:推荐Pycharm常用的几款插件

相信对于不少的Python程序员们都是用Pycharm作为开发时候的IDE来使用的,今天来分享几个好用到爆的Pycharm插件,在安装上之后,你的编程效率、工作效率都能够得到极大地提升。 Pycharm插件安装教程 打开file---settings---plugins&#xff0c…

dataframe 添加一行_R语言Data Frame数据框常用操作

来源 | R友舍Data Frame一般被翻译为数据框,感觉就像是R中的表,由行和列组成,与Matrix不同的是,每个列可以是不同的数据类型,而Matrix是必须相同的。Data Frame每一列有列名,每一行也可以指定行名。如果不指…

LeetCode 1737. 满足三条件之一需改变的最少字符数(计数)

文章目录1. 题目2. 解题1. 题目 给你两个字符串 a 和 b ,二者均由小写字母组成。 一步操作中,你可以将 a 或 b 中的 任一字符 改变为 任一小写字母 。 操作的最终目标是满足下列三个条件 之一 : a 中的 每个字母 在字母表中 严格小于 b 中…

oracle对查询结果求和_oracle基础知识分享

原文链接:https://page.om.qq.com/page/OO2PXCD6VZ6CVqLqjpU6uShg0以下是本人整理的ORACLE学习的一些基本的语法知识,如有不对的地方,望大家批评指正,如有转载请注明出处:一、ORACLE完整性约束:1.NOT NULL …

Docker官方案例学习

下面以官方的一个demo学习学习。。。 1、进入windows版docker界面,新建文件夹pp 2、进入pp,在目录下新建三个文件 dockerfile.txt,app.py,requirements.txt 2.1 dockerfile文件 # Use an official Python runtime as a parent…

LeetCode 1738. 找出第 K 大的异或坐标值(DP)

文章目录1. 题目2. 解题947 / 3851&#xff0c;前 24.6%2533 / 11282&#xff0c;前 22.5% 1. 题目 给你一个二维矩阵 matrix 和一个整数 k &#xff0c;矩阵大小为 m x n 由非负整数组成。 矩阵中坐标 (a, b) 的 值 可由对所有满足 0 < i < a < m 且 0 < j <…

小案例:基于python的动态时钟,带十二时辰和经络养身

一、前言 1、仅用来研究学习使用。 2、除正常显示时钟外&#xff0c;还可以实时显示当前对应的时辰&#xff0c;和经络养身提示。 3、适合辅助上班族来养生 二、效果如下&#xff1a; 三、源码如下&#xff1a; 动态时钟附带十二时辰显示import turtle # 导入绘图海龟模块 …

【海淘域名】GoDaddy账户被锁定后的解决方法

转载自【美国海淘网】http://www.usahaitao.com/Experience/Detail_2886.html通过ICANN申诉顺利的从国内无良奸商(35互联与商务中国,小编的域名在这2个大的服务商手中。不过开始都是图便宜&#xff0c;不懂得国内域名管理的黑幕&#xff0c;所以从其下属的皮包第三方手里购入域…

回归分析常数项t值没有显著异于零怎么办_线性回归分析思路总结!简单易懂又全面!...

线性回归分析是一种研究影响关系的方法&#xff0c;在实际研究里非常常见。不管你有没有系统学习过&#xff0c;对于线性回归&#xff0c;相信多少都有那么一点了解。即使如此&#xff0c;在实际分析时&#xff0c;还是会碰到很多小细节&#xff0c;让我们苦思冥想困扰很久&…

LeetCode 1733. 需要教语言的最少人数(哈希+枚举)

文章目录1. 题目2. 解题1. 题目 在一个由 m 个用户组成的社交网络里&#xff0c;我们获取到一些用户之间的好友关系。 两个用户之间可以相互沟通的条件是他们都掌握同一门语言。 给你一个整数 n &#xff0c;数组 languages 和数组 friendships &#xff0c;它们的含义如下&a…

在c#中用mutex类实现线程的互斥_面试官经常问的synchronized实现原理和锁升级过程,你真的了解吗...

本篇文章主要从字节码和JVM底层来分析synchronized实现原理和锁升级过程&#xff0c;其中涉及到了简单认识字节码、对象内部结构以及ObjectMonitor等知识点。阅读本文之前&#xff0c;如果大家对synchronized关键字的基本使用还不是很了解的话&#xff0c;推荐阅读笔者之前的一…

TensorFlow 2.x GPU版在conda虚拟环境下安装步骤

先下载安装驱动&#xff1a;https://www.nvidia.cn/Download/index.aspx?langcn&#xff0c;版本要求 WSL cuda 驱动 https://developer.nvidia.com/cuda/wsl 下载安装 anaconda&#xff0c;管理虚拟环境&#xff1a;https://www.anaconda.com/products/individual&#xff0…

如何通过网络将文件传输到嵌入式设备_嵌入式系统 Boot Loader技术内幕,带你完全了解Boot Loader...

一个嵌入式 Linux 系统从软件的角度看通常可以分为四个层次&#xff1a;1. 引导加载程序。包括固化在固件(firmware)中的 boot 代码(可选)&#xff0c;和 Boot Loader 两大部分。2. Linux 内核。特定于嵌入式板子的定制内核以及内核的启动参数。3. 文件系统。包括根文件系统和建…

python获取当前路径的方法_Python获取脚本所在目录的正确方法【转】

原博文 2015-09-24 10:21 − 1.以前的方法如果是要获得程序运行的当前目录所在位置&#xff0c;那么可以使用os模块的os.getcwd()函数。如果是要获得当前执行的脚本的所在目录位置&#xff0c;那么需要使用sys模块的sys.path[0]变量或者sys.argv[0]来获得。实际上sys.path是Pyt…

TensorFlow 2.0 - Checkpoint 保存变量、TensorBoard 训练可视化

文章目录1. Checkpoint 保存变量2. TensorBoard 训练过程可视化学习于&#xff1a;简单粗暴 TensorFlow 2 1. Checkpoint 保存变量 tf.train.Checkpoint 可以保存 tf.keras.optimizer 、 tf.Variable 、 tf.keras.Layer 、 tf.keras.Model path "./checkp.ckpt" …

coturn的负载均衡特性_高性能负载均衡

单服务器无论如何优化&#xff0c;无论采用多好的硬件&#xff0c;总会有一个性能天花板&#xff0c;当单服务器的性能无法满足业务需求时&#xff0c;就需要设计高性能集群来提升系统整体的处理性能。高性能集群的本质很简单&#xff0c;通过增加更多的服务器来提升系统整体的…

LintCode MySQL 1928. 网课上课情况分析 I

文章目录1. 题目2. 解题1. 题目 online_class_situation 表展示了一些同学上网课的行为活动。 每行数据记录了一名同学在退出网课之前&#xff0c;当天使用同一台设备登录课程后听过的课程数目&#xff08;可能是0个&#xff09;。 写一条 SQL 语句&#xff0c;查询每位同学第…