pandas 笔记:to_numeric

1 函数介绍

它用于将参数转换为数值类型

这个函数尤其适用于在数据清洗过程中,将数据集中的字符串或其他类型的列转换为数值型数据。

pandas.to_numeric(arg, errors='raise', downcast=None, dtype_backend=_NoDefault.no_default)

2 参数说明

arg要转换的数据。可以是标量、列表、元组、一维数组或 Pandas Series
errors

决定了当转换过程中遇到无效数据时的行为。

  • 如果设置为 'raise',则无效解析将引发异常。
  • 如果设置为 'coerce',则无效解析将被设置为 NaN。
  • 如果设置为 'ignore',则无效解析将返回输入值。
downcast

用于指定转换后的数据类型。

  • 可以设置为 'integer''signed''unsigned''float'

3 举例说明

3.1 downcast

import pandas as pd
s = pd.Series(['1.0', '2', -3])
pd.to_numeric(s)
'''
0    1.0
1    2.0
2   -3.0
dtype: float64
'''
pd.to_numeric(s, downcast='integer')
'''
0    1
1    2
2   -3
dtype: int8
'''

3.2 errors

s = pd.Series(['apple', '1.0', '2', -3])
pd.to_numeric(s, errors='ignore')
'''
0    apple
1      1.0
2        2
3       -3
dtype: object
'''
pd.to_numeric(s, errors='coerce')
'''
0    NaN
1    1.0
2    2.0
3   -3.0
dtype: float64
'''
pd.to_numeric(s, errors='raise')
'''
---------------------------------------------------------------------------
ValueError                                Traceback (most recent call last)
File D:\conda\lib\site-packages\pandas\_libs\lib.pyx:2369, in pandas._libs.lib.maybe_convert_numeric()ValueError: Unable to parse string "apple"During handling of the above exception, another exception occurred:ValueError                                Traceback (most recent call last)
Cell In[40], line 1
----> 1 pd.to_numeric(s, errors='raise')File D:\conda\lib\site-packages\pandas\core\tools\numeric.py:185, in to_numeric(arg, errors, downcast)183 coerce_numeric = errors not in ("ignore", "raise")184 try:
--> 185     values, _ = lib.maybe_convert_numeric(186         values, set(), coerce_numeric=coerce_numeric187     )188 except (ValueError, TypeError):189     if errors == "raise":File D:\conda\lib\site-packages\pandas\_libs\lib.pyx:2411, in pandas._libs.lib.maybe_convert_numeric()ValueError: Unable to parse string "apple" at position 0
'''

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/608542.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Hyperledger Fabric 权限策略和访问控制

访问控制是区块链网络十分重要的功能,负责控制某个身份在某个场景下是否允许采取某个操作(如读写某个资源)。 常见的访问控制模型包括强制访问控制(Mandatory Access Control)、自主访问控制(Discretionar…

代码随想录算法训练营第21天 |530.二叉搜索树的最小绝对差 501.二叉搜索树中的众数 236. 二叉树的最近公共祖先

530.二叉搜索树的最小绝对差 题目链接:530.二叉搜索树的最小绝对差 给你一棵所有节点为非负值的二叉搜索树,请你计算树中任意两节点的差的绝对值的最小值。 示例: 提示:树中至少有 2 个节点。 💡解题思路 题目中…

UE5 将类修改目录

有个需求,需要修改ue里面类的位置,默认在Public类下面,我想创建一个二级目录,将所有的类分好位置,方便查看。 上图为创建一个类所在的默认位置。 接下来,将其移动到一个新的目录中。 首先在资源管理器中找…

Android - CrashHandler 全局异常捕获器

官网介绍如下:Thread.UncaughtExceptionHandler (Java Platform SE 8 ) 用于线程因未捕获异常而突然终止时调用的处理程序接口。当线程由于未捕获异常而即将终止时,Java虚拟机将使用thread . getuncaughtexceptionhandler()查询该线程的UncaughtExceptio…

模集 - 240105 - 模集期末速成

TAG - 模集、期末、速成 模集、期末、速成 模集、期末、速成 // – 高数帮 - 期末速成 – //阈值电压晶体管工作区及其判断方法电路公式//体效应沟长调制效应亚阈值效应…// – 阶段考核1 – //集成电路的优势与特点:体积小、速度快、功耗低、电路中以晶体管为主&a…

Java工程师面试题解析与深度探讨

Java工程师面试题解析与深度探讨 第一部分:引言 Java作为一门广泛应用的编程语言,拥有庞大的生态系统,Java工程师因此成为众多企业追逐的目标。而在Java工程师的招聘中,面试是了解候选人技能和经验的核心环节。本文将深入探讨一…

docker jenkins NB: JAVA_HOME should point to a JDK not a JRE

jenkins java编译错误: 3.5.4/conf/settings.xml The JAVA_HOME environment variable is not defined correctly This environment variable is needed to run this program NB: JAVA_HOME should point to a JDK not a JRE Build step ‘Invoke top-level Maven t…

软件测试|MySQL主键自增详解:实现高效标识与数据管理

简介 在MySQL数据库中,主键自增是一种常见的技术,用于自动为表中的主键字段生成唯一的递增值。本文将深入讨论MySQL主键自增的原理、用途、使用方法,以及在实践中的注意事项和最佳实践。 主键自增 主键自增的原理 主键自增是通过使用AUTO…

phpcms v9未审核推荐信息出现在推荐列表中【BUG修复】

修改文件:phpcms/modules/content/class/content_tag.class.php 调整过的方法: public function __construct() {$this->db pc_base::load_model(content_model);$this->position pc_base::load_model(position_model);$this->position_da…

【Python百宝箱】数字货币赋能:市场分析、回测策略全面解析

数字货币交易与市场分析:Python工具全解析 前言 随着数字货币市场的蓬勃发展,投资者和开发者对于高效获取、处理和分析市场数据的需求日益增长。本文将深入介绍一系列强大的Python库,涵盖从常规市场数据获取到专业的技术分析和回测交易策略…

【PostgreSQL在线创建索引(CIC)功能的锁分析以及使用注意】

前一篇文章提到了普通创建索引会阻塞DML操作 PostgreSQL创建索引的锁分析和使用注意 而PostgreSQL里可以使用create index concurrently 在线创建索引(CIC)功能,降低创建索引在表上申请的锁的级别,ShareUpdateExclusiveLock级别的锁和RowExclusiveLock…

力扣刷题python

文章目录 1.两数之和 1.两数之和 第一种解法 class Solution(object):def twoSum(self, nums, target):""":type nums: List[int]:type target: int:rtype: List[int]"""for i in nums:jtarget-istart_indexnums.index(i)next_indexstart_inde…

知识任务的解决方案-RAG

接上文,本篇介绍论文提到的LocalGPT system,是以NextDoor社区为数据源和应用场景的。 该系统包括两部分:RAG和fine-tune 一、RAG 大致思想就是 给定一个问题/任务,先检索到数据源中最相关的文档,再用这些文档来生成回…

【Linux系统编程二十七】:线程的互斥与同步(互斥锁的使用与应用)

【Linux系统编程二十七】:线程的互斥与同步(互斥锁的使用与应用) 一.问题:数据不一致(混乱/不安全)1.多线程并发计算不安全2.将数据加载到寄存器的本质 二.解决方法--互斥锁三.互斥锁的概念与接口1.定义锁2.加锁/解锁 四.互斥锁实现原理与应用1.原理&…

[redis] redis主从复制,哨兵模式和集群

一、redis的高可用 1.1 redis高可用的概念 在web服务器中,高可用是指服务器可以正常访问的时间,衡量的标准是在多长时间内可以提供正常服务(99.9%、99.99%、99.999%等等)。 高可用的计算公式是1-(宕机时间)/(宕机时…

subversion httpd

通过http访问模式部署SVN的操作步骤如下: 步骤一:安装SVN 步骤二:安装Apache 步骤三:安装mod_dav_svn 步骤四:配置SVN 步骤五:配置Apache 步骤六:浏览器测试访问 步骤一:安装SVN 1.…

Linux网络配置概述

目录 一.查看网络配置 1.ifconfig 2.ip a 3.hostname 4.route 5.netstat和ss (1)netstat (2)ss (3)区别 6.ping 7.traceroute 8.nslookup 9.dig 二.网卡配置 三.域名解析配置文件 1.文件所…

GEE python登录重大更新—— ee.Initialize()初始验证过程更新

最近GEE python进行了更新,因此原始的登录代码将无法使用,所以这里我们看一下通常会报出的错误,这里需要我们将我们运行的projection具体的名称写入进去,也就是GEE中你再JavaScript界面中运行的项目名称,相较与之前我们需要进行验证码的copy,这里直接可以通过项目的写入来…

Linux限制用户可用硬盘空间

为了防止某个用户占用大量资源导致其他用户无法正常使用,一般会对单个用户可占用资源进行限制。就磁盘限额,XFS文件系统原生支持目录级别的限制。ext文件系统不支持目录限制,曲线方式是限制用户的总占用空间。 本文介绍使用quota程序限制用户…

模型评估:评估指标的局限性

“没有测量,就没有科学。”这是科学家门捷列夫的名言。在计算机科学特别是机器学习领域中,对模型的评估同样至关重要。只有选择与问题相匹配的评估方法,才能快速地发现模型选择或训练过程中出现的问题,迭代地对模型进行优化。模型…