Pandas中的日期时间date处理

Pandas提供了强大的日期和时间处理功能,这对于时间序列分析至关重要。本教程将介绍Pandas中处理日期时间的主要方法。包括:

  • 日期时间数据的创建和转换
  • 日期时间属性的提取
  • 时间差计算和日期运算
  • 重采样和频率转换
  • 时区处理
  • 基于日期时间的索引操作

Pandas中的日期时间类型

  • 时间戳(timestamp):表示的是一个特定的时刻,比如 2008 年 8 月 8 日下午午 8:00。
  • 时间周期(period):引用特定开始和结束点之间的时间长度;例如,2015 年。时间段通常引用时间间隔的特殊情况,其中每个间隔具有统一的长度并且不重叠(例如,构成每天的 24 小时长的时间段)。
  • 时间增量或间隔(timedelta):引用确切的时间长度(例如,间隔为 22.56 秒)。

1. 创建日期时间数据

1.1 使用to_datetime()函数
import pandas as pd# 将字符串转换为datetime
date_str = ['2023-01-01', '2023-01-02', '2023-01-03']
dates = pd.to_datetime(date_str)
print(dates)
1.2 创建日期范围
# 创建日期范围
date_range = pd.date_range('2023-01-01', periods=5, freq='D')
print(date_range)# 带有时区的日期范围
date_range_tz = pd.date_range('2023-01-01', periods=5, freq='D', tz='Asia/Shanghai')
print(date_range_tz)

2. 访问日期时间属性

# 创建示例DataFrame
df = pd.DataFrame({'date': pd.date_range('2023-01-01', periods=5, freq='D'),'value': [10, 20, 30, 40, 50]
})# 提取年、月、日等属性
df['year'] = df['date'].dt.year
df['month'] = df['date'].dt.month
df['day'] = df['date'].dt.day
df['day_of_week'] = df['date'].dt.dayofweek  # 周一=0, 周日=6
df['day_name'] = df['date'].dt.day_name()
df['is_weekend'] = df['date'].dt.dayofweek >= 5print(df)

3. 日期时间运算

3.1 时间差计算
# 计算时间差
df['date_diff'] = df['date'] - df['date'].shift(1)
print(df[['date', 'date_diff']])# 使用Timedelta进行时间运算
df['date_plus_2days'] = df['date'] + pd.Timedelta(days=2)
df['date_plus_3hours'] = df['date'] + pd.Timedelta(hours=3)
print(df)
3.2 日期比较
# 日期比较
start_date = pd.to_datetime('2023-01-02')
df['after_start_date'] = df['date'] > start_date
print(df[['date', 'after_start_date']])

4. 重采样和时间频率转换

# 创建示例时间序列数据
ts = pd.Series([1, 2, 3, 4, 5],index=pd.date_range('2023-01-01', periods=5, freq='D')
)# 降采样(低频) - 计算每周平均值
weekly = ts.resample('W').mean()
print("Weekly resample:\n", weekly)# 升采样(高频) - 填充缺失值
hourly = ts.resample('H').ffill()
print("Hourly resample (forward fill):\n", hourly.head(10))  # 只显示前10行

5. 时区处理

# 本地化时区
ts = pd.Series([1, 2, 3],index=pd.date_range('2023-01-01', periods=3, freq='D')
)
ts = ts.tz_localize('UTC')
print("UTC timezone:\n", ts)# 时区转换
ts_shanghai = ts.tz_convert('Asia/Shanghai')
print("Shanghai timezone:\n", ts_shanghai)

6. 日期时间索引操作

# 设置日期为索引
df.set_index('date', inplace=True)# 按年份切片
print(df.loc['2023'])# 按月份切片
print(df.loc['2023-01'])# 按日期范围切片
print(df.loc['2023-01-02':'2023-01-04'])

7. 实际应用示例

# 读取包含日期时间的数据
# 假设有一个CSV文件包含日期列
# df = pd.read_csv('data.csv', parse_dates=['date_column'])# 处理缺失日期
full_date_range = pd.date_range(start=df.index.min(), end=df.index.max(), freq='D')
df = df.reindex(full_date_range)# 填充缺失值
df['value'] = df['value'].fillna(method='ffill')  # 前向填充# 计算滚动平均值
df['7_day_avg'] = df['value'].rolling(window='7D').mean()print(df.head(10))

8. 高级技巧

8.1 自定义工作日历
from pandas.tseries.offsets import CustomBusinessDay
from pandas.tseries.holiday import USFederalHolidayCalendar# 使用美国联邦假日日历
us_bd = CustomBusinessDay(calendar=USFederalHolidayCalendar())
date_range = pd.date_range('2023-01-01', periods=10, freq=us_bd)
print("US business days only:\n", date_range)
8.2 季度数据处理
# 创建季度数据
quarterly = pd.Series([100, 200, 300, 400],index=pd.date_range('2023-01-01', periods=4, freq='Q')
)# 季度开始和结束日期
print("Quarter start:\n", quarterly.index)
print("Quarter end:\n", quarterly.index + pd.offsets.QuarterEnd())

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/902915.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Vue3文件上传组件实战:打造高效的Element Plus上传解决方案,可以对文件进行删除,查看,下载功能。

在现代Web开发中,文件上传功能是许多应用的核心需求之一。无论是企业管理系统、内容管理系统还是医疗信息系统,上传附件的功能都至关重要。本文将分享一个基于 Vue3 和 Element Plus 实现的文件上传组件,结合父子组件的协作,展示如何构建一个功能强大、用户体验友好的文件上…

AI 工程师崛起:科技浪潮下的新兴力量

在当今科技迅猛发展的时代,人工智能(AI)无疑是最热门的领域之一。随着基础模型的涌现和开源 / API 的普及,一种新兴的职业 ——AI 工程师,正逐渐崭露头角。他们在 AI 技术的应用和开发中扮演着关键角色,其崛…

人工智能与机器学习:Python从零实现逻辑回归模型

🧠 向所有学习者致敬! “学习不是装满一桶水,而是点燃一把火。” —— 叶芝 我的博客主页: https://lizheng.blog.csdn.net 🌐 欢迎点击加入AI人工智能社区! 🚀 让我们一起努力,共创…

济南国网数字化培训班学习笔记-第二组-5节-输电线路设计

输电线路设计 工程设计阶段划分 35kv及以上输变电工程勘测设计全过程 可行性研究(包括规划、工程选站)(包括电力系统一次二次,站址选择及工程设想,线路工程选择及工程设想,节能降耗分析,环境…

【Linux网络】TCP服务中IOService应用与实现

📢博客主页:https://blog.csdn.net/2301_779549673 📢博客仓库:https://gitee.com/JohnKingW/linux_test/tree/master/lesson 📢欢迎点赞 👍 收藏 ⭐留言 📝 如有错误敬请指正! &…

Linux 怎么找Java程序的监听的端口

Linux 怎么找Java程序的监听的端口 1、假设你知道启动该Java应用的进程ID (PID),可以通过以下命令查找其监听的端口: 首先找到该Java应用的PID: ps -ef | grep xxxx-1.0-RELEASE.jar或者,如果你知道启动命令的一部分&#xff0…

解读《数据资产质量评估实施规则》:企业数据资产认证落地的关键指南

随着“数据要素市场”建设加速,数据资产逐步成为企业核心资产之一。2024年4月,由中国质量认证中心(CQC)发布的《数据资产质量评估实施规则》(编号:CQC96-831160-2024)正式实施,为企业…

[吾爱出品] 【键鼠自动化工具】支持识别窗口、识图、发送文本、按键组合等

键鼠自动化工具 链接:https://pan.xunlei.com/s/VOOhDZkj-E0mdDZCvo3jp6s4A1?pwdfufb# 1、增加的找图点击功能(不算增加,只能算缝补),各种的不完善,但是能运行。 2、因为受限于原程序的界面,…

【计算机视觉】CV实战项目 - 基于YOLOv5的人脸检测与关键点定位系统深度解析

基于YOLOv5的人脸检测与关键点定位系统深度解析 1. 技术背景与项目意义传统方案的局限性YOLOv5多任务方案的优势 2. 核心算法原理网络架构改进关键点回归分支损失函数设计 3. 实战指南:从环境搭建到模型应用环境配置数据准备数据格式要求数据目录结构 模型训练配置文…

IntelliJ IDEA 中配置 Spring MVC 环境的详细步骤

以下是在 IntelliJ IDEA 中配置 Spring MVC 环境的详细步骤: 步骤 1:创建 Maven Web 项目 新建项目 File -> New -> Project → 选择 Maven → 勾选 Create from archetype → 选择 maven-archetype-webapp。输入 GroupId(如 com.examp…

基于javaweb的SpringBoot+MyBatis通讯录管理系统设计与实现(源码+文档+部署讲解)

技术范围:SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、安卓app、大数据、物联网、机器学习等设计与开发。 主要内容:免费功能设计、开题报告、任务书、中期检查PPT、系统功能实现、代码编写、论文编写和辅导、论文…

EFISH-SBC-RK3588无人机地面基准站项目

一、核心技术组件解析 1. EFISH-SBC-RK3588 性能优势:作为瑞芯微推出的高性能处理器,采用8nm 工艺,搭载ARM Cortex-A76/A55 八核架构,集成强大的 NPU(神经网络处理单元)和 GPU(图形处理器&…

蓝桥杯 4. 卡片换位

卡片换位 原题目链接 题目描述 你玩过华容道的游戏吗? 这是一个类似的,但更简单的游戏。 看下面的 3 2 格子: --------- | A | * | * | --------- | B | | * | ---------在其中放置了 5 张牌,其中: A 表示关…

7.Excel:单元格格式

一 案例 1.案例1 2.案例2 3.案例3 二 三种基本数据类型 补充:在没有任何格式的情况下是这样对齐的。 1.文本 默认左对齐,文本不可参与计算。 2.数值 默认右对齐,数值计算精度是15位。 若超出15位,超出部分显示为0。 3.逻辑值 …

高效DCDC电源芯片在运动控制器中的应用:设计考量、性能评估与可靠性分析

摘要 随着工业自动化的深入推进,运动控制器作为自动化系统的核心组件,对电源芯片的性能提出了极高要求。高效率DCDC电源芯片凭借其卓越的电能转换效率、优异的负载响应特性和高功率密度,在运动控制器领域得以广泛应用。本文以国科安芯的ASP3…

Action:Update your application‘s configuration

在使用Maven项目时,有一个报错信息是:Update your applications configuration 这类问题,就是我们的application.yml文件 或者 application.properties文件 内容哪里写错了 最有可能就是对齐方式有问题

Pycharm(六):可变与不可变类型

一、引用 在java中既有值传递,也有引用传递,我们思考一下在python中值的传递方式是哪种类型呢? 答案是引用传递。 概述: Python中存储变量是需要占用内存空间的,为了更好地管理这些空间,每块空间都是有自己的地址值的。 格式: id(变量名/值) 可以查看变量/…

动态ip与静态ip的概念、区别、应用场景

动态ip与静态ip的区别 前言 一、IP地址的概念和作用 1.1、IP地址的定义 1.2、IP地址的作用 二、动态IP和静态IP的区别 2.1、动态IP和静态IP的定义 2.2、动态IP和静态IP的特点 2.3、动态IP和静态IP的优缺点比较 三、动态IP和静态IP的应用场景 3.1. 动态IP的应用场景 3.2. 静态IP…

六个能够白嫖学习资料的网站

一、咖喱君的资源库 地址:https://flowus.cn/galijun/share/de0f6d2f-df17-4075-86ed-ebead0394a77 这是一个学习资料/学习网站分享平台,包含了英语、法语、德语、韩语、日语、泰语等几十种外国语言的学习资料及平台,这个网站的优势就是外语…

[贪心_7] 最优除法 | 跳跃游戏 II | 加油站

目录 1.最优除法 题解 2.跳跃游戏 II 题解 3.加油站 题解 利用 单调性,可以实现 区间跳跃 1.最优除法 链接: 553. 最优除法 给定一正整数数组 nums,nums 中的相邻整数将进行浮点除法。 例如,nums [2,3,4],我…