数据分析中,文件解析库解析内容样式调整

CSV文件:使用Python标准库中的csv模块,通过简单的文本解析来读取数据。
Excel文件:使用专门的库(如openpyxl、xlrd)来解析复杂的文件格式,或者使用pandas库来简化读取过程。

在进行文件读取后的格式调整时,可设置显示选项进行整理,在进行举例前,先介绍需要引入的tabulate库
tabulate库主要用于:

  1. 格式化输出:将复杂的数据结构(如列表、字典)转换为易于阅读的表格格式。
  2. 控制台展示:在命令行界面中以表格形式展示数据,适用于脚本和命令行工具。
  3. 文件保存:将表格数据保存为文本文件,支持多种表格格式(如 Markdown、HTML、LaTeX 等)。
  4. 数据对比:用于比较不同数据集,通过表格形式直观展示差异。
  5. 报告生成:在生成报告时,使用表格形式展示数据,使报告更加清晰和专业。
    多种表格格式:支持多种表格格式,包括简单的文本表格、Markdown、HTML、LaTeX 等。
    自定义样式:允许用户自定义表格的样式,包括表头、分隔符、对齐方式等。
    灵活性:可以处理各种数据结构,包括嵌套列表和字典。

举例:(注:需要引入tabulate 库)
pd.set_option(‘display.max_columns’, None) # 显示所有列
pd.set_option(‘display.max_rows’, None) # 显示所有行
pd.set_option(‘display.width’, None) # 自动调整宽度
pd.set_option(‘display.max_colwidth’, 100) # 设置最大列宽
pd.set_option(‘display.precision’, 2) # 设置小数精度
pd.set_option(‘display.unicode.ambiguous_as_wide’, True) # 处理中文对齐
pd.set_option(‘display.unicode.east_asian_width’, True) # 处理中文对齐

完整代码如下:
解析文件为csv 文件,文件内容如下:
订单编号 总金额 买家实际支付金额 收货地址 订单创建时间 订单付款时间 退款金额
1 178.8 上海 2020/2/21 0:00 0.0
2 21 内蒙古自治区 2020/2/20 23:59 2020/2/21 0:00 0.0
3 37 安徽省 2020/2/20 23:59 0.0
4 157 湖南省 2020/2/20 23:58 2020/2/20 23:58 0.0
5 64.8 江苏省 2020/2/20 23:57 2020/2/20 23:57 64.8
6 65.8 江苏省 2020/2/21 23:57 2020/2/21 23:57 0
7 66.8 江苏省 2020/2/22 23:57 2020/2/22 23:57 0
8 67.8 江苏省 2020/2/23 23:57 0
9 68.8 江苏省 2020/2/24 23:57 2020/2/24 23:57 0
10 69.8 江苏省 2020/2/25 23:57 2020/2/25 23:57 0
11 70.8 江苏省 2020/2/26 23:57 2020/2/26 23:57 0

import pytest
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import os
import warnings
from tabulate import tabulate  # 添加tabulate库
warnings.filterwarnings('ignore')# 设置显示选项
pd.set_option('display.max_columns', None)  # 显示所有列
pd.set_option('display.max_rows', None)     # 显示所有行
pd.set_option('display.width', None)        # 自动调整宽度
pd.set_option('display.max_colwidth', 100)  # 设置最大列宽
pd.set_option('display.precision', 2)       # 设置小数精度
pd.set_option('display.unicode.ambiguous_as_wide', True)  # 处理中文对齐
pd.set_option('display.unicode.east_asian_width', True)   # 处理中文对齐def display_aligned_dataframe(df):"""打印对齐的数据框"""# 创建一个样式对象styled_df = df.style.set_properties(**{'text-align': 'left','padding': '10px'})# 设置表格边框styled_df = styled_df.set_table_styles([{'selector': 'th','props': [('text-align', 'center'),('background-color', '#f0f0f0'),('padding', '10px')]},{'selector': 'td','props': [('text-align', 'left'),('padding', '10px')]}])return styled_df# 读取CSV文件后使用新的显示方式
file_path = 'E:\TestDome\Demo1.csv'
df = pd.read_csv(file_path, encoding="gbk")# 使用新的显示方式
print("\n数据预览:")
print(tabulate(df, headers='keys', tablefmt='grid', showindex=True))  # 使用tabulate对齐表头和数据# 或者使用样式化显示
display_aligned_dataframe(df)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/73352.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Swift 二分法求函数的近似解

在实际开发中会遇到一些工程问题,需要求解复杂函数方程的问题。使用传统的数学方法比较难以处理。本文将使用二分法不断获取一个函数的近似解。 二分法:其基本思想是利用函数在某个区间内的连续性,通过不断缩小区间范围来逼近方程的解。 算法…

stanley 路径跟踪控制算法

文章目录 写在前面的话算法思路核心代码1 路径发布2 获取车子当前位置3 预瞄路径点4 计算航向误差5 计算横向误差 完整控制代码演示视频 写在前面的话 轨迹跟踪 Trajectory Tracking 和 路径跟踪 Path Following 是机器人控制和自动驾驶领域中的两个核心概念,尽管它…

Qt中通过QLabel实时显示图像

Qt中的QLabel控件用于显示文本或图像,不提供用户交互功能。以下测试代码用于从内置摄像头获取图像并实时显示: Widgets_Test.h: class Widgets_Test : public QMainWindow {Q_OBJECTpublic:Widgets_Test(QWidget *parent nullptr);~Widgets…

在STM32F7上实现CAN总线收发队列

下面我将提供一个完整的STM32F7 CAN总线通信实现方案,包含中断驱动的收发队列管理。 1. CAN总线配置与队列定义 can_bus.h #ifndef __CAN_BUS_H #define __CAN_BUS_H#include "stm32f7xx_hal.h" #include "queue.h"// CAN消息结构体 typedef …

【例3.5】位数问题(信息学奥赛一本通-1313)

【题目描述】 在所有的N位数中,有多少个数中有偶数个数字3?由于结果可能很大,你只需要输出这个答案对12345取余的值。 【输入】 读入一个数N(N≤1000)。 【输出】 输出有多少个数中有偶数个数字3。 【输入样例】 2 【输出样例】 73 【题解代码】 #incl…

pyQt学习笔记——Qt资源文件(.qrc)的创建与使用

Qt资源文件(.qrc)的创建与使用 1. 选择打开资源2. 创建新资源3. 添加资源文件夹4. 选择要加载的图片文件5. 编译resource.qrc文件6. 替换PySlide6为PyQt57. 其他说明 1. 选择打开资源 在Qt项目中,可以通过windowIcon点击选择打开资源。 2. 创…

光电效应及普朗克常数的测定数据处理 Python实现

内容仅供参考,如有错误,欢迎指正,如有疑问,欢迎交流。 因为我不会Excel所以只能用Python来处理 祝大家早日摆脱物理实验的苦海 用到的一些方法 PCHIP (分段三次埃尔米特插值多项式) 因为实验时记录的数…

2025最新3个wordpress好用的主题

红色大气的wordpress企业主题,适合服务行业的公司搭建企业官方网站使用。是一款专为中小企业和个人开发者设计的WordPress主题,旨在提供专业的网站构建解决方案。 通过此WordPress主题,用户可以轻松创建和维护一个专业的企业网站&#xff0c…

OLLVM 增加 CC++ 字符串加密功能

版权归作者所有&#xff0c;如有转发&#xff0c;请注明文章出处&#xff1a;https://cyrus-studio.github.io/blog/ 前言 当我们如果没有对字符串进行加密&#xff0c;使用 IDA 反汇编一下 so 可以看到 C 代码中的字符串就直接暴露了。 字符串加密原理 sobf.c #include <…

桑福德·韦尔策划美国捷运公司收购南美银行案例分析

桑福德韦尔(Sanford I. Weill)在1981年策划美国捷运公司(American Express)以5.5亿美元收购南美贸易发展银行所属外国银行机构的案例中,展现了其作为战略家与执行者的双重能力。这一交易的流程和韦尔的具体行为可从以下六个关键环节解析: 一、战略定位与目标筛选 战略目标…

人工智能与区块链融合:开启数字信任新时代

引言 在当今数字化飞速发展的时代&#xff0c;人工智能&#xff08;AI&#xff09;与区块链技术正以前所未有的速度改变着我们的生活和工作方式。AI以其强大的数据处理和智能决策能力&#xff0c;为各行业带来了效率的飞跃&#xff1b;而区块链则以其去中心化、不可篡改的特性…

自动化逆向框架使用(Objection+Radare2)

1. 工具链架构与核心优势 1.1 动静结合逆向体系 graph LR A[动态分析] -->|Objection实时Hook| B[关键点定位] B --> C[行为数据捕获] D[静态分析] -->|Radare2深度解析| E[控制流重建] E --> F[漏洞模式识别] B --> F C --> F 组合优势对比&…

流式ETL配置指南:从MySQL到Elasticsearch的实时数据同步

流式ETL配置指南&#xff1a;从MySQL到Elasticsearch的实时数据同步 场景介绍 假设您运营一个电商平台&#xff0c;需要将MySQL数据库中的订单、用户和产品信息实时同步到Elasticsearch&#xff0c;以支持实时搜索、分析和仪表盘展示。传统的批处理ETL无法满足实时性要求&…

Docker-Volume数据卷详讲

Docker数据卷-Volume 一&#xff1a;Volume是什么&#xff0c;用来做什么的 当删除docker容器时&#xff0c;容器内部的文件就会跟随容器所销毁&#xff0c;在生产环境中我们需要将数据持久化保存&#xff0c;就催生了将容器内部的数据保存在宿主机的需求&#xff0c;volume …

单片机和微控制器知识汇总——《器件手册--单片机、数字信号处理器和可编程逻辑器件》

目录 四、单片机和微控制器 4.1 单片机(MCU/MPU/SOC) 一、定义 二、主要特点 三、工作原理 四、主要类型 五、应用领域 六、选型与设计注意事项 七、发展趋势 4.2 数字信号处理器(DSP/DSC) ​编辑​编辑 一、定义 二、工作原理 三、结构特点 四、应用领域 五、选型与设计注…

macOS 安装 Miniconda

macOS 安装 Miniconda 1. Quickstart install instructions2. 执行3. shell 上初始化 conda4. 关闭 终端登录用户名前的 base参考 1. Quickstart install instructions mkdir -p ~/miniconda3 curl https://repo.anaconda.com/miniconda/Miniconda3-latest-MacOSX-arm64.sh -o…

高数下---8.1平面与直线

目录 平面的确定 直线的确定 若要求某一直线或平面就根据要素来求。 例题 平面中的特殊情况 平面中的解题思路 直线的解题思路 平面的确定 两要素 一 一点 二 倾斜角 即法向量 点法式 可化为一般式 Ax By Cz D 0; (A,B,C) 即法向量&#xff1b; 改变D 即…

CMS迁移中SEO优化整合步骤详解

内容概要 在CMS迁移过程中&#xff0c;系统化的规划与执行是保障SEO排名稳定性的核心。首先需明确迁移流程的关键阶段&#xff0c;包括数据备份、URL适配、元数据同步及安全配置等环节。其中&#xff0c;数据备份不仅需覆盖原始数据库与静态资源&#xff0c;还需验证备份文件的…

存储过程、存储函数与触发器详解(MySQL 案例)

存储过程、存储函数与触发器详解&#xff08;MySQL 案例&#xff09; 一、存储过程&#xff08;Stored Procedure&#xff09; 定义 存储过程是预先编译好并存储在数据库中的一段 SQL 代码集合&#xff0c;可以接收参数、执行逻辑操作&#xff08;如条件判断、循环&#xff09;…

Python:进程间的通信,进程的操作队列

进程间的队列&#xff1a; 队列的基本操作&#xff1a; 入队&#xff1a;将数据放到队列尾部 出队&#xff1a;从队列的头部取出一个元素 maxsize&#xff1a;队列中能存放数据个数的上限(整数)&#xff0c;一旦达到上限插入会导致阻塞&#xff0c;直到队列中的数据被消费掉 …