python将Excel文档转成.db数据库文件

python实现Excel转.db数据库

1.程序实现

程序实现以下功能:

1.读取一个Excel文件,文件名通过函数传参数传入

2.将文件读取的内容保存到一个数据库文件中

3.数据库的文件名以传入的Excel文件的文件名命名

4.将excel文件的工作簿的名字作为数据库的表单名

5.将Excel文件的第一行作为数据库的列命名

6.将Excel文件的每一个行的内容加入数据库中

import pandas as pd
import sqlite3
import os
import sys
def excel_to_sqlite(excel_file_path):try:# 获取 Excel 文件名(不包括扩展名)excel_file_name = excel_file_path.split('/')[-1].split('.')[0]# 创建 SQLite 数据库连接db_file_name = f"{excel_file_name}.db"conn = sqlite3.connect(db_file_name)# 使用 ExcelFile 类打开 Excel 文件excel_file = pd.ExcelFile(excel_file_path)# 遍历所有工作簿for sheet_name in excel_file.sheet_names:# 从 Excel 文件读取数据框df = pd.read_excel(excel_file, sheet_name)# 将数据框写入 SQLite 数据库,使用工作簿的名字作为表名df.to_sql(sheet_name, conn, index=False, if_exists='replace')# 关闭数据库连接conn.close()print(f"成功将 Excel 文件 {excel_file_path} 写入 SQLite 数据库 {db_file_name} 中的所有工作簿。")except Exception as e:print(f"发生错误: {e}")def get_data_from_db(db_file_name, table_name):try:# 创建 SQLite 数据库连接conn = sqlite3.connect(db_file_name)# 使用 SQL 查询获取数据query = f"SELECT * FROM {table_name};"df = pd.read_sql_query(query, conn)# 打印获取的数据print(f"获取 {db_file_name} 数据库中表 {table_name} 的数据:")# 关闭数据库连接conn.close()except Exception as e:print(f"发生错误: {e}")# 调用函数将 Excel 文件写入 SQLite 数据库if __name__ == "__main__":print("开始将 Excel 文件写入 SQLite 数据库...")excel_file_path = sys.argv[1]excel_to_sqlite(excel_file_path)excel_name = excel_file_path.split('/')[-1].split('.')[0]db_name = f"{excel_name}.db"get_data_from_db(db_name,"AIR")//AIR是Excel文档中的工作簿的名字

2.数据查询、获取

在函数get_data_from_db中,df的数据类型是<class 'pandas.core.frame.DataFrame'>

在 pandas 中,DataFrame 类提供了许多有用的属性和方法,以便处理和分析数据。以下是 DataFrame 类的一些常用属性和方法,以及简要说明:

  1. head(n):

    • 作用:返回数据框的前 n 行。

    • 示例:

      df.head(5)  # 返回前5行
      
  2. tail(n):

    • 作用:返回数据框的后 n 行。

    • 示例:

      df.tail(3)  # 返回后3行
      
  3. shape:

    • 作用:返回数据框的形状,即行数和列数。

    • 示例:

      print(df.shape)  # 返回 (行数, 列数)
      
  4. columns:

    • 作用:返回数据框的列名。

    • 示例:

      print(df.columns)  # 返回列名列表
      
  5. describe():

    • 作用:返回数据框的描述性统计信息,如均值、标准差等。

    • 示例:

      print(df.describe())
      
  6. info():

    • 作用:返回数据框的基本信息,包括每列的数据类型和非空值数量。

    • 示例:

      df.info()
      
  7. loc[row_index, col_name]:

    • 作用:通过行和列的标签选择单个元素。

    • 示例:

      print(df.loc[0, 'ColumnName'])
      
  8. iloc[row_index, col_index]:

    • 作用:通过行和列的索引选择单个元素。

    • 示例:

      print(df.iloc[0, 2])
      
  9. set_index(col_name):

    • 作用:将指定列设置为索引列。

    • 示例:

      df.set_index('ColumnName', inplace=True)
      
  10. groupby(col_name):

    • 作用:按指定列对数据框进行分组。

    • 示例:

      grouped_data = df.groupby('ColumnName')
      
  11. sort_values(by=col_name, ascending=True):

    • 作用:根据指定列对数据框进行排序。

    • 示例:

      df.sort_values(by='ColumnName', ascending=False, inplace=True)
      
  12. fillna(value):

    • 作用:用指定值填充缺失值。

    • 示例:

      df.fillna(0, inplace=True)
      

这只是 DataFrame 类的一小部分功能,pandas 提供了更多用于数据处理和分析的工具。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/667812.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

idea修改项目git地址

大家好&#xff0c;今天给大家分享的知识是如何在idea中修改项目的git地址。 一、修改地址 首先我们先找到菜单栏中Git选项&#xff0c;然后点击管理远程&#xff08;Manage Remote&#xff09; 之后双击origin之后就可以定义名称或者URL了。

电路设计(10)——超温报警电路的proteus仿真

1.题目背景 在现实生活中&#xff0c;常有一种工程技术&#xff0c;即带有自动温度补偿的设备&#xff0c;能在规定温度内正常工作。但是为了设备安全&#xff0c;需设定工作的上限温度&#xff0c;万一温控补偿失效&#xff0c;设备温度一旦超出上限温度时&#xff0c;便立即切…

前端excel带样式导出 exceljs 插件的使用

案例 <!DOCTYPE html> <html><head><meta charset"utf-8" /><meta name"viewport" content"widthdevice-width, initial-scale1"><title>exceljs 使用</title></head><body><button …

ReactNative实现宽度变化实现的动画效果

效果如上图所示&#xff0c;通过修改设备宽度实现动画效果 import React, {useRef, useEffect, useState} from react; import {Animated, Text, View, Image} from react-native;const FadeInView props > {const fadeAnim useRef(new Animated.Value(0)).current;React…

PyTorch、NCNN、Numpy三者张量的shape

目录 一、PyTorch二、NCNN三、Numpy 一、PyTorch 在 PyTorch 中&#xff0c;张量&#xff08;Tensor&#xff09;的形状通常按照 (N, C, H, W) 的顺序排列&#xff0c;其中&#xff1a; N 是批量大小&#xff08;batch size&#xff09; C 是通道数&#xff08;channel number…

【Node系列】连接数据库

文章目录 一、连接MySql二、连接MongoDB三、相关链接 一、连接MySql 首先&#xff0c;您需要安装mysql模块。在命令行中&#xff0c;导航到您的项目目录并输入以下命令&#xff1a; npm install mysql然后&#xff0c;您可以在Node.js代码中使用mysql模块来连接MySQL数据库、…

在vs code的terminal,debug执行python main.py --train True

GPT4告诉我&#xff1a; 在VS Code中以debug状态执行带有参数&#xff08;如--train&#xff09;的main.py文件&#xff0c;你需要在launch.json配置文件中正确设置参数。以下是详细步骤&#xff1a; 打开你的main.py文件&#xff1a;确保你的main.py文件已经在VS Code中打开…

鸿蒙 状态管理-应用存储

前提&#xff1a;基于官网3.1/4.0文档。参考官网文档 基于Android开发体系来进行比较和思考。&#xff08;或有偏颇&#xff0c;自行斟酌&#xff09; 1.概念 装饰器&#xff08;State、Prop等&#xff09;是用于组件的状态修饰符&#xff0c;本篇讲的是更上一层级别&#xff…

牛客周赛 Round 31(A~F)

文章目录 ABCDEF A #include <bits/stdc.h> #define int long long #define rep(i,a,b) for(int i (a); i < (b); i) #define fep(i,a,b) for(int i (a); i > (b); --i) #define pii pair<int, int> #define pll pair<long long, long long> #defi…

华为自动驾驶干不过特斯拉?

文 | AUTO芯球 作者 | 李诞 什么&#xff1f; 华为的智能驾驶方案干不过蔚小理&#xff1f; 特斯拉的智能驾驶[FSD]要甩中国车企几条街&#xff1f; 这华为问界阿维塔刚刚推送“全国都能开”的城区“无图 NCA” 就有黑子来喷了 这是跪久了站不起来了吧 作为玩车14年&…

Pytorch: nn.dropout

Dropout 是一种用于深度学习模型的正则化技术&#xff0c;旨在减少模型对特定训练样本的过度拟合。其主要作用包括&#xff1a; 减少过拟合&#xff1a; Dropout 阻止神经网络对某些特定输入值过度依赖&#xff0c;从而提高模型的泛化能力。通过随机地失活神经元&#xff08;将…

flutter开发实战-可扩展popup弹窗template模版样式

flutter开发实战-可扩展popup弹窗template模版样式 最近在看到一个flutter_beautiful_popup&#xff0c;可以美化弹窗窗口样式。该插件通过一个template模版的类BeautifulPopupTemplate作为抽象的base类。 一、基类BeautifulPopupTemplate 在BeautifulPopupTemplate中&…

1-1 动手学深度学习v2-线性回归-笔记

简化核心模型 假设1: 影响房价的关键因素是卧室个数&#xff0c;卫生间个数和居住面积&#xff0c;记为 x 1 x_{1} x1​&#xff0c; x 2 x_{2} x2​&#xff0c; x 3 x_{3} x3​假设2: 成交价是关键因素的加权和 y w 1 x 1 w 2 x 2 w 3 x 3 b yw_{1}x_{1}w_{2}x_{2}w_{3…

RabbitMQ——基于 KeepAlived + HAProxy 搭建 RabbitMQ 高可用负载均衡集群

一、集群简介 1.1 集 群架构 当单台 RabbitMQ 服务器的处理消息的能力达到瓶颈时&#xff0c;此时可以通过 RabbitMQ 集群来进行扩展&#xff0c;从而达到提升吞吐量的目的。 RabbitMQ 集群是一个或多个节点的逻辑分组&#xff0c;集群中的每个节点都是对等的&#xff0c;每…

目标检测及相关算法介绍

文章目录 目标检测介绍目标检测算法分类目标检测算法模型组成经典目标检测论文 目标检测介绍 目标检测是计算机视觉领域中的一项重要任务&#xff0c;旨在识别图像或视频中的特定对象的位置并将其与不同类别中的对象进行分类。与图像分类任务不同&#xff0c;目标检测不仅需要…

OfficeWeb365 Readfile 任意文件读取漏洞

免责声明&#xff1a;文章来源互联网收集整理&#xff0c;请勿利用文章内的相关技术从事非法测试&#xff0c;由于传播、利用此文所提供的信息或者工具而造成的任何直接或者间接的后果及损失&#xff0c;均由使用者本人负责&#xff0c;所产生的一切不良后果与文章作者无关。该…

主品牌竞争方向之洞察竞争环境变化

随着市场环境加速变化&#xff0c;如果只停留在过去&#xff0c;未能及时进化的主品牌可能会逐渐老化&#xff0c;失去市场竞争力&#xff0c;甚至被新兴竞争对手所取代。因此&#xff0c;企业需要不断洞察竞争环境变化&#xff0c;避免企业走向衰退&#xff0c;让主品牌进化&a…

TrinityCore安装记录

TrinityCore模拟魔兽世界&#xff08;World of Warcraft&#xff09;的开源项目&#xff0c;并且该项目代码广泛的优化、改善和清理代码。 前期按照官方手册按部就班的安装即可。 注意几点&#xff1a; 1 需要配置Ubuntu22.04版本的服务器或者Debian11 服务器。2 需要使用gi…

网易和腾讯面试题精选---缓存面试问题和答案

介绍 在当今快节奏的数字环境中,数据和资源的高效管理对于确保最佳应用程序性能、可扩展性和响应能力变得至关重要。缓存是一种用于将频繁访问的数据存储在更接近使用点的技术,在提高系统效率、减少延迟和改善各种计算环境中的用户体验方面发挥着关键作用。本文深入探讨了缓存…

Office恢复旧UI|Office UI问题|Word UI|小喇叭找不到

Office恢复旧UI&#xff5c;Office UI问题&#xff5c;Word UI&#xff5c;小喇叭找不到 问题描述&#xff1a;Office新版本默认新UI&#xff0c;主界面没有小喇叭可以切换到旧UI. 解决方案&#xff1a; 以下述内容新建.txt&#xff0c;保存并改后缀为.reg&#xff0c;双击打开…