sqlite简介:sqlite是一个进程内的库,实现了自给自足的、无服务器的、零配置的、事务性的 SQL 数据库引擎。它的设计目标是嵌入式的,而且目前已经在很多嵌入式产品中使用了它(如安卓系统),它占用资源非常的低,在嵌入式设备中,可能只需要几百K的内存就够了。它能够支持Windows/Linux/Unix等等主流的操作系统,同时能够跟很多程序语言相结合,比如 Python、C#、PHP、Java等,还有ODBC接口。利用python进行数据分析时可通过pandas来读取sqlite文件,步骤如下:1、导入包(无需安装直接导入即可)2、链接数据库3、创建游标4、查看数据库中的table5、从数据库中读入所需的table下面是以一份博客数据以sqlite为后缀的文件,利用python读取所需要的数据表进行数据分析;
# 1、导入包import sqlite3import pandas as pd
# 2、链接数据库mydb=sqlite3.connect('E:/数据分析之渔/database.sqlite')
# 3、创建游标cursor=mydb.cursor()
# 4、查看数据库中的表名cursor.execute("SELECT NAME FROM sqlite_master WHERE type='table';")tables=cursor.fetchall()print(tables)
结果如下:本例中一共有4个表,通过pandas提供的两个函数:read_sql() 和 read_sql_query() 进行数据的读取以便后续的数据分析操作。
# 5、读入评论表df=pd.read_sql("SELECT * FROM reviews",con=mydb)print('数据形状\n',df.shape)print('数据类型\n',df.dtypes)print('----------')df.head()
结果如下: