PandasAI的应用与实战解析(一):环境安装、运行demo

文章目录

    • 1.源码包下载、明确依赖版本
    • 2.安装python依赖
    • 3.运行demo

  • 本博客源码仓库地址:gitlab,本篇博客对应01分支
  • python版本为3.10.x

什么是PandasAI?一句话总结的话,PandasAI就是一个结合了Pandas和AI的开源工具,更详细地说,PandasAI 是一款强大的Python库,它使得用户能够以自然语言轻松向各类数据源(如CSV、XLSX、PostgreSQL、MySQL、BigQuery、Databricks及Snowflake等)提出问题。该库借助生成式人工智能技术,助力用户实现对数据的深度探索、清洗与分析工作。

不仅如此,PandasAI 还提供了丰富的可视化功能,可通过图表形式展示数据;同时,它能有效处理缺失值问题以净化数据集,并通过特征生成进一步提升数据质量。因此,无论是对于数据科学家还是数据分析师而言,PandasAI 都是一款全方位的数据处理工具。

官方文档:https://docs.pandas-ai.com/en/latest/
github仓库:https://github.com/Sinaptik-AI/pandas-ai

  • 特点:提升效率,节省开发人员的时间和精力
    自然语言查询:以自然语言向数据提问。
    数据可视化:生成图形和图表以可视化数据。
    数据清理:通过解决缺失值来清理数据集。
    特征生成:通过特征生成提高数据质量。
    数据连接器:连接到各种数据源,如 CSV、XLSX、PostgreSQL、MySQL、BigQuery、Databrick、Snowflake 等。

  • 工作原理简述:
    PandasAI 使用生成式 AI 模型来理解和解释自然语言查询,并将其转换为 python 代码和 SQL 查询。然后,它使用代码与数据进行交互,并将结果返回给用户。


要想使用PandasAI,首先需要把demo跑起来,下面我将演示整个过程的详细步骤。

1.源码包下载、明确依赖版本

  • 进入PandasAI的github仓库https://github.com/Sinaptik-AI/pandas-ai,点击页面上的Releases:

在这里插入图片描述

  • 选择版本,我选择的是v2.0.29,下载source code.zip:

在这里插入图片描述

  • 然后,我将下载的源码包放到了我的项目文件夹根目录下并解压了,查看pandas-ai-2.0.29文件夹下的.readthedocs.yaml文件,里面有关于python版本和依赖安装文件的说明:python版本为3.10,requirements文件为pandas-ai-2.0.29/docs/requirements.txt
    在这里插入图片描述

2.安装python依赖

  • 为了更便于管理环境,我创建了一个conda虚拟环境:
conda create -n pandasai python=3.10
  • 然后进入环境:
conda activate pandasai
  • 在项目根目录下安装requirement文件依赖:
pip install -r ./pandas-ai-2.0.29/docs/requirements.txt
  • 另外还需要安装pandasai这个依赖:
pip install pandasai==2.0.29

到这里环境就安装好了。

3.运行demo

官网提供的demo有bug(使用BambooLLM大语言模型会报错,但是使用OpenAI不会),已经有其他人遇到了和我一样的问题,并给该开源作者提了issue,但是目前这个bug还没有修复,因此需要修改一下demo的代码。

  • 首先我生成了一个包含23条数据的csv数据集(dataset.csv,存放在了pandas-ai-2.0.29/examples/data目录中),用于测试PandasAI是否可以成功地运行:
countries,gdp
United States,10001
Canada,10002
Mexico,10003
Guatemala,10004
Belize,10005
El Salvador,10006
Honduras,10007
Panama,10008
Bahamas,10009
Cuba,10011
Jamaica,10012
Haiti,10013
Dominican Republic,10014
Costa Rica,10015
Saint Kitts and Nevis,10016
Antigua and Barbuda,10017
Dominica,10018
Saint Lucia,10019
Saint Vincent and the Grenadines,10021
Barbados,10022
Grenada,10023
Trinidad and Tobago,10024
Nicaragua,10025
  • 然后,我修改了pandas-ai-2.0.29/examples目录下的from_csv.py的代码:
"""Example of using PandasAI with a pandas dataframe"""from pandasai import SmartDataframe
from pandasai.llm import OpenAI
from pandasai.helpers.openai_info import get_openai_callbackllm = OpenAI(api_token="你的OpenAI Token")df = SmartDataframe("./data/data.csv", config={"llm": llm, "conversational": False})with get_openai_callback() as cb:response = df.chat("Calculate the sum of the gdp of north american countries")print(response)print(cb)
  • 进入examples目录:
cd pandas-ai-2.0.29\examples
  • 运行from_csv.py:

注意,调用OpenAI需要开代理,否则会报网络异常

python from_csv.py

执行成功:

在这里插入图片描述

至此,PandasAI的demo就成功运行起来了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/810748.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

windwos安全加固

一、账号管理 按用户类型分配账号 目的:根据系统要求,设定不同账户和组,管理员、数据库 sa、审计用户、来宾用户等 实施方法: 打开本地用户和计算机管理器 ​ 1.打开运行,输入lusrmgr.msc 2.根据用户要求将账户加入…

秋招算法刷题7

20240410 1.接雨水 方法一,动态规划,时间复杂度O(n^2),空间复杂度O(n) public int trap(int[] height) { int nheight.length; if(n0){ return 0; } …

【Deep Learning】Variational Autoencoder ELBO:优美的数学推导

Variational Autoencoder In this note, we talk about the generation model, where x x x represents the given dataset, z z z represents the latent variable, θ , ϕ \theta,\phi θ,ϕ denote the parameters of models. Latent Variable Model Generate x x x…

爬楼梯问题算法

小乐爬楼梯的问题是一个经典的动态规划问题,也被称为斐波那契数列问题。因为小乐每次可以选择爬1级或2级台阶,所以到达第n级台阶的方法数等于到达第n-1级台阶的方法数加上到达第n-2级台阶的方法数。 具体来说: 如果小乐到达第n-1级台阶&…

java:字符集和字符流

字符集 规定了字符和二进制之间对应关系的一张表 字节是计算机最基本的存储单位 字符则是通过字符组成和编码而成的文本 常见字符集 1,ASCII字符集 基础字符编码标准,包含128个字符,只包括英文字母,数字和一些常见的符号 一个字节表示一个字符 所有的字符集均兼容ASCII…

open-sora

Open-Sora,高效复现类Sora视频生成方案开源!魔搭社区最佳实践教程来啦!https://mp.weixin.qq.com/s/WMQIDgZs2MBPGtx18XSXgw Open-Sora开源方案讲解开源但“平替”的方案。https://mp.weixin.qq.com/s/nPYCzgBA7hIsPZ6PCyXxKQOpen-Sora/docs…

数据分析案例(一):地区收入的PCA主成分分析

练习1 地区收入的PCA主成分分析 0.变量说明 1.导包操作 核心思路:导入基础数据操作库包,PCA、k-means 库包,数据可视化库包 import pandas as pd import numpy as np from sklearn.decomposition import PCA from sklearn.preprocessing i…

Python脚本式编程

脚本式编程 将如下代码拷贝至 hello.py文件中: print ("Hello, Python!");通过以下命令执行该脚本: $ python ./hello.pyhello,python在Linux/Unix系统中,你可以在脚本顶部添加以下命令让Python脚本可以像SHELL脚本一样可直接执…

YOLOV5训练KITTI数据集实践

目录 一、YOLOV5下载安装二、KITTI数据集三、标签格式转换四、修改配置文件五、训练六、测试 一、YOLOV5下载安装 git clone https://github.com/ultralytics/yolov5.git conda create -n yolov5 python3.8 -y conda activate yolov5 cd yolov5 pip install -r requirements.t…

2024最火的情感短视频素材在哪下载?这里有几个素材网站可以下载

在这个看似无边无际的短视频海洋中,我就像那个手握罗盘、脚踏破旧木筏的勇敢航海家,时刻准备着发现新大陆。而我的罗盘,就是那些能够指引我找到珍稀素材的网站。让我带你领略一下我的航海日记吧。九才素材网: 九才素材网提供了丰…

青少年体能素质教育平台

一、项目背景与意义 随着社会的快速发展和人们生活水平的提高,青少年体能素质教育逐渐受到社会各界的广泛关注。体能素质作为青少年全面发展的重要组成部分,对于提升他们的健康水平、增强自信心、培养团队协作精神和创新能力具有重要意义。然而&#xf…

继承【C/C++复习版】

目录 一、什么是继承?怎么定义继承? 二、继承关系和访问限定符? 三、基类和派生类对象可以赋值转换吗? 四、什么是隐藏?隐藏vs重载? 五、派生类的默认成员函数? 1)派生类构造函…

关于转义符 \ 在php正则中的匹配问题

今天做题遇到一个很经典的问题&#xff0c;记录一下&#xff0c;先看一段代码 <?php $str&#xff0c;&#xff0c;"\\"; $pattern&#xff0c;&#xff0c;"/\\/"; if(preg_match($partern,$str,$arr)) { &#xff0c;&#xff0c;&#xff0c;&…

Qt QString类

数值输入 C 提供了两种字符串的实现方式&#xff1a;一种是C风格的字符串&#xff0c;以“0”结尾&#xff1b;另一种是 C引入的 String 类型&#xff0c;即标准模板库中的类。Qt则提供了自己的字符串实现方式——QString。 Qt中的QString字符串类&#xff1a; 无须担心…

如何使用設置Python代理IP?

本文旨在探討Python代理IP、使用Python代理伺服器的好處、如何安裝 Python代理以及如何用Python設置代理IP伺服器。 什麼是Python代理伺服器&#xff1f; 用Python實現的代理IP模式&#xff0c;可用於延遲加載、日誌記錄、訪問控制或其他目的。 Python的動態類型和豐富的類支持…

SpringBoot编写一个SpringTask定时任务的方法

1&#xff0c;在启动类上添加注解 EnableScheduling//开启定时任务调度 2&#xff0c; 任务&#xff08;方法&#xff09;上也要添加注解&#xff1a; Scheduled(cron " 0 * * * * ? ") //每分钟执行一次 域&#xff1a; 秒 分 时 日 月 周 &#xff08;年&#…

如何修复在Deepin系统中因`apt-get autoremove systemd`导致的启动问题

博主猫头虎的技术世界 &#x1f31f; 欢迎来到猫头虎的博客 — 探索技术的无限可能&#xff01; 专栏链接&#xff1a; &#x1f517; 精选专栏&#xff1a; 《面试题大全》 — 面试准备的宝典&#xff01;《IDEA开发秘籍》 — 提升你的IDEA技能&#xff01;《100天精通鸿蒙》 …

选择正确的Go Module Path

最近我在查看项目代码时&#xff0c;注意到有人在go.mod文件中将module path写为com.example.foo了。根据这个写法&#xff0c;相信屏幕前的读者也可以推断出这位开发人员可能是从Java阵营转到Go的。实际开发中可能有很多开发者会使用类似的内容作为module path&#xff0c;但这…

Redis和Mysql如何保证数据一致性?

一份数据同时保存在数据库和Redis中&#xff0c;当数据发生变化时需要同时去更新Mysql和Redis&#xff0c;由于这个更新有先后顺序并且它不像Mysql里面的多表事物一样可以满足ACID的事物特性&#xff0c;所以就会出现数据一致性的问题。 对于这种情况解决方案主要有以下几种&a…

Jmeter针对多种响应断言的判断

有时候response返回的结果并非一种&#xff0c;有多种&#xff0c;需要对这几种进行判断的时候需要使用Bean Shell。 &#xff08;1&#xff09;首先获取响应数据 String response prev.getResponseDataAsString(); ResponseCode 响应状态码 responseHeaders 响应头信息 res…