【玩转TableAgent 数据智能分析】-- 数据分析不再是专业人士的专利

文章目录

    • 前言
    • 一、TableAgent介绍
      • TableAgent 数据分析智能体
      • 融合创新应用的新成果
        • Table Family
    • 二、注册TableAgent
      • 访问TableAgent
      • 注册
      • 用量
    • 三、 体验TableAgent
      • 样例数据集体验
        • 选择样例数据集
        • 样例数据集进行数据分析
          • 数据图
        • 样例数据集进行数据分析规定图表格式
          • 数据图
        • 自定义数据集体验
          • 准备数据
          • 数据概览
          • 数据分析方向
          • 导入数据
          • 简单数据分析
          • 复杂数据分析

前言

在数字化时代,数据分析的重要性已经变得无处不在,就像我们生活中必不可少的空气一样。它是数字化管理和智能决策的基础,但同时也是一项高度专业化的工作。对于那些只会使用Excel的人来说,面对描述性分析、诊断性分析和预测性分析可能会感到相当头疼。然而,九章云极DataCanvas公司自主研发的TableAgent数据分析智能体的出现,让大型模型对个人生产力的提升达到了新的高度。只需要知道如何提问,你就能成为一个顶级的数据分析师,深入洞察数据的奥秘。

2023年7月9日,OpenAI发布了一款震撼全球的Code Interpreter插件,让“人人都是数据分析师”的梦想成为现实。然而,早在6月28日,九章云极DataCanvas公司就已经提前发布了TableGPT。现在,Code Interpreter已经更名为Advanced Data Analysis,而TableGPT也进行了一系列的重大升级,以TableAgent的新名字重新上线,面向全社会开放公测。

一、TableAgent介绍

TableAgent 数据分析智能体

TableAgent是一款功能强大的企业级数据分析智能体,可以实现私有化部署。它具备出色的意图理解能力、分析建模能力和深刻的洞察力。通过充分理解用户的意图,TableAgent能够自主地运用统计科学、机器学习、因果推断等高级建模技术,从海量数据中挖掘出有价值的信息。这不仅为用户提供了精准的分析观点,还能为他们制定决策提供深刻的见解。此外,凭借自有的大型模型和自主研发的T+底层体系,TableAgent能够灵活适应各行各业以及不同专业领域的需求,实现在特定领域内个性化数据分析场景下的专业化微调。
TableAgent现已开放公测 : 点击即可访问

融合创新应用的新成果

九章云极DataCanvas公司自主研发的Alaya九章元识大模型,为TableAgent提供了关键性的技术支持。通过在Alaya基础大模型上进行微调,衍生出了Alaya-ZeroX模型组,这些模型各具特色,能够协同完成复杂的分析任务。不同规模的模型参数确保了生成质量和推理性能的同时满足。
此次TableAgent的发布还带来了一项重要功能,即专业化微调。由于不同行业和企业在数据分析领域有着各自独特的语言背景和分析模型需求,通用的分析工具往往难以满足这些专业化要求。而TableAgent则能为企业提供这种专业化的微调服务。

为了实现这一目标,TableAgent特别设计了一套名为T+(Table Family)的系统。该系统能够高效地进行定制化的微调工作,并且具备自我迭代的能力。这一系统性的支持使得数据分析各个环节的升级更加高效,用户在无需感知的情况下就能享受到不断升级的数据分析体验。

image.png

Table Family

二、注册TableAgent

访问TableAgent

点击链接 体验TableAgent, 如下图所示,点击立刻体验
image.png

注册

输入手机号``验证码 登录 TableAgent
image.png

用量

注册后可以免费使用5次,次数使用完了,可以认证申请增加次数(每天15次)

image.png

三、 体验TableAgent

样例数据集体验

TableAgent 提供了 样例数据集 可以使用样例数据集快速上手 TableAgent

image.png

接下来我们使用TableAgent提供的样例数据集进行数据分析的体验

选择样例数据集

我们选择全球大学排名信息的数据集

当数据集加载成功之后, 左侧的对话框内返回了关于该数据集的信息, 并且提供了问题的可选项以供用户参考, 同时在详情的折叠面板中有这关于数据集的csv 的数据展示 ,如下图所示
image.png

样例数据集进行数据分析

**提问:**画图分析中国的前10所大学最重要的3个指标,简单总结一下他们之间的比较分析。

数据图

效果图

image.png
image.png
image.png
分析:

  1. 根据我给出的问题,并没有指定数据图的格式, 这里TableAgent 自动选择的是柱状图进行展示, 可以说是比较人性化的, 更加直观
  2. x轴数据明显重叠了, 这一点还是有待优化的。
  3. 再给出数据图表的同时,也给出了数据分析的内容,这一点简直绝了。
  4. 在详情的折叠内容中, 也会给出分析的步骤,以及代码思路, 这一点对于研发人员也是非常的友好
样例数据集进行数据分析规定图表格式

通过1.2 的问题我们可以看到, 我们并没有指定图表格式, TableAgent 给我们择优选择了柱状图, 接下来我们规定一下输出的图表格式, TableAgent 是否可以理解并执行呢?

提问: 通过折线图分析中国的前10所大学最重要的3个指标,简单总结一下他们之间的比较分析。

数据图

效果图

image.png
image.png
image.png
分析:
此时我让TableAgent 用折线图进行数据分析, 通过效果图我们发现, TableAgent 返回的数据分析图与我们的预期相符,同时TableAgent 也给了我们相应的分析过程及结果,同时也给出了接下数据分析的方向。

总结:
针对柱状图和折线图以及TableAgent 给出的分析结论我们可以得到综合的结论

  1. 教育水平、研究声誉和师生比例:
  • 从柱状图中可以观察到,北京大学和清华大学在教育水平、研究声誉和师生比例等方面处于领先地位,而其他大学如中国科学技术大学、复旦大学和上海交通大学也表现出色。
  • 数据表中显示了这些大学在不同指标下的具体得分和排名,进一步印证了柱状图的结果。
  1. 学术声誉得分、就业率和国际学生比例:
  • 通过折线图和数据表,可以发现清华大学在学术声誉得分和国际学生比例方面表现较好,而北京大学在就业率上处于较高水平。
自定义数据集体验
准备数据

如下链接为我们准备的csv数据集

online_shopping_10_cats.csv

数据概览

10 个类别(书籍、平板、手机、水果、洗发水、热水器、蒙牛、衣服、计算机、酒店),共 6 万多条评论数据,正、负向评论各约 3 万条

数据分析方向

情感/观点/评论 倾向性分析

导入数据

如下图所示, 我们清楚原有数据集, 然后导入我们准备好的数据集,进行数据分析。

image.png

注意:由于我们准备的数据是10Mb , 但是TableAgent目前允许的最大的数据量是不可以超出5Mb的,因此我们需要对数据进行裁剪,使之在5Mb 以内。

删除"cat"列中包含"洗发水"、“热水器”、“蒙牛”、“衣服”、"计算机"和"酒店"的行


import pandas as pd# 读入CSV文件到DataFrame中
df = pd.read_csv('online_shopping_10_cats.csv')# 删除"cat"列中包含"衣服"、"计算机"和"酒店"的行
df = df[~df['cat'].isin(['洗发水', '热水器', '蒙牛', '衣服', '计算机', '酒店'])]# 将结果保存到新的CSV文件中
df.to_csv('new_data.csv', index=False)

如图所示清理过后数据集大小正好符合要求, 直接导入即可

image.png

简单数据分析

首先我们进行简单的数据分析,
问题如下: 对书籍、平板、手机、水果、洗发水、热水器、蒙牛 这几个类别进行用户倾向性分析,数据集中cat代表类别,label为0代表负面评价为1为正向评价,review代表用户的评价

数据图:
image.png
image.png

分析:对于我们自己的数据集TableAgent不仅给出了图表分析,同时也给出了详细的分析结果,返回结果符合我们的预期

复杂数据分析

接下来我们将问题复杂化,看下TableAgent 是否依旧可以给出完美的分析结果
问题如下: : 对书籍、平板、手机、水果、洗发水、热水器、蒙牛 这几个类别进行用户倾向性分析,数据集中cat代表类别,label为0代表负面评价为1为正向评价,review代表用户的评价,分析数据集中 review列用户的正向评论和负向评论, 并将绘制成旭日图和散点图

数据图:
image.png
image.png
image.png
分析:从结果来看 并不符合我们的预期, 我们计划生成的是旭日图和散点图 , 但是实际上给出的结果却是柱状图, 当然这里不排除我们数据集本身的原因

五、常见问题
通过TableAgent提供的样例数据集和我么自己提供的数据集来看,存在以下问题:

  1. 用户如果导入的数据集低于5MB时, 需要自己对数据进行处理,删除多余的数据,这点显然不是很友好
  2. 过于复杂的图形(可能是数据集的原因), 理解的并不是很友好
  3. 给出的提问方向或者示例,有时并不符合数据集的内容

六、总结
TableAgent其实是九章云极之前发布的TableGPT升级后的产品形态,通过本次的体验能明显感觉到在性能方面有显著提升,以自然语言对话的方式实现结构化数据的分析工作,这对我这种数据建模的小白来说蛮友好的。它的另一个大亮点是支持企业私有化部署,做ToB企业的都知道现在企业对数据安全是多么地看重。不得不说给个大大的赞哦!!!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/204406.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

开源MES/免费MES/开源MES生产流程管理

一、什么是MES生产管理流程 生产管理系统(又称制造执行系统)是一种集成了计划、生产、质量控制、库存管理和材料申请等生产流程的管理系统。工厂生产管理流程是企业中实现高效生产的重要一环。 二、工厂生产管理流程的步骤 步骤一:计划和排…

生成测试数据的4种方法、5种工具介绍

在软件测试中,测试数据是测试用例的基础,对测试结果的准确性和全面性有着至关重要的影响。 因此,在进行软件测试时,需要生成测试数据以满足测试场景和要求。本文将介绍什么情况下需要生成测试数据,如何生成测试数据&a…

数字语言的进化:TikTok词汇如何反映社交变革?

随着数字媒体的崛起,社交平台成为了信息传递和文化表达的重要渠道。TikTok作为一款风靡全球的短视频应用,不仅改变了人们的娱乐方式,还在语言层面上带来了一系列新的词汇和表达方式。 本文将深入探讨数字语言的进化,聚焦于TikTok…

动态代理IP和静态代理IP有什么区别,适用场景是什么?

互联网行业的从业者经常会用到一种工具,那就是代理IP工具。动态代理IP和静态代理IP是两种常见的代理IP技术,它们在网络通信中起到了重要的作用,比如大数据行业的从业者会经常需要用到动态代理IP,跨境行业的从业者会经常用到静态代…

如何本地搭建Linux DataEase数据可视化分析工具并实现公网访问

文章目录 前言1. 安装DataEase2. 本地访问测试3. 安装 cpolar内网穿透软件4. 配置DataEase公网访问地址5. 公网远程访问Data Ease6. 固定Data Ease公网地址 前言 DataEase 是开源的数据可视化分析工具,帮助用户快速分析数据并洞察业务趋势,从而实现业务…

ahk系列-windows超级运行框-表达式计算(1)—get取值

1、环境准备 windows 7,8,10,11操作系统ahk 2.x_64位 2、使用方式 get 表达式 可以获取配置文件getconfig.txt中配置的值,get可以计算“[ ]”中的表达式 也可以获取用户,系统的环境变量,或者是path 只…

从零开始:同城O2O外卖APP的技术开发指南

随着互联网的迅速发展,O2O(OnlinetoOffline)模式在各个行业都取得了巨大成功,而同城外卖APP更是成为人们生活中不可或缺的一部分。本文将从零开始,为您提供一份同城O2O外卖APP的技术开发指南,让您能够深入了…

家政小程序源码,师傅竞价接单

家政预约上门服务小程序开发方案,php开发语言,前端是uniapp,有成品源码,可以二开,可以定制。 一家政小程序用户端功能:服务分类、在线预约、在线下单。 师傅端:在线接单,竞价&…

用C语言实现链栈的基本操作

#include <stdio.h> #include <malloc.h> #define ElemType char//相当于ElemType等同于char类型 //链式结构 数据域指针域 typedef struct LinkStackNode//定义一个链栈的结构体类型 {ElemType data;//ElemType是链栈的元素类型&#xff0c;代表数据域struct Lin…

在JSP项目中编写一个接口返回JSON 供JSP界面异步请求数据

首先 我们要引入json处理的依赖工具 在 pom.xml文件的 dependency 标签中加入如下代码 <dependency><groupId>com.googlecode.json-simple</groupId><artifactId>json-simple</artifactId><version>1.1.1</version> </dependenc…

mockito加junit实现单元测试笔记

目录 一、简介1.1 单元测试的特点1.2 mock类框架使用场景1.3 常用mock类框架1.3.1 mockito1.3.2 easymock1.3.3 powermock1.3.4 JMockit 二、mockito的单独使用2.1 mock对象与spy对象2.2 初始化mock/spy对象的方式初始化mock/spy对象第1种方式初始化mock/spy对象第2种方式初始化…

新版idea创建maven项目时的下载问题

新版idea创建时没有一个直接的maven选项 而是一个Maven Archetype选项&#xff0c;我们只需要选择它也是一样的&#xff0c;后面跟着选就行 配置国内下载源的方法如下&#xff1a; 1. 2. 3. 代码&#xff1a; <mirror> <id>alimaven</id> <name>al…

dell服务器安装PERCCLI

因在linux 系统中无法查看系统磁盘的raid级别&#xff0c;也无法得知raid状态&#xff0c;需要安装额外的包来监控&#xff0c;因是dell服务器&#xff0c;就在dell网站中下载并安装 1、下载链接&#xff1a;驱动程序和下载 | Dell 中国https://www.dell.com/support/home/zh-…

【评论送书】一本书讲透Java线程:原理与实践

摘要&#xff1a;互联网的每一个角落&#xff0c;无论是大型电商平台的秒杀活动&#xff0c;社交平台的实时消息推送&#xff0c;还是在线视频平台的流量洪峰&#xff0c;背后都离不开多线程技术的支持。在数字化转型的过程中&#xff0c;高并发、高性能是衡量系统性能的核心指…

流程画布开发技术方案归档(G6)

&#x1f3a8; 在理想的最美好世界中&#xff0c;一切都是为最美好的目的而设。 —— 伏尔泰 如果可以实现记得点赞分享&#xff0c;谢谢老铁&#xff5e; 一、技术选型 •从可维护性和可拓展性出发 •基本满足 1&#xff1a;链接: https://github.com/hukaibaihu/vue-org…

如何在报表工具 FastReport Cloud 中使用 ClickHouse

FastReport Cloud 是一项云服务 (SaaS)&#xff0c;旨在为您的企业存储、编辑、构建和发送报告。您的整个团队可以从世界任何地方访问这些报告&#xff0c;并且无需创建自己的应用程序。 FastReport Cloud 试用&#xff08;qun&#xff1a;585577353&#xff09;https://chat8.…

Linux C语言 39-进程间通信IPC之管道

Linux C语言 39-进程间通信IPC之管道 本节关键字&#xff1a;C语言 进程间通信 管道 FIFO 相关库函数&#xff1a;pipe、mkfifo、mknod、write、read 什么是管道&#xff1f; 管道通常指“无名管道”&#xff0c;是Unix系统中最古老的IPC通信方式。 管道的分类 管道&#…

2023下半年软件设计师 关于我用了半个月过了软件设计师这件事

前言 废话不多说、看图喽。刚可以查询、我就赶紧去查成绩 上午成绩是57分、下午成绩是45分。下午成绩刚好踩着及格线 有关备考 我是在工作之余外进行的备考、备考前前后后花了半个月。但是备考的很仓促、每天下班都要搞到十一二点。早上赶班车也在刷题&#xff0c;吃饭的时候也…

【JavaEE】生产者消费者模式

作者主页&#xff1a;paper jie_博客 本文作者&#xff1a;大家好&#xff0c;我是paper jie&#xff0c;感谢你阅读本文&#xff0c;欢迎一建三连哦。 本文于《JavaEE》专栏&#xff0c;本专栏是针对于大学生&#xff0c;编程小白精心打造的。笔者用重金(时间和精力)打造&…

期末速成数据库极简版【分支循环函数】(4)

目录 全局变量&局部变量 局部变量定义declare 局部变量赋值select 局部变量赋值select 【1】分支结构IF 【2】分支结构CASE 简单CASE语句 搜索CASE语句 【3】循环结构While 【4】系统函数 常用字符串函数 时间函数 【5】自定义函数—标量函数 函数创建 函…