分享一个用AI降本的思路,不懂代码也能上手

如何用AI解决实际的业务问题?

生财圈友@我来利用ChatGPT做算法建模,每年为公司省下6万元。

今天他将分享通过ChatGPT进行数据分析的思路,从最开始定义问题到最终数据论证。

上手的实操过程门槛并不高,但可以实现把官方电商平台的流量指数,转化为真实的销量等我们想要的数据。

希望今天的这篇分享,对大家有所启发。

图片

大家好,我是我来。

最近使用GPT,为公司每年省下了至少6万元。

原因是拟合出生意参谋(淘宝数据)&罗盘策略(抖音数据),行业竞争版块指数与真实值之间的函数关系,帮助公司获取真实的市占率等数据。

希望给大家带来一些思考,如果你能用在自己业务中也降低成本就更好了。

有一些数据分析的逻辑,对不熟悉这个领域的同学有些硬核,没关系,大家可以参考我解决问题的思路来处理自己的业务问题。

这个案例,是我如何使用GPT解决问题的全过程,从最开始定义问题到最终数据论证。

Part 1

背景信息

做电商的老板,一般都很关注自己品牌在行业内的市占率。市占率的数据获取,一般有2种途径。

01 官方平台

生意参谋、罗盘策略、京东商智等官方平台,会有行业竞争版块。

但平台方不希望品牌方拿到竞品的真实销售额,给的都是指数,没有办法看到实际的市占、竞品销售情况。

只能看到处理后的:交易指数、金额指数、流量指数等信息。

图片

图片

图片

(向右滑动以查看)

02 第三方平台

购买第三方平台的数据,如情报通、飞瓜。

第三方平台往往比较贵,比如情报通两个类目三个平台一年至少20w,且还是按周更新的。并且,第三方平台的稳定性和准确性,都不算太好。

所以说,能选官方当然选官方。之前生意参谋行业竞争数据,还可以用店透视、小旺神等插件进行转换,从而拿到真实数据。

图片

但最近,官方平台的指数算法升级,不同店铺的账号,看到同一个品牌的指数是不一样的,风控更严了。导致第三方插件逐渐无法使用。

图片

(点击查看大图)

但是,大盘销售额、本竞品市占率,又都是品牌方非常关注的指标,怎么办啊?

Part 2

探寻解法

遇事不决GPT,这事儿当然要找GPT,我就去找了它。

图片

GPT回答的第一点让我眼前一亮,困扰我们的问题的解法找到了!

通过找出历史数据中的销售额与相应时期的指数关系,建立数据模型,就可以测算出指数对应的大概销售额。

这题我会啊,不就是找y和x之间的函数关系,指数看成自变量x,实际成交金额看成因变量y。

只要能找出y与x之间的函数关系,我们可以去平台上获取指数x,通过函数关系计算出y的值,这题也就有解了。

此时的我,看到了希望······

然后,又陷入了绝望。这函数关系,咋找呢?我是数据产品经理,又不是算法工程师,要搞数据拟合,还要准确,这题咋解?

遇事不决GPT,我又把眼光投向了GPT,人我是PUA不了的,但GPT我可以无限PUA啊。

图片

唉,这个流程和数据分析很接近啊,数据分析我熟,这题大概能解了。

合并了一下思路,接下来要做三步:

1、数据收集与预处理

2、数据探查与模型建立

3、模型评估与验证

Part 3

实现过程

下面结合抖音-罗盘策略的品牌榜为例,来说说我的实现过程。生意参谋和京东商智也是一样的道理。

01 数据收集与预处理

之前明确过,测算的本质是:基于本品牌的历史数据,寻找指数与实际成交金额之间的函数关系,拟合出一个函数公式。

所以我们需要两部分数据:

1、本品牌的历史销售数据

2、行业竞争品牌榜的本品牌每日的指数值

把这两部分数据找出来之后,做个数据透视,留下需要的字段和数据。注意做好数据脱敏,最好把品牌相关信息去掉。

1、历史销售数据,保留以下字段:日期、品牌名称、销售额。

2、行业竞争品牌榜指数,筛选出自己品牌的指数数据,其他删掉,保留一下字段:日期、品牌名称、指数。

然后将这两部分数据,使用VLOOKUP函数合并到一张表格中。得到下图这样一张表,接下来就是寻找指数与销售额之间的函数关系了。

图片

可能有朋友在这一步就卡住了,Vlookup函数只能针对指定的一列做处理,没有办法处理两列啊。

没关系,遇事不决GPT,不妨我们把这个问题也丢给GPT看看。

你是一位excel处理专家。接下来需要问你一个excel问题,

我有两张数据表:

1)历史销售数据,字段有:日期、品牌名称、销售额。

2)行业竞争品牌榜指数,字段有:日期、品牌名称、指数。

我需要将第一张表的销售额拼到第二张表,根据日期和品牌名称拼,就是说,这两个字段一样时,拼过来。

我应该怎么操作?

图片

(向右滑动以查看)

再来看看更高阶的玩法,让GPT-4的代码解释器处理好给到我们。

在这里插入图片描述

(向右滑动以查看)

聊聊代码解释器

23年,GPT-4上线了代码解释器,它有一个很好用的地方是:允许模型自动生成代码,并且能够运行代码,当发现代码运行出错时,能自动修改代码继续运行。

这对于不会编程或者编程能力较弱的人来说是一个很大的福音,可以通过提示词来让GPT运行程序帮助自己处理一些问题。尤其是后来GPT又升级了一次,可以输入文件和导出文件。

这就意味着,我可以丢给GPT几个文件,然后让它处理,处理好之后把文件输出出来,整个过程相当丝滑。

就好比:我们提了一个数据处理的需求给Python工程师,工程师帮我们处理好了之后,然后又丢给我了。相当于有了一个可以无限PUA的Python工程师,让它干啥它就干啥,还从来不和你争论,一个月的工钱还不到200元。

代码解释器做数据处理有啥好处?

1、GPT-4做数据处理的原理是先自动编写Python脚本,通过Python做数据处理,所以不用担心它发生胡说

2、GPT-4可以上传多个文件,这样使得我们可以把数据文件上传给GPT-4,让它做处理

3、GPT-4可以输出文件,这样使得我们可以直接下载GPT-4处理好的文件

使用代码解释器的注意事项

1、代码解释器在封闭的环境下运行,且没有办法安装新的库(库在Python可以简单理解为一个个插件),也就是说如果没有这个库,可能Python是没有办法运行的。当然常用的一些库肯定是有的,比如数据分析、图表可视化、图像处理、机器学习等

2、注意数据脱敏,毕竟数据是需要上传给GPT的

3、提示词的写法,需要清晰、明确、具体

4、代码解释器目前的算力有限,且计算时间很小,如果数据量级过大目前还不太能处理。

使用Python做数据处理的注意点

1)一维数据、二维数据

一维数据:一般从各个平台下载下来的数据都是一维的,比如下图这种,字段(维度or指标)在一行,然后就是一条一条的数据

在这里插入图片描述

二维数据:一般是最终处理后的报表,比如下图,行与列均有对应的字段(维度or指标)
在这里插入图片描述

使用Python一般处理一维数据会比较好,二维数据,Python也能处理,但复杂度会高很多。所以,建议只给一维数据做处理。

2)数据处理类提示词写法注意点

数据类指令对清晰和明确要求会更高,所以在写此类指令要写清楚:有什么(输入),希望怎么处理(处理步骤),最后希望得到什么样的结果(输出)。

比如我这一段指令:

(角色设定)**你是一位Python处理专家,

输入)**接下来我会给你发两个文件:本品牌销售额、本品牌指数。

1)本品牌销售额字段有:日期、品牌名称、销售额

2)本品牌指数有:日期、品牌名称、指数

(处理过程)我希望你讲这两个文件合到一起,将本品牌销售额表中的销售额按照日期和品牌名称拼到本品牌指数表中

(输出)处理完之后,输出excel给我。

注释:

付费读书会产品的设计和销售

《视频号直播卖读书会 | 4小时进账2W+》@阿猫

付费减脂训练营的设计和实操

《0元投入变现4.5W,复购率超50%线上减脂营项目复盘》@小达

1、尽可能清晰明确,会发现我把字段全部列出来了,并告诉对方要怎么处理,“将本品牌销售额表中的销售额按照日期和品牌名称拼到本品牌指数表中”,这在数据逻辑中其实是左关联。

如果不明确,GPT也可以理解为另一种含义,“将本品牌指数表中的指数按照日期和品牌名称拼到本品牌销售表中。”

其实这是两种不同的含义,可能会导致结果出错。

2、如果处理步骤过多,最好描述清楚每一步的操作,减少大模型的思考,更容易得到自己需要的结果,比如下面这个提示词:

图片

总结 | 基于GPT-4的3种数据处理方式

图片

(点击查看大图)

大家可能到这一步,基本的数据处理能力就具备了,接下来会和大家分享稍微硬核点的内容,如何用GPT做算法调教。

这里涉及一些数据分析的逻辑,算法复杂不复杂都不重要,因为最后都是投喂给GPT去做的。

02 数据探查与算法建模

这部分是最重要的,需要我们通过GPT拟合出这两者之间的函数关系。

这部分需要对算法有一些基本的理解,先分享一些我理解的基本逻辑(我没有搞过算法,以下均是我个人在这次调教过程中总结的一些经验)

算法拟合基本的逻辑:数据预处理 >> 选择合适的算法模型 >> 调教模型,确定参数 >> 数据验证。

在这里插入图片描述

(点击查看大图)

关键点:

模型选择:模型有很多种,线性回归、多项式回归、决策树等等,需要根据我们当前面临的问题选择合适的模型,比如回归问题适合使用线性回归,分类问题适合决策树。

评估指标确定:一个判断什么样的模型是合格的标准,基于这个标准,我们可以选择到合适的模型。

这里带大家回忆一下高中数学学习过的线性回归,就是一个算法模型的处理过程。

数据探查:我们一般会先画散点图,观察趋势

模型选择:然后再使用线性回归方程求出参数

效果评估:计算R^2的值来评估模型拟合的好坏

图片

(向右滑动以查看)

本次可能用到的算法模型:

图片

(点击查看大图)

好了,我们回头来看看这次的案例。

数据探查 | 先让GPT预处理

我们可以先让GPT自己处理一下,看看GPT的效果:

图片

图片

(向右滑动以查看)

处理的时候会发现,GPT虽然拟合的效果不错,但与我们最终的目标还是差了点。

算法建模 | 反复调教GPT来修正结果

就像我们刚刚讲的,有两个关键点,我们来看看:

模型选择:不妨先从线性回归模型尝试,然后再尝试多项式回归(这里直接和大家说结论,指数测算需要使用分段函数,每一段内分别用一次项、二次项、三次项进行拟合)

评估指标:使用R^2和差值率(计算公式为:(测算金额-实际金额)/实际金额)。选择这两个指标的原因如下:

R^2,是统计学中用来评估模型的重要标准

差值率,是我们判断拟合效果的核心指标(最后会计算差值率作为监控的指标)

这里给大家贴一下我当时调教的记录:

图片

(向右滑动以查看)

按照这样的方式不断调教,每次让GPT给我们15种方案,直到我们能找到R^2>99% ,-5%< 差值率 < 5%的函数关系。

03 模型效果评估

测算完之后,需要验证这套公式是否可以使用。

验证方法如下:

验证标准:将实际成交金额与用指数计算出来的成交金额做差值比对。

1)通过GPT拟合出来的公式,计算成交金额

2)计算两个值,差值 = 计算成交金额 - 实际成交金额,差值率 = (计算成交金额 - 实际成交金额)/实际成交金额

图片

最后会得到类似于上图的数据,可以看出来误差很小,基本上就可以判断:指数测算成功。

Part 4

最后效果

用GPT测算的结果怎么样?

根据上面找到的拟合方法,我们先来看看最终实现的结果:

天猫 / 抖音 / 京东,均可以测算出指数与实际金额之间的关系,误差在5%以内,且数据量越大、数据质量越高,误差越小。

下图是三个平台能否测算的结论:

图片

** 注释:最新消息,生意参谋行业竞争版块在4月30日发生调整,行业大盘会下线,其余变成区间值。

然后和大家分享一下,目前实现的效果:

在一张电子表格中,每天监控天猫/京东/抖音,三大平台的指定类目下的行业销售额、本竞品市占率,每天上午可自动生成监控报表。

图片

总结 | 目前AI大模型在数据层面的应用

图片

如何学习AI大模型?

现在社会上大模型越来越普及了,已经有很多人都想往这里面扎,但是却找不到适合的方法去学习。

作为一名资深码农,初入大模型时也吃了很多亏,踩了无数坑。现在我想把我的经验和知识分享给你们,帮助你们学习AI大模型,能够解决你们学习中的困难。

我已将重要的AI大模型资料包括市面上AI大模型各大白皮书、AGI大模型系统学习路线、AI大模型视频教程、实战学习,等录播视频免费分享出来,需要的小伙伴可以扫取。

在这里插入图片描述

一、AGI大模型系统学习路线

很多人学习大模型的时候没有方向,东学一点西学一点,像只无头苍蝇乱撞,我下面分享的这个学习路线希望能够帮助到你们学习AI大模型。

在这里插入图片描述

二、AI大模型视频教程

在这里插入图片描述

三、AI大模型各大学习书籍

在这里插入图片描述

四、AI大模型各大场景实战案例

在这里插入图片描述

五、结束语

学习AI大模型是当前科技发展的趋势,它不仅能够为我们提供更多的机会和挑战,还能够让我们更好地理解和应用人工智能技术。通过学习AI大模型,我们可以深入了解深度学习、神经网络等核心概念,并将其应用于自然语言处理、计算机视觉、语音识别等领域。同时,掌握AI大模型还能够为我们的职业发展增添竞争力,成为未来技术领域的领导者。

再者,学习AI大模型也能为我们自己创造更多的价值,提供更多的岗位以及副业创收,让自己的生活更上一层楼。

因此,学习AI大模型是一项有前景且值得投入的时间和精力的重要选择。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/16212.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

c++ 虚函数常见问题

1 虚函数&#xff0c;虚表基础 虚函数&#xff0c;虚表基础 2 虚函数表保存在哪里 ? 虚函数表在编译的时候确定。在 linux 下&#xff0c;保存在只读数据段的重定位段&#xff0c;这个段的名字是 .data.rel.ro。 如下代码&#xff0c;编译之后&#xff0c;使用 readelf -t a…

仿《Q极速体育》NBACBA体育直播吧足球直播综合体育直播源码

码名称&#xff1a;仿《Q极速体育》NBACBA体育直播吧足球直播综合体育直播源码 开发环境&#xff1a;帝国cms7.5 空间支持&#xff1a;phpmysql 仿《Q极速体育》NBACBA体育直播吧足球直播综合体育直播源码自动采集 - 我爱模板网源码名称&#xff1a;仿《Q极速体育》NBACBA体育直…

网络攻防概述(基础概念)

文章目录 APTAPT概念APT攻击过程 网络空间与网络空间安全网络空间(Cyberspace)网络空间安全(Cyberspace Security) 网络安全属性机密性(Confidentiality或Security)完整性(Integrity)可用性&#xff08;Availability&#xff09;不可否认性&#xff08;Non-repudiation&#xf…

如何学习计算机网络(超详细,方法论)

分享一下学习计算机网络的方法论 首先是看视频&#xff1a; 这里我推荐中科大郑烇、杨坚全套《计算机网络&#xff08;自顶向下方法 第7版》课程 课程目标_哔哩哔哩_bilibili 教材采用神书《计算机网络&#xff08;自顶向下方法&#xff09;》&#xff0c;授课风格更偏向实…

企业如何正确地利用LLM大模型?

大型语言模型 (LLM) 不值得信任。就是这样。 考虑到它们先进的 AI 能力以及当今强大的基础模型的普遍知识&#xff0c;这似乎是一件令人惊讶的事情。然而&#xff0c;问题的关键在于 LLM 无法解释其输出。你不能信任 LLM 的结果&#xff0c;不是因为它不准确&#xff0c;而是因…

无畏并发: Rust Mutex的基本使用

并发是很多编程语言避不开的一块主要内容&#xff0c;主打一个无畏并发的Rust自然也面临这样的挑战。Rust中的Mutex提供了强大的同步原语&#xff0c;确保共享数据的线程安全&#xff0c;这篇文章中&#xff0c;我们会探讨Mutex的使用&#xff0c;从基础的用法到一些高阶内容。…

2024电工杯B题平衡膳食食谱的优化设计及评价原创论文分享

大家好&#xff0c;从昨天肝到现在&#xff0c;终于完成了2024电工杯数学建模B题的完整论文啦。 实在精力有限&#xff0c;具体的讲解大家可以去讲解视频&#xff1a; 给大家看一下目录吧&#xff1a; 目录 摘 要&#xff1a; 10 一、问题重述 14 二&#xff0e;问题分析 …

Python学习---基于HTTP的服务端基础框架搭建案例

整体功能&#xff1a; 1 创建框架构建相关的文件夹 2 创建app,模块文件 3 在 app模块文件中创建application函数(用于处理请求) 4 将request_handler()中的处理逻辑交由app模块的application函数完成 5 app模块的 application函数返回响应报文 6 在application 文件夹中创建一个…

淘工厂订单导出自动化工具

目录 下载安装与运行 主要目的 其他工具的弊端 本工具的优势 视频演示 下载新版后的注意事项 支持的导出项 什么叫一单多拍 常见问题 如何实现快捷登录 导出卡住时如何操作 如何精确导出 下载安装与运行 下载、安装与运行 语雀 主要目的 导出订单信息&#xf…

知识分享:隔多久查询一次网贷大数据信用报告比较好?

随着互联网金融的快速发展&#xff0c;越来越多的人开始接触和使用网络贷款。而在这个过程中&#xff0c;网贷大数据信用报告成为了评估借款人信用状况的重要依据。那么&#xff0c;隔多久查询一次网贷大数据信用报告比较好呢?接下来随小易大数据平台小编去看看吧。 首先&…

某钢铁企业数字化转型规划案例(114页PPT)

案例介绍&#xff1a; 该钢铁企业的数字化转型案例表明&#xff0c;数字化转型是钢铁企业应对市场竞争、提高生产效率、降低成本、优化资源配置和降低能耗排放的重要手段。通过引入先进的技术和管理理念&#xff0c;加强员工培训和人才引进&#xff0c;企业可以成功实现数字化…

欢乐钓鱼大师游戏攻略:自动钓鱼技巧!

《欢乐钓鱼大师》是一款极具趣味性和挑战性的钓鱼模拟游戏&#xff0c;为玩家提供了一个体验钓鱼乐趣的虚拟世界。从湖泊到河流&#xff0c;再到广袤的海洋&#xff0c;游戏中的各种钓场让人流连忘返。无论是新手钓友&#xff0c;还是经验丰富的老钓手&#xff0c;都可以在游戏…

k8s集群中pod的容器资源限制和三种探针

一、资源限制 总结&#xff1a; requests表示创建pod时预留的资源&#xff0c;limits表示pod能够使用资源的最大值。requests值可以被超&#xff0c;limits值不能超过&#xff0c;如果是内存使用超过limits会触发oom然后杀掉进程&#xff0c;如果是cpu超过limits会压缩cpu的使用…

20.SkyWalking

一.简介 SkyWalking用于应用性能监控、分布式链路跟踪、诊断&#xff1a; 参考连接如下&#xff1a; https://github.com/apache/skywalking https://skywalking.apache.org/docs/ 二.示例 通过官网连接进入下载页面&#xff1a;https://archive.apache.org/dist/skywalkin…

揭秘章子怡成功之路:她是如何征服世界的?

章子怡的演艺生涯可谓是一部传奇❗❗❗ 从一个普通工人家庭的女孩&#xff0c;到如今的国际巨星 她的每一步都充满了努力和汗水 她的舞蹈基础为她日后的演艺事业奠定了坚实的基础 而她对戏剧和电影的热爱更是让她在演艺道路上不断前行 从《我的父亲母亲》到《卧虎藏龙》&…

代码随想录|Day55|动态规划 part15|● 392.判断子序列 ● 115.不同的子序列

392.判断子序列 class Solution: def isSubsequence(self, s: str, t: str) -> bool: dp [[0] * (len(t) 1) for _ in range(len(s) 1)] for i in range(1, len(s) 1): for j in range(1, len(t) 1): if s[i - 1] t[j - 1]: dp[i][j] dp[i - 1][j - 1] 1 else: dp[i…

【UE5.1 角色练习】06-角色发射火球-part2

目录 效果 步骤 一、火球生命周期 二、添加可被伤害的NPC 三、添加冲量 在上一篇&#xff08;【UE5.1 角色练习】06-角色发射火球-part1&#xff09;基础上继续实现角色发射火球相关功能 效果 步骤 一、火球生命周期 为了防止火球没有命中任何物体而一直移动下去&#…

【全开源】赛事报名系统源码(Fastadmin+ThinkPHP和Uniapp)

基于FastadminThinkPHP和Uniapp开发的赛事报名系统&#xff0c;包含个人报名和团队报名、成绩查询、成绩证书等。 构建高效便捷的赛事参与平台 一、引言&#xff1a;赛事报名系统的重要性 在举办各类赛事时&#xff0c;一个高效便捷的报名系统对于组织者和参与者来说都至关重…

WebService的wsdl详解

webservice服务的wsdl内容详解&#xff0c;以及如何根据其内容编写调用代码 wsdl示例 展示一个webservice的wsdl&#xff0c;及调用这个接口的Axis客户端 wsdl This XML file does not appear to have any style information associated with it. The document tree is shown…

编译aosp刷入pixel 真机得问题记录

编译aosp要做什么&#xff08;ubuntu下编译问题相对少&#xff09; 需要vmware并且已经安装了ubuntu镜像系统 直接切换到root 避免后期避免麻烦 参考地址 https://mp.weixin.qq.com/s/yJp3ijIxykiMmNVYr2V1nQ apt install git //安装git sudo apt install git//给git设置用户…