AI大模型的使用-让AI帮你写单元测试

1.体验多步提示语

我们本节就让AI帮我们写一个单元测试,全程用AI给我们答案,首先单元测试前需要有代码,那么我们让AI给我们生成一个代码,要求如下:

用Python写一个函数,进行时间格式化输出,比如:
输入  输出
1  1s
61  1min1s
要求仅需要格式化到小时(?h?min?s),即可

假如AI给了我们这样一段代码,比如,输入 1 就返回 1s,输入 61 就返回 1min1s,代码如下:

def format_time(seconds):minutes, seconds = divmod(seconds, 60)hours, minutes = divmod(minutes, 60)if hours > 0:return f"{hours}h{minutes}min{seconds}s"elif minutes > 0:return f"{minutes}min{seconds}s"else:return f"{seconds}s"
print(format_time(1))

我们可以用单元测试一下下面代码,单元测试包采取pytest

!pip install pytest
import pytestdef test_format_time():assert format_time(1) == "1s"assert format_time(59) == "59s"assert format_time(60) == "1min0s"assert format_time(61) == "1min1s"assert format_time(3600) == "1h0min0s"assert format_time(3661) == "1h1min1s"

ok,没有问题,但是关注点放入这个单元测试,我们发现这个单元测试过于简单,很多边界情况或者容易出现异常的情况都没有测试到,如,没有包含异常情况以及类型不一致或者空情况的测试。

我们想让AI生成完美的单元测试就需要一步一步引导,让它理解代码是干什么的,才能进行单元测试的编写。

下面我们就给出代码让它解释出我们的代码是干嘛的,看解释的是否准确,代码比较简单,

1.定义代码变量code母的是将代码给到openAI让它解释这段代码,

2.定义prompt跟Ai说明需求,这里需求是“让它写单元测试,并用Python 3.10和pytest高级特性写代码出合适的单元测试代码验证有效性,写代码之前,先去了解作者的意图”将需求promot和代码传给 AI即可,

3.最后我们防止直接给出代测试代码(不完美的单元测试),我们需要用stop及时停止,让它只返回代码解释说明,看看它有没有理解。

#! pip install openai
import openai
openai.api_key='sk'
# 使用text-davinci-002模型,是一个通过监督学习微调的生成文本的模型。因为这里我们希望生成目标明确的文本的代码解释,所以选用了这个模型。
# openAI调用
def gpt35(prompt, model="text-davinci-002", temperature=0.4, max_tokens=1000, top_p=1, stop=["\n\n", "\n\t\n", "\n    \n"]):response = openai.Completion.create(model=model,prompt = prompt,temperature = temperature,max_tokens = max_tokens,top_p = top_p,stop = stop)message = response["choices"][0]["text"]return message# 代码
code = """
def format_time(seconds):minutes, seconds = divmod(seconds, 60)hours, minutes = divmod(minutes, 60)if hours > 0:return f"{hours}h{minutes}min{seconds}s"elif minutes > 0:return f"{minutes}min{seconds}s"else:return f"{seconds}s"
"""# promot跟AI说明要做什么
def explain_code(function_to_test, unit_test_package="pytest"):prompt = f""""# How to write great unit tests with {unit_test_package}In this advanced tutorial for experts, we'll use Python 3.10 and `{unit_test_package}` to write a suite of unit tests to verify the behavior of the following function.
```python
{function_to_test}Before writing any unit tests, let's review what each element of the function is doing exactly and what the author's intentions may have been.
- First,"""response = gpt35(prompt)return response, prompt
# 在最后一行用 “- First” 开头,引导 GPT 模型,逐步分行描述要测试的代码干了什么。# 封装调用
code_explaination, prompt_to_explain_code = explain_code(code)-
print(code_explaination)

结果:

the function `format_time` takes in a single parameter `seconds` which should be a `float` or an `int`.
- The function then uses `divmod` to calculate the number of `minutes` and `seconds` from the total number of `seconds`.
- Next, `divmod` is used again to calculate the number of `hours` and `minutes` from the total number of `minutes`.
- Finally, the function returns a `string` formatted according to the number of `hours`, `minutes`, and `seconds`.

接下来根据上面的反馈以及进一步的需求,让它帮忙写出一个简单的但是包含多种情况的单元测试例子,我们提出测试单元的需求,看看它能否给出可靠的全面的测试要求,代码如下,

# 要求如下
# 1.我们要求测试用例,尽量考虑输入的范围广一些。
# 2.我们要求 AI 想一些连代码作者没有想到过的边界条件。
# 3.我们希望 AI 能够利用好 pytest 这个测试包的特性。
# 4.希望测试用例清晰易读,测试的代码要干净。
# 5.我们要求测试代码的输出结果是确定的,要么通过,要么失败,不要有随机性。
def generate_a_test_plan(full_code_explaination, unit_test_package="pytest"):prompt_to_explain_a_plan = f"""A good unit test suite should aim to:
- Test the function's behavior for a wide range of possible inputs
- Test edge cases that the author may not have foreseen
- Take advantage of the features of `{unit_test_package}` to make the tests easy to write and maintain
- Be easy to read and understand, with clean code and descriptive names
- Be deterministic, so that the tests always pass or fail in the same way`{unit_test_package}` has many convenient features that make it easy to write and maintain unit tests. We'll use them to write unit tests for the function above.For this particular function, we'll want our unit tests to handle the following diverse scenarios (and under each scenario, we include a few examples as sub-bullets):
-"""prompt = full_code_explaination + prompt_to_explain_a_planresponse = gpt35(prompt)return response, prompttest_plan, prompt_to_get_test_plan = generate_a_test_plan(prompt_to_explain_code + code_explaination)
print(test_plan)

结果:当然每次执行返回不一样,因为大模型的随机性。可以看到它能够考虑到异常情况,以及字符不符合会出现什么问题。

 Normal inputs- `format_time(0)` should return `"0s"`- `format_time(1)` should return `"1s"`- `format_time(59)` should return `"59s"`- `format_time(60)` should return `"1min0s"`- `format_time(61)` should return `"1min1s"`- `format_time(3599)` should return `"59min59s"`- `format_time(3600)` should return `"1h0min0s"`- `format_time(3601)` should return `"1h0min1s"`- `format_time(3660)` should return `"1h1min0s"`- `format_time(7199)` should return `"1h59min59s"`- `format_time(7200)` should return `"2h0min0s"`
- Invalid inputs- `format_time(None)` should raise a `TypeError`- `format_time("1")` should raise a `TypeError`- `format_time(-1)` should raise a `ValueError`

可以根据它提供的修改为可执行的单元测试:

import pytestdef test_format_time():assert format_time(0) == "0s"assert format_time(1) == "1s"assert format_time(59) == "59s"assert format_time(60) == "1min0s"assert format_time(61) == "1min1s"assert format_time(3600) == "1h0min0s"assert format_time(3661) == "1h1min1s"assert format_time(7200) == "2h0min0s"assert format_time(None) == "TypeError"assert format_time("1") == "TypeError"assert format_time(-1) == "ValueError"

没问题继续往下走,要是生成的测试计划数不满意,可以判断用例数是否小于指定的数,如果是那么就继续promot让其再生成按照如下的要求。

not_enough_test_plan = """The function is called with a valid number of seconds- `format_time(1)` should return `"1s"`- `format_time(59)` should return `"59s"`- `format_time(60)` should return `"1min"`
"""approx_min_cases_to_cover = 7
# 上下文用例数是否小于指定数字
elaboration_needed = test_plan.count("\n-") +1 < approx_min_cases_to_cover 
# 是的话就提需求,在调用下AI
if elaboration_needed:prompt_to_elaborate_on_the_plan = f"""In addition to the scenarios above, we'll also want to make sure we don't forget to test rare or unexpected edge cases (and under each edge case, we include a few examples as sub-bullets):
-"""more_test_plan, prompt_to_get_test_plan = generate_a_test_plan(prompt_to_explain_code + code_explaination + not_enough_test_plan + prompt_to_elaborate_on_the_plan)print(more_test_plan)

结果:

The function is called with a valid number of seconds- `format_time(1)` should return `"1s"`- `format_time(59)` should return `"59s"`- `format_time(60)` should return `"1min"`
- The function is called with an invalid number of seconds- `format_time(-1)` should raise a `ValueError`- `format_time("1")` should raise a `TypeError`
- The function is called with a valid number of minutes- `format_time(60)` should return `"1min"`- `format_time(119)` should return `"1min59s"`
- The function is called with an invalid number of minutes- `format_time(-1)` should raise a `ValueError`- `format_time("1")` should raise a `TypeError`
- The function is called with a valid number of hours- `format_time(3600)` should return `"1h"`- `format_time(7199)` should return `"1h59min"`
- The function is called with an invalid number of hours- `format_time(-1)` should raise a `ValueError`- `format_time("1")` should raise a `TypeError`

2.根据测试计划生成测试代码

我们根据上面给的需求以及AI给的答案拼装到新添加的prompt的给到AI,然后让它给我们一个测试单元代码

def generate_test_cases(function_to_test, unit_test_package="pytest"):# 将内容加载到prompt的{starter_comment}中starter_comment = "Below, each test case is represented by a tuple passed to the @pytest.mark.parametrize decorator"# promptprompt_to_generate_the_unit_test = f"""Before going into the individual tests, let's first look at the complete suite                 of unit tests as a cohesive whole. We've added helpful comments to explain what      each line does.```pythonimport {unit_test_package}  # used for our unit tests{function_to_test}#{starter_comment}"""# 将所有的需求和ai给的结果拼接到prompt里,目的为了给的结果更准确full_unit_test_prompt = prompt_to_explain_code + code_explaination + test_plan + prompt_to_generate_the_unit_testreturn gpt35(model="text-davinci-003", prompt=full_unit_test_prompt, stop="```"), prompt_to_generate_the_unit_testunit_test_response, prompt_to_generate_the_unit_test = generate_test_cases(code)
print(unit_test_response)

结果:可以拿过去直接执行

#The first element of the tuple is the name of the test case, and the second element is a dict
#containing the arguments to be passed to the function.
@pytest.mark.parametrize("test_case_name, test_case_args",[("positive_integer", {"seconds": 1}),("positive_integer_60", {"seconds": 60}),("positive_integer_3600", {"seconds": 3600}),("positive_integer_3601", {"seconds": 3601}),("negative_integer", {"seconds": -1}),("negative_integer_60", {"seconds": -60}),("negative_integer_3600", {"seconds": -3600}),("negative_integer_3601", {"seconds": -3601}),("float", {"seconds": 1.5}),("float_60", {"seconds": 60.5}),("float_3600", {"seconds": 3600.5}),("string", {"seconds": "1"}),("string_60", {"seconds": "60"}),("string_3600", {"seconds": "3600"}),("string_3601", {"seconds": "3601"}),("decimal", {"seconds": Decimal("1")}),("decimal_60", {"seconds": Decimal("60")}),("decimal_3600", {"seconds": Decimal("3600")}),("decimal_3601", {"seconds": Decimal("3601")}),],
)
def test_format_time(test_case_name, test_case_args):# Here, we use the test case name to determine the expected output.# This allows us to DRY up our code and avoid repeating ourselves.if "positive_integer" in test_case_name:expected = f"{test_case_args['seconds']}s"elif "positive_integer_60" in test_case_name:expected = "1min"elif "positive_integer_3600" in test_case_name:expected = "1h"elif "positive_integer_3601" in test_case_name:expected = "1h0min1s"elif "negative_integer" in test_case_name:expected = f"-{test_case_args['seconds']}s"elif "negative_integer_60" in test_case_name:expected = "-1min"elif "negative_integer_3600" in test_case_name:expected = "-1h"elif "negative_integer_3601" in test_case_name:expected = "-1h0min1s"elif "float" in test_case_name:expected = f"{test_case_args['seconds']}s"elif "float_60" in test_case_name:expected = "1min0.5s"elif "float_3600" in test_case_name:expected = "1h0.5s"elif "string" in test_case_name:expected = f"{test_case_args['seconds']}s"elif "string_60" in test_case_name:expected = "1min"elif "string_3600" in test_case_name:expected = "1h"elif "string_3601" in test_case_name:expected = "1h0min1s"elif "decimal" in test_case_name:expected = f"{test_case_args['seconds']}s"elif "decimal_60" in test_case_name:expected = "1min"elif "decimal_3600" in test_case_name:expected = "1h"elif "decimal_3601" in test_case_name:expected = "1h0min1s"# Now that we have the expected output, we can call the function and assert that the output is

那么如果全程自动化的话,我并不知道是否给的代码是否是有语句错误等行为,所以我们可以借用AST 库进行语法检查。

3.通过AST 库进行语法检查

可以检测下AI生成的代码,用Python 的 AST 库来完成。代码也是很简单,我们找到代码片段,将代码传给ast.parse()进行校验,有问题则抛出异常

# 语义检查
import ast
# 找到代码的索引
code_start_index = prompt_to_generate_the_unit_test.find("```python\n") + len("```python\n")
# 找到prompt_to_generate_the_unit_test里从187到最后的内容,并拼接单元测试代码的内容
code_output = prompt_to_generate_the_unit_test[code_start_index:] + unit_test_response
print("code_output:",code_output)# 进行语义检查
try:ast.parse(code_output)
except SyntaxError as e:print(f"Syntax error in generated code: {e}")

本节知识资料感谢徐文浩老师的《AI大模型之美》,让我感受它是真的美!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/57371.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

WPF基础入门-Class4-WPF绑定

WPF基础入门 Class4&#xff1a;WPF绑定 一、简单绑定数据 1、cs文件中设置需要绑定的数据&#xff1a; public partial class Class_4 : Window{public Class_4(){InitializeComponent();List<Color> test new List<Color>();test.Add(new Color() { Code &q…

leetcode算法题--使子序列的和等于目标的最少操作次数

原题链接&#xff1a;https://leetcode.cn/problems/minimum-operations-to-form-subsequence-with-target-sum/description/ 视频讲解&#xff1a;https://www.bilibili.com/video/BV1Em4y1T7Bq?t1456.1 这题是真的难。。 func minOperations(nums []int, target int) int…

netty与websockt实现聊天

配置websockt&#xff1a; import lombok.Data; import org.springframework.boot.context.properties.ConfigurationProperties; import org.springframework.context.annotation.Configuration;/*** websocket配置*/ Data Configuration ConfigurationProperties(prefix &qu…

PHP获取两个日期之间的所有日期

下面是一个示例代码&#xff0c;用于计算给定开始和结束日期之间的所有日期&#xff1a; <?phpfunction getDatesBetween($start_date, $end_date) {// 初始化结果数组$dates array();// 将开始日期转换为时间戳$current_date strtotime($start_date);$end_date strtot…

Java并发编程第6讲——线程池(万字详解)

Java中的线程池是运用场景最多的并发框架&#xff0c;几乎所有需要异步或并发执行任务的程序都可以使用线程池&#xff0c;本篇文章就详细介绍一下。 一、什么是线程池 定义&#xff1a;线程池是一种用于管理和重用线程的技术&#xff08;池化技术&#xff09;&#xff0c;它主…

微服务中间件--分布式搜索ES

分布式搜索ES 11.分布式搜索 ESa.介绍ESb.IK分词器c.索引库操作 (类似于MYSQL的Table)d.查看、删除、修改 索引库e.文档操作 (类似MYSQL的数据)1) 添加文档2) 查看文档3) 删除文档4) 修改文档 f.RestClient操作索引库1) 创建索引库2) 删除索引库/判断索引库 g.RestClient操作文…

http协议与apache

http概念&#xff1a; 互联网&#xff1a;是网络的网络&#xff0c;是所有类型网络的母集 因特网&#xff1a;世界上最大的互联网网络。即因特网概念从属于互联网概念 万维网&#xff1a;万维网并非某种特殊的计算机网络&#xff0c;是一个大规模的、联机式的信息贮藏库&…

C++11---std::bind

下面这段代码解析 std::function<decltype(f(args...))()> func std::bind(std::forward<F>(f), std::forward<Args>(args)...); 这行代码的作用是创建一个 std::function 对象 func&#xff0c;将其绑定到一个可调用对象上。 让我们逐步解释这行代码的各…

长胜证券:沪指探底回升涨0.47%,券商、酿酒板块拉升,传媒板块活跃

24日早盘&#xff0c;沪指盘中震动回落&#xff0c;接近午盘快速拉升走高&#xff1b;深成指、创业板指强势上扬&#xff1b;北向资金今天转向&#xff0c;早盘积极出场&#xff0c;半日净买入近30亿元。 到午间收盘&#xff0c;沪指涨0.47%报3092.88点&#xff0c;深成指涨1.1…

最新AI创作系统ChatGPT源码+详细图文部署教程/支持GPT-4/AI绘画/H5端/Prompt知识库/思维导图生成

一、AI系统 如何搭建部署AI创作ChatGPT系统呢&#xff1f;小编这里写一个详细图文教程吧&#xff01;SparkAi使用Nestjs和Vue3框架技术&#xff0c;持续集成AI能力到AIGC系统&#xff01; 1.1 程序核心功能 程序已支持ChatGPT3.5/GPT-4提问、AI绘画、Midjourney绘画&#xf…

Django(8)-静态资源引用CSS和图片

除了服务端生成的 HTML 以外&#xff0c;网络应用通常需要一些额外的文件——比如图片&#xff0c;脚本和样式表——来帮助渲染网络页面。在 Django 中&#xff0c;我们把这些文件统称为“静态文件”。 我们使用static文件来存放静态资源&#xff0c;django会在每个 INSTALLED…

Vue——axios的二次封装

文章目录 一、请求和传递参数1、get 请求2、post 请求3、axios 请求配置 二、axios 的二次封装1、配置拦截器2、发送请求 三、API 的解耦1、配置文件对应的请求2、获取请求的数据 四、总结 一、请求和传递参数 在 Vue 中&#xff0c;发送请求一般在 created 钩子中&#xff0c…

LiveGBS伴侣

【1】LiveGBS 简介 LiveGBS是一套支持国标(GB28181)流媒体服务软件。 国标无插件;提供用户管理及Web可视化页面管理&#xff1b; 提供设备状态管理&#xff0c;可实时查看设备是否掉线等信息&#xff1b; 实时流媒体处理&#xff0c;PS&#xff08;TS&#xff09;转ES&…

githubssh配置

GitHub SSH配置是用来将本地计算机与GitHub服务器之间建立安全连接的一种方法。它允许用户通过SSH密钥进行身份验证&#xff0c;从而实现无需每次都输入用户名和密码的登录过程。 以下是在Windows环境下配置GitHub SSH的步骤&#xff1a; 首先&#xff0c;在本地计算机上打开…

GFPGAN 集成Flask 接口化改造

GFPGAN是一款腾讯开源的人脸高清修复模型&#xff0c;基于github上提供的demo&#xff0c;可以简单的集成Flask以实现功能接口化。 GFPGAN的安装&#xff0c;Flask的安装请参见其他文章。 如若使用POSTMAN进行测试&#xff0c;需使用POST方式&#xff0c;form-data的请求体&am…

5G 数字乡村数字农业农村大数据中心项目农业大数据建设方案PPT

导读&#xff1a;原文《5G 数字乡村数字农业农村大数据中心项目农业大数据建设方案PPT》&#xff08;获取来源见文尾&#xff09;&#xff0c;本文精选其中精华及架构部分&#xff0c;逻辑清晰、内容完整&#xff0c;为快速形成售前方案提供参考。以下是部分内容&#xff0c; 喜…

TCP协议的重点知识点

TCP协议的重点知识点 TCP(传输控制协议)是一种面向连接、可靠的数据传输协议,工作在传输层,提供可靠的字节流服务。它是互联网协议栈中最重要、最复杂的协议之一,也是面试中常被问到的知识点。本文将详细介绍TCP协议的各个重要概念。 TCP基本特性 TCP主要具有以下基本特性: …

云原生周刊:CNCF 宣布 KEDA 毕业 | 2023.8.28

开源项目推荐 KDash KDash 是一个用 Rust 构建的简单快速的 Kubernetes 仪表板。它提供了一个终端界面&#xff0c;用于监视和管理 Kubernetes 集群。该仪表板具有多种功能&#xff0c;包括节点指标、资源监视、自定义资源定义、容器日志流式传输、上下文切换等。它还支持不同…

Django(9)-表单处理

django支持使用类创建表单实例 polls/forms.py from django import forms class NameForm(forms.Form):your_nameforms.CharField(label"Your name",max_length100)这个类创建了一个属性&#xff0c;定义了一个文本域&#xff0c;和它的label和最大长度。 polls/vi…

浅析Linux SCSI子系统:设备管理

文章目录 概述设备管理数据结构scsi_host_template&#xff1a;SCSI主机适配器模板scsi_host&#xff1a;SCSI主机适配器主机适配器支持DIF scsi_target&#xff1a;SCSI目标节点scsi_device&#xff1a;SCSI设备 添加主机适配器构建sysfs目录 添加SCSI设备挂载LunIO请求队列初…