哈喽大家好,我是chowley,最近sora真是垄断了科技区的话题榜,几乎每个技术博主都上来讲两句
我在半年前也是一名深度学习的研究者,今天我以测试开发工程师的视角来解读一下sora!
首先打开OpenAI官网的sora页面,映入眼帘的就是文字+背景视频的介绍
视频相信大家在网上已经看过不少了,简单来说就是我输入一段文字描述一个场景,然后sora来理解文本、生成视频,那如果我是OpenAI的QA会如何测试这个功能呢?
下面我就从前端UI、接口、代码三方面分别来介绍一下
前端UI测试
首先幻想一下sora公测那天的交互界面,如果OpenAI不想让用户有过多的操作,只留一个文字框收集文字描述就行了,然后就是生成视频后的展示、播放、下载等,那么它大概率长这样
- 文本输入框测试: 确保文本输入框可以接受用户输入,并且能够正确显示输入的文本。
- 提交按钮测试: 点击提交按钮后,验证是否能够正确触发生成视频的操作。
- 视频展示区域测试: 确保生成的视频能够正确显示在页面上。
- 视频相关操作:播放、暂停、下载、静音、速度、分辨率、色彩、饱和度、文字编码等。
- 响应式设计测试: 测试不同设备下页面的显示效果,确保在不同分辨率下都能够正常使用。
接口测试
接口测试不是公司内部人员自然无法进行,我也不知道它的接口名是啥,虽然可以抓包看看,但没有接口文档的话,参数的内容、格式、顺序就很难对得上
那我就假设这个功能只涉及三个接口,一个接受文本,一个生成视频,一个回传视频到用户端
- 文本解析接口测试: 测试文本输入是否能够正确解析并转换成视频生成的请求。
- 视频生成接口测试: 验证视频生成接口是否能够根据文本生成对应的视频文件,当然这个不是简单说说就能测出来的,需要借助CV+NLP进行特征分析和比对,这里就不细说了。
- 视频回传接口测试: 测试视频回传接口是否能够正确返回生成的视频文件。
代码测试
代码测试要求的权限就更高了,在一些公司里,除了开发能看自己的代码,其他的角色是都没有read权限的,像OpenAI这样每个产品都有可能颠覆行业的公司,保密系数自然更高,但正常来说代码测试都分为:单元测试、模块测试、集成测试等
- 单元测试: 对关键逻辑进行单元测试,确保各个模块的功能正常。
- 模块测试:将几个相互之间有关联的模块拼接在一起进行测试。
- 集成测试: 验证各个模块之间的交互是否正确,确保整体功能正常。
总结
通过前端UI、接口、代码三方面的测试,我们可以全面评估sora在文本理解和视频生成方面的功能和表现。前端UI测试确保用户能够正常使用页面,接口测试验证系统能够正确解析文本并生成对应的视频,代码测试则保证了系统的稳定性和可靠性。
这两年的AI产品层出不穷,也带来了很多的焦虑思考,好像大部分人都要被代替,又赶上大环境不好,很多技术能力强的工程师‘英年早退’,但生活还要继续,期待明天会更好!
好了,以上就是本文的全部内容,如有问题欢迎留言讨论。
本人正在组建测试开发方向的交流社区,如果您对软件质量管理方面感兴趣,欢迎私信我了解。
我是chowley,一个专注互联网技术和软件质量保障领域的博主,我们下次再见!
欢迎点赞、评论、收藏,it's important for me.
欢迎点赞、评论、收藏,it's important for me.
欢迎点赞、评论、收藏,it's important for me.