绿野仙踪不仅是童话,还是便宜又好用的产品测试法!

以 ChatGPT 为代表的大语言模型爆火后,推动了对话类人工智能产品的高速发展,我们已经看到了如智能助理、问答系统、自动写作等多种类型的个性化对话类 AI 服务。 AI 能力的提升让人们对智能 AI 产品的期望越来越高,相关产品的用户体验也因此变得重要起来。而用户测试是保障产品用户体验的重要方法,对于 AI 类产品也不例外。

但与传统使用图形界面的产品不同,以自然语言作为输入的对话类 AI 产品的用户测试仍然面临着一定的挑战。

图片

在传统图形界面中,用户的交互指令是相对有限的,因为界面中的按钮、菜单选项等都是有固定数量的,我们可以预期单个任务的用户交互路径数量。

然而,因人类语言系统的开放性,在对话类的 AI 产品中,用户为使用一个功能所给出的语音指令是无限的,这大大增加了测试的难度。尤其是在产品概念期和设计早期,在 AI 系统尚未实现全部功能时,如何通过有限的系统能力,应对无限的用户指令进行测试,了解用户对 AI 系统的真实、有效反馈就成为了问题。

在 AI 产品有了大量数据和长时间的训练,并达到稳定有效时,产品设计和开发者已经投入了大量的时间成本和人力成本,如果这时再进行用户测试发现体验不好,就会造成很大的损失。

那有没有什么办法提前验证 AI 驱动的产品,并提前了解它的用户体验呢?这时,绿野仙踪测试就派上用场了。

图片

这个名字来源于经典童话《绿野仙踪》(the Wizard of Oz),故事中的主角们遇到了一个无所不能的魔法师——奥兹国王,但这个国王其实只是一个没有任何法术的普通人,大家看到的一切都是他躲在帘子后面操作机器完成的。

图片

绿野仙踪测试法就是来自这,由真人在幕后扮演 AI ,从而使在前台的用户相信产品是通过人工智能技术来实现他们指定任务的。它的好处是用低成本的方式测试开发成本高的项目,非常适合用来在早期测试 AI 驱动的产品。

图片

早在 1984 年,就有人使用了绿野仙踪测试法,进行了经典的智能语音输入实验,成功展示了如何测试一个还不存在的系统。

图片

被试者被告知可以使用语音输入的方式在电脑上录入,但实际上他看见的所有呈现在电脑上的字,都是在另一间屋子中研究者输入的。即研究者能听到被试者说了什么,然后用键盘帮他打字。但整个过程,被试者都以为是电脑自动化完成的。

图片

一般我们需要两位研究者进行测试,一位担任主持人向参与的测试者介绍测试的大体流程,并在测试过程中进行观察和记录,另一位研究者在幕后担任“魔法师”。

测试开始前,要先确定被测试产品的概念,为它创建必要的图像、元素。同时,在测试的前期,需要明确“魔法师”与测试者的交互方式,即测试中使用哪些设备、技术?通过什么操控产品原型?

其他就如同传统的用户测试一样,需要准备用于测试的,能代表产品核心功能的任务,并准备好预演,确保研究员在测试现场能根据用户的各类语言指令迅速做出有效的响应。需要注意的是,绿野仙踪法对于“魔法师”有一定的要求,需要扮演这个角色的研究者训练有素,只可针对研究相关的特定场景和指令类型有所回应。

图片

通过这样的方式,在系统还未完善前,我们就能了解到用户对于这些功能的体验如何,以及使用这些功能时的心理模型、期望和用于下达交互指令的词汇。

例如让智能助手类 AI 创建一个群聊,用户会有多少类表达方式,这些在目前我们的产品功能定义中是否都覆盖了?或者在某些聊天场景中,有没有因机器人的智能程度不足,阻碍了用户的使用,这对于用户体验的影响是否严重。这些信息都可以通过绿野仙踪法在正式开发前就提前获得的。

图片

对于很多使用自然交互类的 AI 产品来说,绿野仙踪法是强大的测试工具。它让产品设计者可以不需要等到产品功能齐全,在低成本、低风险的环境中测试和完善用户界面。

同时,"绿野仙踪法"有助于建立更深入的用户参与度。通过在测试中使用虚拟环境和故事情节,测试参与者可以更好地理解产品的用途和潜在价值。他们能够更容易地将自己投入到产品的使用情境中,从而提供更为真实和有代表性的反馈。这有助于发现产品的潜在问题和改进点,使产品更符合用户的需求和期望。

换句话说,它加速了产品的开发过程,提高了产品的质量,同时使测试过程更富有创意和吸引力。通过这种方法,产品设计者可以更好地满足用户需求,创造出更具吸引力和竞争力的产品。

鼎道智联一直以 AI-Native 为目标,DingOS 也在努力为用户们带来更安全、绿色、便捷的操作体验,为开发者带来更开放的合作环境,为所有的使用者如果你也认可我们的想法,欢迎关注和加入鼎道生态。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/55925.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

豆包MarsCode 合伙人计划限时招募中,推广最高赢万元现金!

豆包MarsCode 合伙人计划正式上线啦!作为官方推出的推广激励项目,豆包MarsCode 编程助手号召和鼓励所有用户向我们推荐新用户。 现在正式开启首轮合伙人招募,诚邀各位有意愿推广普及 AI 编程产品的伙伴成为我们的合伙人,全国限量…

jmeter输出性能测试报告(常见问题处理与处理)

问题1:报错 WARNING: Could not open/create prefs root node Software\JavaSoft\Prefs at root 0x80000002. Windows R 意思是:报没有权限 处理: 操作非gui生成测试报告的方法 cmd界面进入到 jmeter的bin目录 jmeter –n –t -l -e –o …

对后端返回的日期属性进行格式化(扩展 Spring MVC 的消息转换器)

格式化之前 格式化之后: 解决方式 方式一 在属性中加上注解,对日期进行格式化 JsonFormat(pattern "yyyy-MM-dd HH:mm:ss")private LocalDateTime createTime;//JsonFormat(pattern &quo…

利用FnOS搭建虚拟云桌面,并搭建前端开发环境(一)

利用FnOS搭建虚拟云桌面,并搭建前端开发环境 一 飞牛FnOS官方文档一、安装FnOS【Win11系统】1.下载VirtualBox2.下载FnOS镜像3.创建虚拟机4.启动完成后,会进入这样一个界面,这个基本上后续就后台了 本人在网上冲浪了很久,一直也没…

DGX的优势

NVIDIA DGX 的 AI 领导力 文章目录 前言一、概述推动跨行业的 AI 创新二、优势客户体验到哪些好处?1. 利用生成式 AI 释放研究人员的潜力2. 加快现代应用程序的上市时间3. 利用 AI 改善客户体验三、性能性能很重要1. 为世界上最先进的超级计算机提供动力2. 打破世界纪录3. 提高…

ES6总结

1.let和const以及与var区别 1.1 作用域 var: 变量提升(Hoisting):var 声明的变量会被提升到其作用域的顶部,但赋值不会提升。这意味着你可以在声明之前引用该变量(但会得到 undefined)。 con…

CSS元素显示类型

display 属性是 CSS 中最重要的属性之一&#xff0c;主要用来控制元素的布局&#xff0c;通过 display 属性您可以设置元素是否显示以及如何显示。 根据元素类型的不同&#xff0c;每个元素都有一个默认的 display 属性值&#xff0c;例如<div>默认的 display 属性值为 …

电脑端视频通过PCIE到FPGA端转UDP网络视频输出,基于XDMA+PHY芯片架构,提供3套工程源码和技术支持

目录 1、前言工程概述免责声明 2、相关方案推荐我已有的PCIE方案我这里已有的以太网方案 3、PCIE基础知识扫描4、工程详细设计方案工程设计原理框图电脑端视频PCIE视频采集QT上位机XDMA配置及使用XDMA中断模块FDMA图像缓存UDP视频组包发送UDP协议栈MAC数据缓冲FIFO组Tri Mode E…

STM32编码器接口

一、概述 1、Encoder Interface 编码器接口概念 编码器接口可接收增量&#xff08;正交&#xff09;编码器的信号&#xff0c;根据编码器旋转产生的正交信号脉冲&#xff0c;自动控制CNT自增或自减&#xff0c;从而指示编码器的位置、旋转方向和旋转速度每个高级定时器和通用…

CSS 3D转换

在 CSS 中&#xff0c;除了可以对页面中的元素进行 2D 转换外&#xff0c;您也可以对象元素进行 3D转换&#xff08;将页面看作是一个三维空间来对页面中的元素进行移动、旋转、缩放和倾斜等操作&#xff09;。与 2D 转换相同&#xff0c;3D 转换同样不会影响周围的元素&#x…

CVE-2024-36971漏洞修复----Debian 10.13 内核升级

CVE-2024-36971漏洞修复---Debian 10.13 内核升级 1. 下载内核2. 安装依赖包3. 二进制安装3.1 上传3.2 解压3.3 修改配置文件3.4 编译3.5 安装内核及模块 4. 重启服务器并确认升级成功 1. 下载内核 到kernel.org下载新版的Kernel 由于开发那边不想让Kernel跨大版本,所以就升级…

OpenCV高级图形用户界面(1)创建滑动条函数createTrackbar()的使用

操作系统&#xff1a;ubuntu22.04 OpenCV版本&#xff1a;OpenCV4.9 IDE:Visual Studio Code 编程语言&#xff1a;C11 算法描述 创建一个滑动条并将其附加到指定的窗口。 该函数 createTrackbar 创建一个具有指定名称和范围的滑动条&#xff08;滑块或范围控制&#xff09;…

机器学习笔记-1

文章目录 前言一、How to find a function二、Define Loss from Training Data三、Optimization总结 前言 机器学习&#xff08;Machine Learning, ML&#xff09;是一门让计算机通过数据来自动学习和改进的技术。它的核心理念是通过分析大量的历史数据来找到其中的规律&#…

Qt-链接数据库可视化操作

1. 概述 Qt 能够支持对常见数据库的操作&#xff0c;例如&#xff1a; MySQL、Oracle、SqlServer 等等。 Qt SQL模块中的API分为三层&#xff1a;驱动层、SQL接口层、用户接口层。 驱动层为数据库和SQL接口层之间提供了底层的桥梁。 SQL接口层提供了对数据库的访问&#xff0…

蓝桥杯【物联网】零基础到国奖之路:十六. 扩展模块之矩阵按键

蓝桥杯【物联网】零基础到国奖之路:十六. 扩展模块之矩阵按键 第一节 硬件解读第二节 CubeMX配置第三节 MDK代码 第一节 硬件解读 扩展模块和ADC模块是一摸一样的&#xff0c;插在主板上。 引脚对应关系&#xff1a; PB6-ROW1 PB7-ROW2 PB1-COLUMN1 PB0-COLUMN2 PA8-COLUMN3 …

adb安装教程(Windows10)

本章教程&#xff0c;主要介绍如何在Windows10操作系统上安装adb。 一、adb简介 ADB&#xff0c;全称为Android Debug Bridge&#xff0c;是Android开发中一个重要的命令行工具。它用于与Android设备进行通信&#xff0c;提供了多种功能来帮助开发者进行调试和应用管理。 二、下…

Qt第三课 ----------显示类的控件属性

作者前言 &#x1f382; ✨✨✨✨✨✨&#x1f367;&#x1f367;&#x1f367;&#x1f367;&#x1f367;&#x1f367;&#x1f367;&#x1f382; ​&#x1f382; 作者介绍&#xff1a; &#x1f382;&#x1f382; &#x1f382; &#x1f389;&#x1f389;&#x1f389…

美团Java一面

美团Java一面 9.24一面&#xff0c;已经寄了 收到的第一个面试&#xff0c;表现很不好 spring bean生命周期 作用域&#xff08;忘完了&#xff09; 为什么用redis缓存 redis和数据库的缓存一致性问题 redis集群下缓存更新不一致问题 aop说一下 arraylist和linkedlist 数据库的…

kali(专业的渗透测试虚拟机)|kali下载链接地址 |kali安装 |kali部署指南

介绍 kali 是Debian开源linux系统体系下的子分支之一 Debian-kali 扩展&#xff1a;Ubuntu也是Debian开源linux系统体系下的子分支之一 Debian-ubuntu 安装kali 2023.03 稳定版 Index of /kali-images/kali-2023.1/ 安装可以参考他的教程&#xff0c; 写的很详细了…

C语言-数据结构 折半查找

在折半查找中&#xff0c;刚开始学可能会在下标处产生困惑&#xff0c;例如奇数个长度的数组怎么处理&#xff0c;偶数个长度的数组怎么处理&#xff0c;不需要修改代码吗&#xff1f;并且下标我从1开始算和0开始算影响代码吗&#xff1f;其实都可以用一样的代码&#xff0c;产…