打造基于大模型的AI产品

我要飞往印度进行短暂旅行,因此花了一个小时的时间处理在线签证申请流程。完成后,由于我现在知道涉及的内容,我向 ChatGPT 4o 询问了相关问题。这些观点中的大多数都是部分或完全错误的。

NSDT工具推荐: Three.js AI纹理开发包 - YOLO合成数据生成器 - GLTF/GLB在线编辑 - 3D模型格式在线转换 - 可编程3D场景编辑器 - REVIT导出3D模型插件 - 3D模型语义搜索引擎 - Three.js虚拟轴心开发包 - 3D模型在线减面 - STL模型在线切割 

这是一个“不公平”的测试。这是使用 LLM 的“糟糕”方式的一个很好的例子。这些不是数据库。它们不会对问题产生精确的事实答案,它们是概率系统,而不是确定性系统。今天的 LLM 无法给我一个完全准确的答案。答案可能是正确的,但你不能保证这一点。

人们有一种趋势,认为这意味着这些LLM是无用的。这是一种误解。相反,思考生成式 AI 模型的一个有用方法是,它们非常擅长告诉你对这样的问题的良好答案可能是什么样子。在一些用例中,“看起来是个不错的答案”正是你想要的,而在一些用例中,“大致正确”就是“完全错误”。

事实上,进一步推论,可以认为完全相同的提示和完全相同的输出可能是好结果,也可能是坏结果,这取决于你想要它的原因。

不管怎样,在这种情况下,我确实需要一个精确的答案,而 ChatGPT 原则上不能依赖它给我一个答案,相反,它给了我一个错误的答案。我要求它做一些它做不到的事情,所以这是一个不公平的测试,但它是一个相关的测试。答案仍然是错误的。

有两种方法可以尝试解决这个问题。一种是将其视为科学问题 - 现在还为时过早,模型会变得更好。你可以经常说“RAG”和“多智能体”。模型肯定会变得更好,但会好多少呢?你可以花上几周时间在 YouTube 上观看机器学习科学家争论这个问题的视频,结果却发现他们其实并不知道。实际上,这是“大模型会产生通用人工智能吗?”争论的一个版本,因为在我看来,一个能够完全正确回答“任何”问题的模型听起来至少是一种通用人工智能的良好定义(不过,同样,没有人知道)。

但另一种方法是将其视为产品问题。我们如何围绕我们应该假设会“出错”的模型构建有用的大众市场产品?

AI人员对我这样的例子的常见反应是说“你用错了” :

  • 我问了错误的问题类型
  • 我以错误的方式提问

我应该做大量提示工程设计!但过去 50 年消费者计算的发展告诉我们,你不能通过让用户学习命令行来推动技术的应用 - 你必须走向用户:

早期的即时工程(WordPerfect 纸板键盘覆盖层)。这不是未来

我认为我们可以进一步将其分解为两种产品问题。

一方面,屏幕截图中的产品设计传达了确定性,而模型本身本质上是不确定的。谷歌给你(大部分)十个蓝色链接,传达“它可能是其中之一”的信息,但这里我们只得到了一个“正确”的答案。这误导了很多人,尤其是因为文本生成(与实际答案不同)几乎是完美的。事实上,德勤的这项有趣的调查表明,一旦人们使用了这些系统,他们更容易被这种明显的确定性误导:

但问题的另一半是,在我得到“答案”之前,产品并没有告诉我可以问什么。我给了它一个“坏”查询(它实际上不能很好地回答),但产品中没有任何内容告诉我。相反,它被呈现给我作为一个通用工具。如果产品必须尝试回答任何问题,那么模型就很难正确,但这也使得界面很难传达哪些是好问题。

我制作了下面的幻灯片,用于我将在印度进行的演讲,试图捕捉由此提出的替代方案:

最激进的方法是完全通用的聊天机器人作为产品,我刚刚讨论了其中的挑战。但至少还有另外两种方法。

第一种方法是将产品限制在一个狭窄的领域,这样你就可以围绕输入和输出创建一个自定义 UI,传达它能做什么、不能做什么以及你可以问什么,也许还可以关注模型本身(因此有了 RAG)。这为我们带来了过去 12 个月中爆发式增长的编码助手和营销工具,以及知识管理工具的首次尝试。WPP 已经建立了一个内部仪表板,让其员工将模型引导到特定的品牌语调或目标人群。因此,“让这个工具为品牌 Y 的演示 Z 提出 50 个产品 X 的想法 - 不要问它你是否患有阑尾炎。”你将提示包装在按钮和 UI 中 - 在产品中:

但另一种方法是,用户永远看不到提示或输出,或者根本不知道这是生成式人工智能,输入和输出都被抽象为其他事物中的函数。该模型启用了某些功能,或者使构建该功能变得更快、更容易,即使你以前可以做到这一点。这就是上一波机器学习的大部分内容被吸收到软件中的方式:有新功能,或者功能效果更好,或者可以更快、更便宜地构建,但用户永远不知道它们是“人工智能”——它们不是紫色的,也没有小星星群。因此,有一个老笑话说,AI是任何还没有起作用的东西,因为一旦它起作用,它就只是软件。

从另一个角度来看:对于任何新技术,我们首先尝试让它适应我们已经存在的问题,而目前的市场领导者则试图让它成为一项功能(因此谷歌和微软在去年将LLM喷洒到他们的所有产品上)。然后,初创公司使用它来拆分现有产品(拆分搜索、Oracle 或电子邮件),但与此同时,其他初创公司试图找出我们可以构建的真正原生于新技术的产品。这分阶段进行。首先,Flickr 有一个 iPhone 应用程序,但后来 Instagram 使用智能手机摄像头,并使用本地计算添加过滤器,再后来,Snap 和 TikTok 使用触摸屏、视频和位置来打造真正原生于平台的产品。那么,我们用它构建了什么样的原生体验,不是聊天机器人本身,也不是“错误率”无关紧要,而是以某种方式抽象了这种新功能?

这当然提出了一个悖论,我之前已经谈到过:我们拥有一项通用技术,但部署方式是将其分解为单一用途的工具和体验。然而,将其视为悖论可能只是错位了正确的抽象层次。电动机是一种通用技术,但你不会从家得宝 (Home Depot) 购买一箱电动机 - 你会购买钻头、洗衣机和搅拌机。通用技术被实例化为用例。个人电脑和智能手机是取代单一用途工具的通用工具 - 它们取代了打字机、计算器、录音机和音乐播放器 - 但这些功能都是通过一个单一用途软件实现的:大多数人不会将 Excel 用作文字处理器。有些人对 LLM 如此兴奋的一个原因是他们可能不会遵循这种模式:他们可能会通过所有这些抽象级别上升到顶部。这将没有空间容纳“薄 GPT 包装器”。然而,我认为他们还不能真正做到这一点,因此,我刚才所写的一切实际上只是在思考,即使这种情况从未发生,你又能建立什么来改变世界。


原文链接:打造AI产品 - BimAnt

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/28545.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

微信小程序开发系列(三十五)·自定义组件的属性properties

微信小程序开发系列(三十四)自定义组件的创建、注册以及使用(数据和方法事件的使用)_wx小程序组件开发-CSDN博客 目录 1. 组件的属性 2. 组件的使用 3. 细节描述 1. 组件的属性 Properties是指组件的对外属性,主…

Ms08067安全实验室成功实施多家业务系统渗透测试项目

点击星标,即时接收最新推文 近日,Ms08067安全实验室针对多家公司重要系统实施渗透测试项目。公司网络信息系统的业务应用和存储的重要信息资产均较多,存在网络系统结构的复杂性和庞杂等特点,使得公司网络信息系统面临一定风险。项…

顺安蜘蛛池四川官网下载

baidu搜索:如何联系八爪鱼SEO? baidu搜索:如何联系八爪鱼SEO? baidu搜索:如何联系八爪鱼SEO? 虽然影视泛目录很火,但超度站群版本自出现以来-直流量稳定,可惜这两年起站全靠域名。但话说回来,咱不能否认,只要用的域名好,做啥泛目录都有好…

【第11章】别人的工作流,如何使用和调试(上)?(2类必现报错/缺失节点/缺失模型/思路/实操/通用调试步骤)ComfyUI基础入门教程

经过前面章节的学习,相信大家对于工作流是什么?如何搭建?怎么使用基础的工作流?已经很清楚了。 那么,接下来的课程,我们会上一点难度, 并且更接近实战状态了。 这节课,我们就用一套从“文本 - 静帧 - 视频”的AI短片全流程工作流,讲一下,网络上下载的工作流,需要如…

树与图的深度优先遍历——AcWing.846树的重心

树与图的深度优先遍历 定义 从图的某个顶点出发,沿着一条路径尽可能深地访问图中顶点。 运用情况 图的连通性判断。寻找特定路径或回路。 注意事项 要标记已访问的节点,以避免重复访问导致死循环。对于有向图和无向图可能需要不同的处理。 解题思…

C++ Primer Plus第五版笔记(p201-250)

第六章 函数(下) 在含有return语句的循环后面应该也有一条return语句 不要返回局部对象的引用或指针,当函数结束时临时对象占用的空间也就随之释放掉了,所以两条return语句都指向了不再可用的内存空间。 如果函数返回指针、引用…

排序(2)【选择排序】【快速排序】

一.选择排序 选择排序就是选择一个数组的最大的数字或者最小的数字,放在一整个数组的最后或者开头的位置。 1.选择排序的实现 我们可以对选择排序进行一些加强,普通的选择排序是选择最小的数,然后进行交换。这个加强之后就是我们既要选择出…

从ES的JVM配置起步思考JVM常见参数优化

目录 一、真实查看参数 (一)-XX:PrintCommandLineFlags (二)-XX:PrintFlagsFinal 二、堆空间的配置 (一)默认配置 (二)配置Elasticsearch堆内存时,将初始大小设置为…

ElasticSearch + kibana:类型声明

当我们使用 kibana 创建索引时,如果不申明数据类型,默认字符串赋予 text类型,如下图所示 接下来我们继续创建多条数据如下: 下面我们来检索下: 通过以上两个案例我们发现,使用 match 模糊查询 li-3 明明…

别再问别人了,这是小白都能懂的拓扑图指南

号主:老杨丨11年资深网络工程师,更多网工提升干货,请关注公众号:网络工程师俱乐部 上午好,我的网工朋友。 老杨的网工交流群里经常会有这种现象: 一群小伙伴在问各类型拓扑图的问题,怎么设计&…

monitor-zabbix

监控体系理论 学习本篇文章,了解运维监控系统的前世今生 zabbix官网仓库地址 zabbix官网 https://www.zabbix.com/cn/zabbix官网仓库地址 http://repo.zabbix.com/zabbix/ http://repo.zabbix.com/zabbix/4.0/ubuntu/pool/main/z/zabbix-release/zabbix-release_…

Hi3861 OpenHarmony嵌入式应用入门--基于HI-12F开发板烧写程序

首先需要一个开发板,我已经在嘉立创上进行了开源,基于安信可hi-12f模块的开发板,集成了两个按键,一个三色灯,一个滑动变阻器,可外接一个0.96寸液晶。 【HI-12F】基于安信可hi-12f模块的开发板 - 嘉立创EDA…

借助Aspose.Email,使用 C# .NET 创建 PST 文件并填充内容

PST(个人存储表)文件是管理 Outlook 数据的重要组成部分,方便存储电子邮件、联系人、日历和其他项目。在 C# .NET 开发领域,创建和管理存储文件的过程对于各种应用程序至关重要。 在本文中,我们将探讨如何使用 C# .NE…

内窥镜窄带光

文章目录 NBI相关信息 NBI相关信息 第一不知道哪家有这个技术? 第二直接搜索找不到相关信息 第三只能搜企业官网 搜集到的与NBI,相关的信息如下 英美达医疗公司 https://www.innermed.com/index.php/gongsixinwen/139.html 新光维医疗公司 官网页面…

【Spring】1. Maven项目管理

📚博客主页:爱敲代码的小杨. ✨专栏:《Java SE语法》 | 《数据结构与算法》 | 《C生万物》 |《MySQL探索之旅》 |《Web世界探险家》 ❤️感谢大家点赞👍🏻收藏⭐评论✍🏻,您的三连就是我持续更…

【无标题】Pycharm执行报错

file 读取未指定utf-8编码,加上就好了 疑问:为什么 有的电脑可以直接跑呢?该电脑、Pycharm、工程,已经做了修改设置默认值,但是到新的电脑上,就需要重新设置,所以 file 读、写,最好…

鸿蒙轻内核调测-内存调测-内存泄漏检测

1、基础概念 内存泄漏检测机制作为内核的可选功能,用于辅助定位动态内存泄漏问题。开启该功能,动态内存机制会自动记录申请内存时的函数调用关系(下文简称LR)。如果出现泄漏,就可以利用这些记录的信息,找到…

程序员日志之计算机相关专业还值得选择吗?

目录 传送门正文日志1、概要2、专业选择2.1、专业2.2、学校2.3、城市 3、计算机相关专业还值得选择吗? 传送门 SpringMVC的源码解析(精品) Spring6的源码解析(精品) SpringBoot3框架(精品) MyB…

中华老字号李良济,展现百年匠心之魅力,释放千年中医药文化自信

6月14-16日,“潮品老字号 国货LU锋芒”江苏老字号博览会在南京隆重启幕,中华老字号李良济凭借过硬的品牌实力和优质的口碑再次受邀参加,并在展会上绽放百年匠心魅力,彰显千年中医药文化自信! 百年匠心 以实力铸就荣耀…

计算机组成原理之定点乘法运算

文章目录 原码并行乘法与补码并行乘法原码算法运算规则存在的问题带符号的阵列乘法器习题原码阵列乘法器间接补码阵列乘法器直接补码阵列乘法器 补码与真值的转换 原码并行乘法与补码并行乘法 原码算法运算规则 存在的问题 理解流水式阵列乘法器(并行乘法器&#x…