2024年企业级通用人工智能的关键技术趋势

  每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

在当今这个时代,企业级人工智能与众不同之处在于,它专注于可测量、受控制的产出,企业可以将其与自身品牌联系起来。今年,技术工具将主导舞台,使得通用人工智能(以下简称为“它”)克服挑战,成为一种可靠的工具,而不仅仅是潜力所在。

数据科学家在预测自己领域的未来方面确实很糟糕(这里有点自嘲!)。因此,对这些预测,请以95%的置信区间来接受 :)

转变资本支出周期这一块,现如今没有哪个企业不投资于“它”。

今年的某个时候,这些投资将开始要求回报。新技术的资本支出周期通常遵循18个月的规律:投资18个月,找到市场18个月,然后决定是否进一步开发以达到顶尖位置或转而投资于其他领域。虽然构建通用人工智能的概念验证是容易的部分,但将其投入生产却极具挑战性,鉴于幻觉问题、治理缺失、缺乏评估标准和架构混乱等问题。

到2024年秋天,我们将看到公司们努力为去年春天开始嵌入人工智能的一切找到产品市场契合点。这意味着一些企业将无法达标,而真正的强者将从人群中脱颖而出。这将意味着那些找不到产品市场契合点的公司将面临有关其投资和工作团队的艰难决定。

这是否意味着通用人工智能的泡沫即将破灭?远非如此。然而,我们将看到企业通过整合资源,不仅仅关注于概念验证项目,而是关注于他们打算在今年秋天结束之前投入生产的项目。那些没能做到的,将不得不要么展示出成果,要么剥离。

推理优化这一领域,在迄今为止的大多数通用人工智能的概念验证中,最被忽视的就是运行这些庞大的基于大型语言模型的推理的成本。

看似单位价格很小,但对于一个拥有几百万推理调用的中等规模公司来说,成本很快就会累积起来。今年的一个重点将是开发推理优化方法。这将是一个可以平衡成本效益权衡的领域,通过考虑各种因素如准确性、投资回报率预测、底层的本地云对比云基础设施对比软件即服务模型、大型语言模型的大小,以及它是否应该是检索增强生成或微调或自定义调整模型等。

至于想要利用“它”为客户增加价值的公司来说,关键在于如何利用其数据的独特性。这意味着使用检索增强生成或微调等方法来实现。

今年,我们还将看到对小型语言模型、中型语言模型和非常小的语言模型的兴趣激增,这些模型通常具有不到7亿参数,可以轻松地适应单个图形处理单元。我之前也在我的博客中写过这个话题:“为什么更大并不总是更好”。

“多”将是今年的关键词:多模型、多模态和多云。

对于任何企业来说,协调这么多选择将会产生一系列新问题。今年,人工智能领导者将需要解决几个挑战:

企业希望在其架构中支持多少个不同的大型语言模型?(记住,由于图形处理单元短缺,仅加载和推理一个340亿参数的大型语言模型就需要6个图形处理单元)。我们是否想要支持所有这些,还是选择更多的小型模型,或几个中等大小的模型,或一个大型和一个小型模型?
单一云运行风险高且昂贵,那么我们如何在多个云与本地大型语言模型之间管理工作负载?通常,本地模型部署从长远来看可以节省大量资金,并提供更好的治理和输出控制。
多模态——结合文本、图像、视频和音频将是一个值得关注的主题。部署这些多模态模型仍然是一个需要开发工具的领域。
如果有一个领域让顶级执行官们在通用人工智能方面夜不能寐,那就是人工智能治理。他们不知道何时他们的聊天机器人应用会提供错误信息,他们将不得不支付罚款(如加拿大航空的案例),或何时它会脱口而出仇恨内容并被撤下(如谷歌),或如何遵守新的一套规定,如欧盟法律。

所有公司都想知道的答案是,一旦将其投入生产后,它将如何运作。尚未解决的问题是“如何衡量”它。没有简单的度量或解决方案来衡量幻觉,特别是当涉及到没有普遍基准真相的特定领域数据(如政策)时。另一个挑战是为合规性而工具化,就像为审计目的一样。使黑盒变得开放和可预测是阻碍许多公司将他们的通用人工智能概念验证推向生产的一个挑战。

期待在私人和公共空间对这个问题进行大量讨论。希望美国国会能通过一些法律,行业能采纳一套类似于药物试验的通用标准。当然,大部分还是一厢情愿的想法,直到那时,像WatsonX.Governance这样的工具将是不可或缺的。

最后但同样重要的是,数据科学家的回归(或称为绝地武士)。

去年,似乎成为一个人工智能工程师就是从事人工智能工作所需的一切(一些误导性的新报道声称,成为一名人工智能工程师可以让你年薪90万到40万美元,而无需其他薪水)。

今年可能会慢慢意识到的最后一个变化是,数据科学家仍然非常需要,以将通用人工智能从潜力推向效能。

首先,两者有什么区别?传统的机器学习需要训练模型,数据科学家会利用他们的统计和算法专业知识来使模型适应你的用例。有了大型语言模型,你已经有了一个预训练的模型,所以人们认为你不再需要这样做了。无论你需要什么都可以通过提示调优来完成,这是一种聪明的英语写作。因此,人工智能工程师的数量增加了,他们不太关注科学部分,而是更多地专注于机器学习运维工程,以配置、集成和部署通用人工智能到应用程序中。

事实证明,现实要复杂得多,特别是对于企业级通用人工智能。以检索增强生成应用为例,为几十个文档构建检索增强生成很容易,但当涉及到几百万个文档时,你需要了解检索和重排算法(如KNN、编码器、BM-25)的深度知识。对于另一个用例,如text2sql,你需要技能来微调模型(比如PEFT、束搜索等)。此外,所有通用人工智能应用都需要评估模型的技能,并提出适合该数据集和用例的正确统计指标(如NDCG、Fleiss-Kappa)。所有这些意味着,统计和机器学习算法的核心技能仍然非常相关,仅仅组合起来是不够的。

因此,数据科学家将作为绝地武士回归,以使通用人工智能成为现实。核心统计技能将是你能多快提供高度准确的通用人工智能解决方案的关键因素。

期待意想不到的事情发生。人工智能的美在于它的不可预测性(这不是一个缺陷,而是一个特性,鉴于一切都建立在概率之上)。包括Sam Altman在内的每个人都未能预测当前的通用人工智能浪潮。我们首先看到的是2012年视觉模型的高峰和自动驾驶汽车的炒作。现在,又有了关于大型语言模型的另一波热潮。

所有企业都应该准备好,以迎接可能出现的任何意外。他们自己的计划可能会因为一些表现超出预期的新模型(如Llama3或GPT-5)或某些真正不同寻常的新事物而被推翻。一个新的模型、方法、数据集或服务器都可能颠覆现状。在通用人工智能领域,总是要期待意想不到的高潮和低谷。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/765074.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

腾讯三面被问到有没有参加过CTF_我反手就是一套军体拳打得面试官哑口无言!

目录 ​ 前言: 正文: 什么是CTF? 什么是PWN? 为什么要学CTF? CTF竞赛模式: CTF各大题型简介: 学之前的思考:分析赛题情况 常规做法 CTF比赛需要的知识储备 CTF比赛的神器&#xff…

51单片机中断信号的种类及应用场景

在嵌入式系统中,中断是一种重要的事件处理机制,它可以在程序执行的任何时候暂停当前任务,转而执行与之相关的特殊任务或事件。51单片机作为一种常见的微控制器,其中断功能在各种应用中起着关键作用。然而,对于初学者和…

Jmeter-基础元件使用(二)-属性及对数据库简单操作

一、Jmeter属性 当我们想要在不同线程组中使用某变量,就需要使用属,此时Jmeter属性的设置需要函数来进行set和get操作 1.创建set函数 2.然后采用Beanshell取样器进行函数执行 3.调用全局变量pro_id 4.将上面生成的函数字符串粘贴到另一个线程组即可…

二、阅读器的开发(初始)-- 2、阅读器开发

1、epubjs核心工作原理 1.1 epubjs的核心工作原理解析 epub电子书,会通过epubjs去实例化一个Book对象,Book对象会对电子书进行解析。Book对象可以通过renderTo方法去生成一个Rendition对象,Rendition主要负责电子书的渲染,通过R…

PointNet++论文复现(一)【PontNet网络模型代码详解 - 分类部分】

PontNet网络模型代码详解 - 分类部分 专栏持续更新中!关注博主查看后续部分! 分类模型的训练: ## e.g., pointnet2_ssg without normal features python train_classification.py --model pointnet2_cls_ssg --log_dir pointnet2_cls_ssg python test_classification.py…

【C#】C#窗体应用修改窗体的标题和图标

修改窗体顶部的标题和图表,如果不修改则会使用默认的图标,标题默认为Form1,如第一张图,这时候如果想换成和系统有关的内容,如第二张图,可以使用下面的方法进行修改,修改后打开该软件任务栏显示的…

学习笔记Day14:Linux下软件安装

软件安装 Anaconda 所有语言的包(package)、依赖(dependency)和环境(environment)管理器&#xff0c;类似应用商店 Conda < Miniconda < Anaconda&#xff08;有交互界面&#xff09; Linux下Miniconda即可 安装Miniconda 搜索北外/清华miniconda镜像网站&#xff…

echarts图表动态监听dataZoom滑动,控制柱条的宽度以及数值的显示隐藏

当数值过多时&#xff0c;显示所有柱条看着会很凌乱且文字会挤在一起&#xff0c;于是就需要监听datazoom的滑动&#xff0c;拿到对应的阈值后做出相应的配置。 “dataZoom” 事件通常用于响应用户对图表进行数据缩放的操作。 这里是datazoom官网api地址&#xff1a;点击跳转至…

服务器端(Debian 12)配置jupyter与R 语言的融合

融合前&#xff1a; 服务器端Debian 12,域名&#xff1a;www.leyuxy.online 1.安装r-base #apt install r-base 2.进入R并安装IRkernel #R >install.packages(“IRkernel”) 3.通过jupyter notebook的Terminal执行&#xff1a; R >IRkernel::installspec() 报错 解决…

DFS基础——迷宫

迷宫 配套视频讲解 关于dfs和bfs的区别讲解。 对于上图&#xff0c;假设我们要找从1到5的最短路&#xff0c;那么我们用dfs去找&#xff0c;并且按照编号从大到小的顺序去找&#xff0c;首先找到的路径如下&#xff0c; 从节点1出发&#xff0c;我们发现节点2可以走&#xff…

在Linux上运行JMeter(非界面)

参考&#xff1a; 查看文件类型&#xff1a;https://www.linuxprobe.com/files-tehre-fangfa.html 华为云平台 配置&#xff1a;jdk环境、jmeter环境 jmeter配置&#xff08;在/etc/profile文件中&#xff09;&#xff1a; export JMETER_HOME/path/to/jmeter/installati…

嵌入式学习41-数据结构2

今天学习了链表的增删改查 &#xff08;暂定&#xff01;&#xff01;后续再补内容&#xff09; 高内聚 &#xff1a;一个函数只实现一个功能 …

Docker 镜像仓库

目录 1、搭建私有 registry 服务端创建镜像仓库 客户端推送镜像 镜像导入导出 2、Nginx 代理 registry 仓库 SSL 证书 & https 协议 SSL证书 https协议 SSL 的验证流程 客户端安装 Nginx 使用 openssl 生成CA根证书和根证书key 创建 Nginx 服务证书 配置启动 N…

Airgorah:一款功能强大的WiFi安全审计工具

关于Airgorah Airgorah是一款功能强大的WiFi安全审计工具&#xff0c;该工具可以轻松发现和识别连接到无线接入点的客户端&#xff0c;并对特定的客户端执行身份验证攻击测试&#xff0c;捕捉WPA握手包&#xff0c;并尝试破解接入点的密码。在该工具的帮助下&#xff0c;广大研…

在Ubuntu上使用Script命令捕获命令与其输出

在Ubuntu上使用Script命令捕获命令与其输出 起初&#xff0c;是为了记录软件的安装过程&#xff0c;就在想有没有简单高效的记录方法&#xff0c;之后就找到了script命令。 使用 script命令&#xff0c;可以很容易地记录下你在终端里所有的操作与输出&#xff0c;非常适合用来…

是时候来唠一唠synchronized关键字了,Java多线程的必问考点!

写在开头 在之前的博文中&#xff0c;我们介绍了volatile关键字&#xff0c;Java中的锁以及锁的分类&#xff0c;今天我们花5分钟时间&#xff0c;一起学习一下另一个关键字&#xff1a;synchronized。 synchronized是什么&#xff1f; 首先synchronized是Java中的一个关键字…

Tensorflow 2.0 常见函数用法(一)

文章目录 0. 基础用法1. tf.cast2. tf.keras.layers.Dense3. tf.variable_scope4. tf.squeeze5. tf.math.multiply 0. 基础用法 Tensorflow 的用法不定期更新遇到的一些用法&#xff0c;之前已经包含了基础用法参考这里 &#xff0c;具体包含如下图的方法&#xff1a; 本文介…

dbscan算法实现鸢尾花聚类(python实现)

DBscan算法原理 : dbscan算法-CSDN博客 法一(调库) : 直接调库 : import numpy as np import matplotlib.pyplot as plt from sklearn import datasets from sklearn.cluster import DBSCAN from sklearn.decomposition import PCA from sklearn.discriminant_analysis …

leetcode 225.用队列实现栈 JAVA

题目 思路 1.一种是用双端队列&#xff08;Deque&#xff09;&#xff0c;直接就可以调用很多现成的方法&#xff0c;非常方便。 2.另一种是用普通的队列&#xff08;Queue&#xff09;,要实现栈的先入后出&#xff0c;可以将最后一个元素的前面所有元素出队&#xff0c;然后…

【Flask】Flask项目结构初识

1.前提准备 Python版本 # python 3.8.0 # 查看Python版本 python --version 安装第三方 Flask pip install flask # 如果安装失败&#xff0c;可以使用 -i&#xff0c;指定使用国内镜像源 # 清华镜像源&#xff1a;https://pypi.tuna.tsinghua.edu.cn/simple/ 检查 Flask 是…