科技云报道:打造生成式AI应用,什么才是关键?

科技云报道原创。

生成式AI作为当前人工智能的前沿领域,全球多家科技企业都在加大生成式AI的研发投入力度。

随着技术、产品及应用等方面不断推出重要成果,如今有更多的行业用户在思考该如何将生成式AI应用落地。
在这里插入图片描述

但开发生成式AI应用是一个充满挑战的系统工程,并不是单纯的产品和服务拼接,涉及基础设施领域一系列的挑战。

亚马逊云科技大中华区产品部总经理陈晓建表示,当我们谈论生成式AI时,大多数人都在谈论基础模型,而整个生成式AI应用就像是浮在海面的冰山,露在海面上方能被大多数人看到的冰山一角就像是基础模型,而在冰川的底部,同样需要大量的基础模型以外的服务来支撑,如加速芯片、数据库、数据分析、数据安全服务等等。

那么,想要构建一个成功的生成式AI应用,需要哪些基础设施助力?业界是否有一些最佳实践可以参考呢?

生成式AI应用构建的关键
高性价比的基础设施

都说算力、算法和数据是人工智能发展的三要素,想要让这些要素更好地与生成式AI应用匹配,高性价比的基础设施必不可少。

AI高性能芯片为生成式AI训练提供算力支撑
人工智能的发展从深度学习时代进入到大模型时代,大规模预训练模型的参数量呈现指数级上升,需要高性能算力的支撑。

目前,大规模预训练模型训练算力是以往的10到100倍,当前主流生成式AI模型的训练广泛使用到英伟达Tensor Core GPU芯片,如微软斥资数亿美元购买数万颗英伟达A100芯片以帮助Open AI打造ChatGPT。

AI计算集群为生成式AI模型训练降低成本
AI计算集群能够提供大规模算力、持续提高算力资源利用率、提升数据存储和处理能力,进一步降低模型训练门槛和成本,推动生成式AI模型的落地进程。

当前较为典型的AI计算集群,例如基于英伟达最新GPU芯片H100 Tensor Core的Amazon EC2 P5实例,与上一代相比速度快6倍,训练成本节省40%;

基于亚马逊云科技自研的机器学习推理芯片Amazon Inferentia2推出的Amazon EC2 Inf2实例,与其他类似的EC2实例相比性价比高40%;

基于自研机器学习训练芯片Amazon Trainium推出的Amazon EC2 Trn1实例,与同类实例相比训练成本节省高达50%。

这也是为什么有越来越多的客户,比如Airbnb、OPPO、Sprinklr 和 Autodesk等,会选择使用亚马逊云科技的自研芯片来承载他们的生成式AI应用。

基础模型服务为构建生成式AI提升效率
生成式AI的核心是利用机器学习领域的基础模型驱动的,从RNN、CNN到VAE、GAN,每种模型都有其独特的优点和应用领域,这些模型在很大程度上决定了AI系统的表现。

然而,基础模型的发展和迭代速度正超越以外任何一项技术,基本以月甚至天为单位持续迭代。

在众多的基础模型中,应该如何便捷安全的选择最适合自己业务场景的基础模型,是每一家企业在构建生成式AI应用时面临的挑战。

事实上,借助专门构建的生成式AI工具和基础设施,可以帮助企业快速构建高性价比的生成式AI应用。

例如,亚马逊云科技Amazon Bedrock是一项无服务器服务,提供了广泛的模型选择、数据隐私,并且能够自定义模型,无需管理任何基础设施。

该服务提供的基础模型来自Meta, Anthropic, Stability AI, AI21 Labs, Cohere等第三方领先提供商以及自身的Amazon Titan模型等,近期还加入了Meta的下一代开源大模型Llama2以及Anthropic的Claude2等热门基础模型。

同时,Amazon Bedrock与Amazon SageMaker Jumpstart结合,用户可以从Amazon SageMaker Jumpstart中选择开源的基础模型,然后根据自身需求可以选择全量微调,轻量微调等不同方式,进一步确定微调框架,利用分布式训练实现微调,从而更好的评估微调效果。
在这里插入图片描述

云原生服务加速生成式AI应用构建
人工智能预训练模型的开发对于云服务有较大需求,AI云服务可以提供人工智能开发模块,通过多元化的服务模式,降低开发者的开发成本和产品开发周期,为模型开发提供AI赋能。

尤其是借助云原生服务,可以加速AI应用构建,助力业务敏捷创新。

比如,以微服务化和事件驱动架构为核心的设计框架,松耦合的去处理每个功能模块之间的互相依赖;Serverless First能够简化运维、提升效率;在DevOps、基础设施即服务、自动化等现代应用治理理念持续投入,可以促进企业内部的应用资产与实践的分享,构建高效敏捷的构建者文化等等。

数据服务为生成式AI打造基座
数据作为生成式AI的关键,也将推动生成式AI的广泛应用,对于所有的组织企业来说都十分重要。

首先,面向生成式AI构建强大的数据“基座”,需要一套全面的服务,以便能够存储用于构建和微调模型的各种类型的数据;

其次,还需要服务间的集成,以打破数据孤岛,确保能够随时访问所有数据;

最后,还需要在构建生成式AI应用程序的整个生命周期中,确保数据安全并对其进行管理。

以亚马逊云科技为例,针对生成式AI领域的用户个人信息、会话信息管理、私域知识库等应用场景都提供了专门构建的数据库。

在数据集成方面,亚马逊云科技已经在Amazon S3、Amazon Aurora、Amazon Redshift、Amazon SageMaker、Amazon EMR、Amazon Athena、Amazon Kinesis等各项服务之间,实现了深度的数据集成,帮助企业执行分析和机器学习,且无需移动数据。

在数据治理方面,亚马逊云科技Amazon DataZone让客户能够跨组织边界发现、访问、共享和治理大规模数据,并减少企业内部成员访问数据和使用分析工具时繁重的工作量。

构建生成式AI
应用的行业实践

目前,由生成式AI引导的企业变革序幕全面展开,以多元应用不断创新AI应用范式,并将实践成果逐步延伸至智慧教育、智能制造、医疗等领域,真正成为人们生产生活的得力助手。

其中,在行业类应用场景中,AI助手类应用得到了广泛运用,比如在协同办公赛道就掀起了新风口:

钉钉接入千问大模型,用户可以唤起10余项AI能力如:自动整理群聊要点、生成待办、预约日程、写文案、生成海报、一键生成讨论要点等。

飞书宣布推出智能助手“My AI”,功能包括汇总会议纪要、创建报告、优化和续写文字内容等功能。

金山办公推出“WPS AI”,支持内容生成、公式生成、制作PPT、扫描识别并分析文件等功能。

而在金融、医疗、工业等领域,最具前景的应用则来自于数据挖掘和知识洞察(Insight)类工具。

但无论是哪种形式的生成式AI的应用落地,背后都离不开强大的基础设施作为支撑。

金山办公软件股份有限公司的 AI 研发总监刘强表示,今年起WPS开始将大语言模型的能力全面引入产品,致力于开发新一代办公软件。

而在构建生成式AI应用的过程中,基础模型性能有限,数据隐私与安全难以保障,高额管理成本等现实情况成为了摆在金山办公面前的重重障碍。

亚马逊云科技Amazon Bedrock中支持的领先大语言模型,在多个文字处理场景中符合金山办公的需求。

除多种模型选择外,Amazon Bedrock还在数据安全层面给金山办公提供了充分的支持,极大地提高了金山办公的内部开发效率,助力金山办公进一步革新办公体验。

西门子中国也借助了一系列云基础设施、大数据、机器学习等技术,来构建生成式AI应用。

据西门子中国大禹团队介绍,长期以来企业内部资源的检索和调用都存在结构散乱、检索速度慢、交互不便等问题。因此,大禹团队决定将大数据库和生成式 AI 应用于一个全新的“智能知识库”,从根本上提升知识库的可用性。

在亚马逊云的技术支持下,西门子中国大禹团队通过一个智能知识库暨智能会话机器人的解决方案,三个月时间就上线了生成式AI对话机器人“小禹”,实现了快速、精准的查询和回复。

在整个解决方案中,包括预训练大语言模型,Amazon OpenSearch Service的向量数据服务,以及相关系统集成等,这些核心关键能力让解决方案指南能实现目标知识库约80%功能,西门子中国根据企业内部需求再做20%定制化开发,最终形成完整的解决方案。

同时,Amazon OpenSearch Service的无服务器特性,让开发人员不需要管理集群或担心生产规模,可以快速推动部署。

基于Amazon SageMaker上提供的丰富的模型开发和训练工具,也保证了开发人员可以在云端轻松实现大语言模型的调优以及测试更多不同类型的开源模型。

结语

生成式AI正在成为企业新一轮业务创新的重要工具,成为下一代的生产力工具。

总体来看,高性价比的云基础设施技术如同一艘航母,能够为企业提供坚实的底座,让企业摆脱基础设施的束缚,更好、更高效地专注于创新。
【关于科技云报道】

专注于原创的企业级内容行家——科技云报道。成立于2015年,是前沿企业级IT领域Top10媒体。获工信部权威认可,可信云、全球云计算大会官方指定传播媒体之一。深入原创报道云计算、大数据、人工智能、区块链等领域。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/127669.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

关于嵌入式rtthread系统与单片机芯片

简介 我估计已经有很久没更新了,近一年都在某个国企里工作,我做的就是嵌入式工程师的岗位,最近才刚刚退出来,想来说说自己的工作使用的软件和系统。 本身进公司的时候,其实做的就是写单片机的板子的程序的工作&#x…

破局:如何从产业角度锻造企业不败竞争优势?

引言:究竟是坚守过去的辉煌,还是勇敢拥抱未来的变化?柯达的沉沦与富士胶片的崛起,揭示企业如何通过深刻理解自身的核心竞争力,利用产业战略的转变来实现持续发展。从产品竞争到产业升级,这不仅仅是一场商业竞赛的变革,更是一次企业战略思维的…

第24期 | GPTSecurity周报

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预训练 Transformer(GPT)、人工智能生成内容(AIGC)以及大型语言模型(LLM)等安全领域应用的知识。在这里,您可以…

Linux0.11内核源码解析-exec.c

主要实现对二进制可执行文件和shell文件的加载和执行,其中主要的函数是do_execve(),它是系统中断调用int 0x80的功能号__NR_execve()调用,是exec()函数的主要实现以下几点功能: 1.执行对参数和环境参数空间页面的初始化操作,初始…

基于51单片机的智能指纹考勤系统设计

**单片机设计介绍,1661【毕设课设】基于51单片机的智能指纹考勤系统设计-原理图-PCB-程序-报告 文章目录 一 概要二、功能设计设计思路 三、 软件设计原理图 五、 程序六、 文章目录 一 概要 基于51单片机的智能指纹考勤系统是一种利用51单片机作为主控芯片&#x…

Java生成二维码并打印二维码和文字信息

目录 1、生成二维码,并调用画布进行二维码和文字的描绘。 2、主程序:获取打印机,并打印内容 3、打印效果 参考文献: 前期工作是安装好打印机驱动,可连接打印机。 添加三个依赖jar: 具体见文底的参考文献…

k8s 多网卡方案multus

kubernetes 多网卡方案之 Multus_CNI 部署以及基本使用 一、multus cni 出现的背景 在k8s的环境中启动一个容器,默认情况下只存在两个虚拟网络接口(loopback 和 eth0), loopback 的流量始终都会在本容器内或本机循环&#xff0c…

有谁知道怎么下载微信视频号视频吗?

抖音视频下载、某站视频下载都很常见,那你知道怎么下载V信视频号视频吗/今天给大家分享两种简单方便的办法,继续往下看吧!一、犀牛视频下载机器人犀牛视频下载器可以直接解析并下载视频号短视频。您只需转发视频到机器人即可下载。此方法也是…

掌握口才与演讲技巧,让你职场中脱颖而出

在职场竞争日趋激烈的今天,口才和演讲能力已经成为一个人成功的重要标志之一。掌握了优秀的口才与演讲技巧,不仅可以帮助你在工作中更好地表达自己和传达信息,同时也可以让你在同事和上级心中留下深刻印象,从而在职场中脱颖而出&a…

费用预算管理系统

费用预算管理系统 1. 模块概述 《费用管理》以企业费用管理为核心,围绕费用支出审批流程,从费用发生前的事前申请,报销单据审批、付款单据审批,再到出纳付款、会计记账等所有工作流程都在系统中全员、协同完成;并且能…

PaDiM 无监督异常检测和定位-论文和源码阅读

目录 1. 论文 1.1 检测效果 1.2 框架 1.2.1 特征提取embedding extraction 1.2.2 正样本学习Learning of the normality 1.2.3 计算异常图 inference: computation of the anomaly map 2. 源码 2.1 dataset 2.2 model 2.3 提取特征 2.4 infer 1. 论文 https://arx…

图扑 HT for Web 手机端运维管理系统

随着信息技术的快速发展,网络技术的应用涉及到人们生活的方方面面。其中,手机运维管理系统可提供数字化、智能化的方式,帮助企业和组织管理监控企业的 IT 环境,提高运维效率、降低维护成本、增强安全性、提升服务质量,…

分享一下微信小程序里怎么开店

如何在微信小程序中成功开店:从选品到运营的全方位指南 一、引言 随着微信小程序的日益普及,越来越多的人开始尝试在微信小程序中开设自己的店铺。微信小程序具有便捷、易用、即用即走等特点,使得开店门槛大大降低。本文将详细介绍如何在微…

【计算系统】5分钟了解超算,高性能计算,并行计算,分布式计算,网格计算,集群计算以及云计算的区别

5分钟了解超算,高性能计算,并行计算,分布式计算,网格计算,集群计算以及云计算的区别 1. 超算2. 高性能计算3. 并行计算4. 分布式计算5. 网格计算6. 集群计算7. 云计算小结相关资料 1. 超算 超级计算机(Sup…

分享88个工作总结PPT,总有一款适合您

分享88个工作总结PPT,总有一款适合您 88个工作总结PPT下载链接:https://pan.baidu.com/s/1y08X9RMdIOCncbs28aMgDw?pwd8888 提取码:8888 Python采集代码下载链接:采集代码.zip - 蓝奏云 蓝色水彩风年终总结PPT模板 清新水彩简…

深度学习之基于YoloV5火灾烟雾报警系统(GUI界面)

欢迎大家点赞、收藏、关注、评论啦 ,由于篇幅有限,只展示了部分核心代码。 文章目录 一项目简介 二、功能三、火灾烟雾报警系统四. 总结 一项目简介 YoloV5 是深度学习中用于目标检测的一种算法,可以对输入的图像进行识别,标识出…

windows server 2016-IIS静态服务器-设置详细过程

文章目录 1.打开仪表盘新建角色2.iis功能模块3.启动服务器4.优点 1.打开仪表盘新建角色 2.iis功能模块 能选上的尽量选上,除非知道自己用不上。 然后确认,下一步,安装。 3.启动服务器 搜索IIS,启动IIS管理器。 启动网站。 右…

HHDBCS扩展数据库类型

为应对市面上的数据库种类繁多的问题,HHDBCS设置了扩展数据库功能。 在登陆界面点击“工具”,选择“扩展数据库类型”; 注:HHDBCS支持已kingbase,本文仅用来举例。 填入名称、所需数据库的信息,上传驱动…

【tensorboard打开失败】No dashboards are active for the current data set.

这里我再跟视频学的时候,找了很多的指令,说是对应版本不一样,但是发现用了很多指令都可以弹出来跳转的url,那应该就不是输入指令的问题 直到我想把logs里面的文件删掉重新跑的时候,我突然注意到这里有中文字符&#xf…

Android Icon 添加水印 Python脚本

源代码 # -*- coding: utf-8 -*- from PIL import Image 图片合成def mergePictureLXJ():commonIcon Image.open("icon.png")markIcon Image.open("领现金.png")markLayer Image.new(RGBA, commonIcon.size, (0, 0, 0, 0))markLayer.paste(markIcon, (0…