基于Azure OpenAI Service 的知识库搭建实验⼿册

1.概要
        介绍如何使⽤Azure OpenAI Service 的嵌⼊技术,创建知识库;以及创建必要的资源组和资源,包括 Form Recognizer 资源和
Azure 翻译器资源。在创建问答机器⼈服务时,需要使⽤已部署模型的 Azure OpenAI 资源、已存在的表格识别资源和翻译资
源。通过 Azure ⾃定义资源模板创建服务,填写相应的参数即可。参数包括在您的 Azure OpenAI 资源上部署的指令引擎、在
Azure OpenAI 资源上部署的⽂档嵌⼊引擎、在 Azure OpenAI 资源上部署的查询嵌⼊引擎、您的 Azure OpenAI 资源名称、您的
Azure OpenAI API 密钥、 Redis Stack URL Azure Blob 存储连接字符串等。
嵌⼊是⼀种特殊的数据表⽰格式,可由机器学习模型和算法轻松使⽤。 嵌⼊是⼀段⽂本的语义含义的信息密集表⽰。 每个嵌⼊
是浮点数的⼀个向量,向量空间中两个嵌⼊之间的距离与原始格式的两个输⼊之间的语义相似性相关。 例如,如果两个⽂本相
似,则它们的向量表⽰形式也应该相似。
2. 实验步骤
本节主要描述了如何部署知识库问答服务的相关步骤。
2.1 创建必要的资源组和资源
本节主要是准备动作,创建好最终搭建服务所需要的资源。
2.1.1 创建资源组
Azure OpenAI 服务⽬前部署在 Azure 美东、美国中南部、⻄欧三个数据中⼼。因此,为了让相关资源配合运⾏时取得最低的时
延,建议将资源组以及内含的资源也创建在这三个数据中⼼之中。本例选择在美东数据中⼼创建全部资源和资源组。
以下是在 Azure 美东数据中⼼ (East US) 创建资源组的步骤:
登陆 Azure 管理界⾯ https://portal.azure.com ,选择左侧导航栏中的 资源组 选项
点击 “+ 新建 按钮,在弹出的新建资源组窗⼝中输⼊相关信息,包括资源组名称、订阅、区域等,区域选择美国东部

 

单击 查看 + 创建 以预览并创建资源组
2.1.2 创建 Azure OpenAI 资源
Azure OpenAI 资源是该解决⽅案的核⼼,需要率先创建 Azure OpenAI 资源才能实现对 OpenAI ⼤模型的部署,在 Azure Portal
中创建 Azure OpenAI 资源的步骤如下:
在资源组内,单击 “+ 添加 按钮,在弹出的菜单中选择 “Marketplace” 选项
“Marketplace” ⻚⾯中,搜索 “OpenAI” 并选择 “Azure OpenAI” 服务

 

点击 创建 按钮,根据提⽰填写相关信息,包括名称、订阅、资源组、地区、定价层等,地区选择 East US

点击 查看 + 创建 以预览并创建 Azure OpenAI 资源
创建完成后,访问 https://oai.azure.com ⻚⾯

 

在⻚⾯上点击新建部署按钮,创建 text-davinci-003 部署和 text-embedding-ada-002 部署

 

 

两个部署创建完成后,即意味着 OpenAI 资源已经准备就绪。
2.1.3 创建 Form Recognizer 资源
Azure Form Recognizer 的作⽤是⽤于从⽂档中提取表格、键值对等结构化数据。在本实验中,我们将使⽤ Form Recognizer
别知识库中的⽂本数据。创建 Form Recognizer 资源的步骤如下:
在资源组内,单击 “+ 添加 按钮,在弹出的菜单中选择 “Marketplace” 选项
“Marketplace” ⻚⾯中,搜索 “Form Recognizer” 并选择 表单识别器 服务
点击 创建 按钮,根据提⽰填写相关信息,包括名称、订阅、资源组、地区等,地区选择 East US
点击 查看 + 创建 以预览并创建表单识别器资源
2.1.4 创建 Azure 翻译器资源
Azure 翻译器资源的作⽤是将⽂本翻译成不同的语⾔。在本实验中,我们将使⽤ Azure 翻译器将知识库中的⽂本翻译成多种语
⾔。创建 Azure 翻译器资源的步骤如下:
在资源组内,单击 “+ 添加 按钮,在弹出的菜单中选择 “Marketplace” 选项
“Marketplace” ⻚⾯中,搜索 “Azure 翻译器 并选择该服务

 

单击 创建 按钮,根据提⽰填写相关信息,包括名称、订阅、资源组、地区等,地区选择 East US

 

单击 查看 + 创建 以预览并创建 Azure 翻译器资源

 

2.2 创建知识库问答服务

此存储库使⽤ Azure OpenAI 服务从⽂档创建嵌⼊向量。 为了回答⽤户的问题,它检索最相关的⽂档,然后使⽤ GPT-3 提取问
题的匹配答案。
请注意,您需要:
拥有已部署模型的 Azure OpenAI 资源(例如 text-davinci-003 等指令模型和 text-embedding-ada-002 等嵌⼊模型)
拥有已存在的表格识别资源
拥有已存在的翻译资源
以下是通过 Azure ⾃定义资源模板创建服务的步骤:
Azure 管理界⾯中选择左侧导航栏中的 创建资源 选项
在弹出的 创建资源 窗⼝中输⼊ 模板部署 ,选择 模板部署 ( 使⽤⾃定义模板部署 )”

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/25446.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

SAP-MM-发票校验的重复校验功能

路径:SPRO-物料管理-后勤发票校验-收入发票-设置重复发票检查 按公司代码设置重复检查,可以按三个方式进行检查,公司代码、参照、发票日期,如果此处未维护就是按供应商(XK02)的六项进行检查 但是如果两处都…

MySQL 中的 distinct 和 group by 哪个效率更高?

在 MySQL 中,DISTINCT 和 GROUP BY 都是用来去除重复的数据,但它们的使用场景和性能影响是不同的。 有索引的情况下 group by 和 distinct 都能使用索引,效率相同。 无索引的情况下 distinct 效率高于 group by。原因是 distinct 和 group …

深入学习 Redis - 事务、实现原理、指令使用及场景

目录 一、Redis 事务 vs MySQL事务 二、Redis 事务的执行原理 2.1、执行原理 2.2、Redis 事务设计这么简单,为什么不涉及成 MySQL 那样强大呢? 三、Redis 事务的使用 3.1、使用场景 3.2、具体演示 开启/执行/放弃事务 watch 监控 watch 实现原理…

chapter14:springboot与安全

Spring Boot与安全视频 Spring Security, shiro等安全框架。主要功能是”认证“和”授权“,或者说是访问控制。 认证(Authentication)是建立在一个声明主体的过程(一个主体一般指用户,设备或一些可以在你的应用程序中…

nginx配置访问springboot服务

一、idea中可通过 clean package打包命令,打好包 ,比如:端口为8080,服务访问地址为/, 前端打包文件为dist,访端口为8000, 则可以这样配置nginx server {listen 8000;location / {root html/dist;…

ASP.NET Core SignalR

ASP.NET Core SignalR是一个开发实时网络应用程序的框架,它使用WebSocket作为传输协议,并提供了一种简单和高效的方式来实现实时双向通信。 SignalR使用了一种称为"Hub"的概念来管理连接和消息的传递。开发者可以编写自己的Hub类,…

Django之JWT库与SimpleJWT库的使用

Django之JWT库与SimpleJWT库的使用 JWTJWT概述头部(header)载荷(payload)签名(signature) Django使用JWT说明jwt库的使用安装依赖库配置settings.py文件配置urls.py文件创建视图配置权限 SimpleJWT库的使用安装SimpleJWT库配置Django项目配置路由创建用户接口测试身份认证自定义…

【雕爷学编程】Arduino动手做(190)---MAX4466声音模块

37款传感器与模块的提法,在网络上广泛流传,其实Arduino能够兼容的传感器模块肯定是不止37种的。鉴于本人手头积累了一些传感器和执行器模块,依照实践出真知(一定要动手做)的理念,以学习和交流为目的&#x…

(五)Node.js -模块的加载机制

1. 优先从缓存中加载 模块在第一次加载后会被缓存。这意味着多次调用require()不会导致模块的代码被执行多次。 注意:不论是内置模块、用户自定义模块、还是第三方模块,它们都会优先从缓存中加载,从而提高模块的加载效率。 2. 内置模块的加载…

Jenkins Gerrit Trigger实践

1.创建Gerrit Trigger 2.jenkins master节点生成gerrit用户的密钥 这里的用户名得写登录gerrit后个人信息中的 Username 3.gerrit 配置刚刚jenkins生成密钥的公钥 4.gerrit 用户加入群组 不加这个群组,下一步测试就会报错“User aeshare has no capability conn…

通过VBA宏合并Excel工作表

工作中经常会用到的把几个Excel文件合并到一个,或者是把一个Excel文件里的所有Sheet合并到一个Sheet来进行统计。下面分别提供用vba宏来解决这两个问题的方法。 1、合并Excel文件 打开一个空Excel文件,AltF11,插入一个模块,开始…

Dueling Network

Dueling Network —— Dueling Network Architectures for Deep Reinforcement Learning 论文下载地址 论文介绍 图9. Dueling Network 模型结果示意图 Dueling Network与传统DQN的区别在于神经网络结构的不同,Dueling Netowrk在传统DQN的基础上只进行了微小的改动…

Flowise AI:用于构建LLM流的拖放UI

推荐:使用NSDT场景编辑器助你快速搭建可二次编辑的3D应用场景 什么是Flowise AI? Flowise AI是一个开源的UI可视化工具,用于帮助开发LangChain应用程序。在我们详细介绍 Flowise AI 之前,让我们快速定义 LangChain。LangChain是…

MapTR论文笔记

MAPTR: STRUCTURED MODELING AND LEARNING FOR ONLINE VECTORIZED HD MAP CONSTRUCTION 目的 传统高精地图 通过一些离线的基于 SLAM 的方法生成,需要复杂的流程以及高昂的维护费用。基于 bev 分割的建图方法,缺少向量化 实例级的信息,比如…

应急响应-web后门(中间件)的排查思路

0x01 获取当前网络架构 语言,数据库,中间件,系统环境等 0x02 分析思路 1.利用时间节点筛选日志行为 2.利用已知的漏洞在日志进行特征搜索,快速定位到目标ip等信息 3.后门查杀,获取后门信息,进一步定位目…

基于Vue+wangeditor实现富文本编辑

目录 前言分析实现具体解决的问题有具体代码实现如下效果图总结前言 一个网站需要富文本编辑器功能的原因有很多,以下是一些常见的原因: 方便用户编辑内容:富文本编辑器提供了类似于Office Word的编辑功能,使得那些不太懂HTML的用户也能够方便地编辑网站内容。提高用户体验…

从零开始实现一个 mini-Retrofit 框架

前言 本篇文章将采用循序渐进的编码方式,从零开始实现一个Retorift框架,在实现过程中不断提出问题并分析实现,最终开发出一个mini版的Retrofit框架 演示一个使用OkHttp的项目Demo 为了更好的演示框架的实现过程,这里我先创建了一…

Compose应用案例(利用docker compose安装lnmp实例)

目录 Compose应用案例 一、前提配置 (一)安装docker-ce(Linux安装Docker) (二)安装docker-compose 二、安装docker compose部署lnmp (一)目录结构: (二…

SPM(Swift Package Manager)开发及常见事项

SPM怎么使用的不再赘述,其优点是Cocoapods这样的远古产物难以望其项背的,而且最重要的是可二进制化、对xcproj项目无侵入,除了网络之外简直就是为团队开发的项目库依赖最好的管理工具,是时候抛弃繁杂低下的cocoapods了。 一&…

c语言——杨辉三角

//杨辉三角 #include<stdio.h> int main() {int i,j,k,n0,a[10][10];while(n<0||n>13){/*行数不超过13&#xff0c;为了显示规范*/printf("n即输入行数");scanf("%d",&n);}printf("%d行杨辉三角如下&#xff1a;\n",n);for(i1;i…