java调用ai模型:使用国产通义千问完成基于知识库的问答

整体介绍:

基于RAG(Retrieval-Augmented Generation)技术,可以实现一个高效的Java智能问答客服机器人。核心思路是将预先准备的问答QA文档(例如Word格式文件)导入系统,通过数据清洗、向量化处理,并存储到向量数据库中。当用户提问时,系统首先识别并理解用户的查询意图,接着从向量数据库中检索出最相关的文档或数据,最后结合大模型生成准确的回答。整个过程利用了Java编程语言的优势,确保了系统的高效运行和维护性。这种方案不仅能够提升客服机器人的响应速度,还能保证答案的准确性与相关性,为用户提供优质的智能问答体验。

rag介绍:

检索增强生成 (RAG) 是一种技术,它结合了检索模型和生成模型,以私有知识库中的信息来辅助文本生成。这解决了使用大模型时常见的问题:模型可能会产生不准确的回答(即幻觉),以及缺乏企业特定数据导致的泛化回答。通过访问私有知识库,RAG能够提供更精准、更符合上下文的回复。

RAG的主要流程

在RAG(Retrieval-Augmented Generation)中,主要流程分为两个部分:索引构建流程和使用流程。

索引构建流程

首先进行数据准备。数据导入阶段,从各种来源收集原始数据,并对其进行清洗,包括去除噪音、处理缺失值等预处理操作,以确保数据的质量;然后将这些数据转换为适合向量化处理的格式。接下来是向量化模块,在这一阶段,利用预训练的语言模型(如BERT或GLP等)从已清洗的数据中提取特征并将其转换成向量形式。最后一步是数据存储与索引构建,这里会把上述生成的向量数据保存到数据库或文件系统里,并基于这些数据创建索引来加速后续的信息检索过程。

使用流程

当用户提出查询时,首先通过意图识别来分析用户的实际需求,并可能对初始问题进行改写优化以便更好地匹配潜在答案。接着进入检索阶段,系统依据之前建立的索引查找与当前问题高度相关的文档或信息片段。找到相关资料后,重排环节会根据内容的相关性和质量等因素调整搜索结果的顺序,使得最符合要求的答案优先显示。之后,输出接入步骤负责将筛选出的信息组织整理成易于理解的形式,并最终形成完整的回复文本。最后,该回复被呈现给用户,同时系统还能够收集用户反馈用于持续改进服务。

通义千问介绍

通义千问介绍

通义千问是由阿里集团输出的开源大模型服务,它支持全尺寸、多模态的大模型。在中文开源模型领域,通义千问具备显著的优势。以下是通义千问的核心能力、能力排行榜以及价格情况的详细介绍。

核心优势
  1. 能力排名靠前:通义千问在多个客观评测指标上表现优异,如MMLU、TheoremQA和GPQA等,超越了Llama 3 70B。特别是在国产大模型中,其竞技场模式下的性能仅次于OpenAI的GPT系列、Claude和GreK。
  1. 可访问性和合规性:通过API调用时,通义千问提供了安全保护措施,有效避免了恶意攻击问题。
  1. 完全开源:作为目前最为开放的模型之一,通义千问提供了全尺寸的多模态大模型开源版本,用户可以根据需求选择不同规模的模型。
  1. 价格合适:通义千问为用户提供100万免费token,并且调用API的成本相对较低。对于自建模型的情况,甚至可以实现免费使用。特别推荐关注Qwen和Qwen VL两个模态的模型,它们在国内开源榜单上均处于领先地位。
能力排行榜
  • 在国内思南大模型竞技场排名中,通义千问位居前列,是表现最好的开源模型之一。
  • 参考链接:
    • 思南平台
    • 国外竞技场排行榜
    • 基准测试参考
价格情况
  • 提供100万免费token,适合初步尝试和小规模应用。
  • API调用成本低,适合长期使用。
  • 开源特性使得自行部署成为可能,从而进一步降低成本。

Spring AI Alibaba介绍

Spring AI Alibaba 是由 Spring 官方团队维护的针对阿里云大模型服务的实现框架,它基于 Spring AI 的 API,提供了与阿里云百炼大模型系列产品的集成。其核心优势在于提供统一的接口来接入多种AI能力,包括对话、文生图、文生语音等,使得开发者可以轻松切换不同的AI服务而无需修改大量代码。此外,Spring AI Alibaba 作为阿里云的最佳实践之一,特别强调了对 RAG(检索增强生成)的支持,这使得 Java 开发者能够便捷地利用私有知识库进行文本生成和问答系统构建,从而极大地提升了开发效率和应用的智能水平。通过这一框架,开发者不仅能够快速整合阿里云的AI能力到自己的Java应用中,还能享受到Spring生态系统的强大支持和良好的社区资源。

检索增强的后端代码编写

要通过检索增强 (RAG) 的方式读取一个名为 问答聊天机器人素材.docx 的 Word 文件,并构建好向量索引,最后对外提供服务,我们可以遵循以下步骤。根据我了解的信息中的内容,这个过程主要涉及配置、依赖添加以及具体的代码实现。

1. 环境准备

首先确保你的开发环境满足以下要求:

  • JDK版本至少为17
  • Spring Boot版本为3.3.x或更高
  • 已从阿里云获取了通义千问的API key

2. 配置文件设置

在项目的application.properties或者application.yml中添加如下配置项来指定API key:

spring.ai.dashscope.api-key=${AI_DASHSCOPE_API_KEY}

同时,在启动项目前需设置环境变量:

export AI_DASHSCOPE_API_KEY=your_api_key_here

3. 添加仓库与依赖

由于Spring AI Alibaba还在Milestone阶段,需要额外添加特定仓库支持。在你的pom.xml里加入如下仓库定义:

<repositories><repository><id>sonatype-snapshots</id><url>https://oss.sonatype.org/content/repositories/snapshots</url><snapshots><enabled>true</enabled></snapshots></repository><repository><id>spring-milestones</id><name>Spring Milestones</name><url>https://repo.spring.io/milestone</url><snapshots><enabled>false</enabled></snapshots></repository><repository><id>spring-snapshots</id><name>Spring Snapshots</name><url>https://repo.spring.io/snapshot</url><releases><enabled>false</enabled></releases></repository></repositories>

接下来添加必要的依赖到pom.xml中:

<dependencies><dependency><groupId>com.alibaba.cloud.ai</groupId><artifactId>spring-ai-alibaba-starter</artifactId><version>1.0.0-M2</version></dependency><!-- 其他可能需要的依赖 -->
</dependencies>

4. 实现服务类和控制器

创建一个名为RagService的服务类来处理向量索引的构建及查询逻辑。此外,我们还需要一个控制器类RagController用于接收外部请求并调用服务层方法。

RagService.java
public class RagService {// 省略其他成员变量声明private final ChatClient chatClient;private final VectorStore vectorStore;private final DashScopeApi dashscopeApi = new DashScopeApi("your_api_key");private DocumentRetriever retriever;public RagService(ChatClient chatClient, EmbeddingModel embeddingModel) {this.chatClient = chatClient;vectorStore = new DashScopeCloudStore(dashscopeApi, new DashScopeStoreOptions("chatbot_knowledge_base"));retriever = new DashScopeDocumentRetriever(dashscopeApi, DashScopeDocumentRetrieverOptions.builder().withIndexName("chatbot_knowledge_base").build());}public String buildIndex() {String filePath = "路径/问答聊天机器人素材.docx";DocumentReader reader = new DashScopeDocumentCloudReader(filePath, dashscopeApi, null);List<Document> documentList = reader.get();vectorStore.add(documentList);return "Index built successfully.";}public StreamResponseSpec queryWithDocumentRetrieval(String message) {return chatClient.prompt().user(message).advisors(new DocumentRetrievalAdvisor(retriever, DEFAULT_USER_TEXT_ADVISE)).stream();}
}
RagController.java
@RestController
@RequestMapping("/ai")
public class RagController {private final RagService ragService;@Autowiredpublic RagController(RagService ragService) {this.ragService = ragService;}@GetMapping("/ragChat")public Flux<String> generate(@RequestParam(value = "input", defaultValue = "你好") String input, HttpServletResponse response) {response.setCharacterEncoding("UTF-8");return ragService.queryWithDocumentRetrieval(input).content();}@GetMapping("/buildIndex")public String buildIndex() {return ragService.buildIndex();}
}

以上步骤实现了基于给定Word文档建立索引,并且能够通过HTTP GET请求访问http://localhost:8080/ai/ragChat?input=...接口以获取对话回复的功能。记得首次运行应用时先调用/buildIndex端点来初始化数据索引。

检索增强的前端代码编写

为了构建一个基于React的简单前端项目,该项目能够支持从后端接收流式数据(flux<String>),我们可以按照以下步骤操作。这个过程包括创建新的React应用、编写必要的组件代码以处理流式响应,并确保后端接口允许跨源资源共享(CORS)。

1. 创建并初始化React应用

首先,你需要设置一个新的React环境。如果还没有安装Node.js和npm,请先进行安装。然后执行如下命令来创建新的React应用:

npx create-react-app frontend
cd frontend
npm install

这将为你准备好一个基础的React项目结构。

2. 配置基本HTML文件

public/index.html中,保持默认配置即可,因为React会自动使用它作为入口点。

3. 编写React组件

接下来,在src/目录下调整或创建相应的文件,以便我们的应用可以发送请求到指定的后端URL,并处理返回的数据流。

src/index.js

此文件负责渲染根组件App到DOM中。

import React from 'react';
import ReactDOM from 'react-dom';
import App from './App';ReactDOM.render(<React.StrictMode><App /></React.StrictMode>,document.getElementById('root')
);
src/App.js

这里定义了顶层的应用布局,我们将在这里引入ChatComponent

import React from 'react';
import ChatComponent from './components/ChatComponent';function App() {return (<div className="App"><ChatComponent /></div>);
}export default App;
src/components/ChatComponent.js

这是主要的聊天组件,它实现了消息输入、发送以及显示接收到的消息流的功能。

import React, { useState } from 'react';function ChatComponent() {const [input, setInput] = useState('');const [messages, setMessages] = useState('');const handleInputChange = (event) => {setInput(event.target.value);};const handleSendMessage = async () => {try {const response = await fetch(`http://localhost:8080/ai/ragChat?input=${input}`);if (!response.ok) throw new Error('Network response was not ok');const reader = response.body.getReader();const decoder = new TextDecoder('utf-8');let done = false;while (!done) {const { value, done: readerDone } = await reader.read();done = readerDone;const chunk = decoder.decode(value, { stream: true });setMessages((prevMessages) => prevMessages + chunk);}// 添加换行符区分不同请求的结果setMessages((prevMessages) => prevMessages + '\n\n=============================\n\n');} catch (error) {console.error('Failed to fetch:', error);}};const handleClearMessages = () => {setMessages('');};return (<div><inputtype="text"value={input}onChange={handleInputChange}placeholder="Enter your message"/><button onClick={handleSendMessage}>Send</button><button onClick={handleClearMessages}>Clear</button><div><h3>Messages:</h3><pre>{messages}</pre></div></div>);
}export default ChatComponent;

4. 运行你的React应用

完成上述所有步骤之后,你可以通过运行以下命令启动开发服务器:

npm start

这将打开一个本地服务器,默认情况下位于http://localhost:3000。此时,你可以在浏览器中访问该地址,测试聊天功能是否正常工作。

请注意,确保你的后端服务已经正确配置好CORS策略,以便允许来自http://localhost:3000的请求。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/61782.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【C++boost::asio网络编程】有关异步Server样例以及伪闭包延长连接生命周期方法的笔记

异步Server 客户端源码Session类start函数handle_readhandle_write Server类构造函数start_accepthandle_accept 可能会造成的隐患利用伪闭包延长连接的生命周期 客户端源码 #include <iostream> #include <boost/asio.hpp> #include <string> int main() {…

力扣hot100道【贪心算法后续解题方法心得】(三)

力扣hot100道【贪心算法后续解题方法心得】 十四、贪心算法关键解题思路1、买卖股票的最佳时机2、跳跃游戏3、跳跃游戏 | |4、划分字母区间 十五、动态规划什么是动态规划&#xff1f;关键解题思路和步骤1、打家劫舍2、01背包问题3、完全平方式4、零钱兑换5、单词拆分6、最长递…

【linux】(23)对象存储服务-MinIo

MinIO 是一个高性能的对象存储服务&#xff0c;兼容 Amazon S3 API。 Docker安装MinIo 前提条件 确保您的系统已经安装了 Docker。如果还没有安装 Docker&#xff0c;可以参考 Docker 官方文档进行安装。 1. 拉取 MinIO Docker 镜像 首先&#xff0c;从 Docker Hub 拉取 Mi…

MySQL有哪些日志?

MySQL主要有三种日志&#xff1a;undo log、redo log、binlog。前两种是InnoDB特有的&#xff0c;binlog是MySQL的Server层中的。 Buffer Pool buffer pool是MySQL的缓冲池&#xff0c;里面存储了数据页、索引页、undo页等&#xff08;与数据库不一致的即为脏页&#xff09;。…

机器学习周志华学习笔记-第13章<半监督学习>

机器学习周志华学习笔记-第13章&#xff1c;半监督学习&#xff1e; 卷王&#xff0c;请看目录 13半监督学习13.1 生成式方法13.2 半监督SVM13.3 基于分歧的方法13.4 半监督聚类 13半监督学习 前面我们一直围绕的都是监督学习与无监督学习&#xff0c;监督学习指的是训练样本包…

SpringCloud框架学习(第六部分:Sentinel实现熔断与限流)

目录 十四、SpringCloud Alibaba Sentinel实现熔断与限流 1.简介 2.作用 3.下载安装 4.微服务 8401 整合 Sentinel 入门案例 5.流控规则 &#xff08;1&#xff09;基本介绍 &#xff08;2&#xff09;流控模式 Ⅰ. 直接 Ⅱ. 关联 Ⅲ. 链路 &#xff08;3&#xff0…

【Java基础面试题009】Java的I/O流是什么?

相关知识补充&#xff1a;黑马-字符集、IO流&#xff08;一&#xff09;.pdf Autism_Btkrsr/Blog_md_to_pdf - 码云 - 开源中国 (gitee.com) 黑马-IO流&#xff08;二&#xff09;.pdf Autism_Btkrsr/Blog_md_to_pdf - 码云 - 开源中国 (gitee.com) 回答重点 Java的I/O&…

第六届国际科技创新学术交流会暨管理科学信息化与经济创新发展(MSIEID 2024)

重要信息 大会官网&#xff1a;msieid2024.iaecst.org &#xff08;点击了解大会&#xff0c;参会等内容&#xff09; 大会时间&#xff1a;2024年12月6-8日 大会地点&#xff1a;中国-广州 大会简介 随着全球化和信息化的不断深入&#xff0c;管理科学、信息化和经济发展…

python学opencv|读取视频(一)灰度视频制作和保存

【1】引言 上一次课学习了用opencv读取图像&#xff0c;掌握了三个函数&#xff1a;cv.imread()、cv.imshow()、cv.imwrite() 相关链接如下&#xff1a; python学opencv|读取图像-CSDN博客 这次课我们继续&#xff0c;来学习用opencv读取视频。 【2】学习资源 首先是官网…

题外话 (火影密令)

哥们&#xff01; 玩火影不&#xff01; 村里人全部评论&#xff01; 不评论的忍战李全保底&#xff01; 哥们&#xff01; 密令领了不&#xff01; “1219村里人集合”领了吗&#xff01; 100金币&#xff01; 哥们&#xff01; 我粉丝没人能上影&#xff01; 老舅说的…

人形机器人训练、机器臂远程操控、VR游戏交互、影视动画制作,一副手套全部解决!

广州虚拟动力基于自研技术推出了多节点mHand Pro动捕数据手套&#xff0c;其最大的特点就是功能集成与高精度捕捉&#xff0c;可以用于人形机器人训练、机器臂远程操控、VR游戏交互、影视动画制作等多种场景。 一、人形机器人训练 mHand Pro动捕数据手套双手共装配16个9轴惯性…

vue3+view-ui-plus+vite+less 实现自定义iview样式

首先是结论&#xff1a; "less": "^2.7.3", "less-loader": "^4.1.0", vite.config.js resolve: {alias: {// 设置路径~: path.resolve(__dirname, ./),// 设置别名: path.resolve(__dirname, ./src)},extensions: [.mjs, .js, .ts…

SpringMVC接收数据

一、访问路径设置: RequestMapping注解的作用就是将请求的URL地址和处理请求的方式(handler方法)关联起来&#xff0c;建立映射关系;SpringMVC接收到指定的请求&#xff0c;就会来找到在映射关系中对应的方法来处理这个请求 1.精准路径匹配: 在RequestMapping注解指定URL地址…

【微服务】Docker

一、Docker基础 1、依赖的兼容问题&#xff1a;Docker允许开发中将应用、依赖、函数库、配置一起打包&#xff0c;形成可移植镜像Docker应用运行在容器中&#xff0c;使用沙箱机制&#xff0c;相互隔离。 2、如何解决开发、测试、生产环境有差异的问题&#xff1a;Docker镜像…

【自用】管材流转项目前端重部署流程 vue2 webpackage4 vuecli4

一、配置 1.下载项目&#xff0c;使用 IDEA 打开&#xff0c;并配置 Nodejs 它提示我&#xff0c;需要 Node.js&#xff0c;因为 nodejs 14 的 installer 已经官网已经找不到了&#xff0c;使用 fnm 又太麻烦&#xff0c; 所以直接采用在 IDEA 中下载的方式就好了。 2.清除缓…

工程设计行业内外网文件交换解决方案:FileLink助力高效、安全的跨网协作

在工程设计行业&#xff0c;文件交换和信息共享是项目顺利推进的关键。尤其是涉及复杂的设计图纸、技术方案、合同文件等重要资料时&#xff0c;如何确保文件在内外网之间的高效、安全传输&#xff0c;直接影响到项目的进度和质量。FileLink正是为此而生&#xff0c;它为工程设…

Wwise SoundBanks内存优化

1.更换音频格式为Vorbis 2.停用多余的音频&#xff0c;如Random Container的随机脚步声数量降为2个 3.背景音乐勾选“Stream”。这样就让音频从硬盘流送到Wwise&#xff0c;而不是保存在内存当中&#xff0c;也就节省了内存 4.设置最大发声数Max Voice Instances 5.设置音频…

C 语言 “神秘魔杖”—— 指针初相识,解锁编程魔法大门(一)

文章目录 一、概念1、取地址操作符&#xff08;&&#xff09;2、解引用操作符&#xff08;*&#xff09;3、指针变量1、 声明和初始化2、 用途 二、内存和地址三、指针变量类型的意义1、 指针变量类型的基本含义2、 举例说明不同类型指针变量的意义 四、const修饰指针1、co…

Android 使用OpenGLES + MediaPlayer 获取视频截图

概述 Android 获取视频缩略图的方法通常有: ContentResolver: 使用系统数据库MediaMetadataRetriever: 这个是android提供的类&#xff0c;用来获取本地和网络media相关文件的信息ThumbnailUtils: 是在android2.2&#xff08;api8&#xff09;之后新增的一个&#xff0c;该类为…

博泽Brose EDI项目案例

Brose 是一家德国的全球性汽车零部件供应商&#xff0c;主要为全球汽车制造商提供机电一体化系统和组件&#xff0c;涵盖车门、座椅调节系统、空调系统以及电动驱动装置等。Brose 以其高质量的创新产品闻名&#xff0c;在全球拥有多个研发和生产基地&#xff0c;是全球第五大家…