2024山软创新实训:软件系统架构

软件架构

本文着重介绍本应用:基于开源LLM的易学大模型软件系统的架构。在经过2个月的探索、选型、实验、开发后,我们团队终于把整个系统的各块拼图搭建了起来,现在剩下的是集成、评测、优化和部署的工作。

1. Distributed System

整个项目的逻辑架构是分布式的,总共分为3.5层:

  1. 客户端应用:主要负责最外层web服务的图形化界面与用户接口
  2. web服务端应用:负责基本的增删改查、信息维护。以及对LLM与向量知识库的集成和整合
  3. LLM && RAG Kernel:这里涉及到最内核的部分,我们通过第三方框架(LangChain)落地实现了RAG技术,并且通过开源软件和一些具有强力算力的设备进行了开源通用LLM的微调:
    1. RAG落地实现:这个子模块负责初始化向量知识库,并对外(web服务端应用)提供各种接口,包括上传知识文件,检索知识文件,更新知识文件,获取知识文件列表等等。
    2. LLM微调与部署:我们利用第三方开源软件以及智谱AI提供的chatglm3-6B,进行大模型的微调,在此过程中,利用一些领域前沿技术,进行语料的生成与准备
基于开源LLM的易学大模型软件系统架构图

建议点击图片放大查看 

2. 各模块功能解析与实现细节

客户端应用

技术选型:Node.js + Vue3.js + 各类开源前端组件/样式/界面库 

Node.js (aliyun.com)

Vue.js - 渐进式 JavaScript 框架 | Vue.js

子模块组成:(客户端应用是我们最晚开始开发的一个子系统。目前尚在开发中,后续补充)

实现细节:

  1. 项目实训5-27 前端框架搭建 JFM

web服务端应用

技术选型:

  1. Web服务器:Uvicorn Uvicorn
  2. Web服务+路由管理:FastAPI + Sharlette FastAPI
  3. 数据校验:Pydantic Welcome to Pydantic - Pydantic
  4. 数据库:
    1. 基于硬盘的嵌入式数据库:Sqlite + SQLAlchemy SQLite Home PageSQLAlchemy - The Database Toolkit for Python
    2. 基于内存的缓存数据库:Redis Redis - The Real-time Data Platform

实现细节:

  1. 服务端接口开发:
    1. 创新实训2024.05.25日志:Web应用技术选型 LYH
    2. 创新实训2024.05.26日志:服务端接口实现——用户开启多个会话 LYH
    3. 创新设计记录(一)LJJ
    4. 创新设计记录(二)LJJ
    5. 创新设计记录 LDL
    6. 项目实训5-28 后端部署+依赖报错问题解决 JFM
  2. 数据库部署落地:
    1. 创新实训2024.05.26日志:落地基于硬盘的数据库服务 LYH

LLM Kernel

技术选型:

  1. 语料生成:智谱AI 智谱AI开放平台 (bigmodel.cn)
  2. 微调实验:
    1. 软件是LLAMA Factory GitHub - hiyouga/LLaMA-Factory: Unify Efficient Fine-Tuning of 100+ LLMs
    2. 硬件不方便透露,是我们学院的机器 
  3. 开源大模型:清华智谱AIchatglm3-6b chatglm3-6b

实现细节:

  1. 语料生成:
    1. 创新实训2024.04.07日志:提取QA对 LYH
    2. 创新实训2024.04.11日志:self-instruct生成指令 LYH
    3. 项目实训2024.04.12日志:Self-QA生成问答对 LYH
    4. 项目实训4-18:过滤QA对,update prompt JFM
  2. 微调实验:我们微调后的大模型还没合并集成部署起来,所以后面再写。
  3. 能力增强/提示工程:
    1. 创新实训2024.05.28日志:记忆化机制、基于MTPE与CoT技术的混合LLM对话机制 LYH
  4. 性能评测:
    1.  创新实训2024.05.29日志:评测数据集与baseline测试 LYH
    2.  创新实训-结果统计 LDL

RAG Kernel

技术选型

  1. RAG工具包:Langchain + Langchain ChatChat LangChain Langchain-Chatchat
  2. 向量知识库:Faiss Welcome to Faiss Documentation — Faiss documentation
  3. 文本嵌入模型:BAAI bge-large-zh bge-large-zh

实现细节:

  1. RAG工具包:
    1. 创新实训2024.04.24日志:RAG技术初探 LYH
  2. 知识库建立部署:
    1. 创新实训2024.05.12日志:建立易学知识库 LYH
    2. 项目实训5-23 RAG重新配置 JFM

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/20033.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【Android】

hint在text显示提示内容 设置主键,在mainactivity // 获取SharedPreferences对象存放的用户名和密码,并设为相应组件的值 //指定key的值,及获取不到值时使用的默认值 String sName sp.getString("name", "unknown")…

媲美苹果、三星uwb芯片,飞睿智能UWB SIP芯片方案,创新无线传输、测距、精准定位新纪元

超宽带(UWB)技术作为一种新兴的无线通信技术,以其高精度定位、低功耗、高安全性和强抗干扰能力等优势,在全球范围内得到了广泛关注和快速应用。 2019 年,苹果iPhone11搭载UWB芯片,火极一时的AirDrop隔空投…

MODIS L1B数据规格介绍

1.MODIS 仪器概述 MODIS是EOS AM-1系列卫星的主要探测仪器,也是EOS Terra平台上唯一进行直接广播的对地观测仪器。MODIS是当前世界上新一代“图谱合一”的光学遥感仪器,具有36个光谱通道,分布在0.4-14um的电磁波谱范围内,波段范围…

Docker Hub 国内镜像源配置

Docker Hub 国内镜像源配置 Docker Hub 国内镜像源是指在国内境内提供 Docker 镜像服务的镜像源。由于国际网络带宽等问题,国内用户下载 Docker 镜像通常速度较慢。因此,为了解决这个问题,一些国内的公司和组织提供了 Docker 镜像的国内镜像…

MySQL--MHA高可用及读写分离

一、什么是高可用 1.企业级高可用标准:全年无故障时间 全年无故障时间全年故障时间具体时间99.9%0.1%525.6 minkeeplive双主 (切换需要人为干预)99.99%0.01%52.56 minMHA (半自动化)99.999%0.001%5.256 minPXC、MGR、…

解决3D模型变黑及贴图不显示的问题---模大狮模型网

在3D建模和渲染过程中,模型变黑或贴图不显示是常见的挑战之一。这不仅影响了模型的视觉效果,还可能导致后续的工作流程受阻。本文将针对这两个问题,提供详细的解决方法和步骤,帮助读者快速有效地解决问题。 一、检查并调整光照设置…

Day 8:1461. 检查一个字符串是否包含所有长度为 K 的二进制子串

Leetcode 1461. 检查一个字符串是否包含所有长度为 K 的二进制子串 给你一个二进制字符串 s 和一个整数 k 。如果所有长度为 k 的二进制字符串都是 s 的子串,请返回 true ,否则请返回 false 。 截取每个长度为 k 的字符串,加入 Set 中&#x…

根据状态转移图实现时序电路 (三段式状态机)

看图编程 * ** 代码 module seq_circuit(input C ,input clk ,input rst_n,output wire Y ); reg [1:0] current_stage ; reg [1:0] next_stage ; reg Y_reg; //输出//第一段 : 初始化当前状态和…

汇总区间,合并区间

题目一&#xff1a; 代码如下&#xff1a; vector<string> summaryRanges(vector<int>& nums) {vector<string> ret;if (nums.size() 0)return ret;int n nums.size();int i 0;while (i < n){int prev i;i;while (i < n && nums[i] n…

烧脑的逻辑图又来了,精力绝对不是花费在做图上。

逻辑图设计之所以比较耗费精力&#xff0c;主要是因为它需要进行深入的思考和分析&#xff0c;以确保设计的逻辑正确、完整和可行。以下是一些可能导致逻辑图设计耗费精力的原因&#xff1a; 复杂性&#xff1a;逻辑图设计通常涉及到复杂的业务流程和系统架构。设计师需要理解各…

Spring boot 集成thymeleaf

Spring boot 集成thymeleaf 背景 自己通过Spring boot集成通义千问实现了一个智能问答系统。Spring boot集成通义千问已经完成&#xff0c;现在需要做一个简单的页面展示&#xff0c;作为一个八年没有摸过前端的后端开发人员&#xff0c;不得不又拿起了html和thymeleaf。 Sp…

用例与系统顺序图

习题 问题 考察点 1.Use Cases 用例绘制 列出8个Use Cases, 按优先权分成三个档次, 并分别用Fully dressed、Causual和Brief方式描述 建议:用Fully dressed方式描述的Use Cases应该是项目比较核心,而且需要尽快研制的功能模块;该功能模块的内容比较充实;不要采用如登陆验…

摘下戛纳大奖的《狗阵》,救得了华谊吗?

随着第77届戛纳国际电影节成功落幕&#xff0c;《狗阵》无疑成为了华语电影的最大赢家。 今年的戛纳电影节可以说是华语电影大年&#xff0c;《风流一代》《狗阵》《酱园弄》《九龙城寨之围城》等多部重量级影片亮相戛纳。 但最终抱得奖项而归的只有管虎导演的《狗阵》&#…

appium元素定位工具_uiautomatorviewer.bat

特点&#xff1a; uiautomatorviewer是android-sdk自带的元素定位工具uiautomatorviewer只能用于安卓系统&#xff1b;它是通过截屏分析XML布局文件方式&#xff0c;来提供控件信息的查看服务 uiautomatorviewer.bat 基本使用 路径&#xff1a;这个工具是Android SDK中自带&…

统计计算六|自助法及置换检验(Bootstrap and Permutation Test)

系列文章目录 统计计算一|非线性方程的求解 统计计算二|EM算法&#xff08;Expectation-Maximization Algorithm&#xff0c;期望最大化算法&#xff09; 统计计算三|Cases for EM 统计计算四|蒙特卡罗方法&#xff08;Monte Carlo Method&#xff09; 统计计算五|MCMC&#x…

flutter开发实战-下拉刷新继续下拉路由进入活动页面实现

flutter开发实战-下拉刷新继续下拉路由进入活动页面实现 很多应用都有首页通过下拉刷新&#xff0c;继续下拉进入新的活动会场进入方式。在Flutter中&#xff0c;也可以通过pull_to_refresh来实现控制刷新页&#xff0c;继续下拉进入新的活动会场页面 一、引入pull_to_refres…

深入解析HTTP方法与路由响应

新书上架~&#x1f447;全国包邮奥~ python实用小工具开发教程http://pythontoolsteach.com/3 欢迎关注我&#x1f446;&#xff0c;收藏下次不迷路┗|&#xff40;O′|┛ 嗷~~ 目录 一、HTTP方法概述 1. GET方法 2. POST方法 二、路由与响应处理 1. 路由的默认响应 2. 处…

SpringBoot 基于jedis实现Codis高可用访问

codis与redis的关系 codis与redis之间关系就是codis是基于多个redis实例做了一层路由层来进行数据的路由&#xff0c;每个redis实例承担一定的数据分片。 codis作为开源产品&#xff0c;可以很直观的展示出codis运维成本低&#xff0c;扩容平滑最核心的优势. 其中&#xff0…

JavaWeb笔记整理+图解——Listener监听器

欢迎大家来到这一篇章——Listener监听器 监听器和过滤器都是JavaWeb服务器三大组件&#xff08;Servlet、监听器、过滤器&#xff09;之一&#xff0c;他们对于Web开发起到了不可缺少的作用。 ps&#xff1a;想要补充Java知识的同学们可以移步我已经完结的JavaSE笔记&#x…

宏集JMobile Studio—实现HMI界面高自由度设计

一、简介 物联网HMI的组态软件是数据可视化的重要工具&#xff0c;工程师可以通过图形化界面来配置、监控和管理现场采集的数据。目前&#xff0c;市面上大多数的组态软件里的可视化控件库都由设计师预先部署&#xff0c;用户只能调用而不能完全自定义控件&#xff0c;导致可视…