InternLM2-lesson3作业+笔记

茴香豆

https://www.bilibili.com/video/BV1QA4m1F7t4/?vd_source=902e3124d4683c41b103f1d1322401fa

一、笔记

RAG

RAG(Retrieval Augmented Generation)是一种结合了检索(Retrieval)和生成(Generation)的技术,旨在通过利用外部知识库来增强大预言模型的性能。它通过检索用户输入相关的信息片段,并结合这些信息来生成更准确、更丰富的回答。简而言之,RAG=搜索引擎+大模型
RAG工作原理

三种范式

Naive RAG→Advanced RAG→Modular RAG
在这里插入图片描述

优化方法
  • 嵌入优化
  • 索引优化
  • 查询优化
  • 上下文管理
  • 检索优化:迭代检索、递归检索、自适应检索
  • 大模型微调
    在这里插入图片描述
RAG vs 微调
RAG微调
简介非参数记忆;能够处理知识密集型任务;可以生成多样化内容参数记忆;微调需要大量标注数据;可能存在过拟合
适用场景适合信息更新较快的任务适合高度专业化的任务
优势动态知识更新,能处理长尾知识可以针对特定任务优化
局限依赖外部知识库的质量和大模型的能力需要大量标注数据,不能很好适应新任务
大模型优化方法比较
  • 微调(Fine-tuning)
  • RAG
  • 提示词工程(Prompt Engineering)
  • 微调+RAG+提示词工程
    在这里插入图片描述

茴香豆

在这里插入图片描述

茴香豆是一个基于LLMs的领域知识助手,俗称豆哥。可以用作智能客服,或在即时通讯工具(IM),如微信群中高效解答问题
在这里插入图片描述

系统组成

知识库+前端+后端大模型+豆哥

  • 知识库:markdown、word、pdf、txt、ppt
  • 前端应用:微信、飞书等
  • 后端:本地大模型——书生浦语、通义千问;远程大模型api——chatgpt、chatglm等
  • 豆哥:豆哥负责整合、打通工作流,形成智能领域的知识问答助手
    豆哥的工作流程可以分为:预处理、拒答工作流和应答工作流
    在这里插入图片描述
    拒答工作流可以对提问进行打分,打分高的问题可以进入应答流进行回答。

二、基础作业

在 InternLM Studio 上部署茴香豆技术助手

(1)环境准备
从官方环境复制运行 InternLM 的基础环境
在这里插入图片描述
(2)安装茴香豆
基础模型文件
下载茴香豆代码
(3)搭建RAG助手
增加茴香豆相关的问题到接受问题示例中在这里插入图片描述

创建向量数据库
在这里插入图片描述在这里插入图片描述
运行RAG知识助手
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
除了一个问题以外,其余两个都没有回答!!!
单独提问也无法正常回答:
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/2616.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

springsecurity-权限控制

一,**需求: **用户没有登录的时候,导航栏上只显示登录按钮,用户登录之后,导航栏可以显示登录的用户信息及注销按钮!还有就是,比如admin这个用户,它只有 vip2,vip3功能&a…

【C++】C++的四种类型转换

一、C语言中的类型转换 在C语言中有两种类型转换,隐式类型转换和显示类型转换。 如果赋值运算符左右两侧类型不同,或者形参与实参类型不匹配,或者返回值类型与接收返回值类型不一致时,就需要发生类型转化。 隐式类型转换&#…

autodl私有云使用方法(成员端使用)

此时找管理员添加进团队,https://private.autodl.com/访问,登录账号。可以看到容器实例。 点击创建实例,根据所需创建。版本号不可以超过最高的CUDA支持,可以自己拉取镜像。 此处需要注意数据盘使用量,密切关注。存取传…

【WEB前端2024】开源元宇宙:乔布斯3D纪念馆-第10课-摆件的交互

【WEB前端2024】开源元宇宙:乔布斯3D纪念馆-第10课-摆件的交互 使用dtns.network德塔世界(开源的智体世界引擎),策划和设计《乔布斯超大型的开源3D纪念馆》的系列教程。dtns.network是一款主要由JavaScript编写的智体世界引擎&am…

Erupt Framework:革命性的通用配置管理框架,零前端代码,急速开发通用管理系统

Erupt Framework:革命性的通用配置管理框架,零前端代码,急速开发通用管理系统 摘要 随着技术的快速发展,软件开发的效率和质量成为了企业竞争的关键因素。Erupt,作为一个低代码全栈框架,通过注解的方式动…

光透过率检测仪解析

TH-SGT1便携式隧道光透过率检测仪是一种用于快速、准确地测量隧道内光透过率的设备。它的主要特点是便携性和易用性,方便用户进行现场检测和监测。 这种检测仪通常结合了光电测量技术和现代便携式设计,使得用户可以在各种环境下方便地进行光透过率的测量…

Next实现 i18n 传递 locales 给 getStaticPaths

在 Next.js 中实现国际化(i18n)时,可以通过配置 next.config.js 文件来传递 locales 给 getStaticPaths 函数。下面是一个示例代码,演示如何在 next.config.js 中配置 locales,并在 getStaticPaths 中获取并使用这些 …

OpenCV如何实现拉普拉斯算子的离散模拟

返回:OpenCV系列文章目录(持续更新中......) 上一篇:OpenCV的Sobel 衍生品 下一篇 :OpenCV 如何实现边缘检测器 目标 在本教程中,您将学习如何: 使用 OpenCV 函数 Laplacian() 实…

Yolov5 v7.0目标检测——详细记录环境配置、自定义数据处理、模型训练与常用错误解决方法(数据集为河道漂浮物)

1. Yolov5 YOLOv5是是YOLO系列的一个延伸,其网络结构共分为:input、backbone、neck和head四个模块,yolov5对yolov4网络的四个部分都进行了修改,并取得了较大的提升,在input端使用了Mosaic数据增强、自适应锚框计算、自…

C++ 二叉搜索树

文章目录 二叉搜索树的概念二叉搜索树的性质二叉搜索树的模拟实现封装框架添加操作查找操作删除操作 二叉搜索树的概念 二叉搜索树又称二叉排序树,它或者是一棵空树,或者是具有以下性质的二叉树: 若它的左子树不为空,则左子树上所有节点的值都…

PD虚拟机和Crossover软件有什么不同?谁更强大?

PD虚拟机(Parallels Desktop)和Crossover软件都是为Mac用户提供在macOS上运行Windows应用程序的能力,但它们在设计理念、功能和使用场景上存在一些差异。 PD虚拟机(Parallels Desktop)的特点: 1. 全面的虚…

MySQL中的并发控制,读写锁,和锁的粒度

MySQL中的并发控制,读写锁,和锁的粒度 并发控制的概述 在数据库系统中,并发控制是一种用于确保当多个用户同时访问数据库时,系统能够提供数据的一致性和隔离性的机制。MySQL支持多种并发控制技术,其中包括锁机制、多…

【论文笔记】设计一款针对情境障碍的视力减弱型文件浏览应用程序(上)

论文关键点 ps:这篇文章可以学习的内容比较多,笔记内容也比较丰富因此本次论文笔记会分为上下期 提出的问题: 不方便视觉障碍的情况下(通勤、走路、眼睛疲劳也算)会用text-speech 系统,但是这种听觉是线性的,不适合skim 推导出了融合听觉和视觉阅读模…

用友 GRP-U8 fastjson远程代码执行漏洞复现(XVE-2024-8863)

0x01 产品简介 用友GRP-U8R10行政事业内控管理软件是用友公司专注于国家电子政务事业,基于云计算技术所推出的新一代产品,是我国行政事业财务领域最专业的政府财务管理软件。 0x02 漏洞概述 用友 GRP-U8 R10系列版本 VerifyToken 接口存在低版本fastjson反序列化漏洞,未经…

class094 贪心经典题目专题6【左程云算法】

class094 贪心经典题目专题6【左程云算法】 前言版权推荐class094 贪心经典题目专题6最后 前言 2024-4-23 14:01:48 以下内容源自《【左程云算法】》 仅供学习交流使用 版权 禁止其他平台发布时删除以下此话 本文首次发布于CSDN平台 作者是CSDN日星月云 博客主页是https://…

用户请求经过哪些处理(公网)

DNS服务器之间协作: 递归DNS查询:用户的请求首先发送到递归DNS服务器。 查询根DNS服务器:递归DNS服务器查询根DNS服务器,以找到管理.com顶级域的TLD DNS服务器。 查询TLD DNS服务器:根DNS服务器响应带有TLD DNS服务器…

1079:计算分数加减表达式的值

1079:计算分数加减表达式的值 时间限制: 1000 ms 内存限制: 65536 KB 提交数:57499 通过数: 41720 【题目描述】 编写程序,输入n的值,求1/1−1/21/3−1/41/5−1/61/7−1/8...(−1)^n−1⋅1/n的值。 【输入】 输入一个正整数n。(1…

让php开发更优雅-ThinkPHP篇

前言 随着开发经验的增加,也伴随团队开发的积累,规范开发显得越来越重要,本文给大家提供一些ThinkPHP框架开发API接口的进阶思路和经验,让大家开发更加统一规范,代码看起来更加优雅。 1.更多使用第三方库。团队开发的…

centos7.6上安装mysql7.6 完整过程

安装过程: 参考:https://blog.csdn.net/qq_45103475/article/details/123151050 查找mysql [rootbogon ~]# whereis mysql mysql: /usr/lib64/mysql /usr/share/mysql 删除目录 [rootbogon ~]# rm -rf /usr/lib64/mysql [rootbogon ~]# whereis mysql m…

计算机服务器中了devicdata勒索病毒怎么处理,devicdata勒索病毒解密工具流程

随着网络技术的不断发展与应用,越来越多的企业离不开网络,通过网络可以开展各项工作业务,网络也为企业的生产运营提供各类极大便利,大大提高了生产效率,但网络在为企业提供便利的同时,也为企业的数据安全带…