大模型学习笔记一：大模型应开发基础（模型归类选型、安全因素选型、）

大模型学习笔记一：大模型应开发基础（模型归类选型、安全因素选型、）

news/2025/4/18 22:08:06/文章来源:https://blog.csdn.net/weixin_43679037/article/details/135852037

文章目录

- 一、大模型一些概念介绍
- 二、市面上大模型对比
- 三、大模型使用安全选型
- 四、使用大模型的方式（一问一答、Agent+ Function Calling、RAG、Fine-tuning
- 五、大模型使用路线
- 九、补充说明
- - 1）注意力机制讲解

一、大模型一些概念介绍

1）产品和大模型的区别（产品通过调用大模型来具备的能力）
2）AGI定义
概念：一切问题可以用AI解决
3）大模型通俗原理
根据上文，猜测下一个词
4）大模型测试代码

from openai import OpenAIfrom dotenv import load_dotenv,find_dotenv
_ = load_dotenv(find_dotenv())client = OpenAI()
prompt = "今天我很"
# prompt = "下班了，今天我很"
# prompt = "放学了，今天我很"
# prompt = "AGI 实现了，今天我很"response = client.completions.create(model      = "gpt-3.5-turbo-instruct",propt      = prompt,max_tokens = 512,stream     = True
)for chunk in response:print(chunk.choices[0].text,end='')

二、市面上大模型对比

在这里插入图片描述

三、大模型使用安全选型

在这里插入图片描述

四、使用大模型的方式（一问一答、Agent+ Function Calling、RAG、Fine-tuning

）
①一问一答
在这里插入图片描述
②Agent+ Function Calling

③RAG

④Fine-tuning
努力记住考试内容，长期记住，活学活用（在基础大模型之上加一层微调，该百年模型的权重）

五、大模型使用路线

1）是否要补充知识？
是—使用RAG
2）是否要对接其他系统
是—Function Calling
3）值得尝试微调？
是—用旧数据做fine-tune，有几大好处
①提高大模型的稳定性
②用户量大，降低推理的成本
③提高大模型生成速度

九、补充说明

1）注意力机制讲解

文本举例讲解
有没有注意力机制的区别图

①RNN会有一个隐藏状态，是AI用来理解一个中文词义的作用，可以看到JE和SUIS通过神经网络变成了一个向量

注意力网络的实现

注意力网络做的事：
①每个同学h(x)都听一遍
②同时还要找出其重点
非注意网络做的事：
①线性传播一个人只能传递给下一个人
注意力网络的方式
上下文的向量：

c2 = a21h1+a22h2+a23h3

①x(数字)是输入的语言，通过RNN神经网络变成一个状态h1，
②α是输入的加权平均（attention weight）
③c是每一个词权重的重点

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/654517.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

时序预测 | Python基于Multihead-Attention-TCN-LSTM的时间序列预测

时序预测 | Python基于Multihead-Attention-TCN-LSTM的时间序列预测

目录效果一览基本介绍程序设计参考资料效果一览基本介绍时序预测 | Python基于Multihead-Attention-TCN-LSTM的时间序列预测 Multihead-Attention-TCN-LSTM（多头注意力-TCN-LSTM）是一种结合了多个注意力机制、时序卷积网络（TCN&#xff0…

阅读更多...

Flutter pubspec.yaml添加三方库、插件依赖时版本号前面的^作用

Flutter pubspec.yaml添加三方库、插件依赖时版本号前面的^作用

在 Flutter 的 pubspec.yaml文件中，依赖的版本号前面的 ^符号用于指定版本范围，而没有 ^ 符号则表示精确指定版本带 ^ 符号在依赖版本前使用 ^ 符号，代表接受这个依赖的任何向上兼容的版本（主版本号相同，次版本号或…

阅读更多...

Windows下EDK2快速搭建（详细）过程总结附软件包地址

Windows下EDK2快速搭建（详细）过程总结附软件包地址

目录简介一、软件包下载安装VS2019下载NASM安下载LLVM/CLANG下载IASL下载安装Python安装OpenSSL下载EDK2 二、设置环境变量新增python系统变量新增NASM系统变量三、编译3.1 在edk2目录直接输入cmd3.2 在cmd目录输入：edksetup.bat3.3 打开edk2编译窗口3.4 确认编译…

阅读更多...

代码随想录算法训练营第四天-链表part2

代码随想录算法训练营第四天-链表part2

day2和day3回家太晚，刷完题忘记写笔记了 - -！ 24.两两交换链表中的节点给自己的笔记： 虚拟节点法是创建一个节点，它的next指针指向链表的头节点，这样便于： current指向虚拟节点，然后对链表进…

阅读更多...

STL相关介绍及具体应用

STL相关介绍及具体应用

STL的诞生 C的面向对象和泛型编程的思想目的就是提升代码复用性。为了建立数据结构和算法的一套标准，且避免重复无意义的代码工作，诞生了STL STL基本概念 1、STL（Standard Template Library）称为标准模板库 2、STL从广义上分为…

阅读更多...

awk命令使用方法

awk命令使用方法

简介 awk 是一种强大的文本处理工具，可以用于处理结构化的文本数据。它可以根据指定的模式和动作来筛选、处理和格式化文本。下面是一些常见的 awk 命令使用方法。详细介绍基本语法： awk pattern { action } filename其中，pattern 是用…

阅读更多...

微软 Power Apps Canvas App 画布应用将上传的附件转化为base64编码操作

微软 Power Apps Canvas App 画布应用将上传的附件转化为base64编码操作

微软 Power Apps Canvas App 画布应用将上传的附件结合Power Automate转化为base64编码操作在使用canvas app的过程中，我们有时需要将上传的文件转换为base64存入数据库或者，调用外部接口传参，那么看下如何将文件转化为base64编码格式。首先…

阅读更多...

【数据分析】numpy基础第三天

【数据分析】numpy基础第三天

前言本文只会讲解最常用的加、减、乘、除，点乘（或叫矩阵乘法）、还有广播机制。本文代码链接提取码：1024 第1部分：基础数学计算使用NumPy进行基本的数学运算是十分直观和简单的。下面我们将展示一些基本的加、…

阅读更多...

笨蛋总结JVM

笨蛋总结JVM

笨蛋总结JVM 由于Java语言将自己的内存控制权交给了虚拟机，所以需要了解虚拟机的运行机制 （主要用于回顾JVM） 笨蛋总结JVM 笨蛋总结JVM1.运行时数据区域线程私有区域程序计数器Java虚拟机栈本地方法栈线程共享区域堆方法区 1.2程序计数器…

阅读更多...

SQL编程作业

SQL编程作业

题目： 创建职工表以及职工工资表职工表字段：工号，姓名，性别，年龄工资表字段：编号自增，职工工号，基础工资10000 通过触发器实现： 对职工进行添加时工资表中也要体现当…

阅读更多...

键盘上Ins键的作用

键盘上Ins键的作用

前几天编写文档时，发现一个问题：插入内容时，输入的字符将会覆盖光标位置后的字符。原来是按到了键盘上的 Ins键，解决方法是：再按一次 Ins键（Ins键如果独立作为一键时，否则使用 “Fn Ins”组合键…

阅读更多...

PHP雪花算法

PHP雪花算法

雪花算法（Snowflake Algorithm）是一种分布式唯一ID生成算法，旨在满足分布式系统中对唯一标识的需求。它由Twitter公司的工程师Snowman（Snowflake的创造者）设计，用于生成全局唯一的ID，以应对分布…

阅读更多...

并查集的学习

并查集的学习

并查集可以理解为数学上的集合并查集一般以树这种数据结构来储存每一个元素，判断两个元素是否为同一个集合，通常判断两个元素所在的树的根结点是否相同，因为比较两个元素是否是同一个树要向上查找根结点，所以一般用双亲表示法&a…

阅读更多...

Sphinx的原理详解和使用

Sphinx的原理详解和使用

一、Sphinx介绍 1.1 简介 Sphinx是由俄罗斯人Andrew Aksyonoff开发的一个全文检索引擎。意图为其他应用提供高速、低空间占用、高结果相关度的全文搜索功能。Sphinx可以非常容易的与SQL数据库和脚本语言集成。当前系统内置MySQL和PostgreSQL 数据库数据源的支持，也…

阅读更多...

限时回归！！！3D版《空洞骑士》！！！

限时回归！！！3D版《空洞骑士》！！！

空洞骑士是一款基于横板平台跳跃的传统风格2D动作冒险游戏。庞大的游戏世界交错相通，玩家控制小虫子去探索幽深黑暗的洞穴，成为了一代人茶余饭后的惦念，深受广大玩家们的喜爱。这类平台跳跃游戏一般是游戏开发初学者以及独立游戏开发者们比…

阅读更多...

【DRAM存储器十八】DDR3介绍

【DRAM存储器十八】DDR3介绍

👉个人主页：highman110 👉作者简介：一名硬件工程师，持续学习，不断记录，保持思考，输出干货内容参考资料：《镁光DDR3数据手册》、《JESD79-3E》最近忙于工作&#xff0…

阅读更多...

Linux使用匿名管道实现进程池得以高效通信

Linux使用匿名管道实现进程池得以高效通信

🎬慕斯主页：修仙—别有洞天 ♈️今日夜电波：Nonsense—Sabrina Carpenter 0:50━━━━━━️💟──────── 2:43 🔄 ◀️ ⏸ ▶️ …

阅读更多...

python基础四------完结(概念在下面，代码看不懂了再看）

python基础四------完结(概念在下面，代码看不懂了再看）

# a_list [1,2,3,4,5] # # print(a_list)# 根据下标来删除列表中的元素 # 爬取的数据中有个别的数据是我们不想要的那么我们就可以通过下标的方式来删除 # del a_list[2] # print(a_list)# b_list [1,2,3,4,5] # print(b_list) # pop是删除列表中的最后一个元素 # b_list.…

阅读更多...

stack Error: EACCES: permission denied

stack Error: EACCES: permission denied

报错 stack Error: EACCES: permission denied解决 npm install webpack --save-dev --unsafe-perm参考 npm报错stack Error: EACCES: permission denied, mkdir

阅读更多...

Kali 基本命令大全

Kali 基本命令大全

一、系统信息 arch 显示机器的处理器架构(1) uname -m 显示机器的处理器架构(2) uname -r 显示正在使用的内核版本 dmidecode -q 显示硬件系统部件- (SMBIOS / DMI) hdparm -i /dev/hda 罗列一个磁盘的架构特性 hdparm -tT /dev/sda 在磁盘上执行测试性读取操作 cat /proc/cpu…

阅读更多...

最新文章