大模型llama结构技术点分享；transformer模型常见知识点nlp面经

大模型llama结构技术点分享；transformer模型常见知识点nlp面经

web/2025/4/18 20:29:42/文章来源:https://blog.csdn.net/weixin_42357472/article/details/140686219

1、大模型llama3技术点

参考：https://www.zhihu.com/question/662354435/answer/3572364267

Llama1-3，数据tokens从1-2T到15T;使用了MHA（GQA缓存）；上下文长度从2-4-8K；应用了强化学习对其。

1、pretraining（(1) 初始预训练，(2) 长上下文预训练，以及 (3)
退火（Annealing））+posttraing（SFT+DPO）
2、合成数据应用
3、Norm函数:RMSNorm，Norm结构:Pre-Norm，Self Attention: Grouped Query Attention(GQA) ，Position编码:ROPE，FFN结构:SwiGLU

Norm函数:RMSNorm
Norm结构:Pre-Norm
Self Attention: Grouped Query Attention(GQA)Position编码:ROPE
FFN结构:SwiGLU

在这里插入图片描述

2、transformer模型常见知识点

大模型面经：
https://docs.qq.com/doc/DSGtaUUpydFBEd2FC

在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/web/49192.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

分布式事务（典型的分布式事务场景+CAP+解决方案）

分布式事务（典型的分布式事务场景+CAP+解决方案）

分布式事务与分布式锁的区别： 分布式锁解决的是分布式资源抢占的问题；分布式事务和本地事务是解决流程化提交问题。 SQL中的4个事务隔离级别：（1）读未提交（2）读已提交（3&#xff09…

阅读更多...

如何远程开发完整分析一台新能源车BMS电池管理系统CAN数据矩阵

如何远程开发完整分析一台新能源车BMS电池管理系统CAN数据矩阵

随着我国新能源汽车的崛起，从网络管理平台、数据中心、科研机构、高校教学、车型对标、整车DBC控制策略分析、电池管理系统研究、电池健康管理、网约车管理、电池梯度利用、车队管理等多方面的市场需求，完整分析一台新能源车BMS电池管理系统的CAN矩阵开发…

阅读更多...

【深度学习】yolov8-seg分割训练，拼接图的分割复原

【深度学习】yolov8-seg分割训练，拼接图的分割复原

文章目录项目背景造数据训练项目背景在日常开发中，经常会遇到一些图片是由多个图片拼接来的，如下图就是三个图片横向拼接来的。是否可以利用yolov8-seg模型来识别出这张图片的三张子图区域呢，这是文本要做的事情。造数据假设拼接方式有…

阅读更多...

生成式AI与自然语言处理的结合-提升生成式AI的语言理解能力

生成式AI与自然语言处理的结合-提升生成式AI的语言理解能力

引言近年来，生成式AI已逐渐成为科技发展的前沿领域，其未来发展方向备受关注。对于人类生活和工作方式的影响，生成式AI在对话系统（Chat）和自主代理（Agent）中的表现引发了广泛讨论。本文将全面探…

阅读更多...

Postman中的API Schema验证：确保响应精准无误

Postman中的API Schema验证：确保响应精准无误

Postman中的API Schema验证：确保响应精准无误在API开发和测试过程中，验证响应数据的准确性和一致性是至关重要的。Postman提供了一个强大的功能——API Schema验证，它允许开发者根据预定义的JSON Schema来检查API响应。本文将详细介绍如何在…

阅读更多...

微软全球蓝屏带来的思考及未来战争走向

微软全球蓝屏带来的思考及未来战争走向

微软全球蓝屏事件不仅揭示了技术层面的问题和挑战，还引发了对未来战争走向的一些深入思考。以下是关于这些思考的内容： 微软全球蓝屏带来的思考： 系统稳定性与安全性：微软全球蓝屏事件凸显了操作系统稳定性和安全性的重要性。一…

阅读更多...

Oracle配置TCPS加密协议测试

Oracle配置TCPS加密协议测试

文章目录一、环境信息二、配置过程1.创建证书2.监听配置2.1.配置sqlnet.ora2.2.配置listener.ora文件2.3.配置tnsnames.ora文件2.4.重载监听 3.数据库本地测试3.1. tcps登录测试3.2.日志监控一、环境信息操作系统：Linux 版本信息：Oracle 19c 参考文档…

阅读更多...

asp.net core 集成redis详解

asp.net core 集成redis详解

ASP.NET Core 集成 Redis 详解如下： 目录一、Redis简介二、在ASP.NET Core中集成Redis 三、Redis的高级用法四、注意事项一、Redis简介 Redis是一个开源的内存数据结构存储系统，它可以用作数据库、缓存和消息代理。Redis内置了复制、Lua脚本、…

阅读更多...

$在可编辑 div (contentEditable)末尾插入换行符(\n 或 \＜br\＞)无效的解决办法$

在可编辑 div (contentEditable)末尾插入换行符(\n 或 \＜br\＞)无效的解决办法

背景: 给可编辑 div 末尾插入换行符, 发现仍然未换行; 解决方法: 提前给 div 末尾插入一个 <br> 就行了, 之后看自己情况要不要去掉示例代码: // 如果输入框末尾没有 BR 换行符, 则自动加一个, 避免 Ctrl Enter 两次才显示 const currLastEl dom_input.lastElement…

阅读更多...

缓存框架 Caffeine 的可视化探索与实践

缓存框架 Caffeine 的可视化探索与实践

作者：vivo 互联网服务器团队- Wang Zhi Caffeine 作为一个高性能的缓存框架而被大量使用。本文基于Caffeine已有的基础进行定制化开发实现可视化功能。一、背景 Caffeine缓存是一个高性能、可扩展、内存优化的 Java 缓存库，基于 Google 的 Guava Cac…

阅读更多...

Ubuntu20.04 设置静态ip

Ubuntu20.04 设置静态ip

Ubuntu 从 17.10 开始，已放弃在 /etc/network/interfaces 里固定 IP 的配置，interfaces 文件不复存在，即使配置也不会生效，而是改成 netplan 方式 ，配置写在 /etc/netplan/01-netcfg.yaml ，50-cloud-init.y…

阅读更多...

机器学习笔记-02-基础线性算法认识（问题-解答自查版）

机器学习笔记-02-基础线性算法认识（问题-解答自查版）

前言以下问题以Q&A形式记录，基本上都是笔者在初学一轮后，掌握不牢或者频繁忘记的点 Q&A的形式有助于学习过程中时刻关注自己的输入与输出关系，也适合做查漏补缺和复盘。本文可以让读者用作自查，答案在后面&#xff0…

阅读更多...

跟《经济学人》学英文：2024年07月20日这期 At last, Wall Street has something to cheer

跟《经济学人》学英文：2024年07月20日这期 At last, Wall Street has something to cheer

At last, Wall Street has something to cheer 华尔街终于有值得欢呼的事情了 at last：终于；最后； Consumer banks, on the other hand, are starting to suffer 原文： Capital markets are twitchy. When interest rates spi…

阅读更多...

数据危机！4大硬盘数据恢复工具，教你如何正确挽回珍贵记忆！

数据危机！4大硬盘数据恢复工具，教你如何正确挽回珍贵记忆！

在这个数字化的时代，硬盘里的数据对我们来说简直太重要了。但糟糕的是，数据丢失这种事时不时就会发生，可能是因为不小心删了，硬盘坏了，或者中了病毒。遇到这种情况，很多人可能就慌了，不知道怎么…

阅读更多...

货架管理a

货架管理a

路由->vue的el标签->Api->call方法里calljs的api接口->数据声明const xxxData-> 编辑按钮:点击跳出页面并把这一行的数据给到表单formDataba2 保存按钮:formDataba2改过的数据->xxApi发送->查询Api 跳转仓库:把tableData.value数据清空->callXxxAp…

阅读更多...

Windows环境下安装Redis并设置Redis开机自启

Windows环境下安装Redis并设置Redis开机自启

文章目录 0. 前言1. 下载 Windows 版本的Redis2. 为 Redis 设置连接密码（可选）3. 启动 Redis4. 设置 Redis 开机自启4.1 将 Redis 进程注册为服务4.2 设置 Redis 服务开机自启4.3 重启电脑测试是否配置成功4.4 关闭 Redis 开机自启（拓展&…

阅读更多...

Typora笔记上传到CSDN

Typora笔记上传到CSDN

1.Typora 安装 Typora链接：百度网盘提取码：b6d1 旧版本是不需要破解的后来的版本比如1.5.9把放在typora的根目录下就可以了 2.上传到CSDN 步骤 csdn 写文章-使用MD编辑器-导入本地md文件即可问题图片没法显示原因图片的链接是本地的当然没法…

阅读更多...

Ubuntu 24 PXE Server bios+uefi 自动化部署esxi 6 7 8

Ubuntu 24 PXE Server bios+uefi 自动化部署esxi 6 7 8

pxe server 前言 PXE（Preboot eXecution Environment，预启动执行环境）是一种网络启动协议，允许计算机通过网络启动而不是使用本地硬盘。PXE服务器是实现这一功能的服务器，它提供了启动镜像和引导加载程序，使得客户端计算机可以通过网络启动并安装操作系统或运行其他软件…

阅读更多...

java学习记录09：Lambda表达式与引用

java学习记录09：Lambda表达式与引用

Lambda表达式例子： （o1，o2） -> Interger.compare(o1,o2); 格式： -> : lambda操作符 -> 的左边: lambda形参列表，对应着要重写的接口中的抽象方法的形参列表。 ->的右边：lamb…

阅读更多...

python编程表白爱心代码，来自程序员的浪漫！

python编程表白爱心代码，来自程序员的浪漫！

Python爱心表白代码感觉的紫色要更加浪漫，其中的文字也是可以直接更改的，非常方便 <文末附带精品籽料> 改变爱心的颜色: 在源代码的13-15行位置，可以通过更改16进制颜色色值进行改变爱心的颜色，这里小编改了一点绿色&…

阅读更多...

最新文章