LLM包含的知识

  1. 基础知识

    图片

    磨刀不误砍柴工,LLM基础知识还是需要的。会按照历史梳理LM,详解BERT、GPT系列等各种预备核心知识点,并带着进行GPT预训练实战、位置编码(长文本问题)实战等。

  2. 数据工程

    图片

    数据很重要,数据是天花板,算法只是无限接近天花板。LLM的第一步就是数据处理,国外的很多SoTA研究都基于此。

  3. 分布式训练框架

    图片

    大语言模型的“大”,就离不开分布式。ZeRO的三个级别、Deepspeed理论与实战等等是必备技能。

  4. 微调

    图片

    LLM微调最费机器,所以也是知识点最多的地方,比如详解各种PEFT方法、LoRA、QLoRA(两种量化、Page Optimizer等)、RLHF(强化学习基础、RW、PPO和PPO-max)等,以及Llama-Factory实战、LLaMA2-QLoRA实战和RLHF实战来巩固所学。

  5. 推理和部署优化

    图片

    LLM模型搞定,就需要考虑如何快速推理了。这里会详解Flash Attention、Speculative Decoding、KV-Cache、Paged Attention、Dynamic Batching和Contiuous Batching、稀疏attention和MoE等。

  6. 评测和分析

    图片

    LLM有输出啦,那么如何评测呢,又该评测哪些呢?这些问题又是哪里导致的呢?这里会一一进行讲解。

  7. 应用

    图片

    目前应用最火的就是Agent、langchain、RAG了,

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/639586.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

java基础07-final、finally和finalize的区别是什么?

1.final用于声明属性、方法和类,分别表示属性不可改变(常量),方法不可覆盖,类不可继承。 2.finally是异常处理语句结构的一部分,表示总是执行。 3. finalize是java.lang.Object类的一个方法,在垃…

华为网络设备常用命令大全

♥️作者:小刘在C站 ♥️个人主页: 小刘主页 ♥️不能因为人生的道路坎坷,就使自己的身躯变得弯曲;不能因为生活的历程漫长,就使求索的 脚步迟缓。 ♥️学习两年总结出的运维经验,以及思科模拟器全套网络实验教程。专栏:云计算技…

在docker中配置 Linux ls 配色方案 与 shell 提示符

发行版中默认的配置一般非常合理,但是docker中往往忽略了这些简单的配置,备忘一下 1. ls 配色方案 vim ~/.bashrc 在文件最末尾加入如下一行内容: export LS_COLORS"rs0:di01;34:ln01;36:mh00:pi40;33:so01;35:do01;35:bd40…

如何避免 QT 的 View/Model 模式产生消息激活的死循环?

1. 收到 QTableWidget 的 itemChanged 信号,关联的槽函数一般做什么工作? 当收到QTableWidget的itemChanged信号时,关联的槽函数一般用于响应单元格数据的修改。它可以执行以下一些常见的工作: 更新数据:槽函数可以获…

Rsync数据远程同步全备-增量备份

rsync是Linux系统下的数据镜像备份工具 使用快速增量备份工具Remote Sync可以远程同步,支持本地复制,或者与其他SSH、rsync主机同步。 它的特性如下: • 可以镜像保存整个目录树和文件系统。 • 可以很容易做到保持原来文件的权限、时间、软…

基于供水管网建模的漏损控制

1.1供水管网模型的概念和管网建模目的 供水管网系统是比较特殊的城市基础设施,不可见且属于压力管道。随着运行年限的增长,管道的过水能力和水泵的运行工况都发生了变化,管道的改扩建也使管网系统的结构发生了变化,导致系统运行状…

WPF-HelixToolkit包的使用(上)

1、引入HelixToolkit包:新建一个WPF项目,在项目“引用”上右击,选择“管理NutGet程序包”, 2、在左侧“浏览”中输入“helixtoolkit” 3、安装第一个“HelixToolkit”包 4、解决错误:右击属性->应用程序->目标框…

Unity -简单键鼠事件和虚拟轴

简单键鼠事件 — “Test_03” KeyTest 键鼠事件每帧都要监听,要放在Update()中处理 public class KeyTest : MonoBehaviour {// Start is called before the first frame updatevoid Start(){}// Update is called once per framevoid Update(){// 【鼠标点击事件…

银河麒麟桌面桌面操作系统v10保姆级安装

目录 一、下载ISO映像文件 1.产品试用申请 2.试用版下载 二、虚拟机搭建 1.新建虚拟机 2. 选择虚拟机硬件兼容性 3.选择安装客户机操作系统 4.选择客户机操作系统 5.命名虚拟机 6.处理器配置 7.虚拟机内存 8.网络类型 9.硬件 10.指定磁盘容量 三、修改虚拟…

STM32 Hal库FreeRtos查看所有任务的内存栈信息使用情况剩余空间 仅需一个函数搞定 超简单

STM32F103 基于Hal库跑FreeRtos,查看所有任务的栈的信息,包括任务名,任务状态,任务优先级,空闲栈,任务号。 运行结果如下 只需要使用一个函数vTaskList :获得任务的统计信息,形式为…

echart3D地图使用

由于项目需求,需要实现3D全国地图,并且在3D地图上通过3D柱状图显示各个区域的数据,并鼠标悬浮该区域的时候,需要实现该省份区域模块整体向上移动的特效 实现效果大致如下,细节需要各位同学自行调整了 需要安装echart…

03--数据库连接池

1、数据库连接池 1.1 JDBC数据库连接池的必要性 在使用开发基于数据库的web程序时,传统的模式基本是按以下步骤: 在主程序(如servlet、beans)中建立数据库连接进行sql操作断开数据库连接 这种模式开发,存在的问题:…

Flink Kubernetes Operator 介绍

一、简介 Flink Kubernetes Operator是针对在Kubernetes上运行Apache Flink应用程序而设计的工具。它充分利用了Kubernetes的优势,实现了对Flink集群的弹性管理和自动化操作,通过扩展Kubernetes API的方式,提供了管理和操作Flink部署的功能。…

【Qt】—— Qt的基本介绍

目录 (一)什么是Qt (二) Qt的发展史 (三)Qt⽀持的平台 (四) Qt版本 (五)Qt的优点 (六)Qt的应⽤场景 (七&#xff09…

5G_射频测试_测试模式解读(三)

Downlink test models FR1 test model 1.1 (NR-FR1-TM1.1)(满PRB,QPSK)FR1 test model 1.2 (NR-FR1-TM1.2)( QPSK/boosted/40% QPSK)FR1 test model 2 (NR-FR1-TM2)(64QAM 只有1个PRB 功率最低)FR1 test model 2a (NR-FR1-TM2a) )(256QAM 只…

一文了解SSL证书价格

SSL证书的价格因供应商、证书类型和服务级别而异。以下是一些一般性的价格范围: 1. 免费证书:一些证书颁发机构(CA)提供免费的SSL证书,最著名的是JoySSL。这种证书通常适用于个人网站和小型业务。免费证书提供了基本的…

c#怎么访问 devexpress.xtrabars.barbuttonitem

namespace DXApplication1 { public partial class Form1 : DevExpress.XtraEditors.XtraForm { public Form1() { InitializeComponent(); // 修改barButtonItem1的Caption barButtonItem1.Captio…

Linux设置nginx开机自启动

第一步:进入到/lib/systemd/system/ cd /lib/systemd/system/ 第二步:创建nginx.service文件,并编辑 内如如下: [Unit] Descriptionnginx service Afternetwork.target [Service] Typeforking ExecStart/usr/local/nginx/sb…

【Java定时任务】Timer、Quartz、Spring、LinuxCron对比

各种定时任务的对比 Java中常用的定时任务有以下四种: 名称优缺点Timer 优点:不需要任何框架,JDK自带,调度简单 缺点:仅仅是个时间间隔的定时器 Quartz 优点:支持cron,功能强大,不用Spring框架…

蓝桥杯官网填空题(海盗与金币)

题目描述 本题为填空题,只需要算出结果后,在代码中使用输出语句将所填结果输出即可。 12名海盗在一个小岛上发现了大量的金币,后统计一共有将近5万枚。 登上小岛是在夜里,天气又不好。由于各种原因,有的海盗偷拿了很…