LLM资料

大语言模型(LLM)课程、论文与资料推荐

现在CV和NLP越来越紧密,AIGC、多模态、大模型越来越火,尤其是在LLM(代表成果ChatGPT)的席卷之下。所以Amusi建议:CVer的技能树中要把NLP或者说LLM(至少主流的工作要follow)加上。

— 正文如下 —

随着ChatGPT的爆火,越来越多人开始关注大语言模型(Large Language Models)。但其实早在去年就有一些国外大学开设了相关的课程。发现知乎上这方面信息并不多,因此打算在这里长期持续更新相关的内容。

这些课程通常由NLP大牛教授开设,系统性强,并有配套的讲义、PPT与相关论文推荐,很适合感兴趣的同学快速入门。

最近更新一些论文与学习资料的内容。

一、LLM课程
Stanford CS324 - Large Language Models
课程链接:Home | CS324
Percy Liang刚开的新课,主要材料是一些notes,介绍了大语言模型的基础知识、能力范围、训练部署以及一些大模型相关的问题(数据安全、法律、危害等),总体来说比较简单,适合入门。

JHU CS 601.471/671 NLP: Self-supervised Models

  • 课程链接:CSCI 601.771 (Self-supervised Models)
  • JHU也是NLP大牛校,这门课难度适中,课程主页上各类资源还挺多的,建议大家看一看。

Princeton COS 597G: Understanding Large Language Models

  • 课程链接:COS 597G: Understanding Large Language Models
  • Danqi Chen的课,课程难度较高,主要材料是PPT和相关的论文,适合深入LLM某个方向的同学。

Stanford CS224N: Natural Language Processing with Deep Learning

  • 课程链接:Natural Language Processing with Deep Learning
  • 这门课Christopher Manning在斯坦福开了很多年,很经典的课程。前面是NLP的基础知识,后面几节课会涉及到大语言模型。

Hugging Face NLP Course

  • 课程链接:Introduction - Hugging Face NLP Course
  • Hugging Face大家应该不陌生,最受欢迎的NLP社区,提供模型与数据集。这门NLP课程结合了他们的框架的学习代码,推荐给需要实践的同学。

二、NLP课程
Princeton COS 484: Natural Language Processing

  • 课程链接:Natural Language Processing
  • Danqi Chen最近刚开的课,课件的质量还是挺高的。前半部分传统NLP,后半部分深度学习NLP。

JHU Course # 601.465/665 Natural Language Processing

  • 课程链接:Natural Language Processing
  • JHU开了很多年的NLP课程,但是大部分内容主要涉及传统NLP,如果对这些经典NLP算法细节感兴趣的话可以看一看。

JHU 601.467/667 Introduction to Human Language Technology

  • 课程链接:https://jhu-intro-hlt.github.io/
  • 机器翻译大佬Philipp Koehn的NLP基础课,涉及文本和语音方面的基础知识与应用。

三、学习资料
Speech and Language Processing (3rd ed. draft)

  • 教材链接:Speech and Language Processing- 最经典的NLP教材,本来计划在大概三四年前就完稿的,但是由于近几年NLP领域发展实在太快,作者干脆就不设DDL了,一直在持续更新中。

李宏毅 【生成式AI】

  • 课程链接:https://www.youtube.com/watch?v=yiY4nPOzJEg&list=P…
  • 李宏毅老师的视频,讲得比较深入浅出。这个系列的视频除了介绍ChatGPT以及背后的原理,还涉及到其他生成式AI比如AI绘画的核心算法Stable Diffusion。

李沐 【跟李沐学AI】

  • 课程链接:跟李沐学AI的个人空间-跟李沐学AI个人主页-哔哩哔哩视频
  • 李沐老师的B站视频,最近上了一些大模型相关的论文精读。

吴恩达Andrew Ng - ChatGPT Prompt Engineering for Developers

  • 课程链接:ChatGPT Prompt Engineering for Developers
  • 学习笔记:hibo:吴恩达联合OpenAI新课ChatGPT Prompt Engineering for Developers学习笔记
  • 吴恩达教授最近开设的一小时的提示工程教学视频,最后还会教你如何利用GPT开发一个AI聊天机器人。

The Illustrated Transformer

  • 笔记链接:The Illustrated Transformer
  • 非常经典的Transformer笔记,图文并茂的讲解Transformer的结构。如果你还不熟悉Transformer,那务必尝试一下这个资料!

四、LLM论文

综述

  • A Survey of Large Language Models
  • LLM的综述论文,必看

GPT系列
李沐GPT系列论文精读:GPT,GPT-2,GPT-3 论文精读【论文精读】_哔哩哔哩_bilibili

  • GPT1:Improving Language Understanding by Generative Pre-Training
  • GPT2:Language Models are Unsupervised Multitask Learners
  • GPT3:Language Models are Few-Shot Learners

指令微调

  • RLHF:Training language models to follow instructions with human feedback
  • Instruction Tuning:FINETUNED LANGUAGE MODELS ARE ZERO-SHOT LEARNERS

OpenAI相关

  • OpenAI官方博客:Blog
  • OpenAI Cookbook:GitHub - openai/openai-cookbook: Examples and guides for using the OpenAI API
  • OpenAI应用研究主管Lilian Weng个人博客:Lil’Log

作者:hibo
原文链接:大语言模型(LLM)课程、论文与资料推荐 - 知乎
hart.js/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/2366.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

photoshop制作法线和凹凸贴图

做个选区 Ctrlj 法线贴图 生成凹凸贴图

Spring框架的创建和使用

目录 Spring框架概述 什么是Spring框架 什么是容器 什么是IoC容器 Spring的核心功能 IoC容器和普通程序开发的区别 DI Spring项目的创建和使用 Spring项目创建 创建一个maven项目 添加Spring框架支持 添加一个启动类 Spring项目的使用 存储Bean对象 获取并使用B…

应用级监控方案Spring Boot Admin

1.简介 Spring Boot Admin为项目常用的监控方式,可以动态的监控服务是否运行和运行的参数,如类的调用情况、流量等。其中分为server与client: server: 提供展示UI与监控服务。client:加入server,被监控的…

dataframe基础操作

目录 用法:DataFrame.drop(labelsNone,axis0, indexNone, columnsNone, inplaceFalse) 参数说明: labels 就是要删除的行列的名字,用列表给定 axis 默认为0,指删除行,因此删除columns时要指定axis1; index…

【Git 快速了解】

Git简单了解 一、控制系统 分布式版本控制系统 git 集中式版本控制系统 svn cvs二、安装Git sudo apt install git sudo apt search git 三、配置git环境 参数:–globle :长命令表示配置整个git环境 git config --global user.name “你的用户名” git config -…

torch中 contiguous(), .view(), .reshape(), .permute(), .transpose()的区别与联系

文章目录 1、张量的数据存储2、张量的连续性:contiguous3、.view() 和 .reshape()4、.permute() 和 .transpose()5、总结 1、张量的数据存储 在pytorch中,张量的存储实际上分为两个部分,一部分是张量的头信息,包括张量的shape&am…

随手笔记——Ceres 求解曲线拟合问题

这里写目录标题 说明步骤源代码 说明 Google Ceres 是一个广泛使用的最小二乘问题求解库。在 Ceres 中,只需按照一定步骤定义待解的优化问题,然后交给求解器计算即可。 步骤 定义每个参数块。 参数块通常为平凡的向量,但是在 SLAM 里也可以…

vue3,elementPlus和自己封装,点击 新增添加表单,删除表单,提交数据

ElementPlus下的form也有新增表单 如果你写H5等没找到合适的 自己也可以进行封装 实现3个代码讲解:1:ElementPlus的代码 2:自己书写的代码 3:自己把2的代码进行封装 1:ElementPlus的运行效果 点击提交 1:ElementPlus…

BrowserRouter刷新404解决方案

1、本地开发环境 在js脚本命令里加上 --history-api-fallback "scripts": {"serve": "webpack serve --config webpack.dev.js --history-api-fallback" }2、生产环境,可以修改 nglnx 配置: server {listen XXXX; //端口号…

Python教程(3)——python开发工具vscode的下载与安装

Python的开发工具有很多款,很多都是非常好用的,其中vscode作为其中一款Python的开发工具,是非常轻量级的,今天我们来介绍一下vs code的下载与安装。 vscode的下载与安装 首先需要到vscode的官网,这个谷歌或者百度一下…

Windows上传ios dsym到Bugly

首先下载符号表工具腾讯 Bugly SDK下载 (qq.com) dsym 可以在 wIndow-Organizer-找到版本 右键show In Finder buglyqq-upload-symbol.jar 在上面得文件同级目录下 进入cmd 输入一下命令 需要修改成你自己得信息 java -jar buglyqq-upload-symbol.jar -appid d83b04b3c3 -ap…

hadoop分布式系统复习题 选择题

1、以下哪一项不属于 Hadoop 可以运行的模式? 互联模式 2、下面哪个程序负责 HDFS 数据存储? Datanode 3、HDFS 中的 block 默认保存__3 _份。 4、配置Hadoop时,JAVA_HOME包含在哪一个配置文件中 hadoop-env.sh 。 5、 Hadoop fs中的-get和-p…

VSCode 注释后光标快速定位下一行

VSCode默认用 Ctrl / 注释一行时,光标停留在该行中。下面介绍如何注释后,光标会自动移动到下一行。 1.【View】 ->【Extensions】->【查找并安装Multi-command 扩展】 2.【File 】 -> 【Preferences 】->【Keyboard Shortcuts】&#xff08…

【人工智能】xAI——“X宇宙”又增添了一位新成员

个人主页:【😊个人主页】 🌞热爱编程,热爱生活🌞 文章目录 前言xAI团队成员做解开宇宙本质的AI 前言 有人问他,xAI公司是干啥的?马斯克的回答引用了其偶像、科幻作家道格拉斯・亚当斯的话&…

Python实现将pdf,docx,xls,doc,wps,zip,xlsx,ofd链接下载并将文件保存到本地

前言 本文是该专栏的第31篇,后面会持续分享python的各种干货知识,值得关注。 在工作上,尤其是在处理爬虫项目中,会遇到这样的需求。访问某个网页或者在采集某个页面的时候,正文部分含有docx,或pdf,或xls,或doc,或wps,或ofd,或xlsx,或zip等链接。需要你使用python自…

写给前端工程师的Dart教程(3):类的基础与命名构造函数

题解 | #删除链表峰值# 更多关于算法题解、软件开发面经、机器学习算法面经、各企业面试问题记录,关注Fintech砖,持续更新中。https://www.nowcoder.com/use 题解 | #牛群的重新分组# 链表模拟题 知识点链表模拟题意分析以k个结点为一组翻转链表, 剩下…

【运维小知识】(四)——linux常用命令

运维专栏:运维小知识 目录 1.🍁🍁用mv命令修改文件名 2.🍃🍃创建及删除文件夹即文件夹下所有文件 3.🍂🍂移动文件夹并重命名 4.🌿🌿复制文件 5.🍄&#x…

Python 算法基础篇之字符串操作:索引、切片、常用方法

Python 算法基础篇之字符串操作:索引、切片、常用方法 引言 1. 字符串的概念和创建2. 字符串的索引3. 字符串的切片4. 字符串的常用方法 a ) 查找子字符串 b ) 替换子字符串 c ) 拆分和连接字符串 总结 引言 字符串是一种常见的数据类型,在 Python 中对…

ARM微控制器 AM2432BSEFHIALXR、AM2432BSFFHIALV技术参数(32位MCU)

1、AM2432BSEFHIALXR 32位MCU采用293引脚FCCSP封装,工作频率最高可达800MHz。该微控制器专为需要结合处理和实时通信的工业应用而构建,例如远程I/O模块和电机驱动器。 核心处理器:ARM Cortex-M4F,ARM Cortex-R5F 内核规格&#xf…

pytest 禁用警告信息(忽略警告信息输出)

如图示例代码,提示test_001这个case 存在警告 新增pytest.ini 配置文件 [pytest] filterwarnings errorignore::UserWarning