【NLP百面百过】大模型算法面试高频面题(全面整理 ʘ‿ʘ)

目录

一、大模型面试指南

重点面题精讲

【LLM面题精讲 - RAG系统面】 查看答案

【LLM面题精讲 - 实体识别面】 查看答案

【LLM面题精讲 - 文本分类面】 查看答案

【LLM面题精讲 - 分布式训练面】 查看答案

【LLM面题精讲 - 大模型微调面】 查看答案

【LLM面题精讲 - 大模型架构面】 查看答案

【LLM面题精讲 - Transformer面】 查看答案

【LLM面题精讲 - LSTM面】 查看答案

【LLM面题精讲 - RNN面】 查看答案

【LLM面题精讲 - Word2Vec面】 查看答案

【LLM面题精讲 - 分词面】 查看答案

高频面题汇总

NLP 基础面 查看答案

BERT 模型面 查看答案

LLMs 微调面 查看答案

二、项目实践

预训练模型

文本分类

LangChain

动手学 RAG

三、算法理论

LLMs篇

BERT篇

Transformer

NLP 基础

四、面经分享

五、大厂AI实践

阿里

百度

腾讯

美团

小米

其他


我在 AI 领域工作多年,长期负责算法团队的招聘和面试,我精心整理了大模型面试中的的一些高频面试题,适合大模型初学者和正在准备面试的小伙伴。

本专栏全面总结了【大模型面试】的高频面题和答案解析,答案尽量保证通俗易懂且有一定深度。旨在帮助AI工程师快速完成面试准备,先人一步顺利拿到心仪 Offer 🎉🎉🎉

一、大模型面试指南

重点面题精讲

【LLM面题精讲 - RAG系统面】 查看答案
  • 用户问题总是召回不准确,在用户理解阶段可以做哪些优化?

  • 文档问答中,如何构建索引,提升对用户问题的泛化能力?

  • 如何合并多路检索的结果,对它们做排序?

  • BM25检索器总是召回无关的知识,最可能的原因是什么?

  • 如何构建重排序模型的微调数据?

  • More ......

【LLM面题精讲 - 实体识别面】 查看答案
  • 实体识别中有哪些难点?

  • 实体识别有哪些常用的解码方式?

  • 如何解决实体嵌套问题?

  • 实体识别的数据是如何进行标注的?

  • 如何解决超长实体识别问题?

  • More ......

【LLM面题精讲 - 文本分类面】 查看答案
  • 如何用检索的方式做文本分类?

  • 如何用Prompt的方式做文本分类?

  • 文本分类任务中有哪些难点?

  • 如何解决样本不均衡的问题?

  • 如果类别会变化如何设计文本分类架构?

  • More ......

【LLM面题精讲 - 分布式训练面】 查看答案
  • PS架构和Ring-AllReduce架构有何不同?

  • 什么是张量并行,如何使用集群计算超大矩阵?

  • ZeRO1、ZeRO2、ZeRO3分别做了哪些优化?

  • 用DeepSpeed进行训练时主要配置哪些参数?

  • More ......

【LLM面题精讲 - 大模型微调面】 查看答案
  • 如果想微调大模型本体参数,有哪些训练技巧?

  • 什么是BitFit微调?

  • 什么是LoRA微调?有哪些可配置的参数?

  • 从零训练一个大模型有哪几个核心步骤?

  • 如何将一个通用大模型训练成行业大模型?

  • 如何准备SFT阶段的训练数据?

  • More ......

【LLM面题精讲 - 大模型架构面】 查看答案
  • LLM架构对Transformer都有哪些优化?

  • 什么是旋转位置编码(RoPE)?

  • RoPE相对正弦位置编码有哪些优势?

  • RoPE如何进行外推?

  • LLM为何使用GQA代替MHA?

  • PreNorm和PostNorm有何不同?

  • 为何使用RMSNorm代替LayerNorm?

  • LLM使用SwiGLU相对于ReLU有什么好处?

  • More ......

【LLM面题精讲 - Transformer面】 查看答案
  • 自注意力层和全连接层有什么区别?

  • 多头注意力相对于单头注意力有什么优势?

  • Transformer中自注意力模块的计算过程?

  • 什么是缩放点积注意力,为什么要除以根号d?

  • BatchNorm和LayerNorm的区别?

  • 解码器为什么要使用Mask?是如何实现的?

  • More ......

【LLM面题精讲 - LSTM面】 查看答案
  • LSTM 如何缓解 RNN 梯度消失的问题?

  • LSTM中记忆单元的作用是什么?

  • LSTM有几个门,分别起什么作用?

  • LSTM的前向计算如何进行加速?

  • LSTM中的tanh和sigmoid分别用在什么地方?为什么?

  • More ......

【LLM面题精讲 - RNN面】 查看答案
  • RNN的输入输出分别是什么?

  • RNN是如何进行参数学习(反向传播)的?

  • 用RNN训练语言模型时如何计算损失?

  • RNN不能很好学习长期依赖的原因是什么?

  • 怎么解决RNN的梯度爆炸问题?

  • More ......

【LLM面题精讲 - Word2Vec面】 查看答案
  • 基于计数的表示方法存在哪些问题?

  • CBOW 和 Skip-gram 哪个模型的词嵌入更好?

  • Word2Vec的词向量存在哪些问题?

  • 为什么说Word2vec的词向量是静态的?

  • Word2Vec如何优化从中间层到输出层的计算?

  • More ......

【LLM面题精讲 - 分词面】 查看答案
  • 如何处理超出词表的单词(OVV)?

  • BPE 分词器是如何训练的?

  • WordPiece 分词器是如何训练的?

  • Unigram 分词器是如何训练的?

  • More ......

高频面题汇总

NLP 基础面 查看答案
  • 【NLP 面试宝典 之 模型分类】 必须要会的高频面题

  • 【NLP 面试宝典 之 神经网络】 必须要会的高频面题

  • 【NLP 面试宝典 之 主动学习】 必须要会的高频面题

  • 【NLP 面试宝典 之 超参数优化】 必须要会的高频面题

  • 【NLP 面试宝典 之 正则化】 必须要会的高频面题

  • 【NLP 面试宝典 之 过拟合】 必须要会的高频面题

  • 【NLP 面试宝典 之 Dropout】 必须要会的高频面题

  • 【NLP 面试宝典 之 早停法】 必须要会的高频面题

  • 【NLP 面试宝典 之 标签平滑】 必须要会的高频面题

  • 【NLP 面试宝典 之 Warm up 】 必须要会的高频面题

  • 【NLP 面试宝典 之 置信学习】 必须要会的高频面题

  • 【NLP 面试宝典 之 伪标签】 必须要会的高频面题

  • 【NLP 面试宝典 之 类别不均衡问题】 必须要会的高频面题

  • 【NLP 面试宝典 之 交叉验证】 必须要会的高频面题

  • More ......

BERT 模型面 查看答案
  • 【NLP 面试宝典 之 BERT模型】 必须要会的高频面题

  • 【NLP 面试宝典 之 BERT变体】 必须要会的高频面题

  • 【NLP 面试宝典 之 BERT应用】 必须要会的高频面题

  • More ......

LLMs 微调面 查看答案
  • 【NLP 面试宝典 之 LoRA微调】 必须要会的高频面题

  • 【NLP 面试宝典 之 Prompt】 必须要会的高频面题

  • 【NLP 面试宝典 之 提示学习微调】 必须要会的高频面题

  • 【NLP 面试宝典 之 PEFT微调】 必须要会的高频面题

  • More ......

二、项目实践

预训练模型
  • 【预训练模型实战(一)】文本分类任务

  • 【预训练模型实战(二)】序列标注任务

  • 【预训练模型实战(三)】文本摘要任务

  • 【预训练模型实战(四)】阅读理解任务

文本分类
  • 【文本分类 理论(一)】如何使用DL做文本分类任务?

  • 【文本分类 理论(二)】多标签分类和长文本分类如何做

  • 【文本分类 理论(三)】层次化多标签文本分类如何做?

  • 【文本分类 实战(一)】使用LSTM完成情感分析任务

  • 【文本分类 实战(二)】基于检索的多层次文本分类

  • 【文本分类 实战(三)】基于 Prompt 的小样本文本分类实践

LangChain
  • 【LangChain 实战(一)】LangChain 初见

  • 【LangChain 实战(二)】PDF 文档问答

  • 【LangChain 实战(三)】源码简读

  • More ......

动手学 RAG
  • 【RAG 项目实战 01】在 LangChain 中集成 Chainlit

  • 【RAG 项目实战 02】Chainlit 持久化对话历史

  • 【RAG 项目实战 03】优雅的管理环境变量

  • 【RAG 项目实战 04】添加多轮对话能力

  • More ......

三、算法理论

LLMs篇

  • 【分布式训练 学习笔记(一)】 流水线并行

  • 【分布式训练 学习笔记(二)】 DP和DDP

  • 【分布式训练 学习笔记(三)】 零冗余优化(ZeRO)

  • 【分布式训练 学习笔记(四)】 张量并行(TP)

  • 【分布式训练 学习笔记(五)】 Megatron 源码解读(上)

  • 【分布式训练 学习笔记(六)】 Megatron 源码解读(下)

  • 【PEFT 学习笔记(一)】PEFT技术综述

  • 【PEFT 学习笔记(二)】技术原理 - BitFit、Prefix Tuning、Prompt Tuning

  • 【PEFT 学习笔记(三)】技术原理 - P-Tuning、P-Tuning v2

  • 【PEFT 学习笔记(四)】技术原理 - Adapter Tuning及其变体

  • 【LoRA 学习笔记(一)】LoRA 原理篇

  • 【LoRA 学习笔记(二)】LoRA 源码篇

BERT篇

  • 【BERT 学习笔记(一)】论文精读

  • 【BERT 学习笔记(二)】源码解析 - 运行示例

  • 【BERT 学习笔记(三)】源码解析 - 模型架构

  • 【BERT 学习笔记(四)】源码解析 - 预训练

  • 【BERT 学习笔记(五)】源码解析 - 模型微调

  • More ......

Transformer

  • 【Transformer 学习笔记(一)】论文精读

  • 【Transformer 学习笔记(二)】核心机制 - 位置编码

  • 【Transformer 学习笔记(三)】核心机制 - 自注意力机制

  • 【Transformer 学习笔记(四)】核心机制 - 层归一化

  • More ......

NLP 基础

  • 【NLP 入门(一)】:自然语言处理概述

  • 【NLP 入门(二)】:中文分词概述

  • 【NLP 入门(三)】:词向量化概述

  • 【NLP 入门(四)】:Seq2Seq 模型概述

  • 【NLP 入门(五)】:Transformer 概述

四、面经分享

  • 双非研究生斩获大厂offer(百度、阿里、顺丰)

  • 六面!双非本科终斩腾讯NLP offer

  • 超详细!腾讯NLP算法岗面经(已offer)

  • 秋招算法面经集合 -- 华为、百度、腾讯、美团等

  • 算法岗通关宝典 -- 社招一年经验,字节5轮、阿里7轮

  • NLP面经集结 -- 达摩院、腾讯、微软、美团、百度

  • NLP面试复盘 -- 阿里、腾讯、头条、paypal、快手

  • More ......

五、大厂AI实践

阿里

  • 阿里小蜜智能服务技术实践及场景探索

  • 阿里云基于预训练模型、智能运维的QA生成算法落地

  • 情感计算在淘宝UGC的应用

  • AliceMind大规模预训练实践及AIGC在ModelScope中的应用

  • More ......

百度

  • 百度:大模型推动的人机交互对话

  • 百度:基于异构互联知识图谱的多模内容创作技术

  • 百度:如何从零样本做中文文本知识标注与挖掘?

  • 百度:文档智能技术与应用

  • 百度:文心开放域对话技术及其应用

  • More ......

腾讯

  • 腾讯:可控、可靠的数据到文本生成技术

  • 腾讯:微信搜一搜中的智能问答技术

  • 腾讯:QQ浏览器搜索中的智能问答技术

  • 腾讯:QQ音乐命名实体识别技术

  • More ......

美团

  • 美团:对话理解技术及实践

  • 美团:大众点评信息流基于文本生成的创意优化实践

  • 美团:对话摘要技术在美团的探索(SIGIR)

  • 美团:基于知识图谱的问答在美团智能交互场景中的应用和演进

  • 美团:美团搜索中查询改写技术实践

  • 美团:美团智能客服核心技术与实践

  • 美团:事件图谱在美团智能客服问答中的应用

  • 美团:小样本学习+自训练实战

  • More ......

小米

  • 小米:音乐垂域的自然语言理解

  • 小米:NLP技术在小米语音助手中的应用

  • More ......

其他

  • 飞猪:POI 识别在飞猪搜索的探索与实践

  • 京东:基于知识图谱的商品营销文案自动生成实践

  • 微软:基于预训练的自然语言生成在搜索与广告中的应用

  • More ......

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/67933.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java 大视界 -- Java 大数据在智能医疗影像诊断中的应用(72)

💖亲爱的朋友们,热烈欢迎来到 青云交的博客!能与诸位在此相逢,我倍感荣幸。在这飞速更迭的时代,我们都渴望一方心灵净土,而 我的博客 正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识,也期待你毫无保留地分享独特见解,愿我们于此携手成长,共赴新程!💖 一、…

list容器(详解)

list的介绍及使用(了解,后边细讲) 1.1 list的介绍(双向循环链表) https://cplusplus.com/reference/list/list/?kwlist(list文档介绍) 1. list是可以在常数范围内在任意位置进行插入和删除的序…

MapReduce分区

目录 1. MapReduce分区1.1 哈希分区1.2 自定义分区 2. 成绩分组2.1 Map2.2 Partition2.3 Reduce 3. 代码和结果3.1 pom.xml中依赖配置3.2 工具类util3.3 GroupScores3.4 结果 参考 本文引用的Apache Hadoop源代码基于Apache许可证 2.0,详情请参阅 Apache许可证2.0。…

【C++STL标准模板库】二、STL三大组件

文章目录 1、容器2、算法3、迭代器 二、STL三大组件 1、容器 容器,置物之所也。 研究数据的特定排列方式,以利于搜索或排序或其他特殊目的,这一门学科我们称为数据结构。大学信息类相关专业里面,与编程最有直接关系的学科&…

算法题(57):找出字符串中第一个匹配项的下标

审题: 需要我们根据原串与模式串相比较并找到完全匹配时子串的第一个元素索引,若没有则返回-1 思路: 方法一:BF暴力算法 思路很简单,我们用p1表示原串的索引,p2表示模式串索引。遍历原串,每次遍历都匹配一次…

求组合数(递推法、乘法逆元、卢卡斯定理、分解质因数)

文章目录 递推法 10^4代码 乘法逆元 10^6代码 卢卡斯定理 1 0 18 m o d 1 0 6 10^{18}mod 10^6 1018mod106代码 分解质因数 常规的解法就不多加赘述了,如(分子/分母,边乘边除),本文讲述以下方法: 递推法 了…

WPF进阶 | WPF 动画特效揭秘:实现炫酷的界面交互效果

WPF进阶 | WPF 动画特效揭秘:实现炫酷的界面交互效果 前言一、WPF 动画基础概念1.1 什么是 WPF 动画1.2 动画的基本类型1.3 动画的核心元素 二、线性动画详解2.1 DoubleAnimation 的使用2.2 ColorAnimation 实现颜色渐变 三、关键帧动画深入3.1 DoubleAnimationUsin…

【Numpy核心编程攻略:Python数据处理、分析详解与科学计算】2.27 NumPy+Pandas:高性能数据处理的黄金组合

2.27 NumPyPandas:高性能数据处理的黄金组合 目录 #mermaid-svg-x3ndEE4hrhO6WR6H {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-x3ndEE4hrhO6WR6H .error-icon{fill:#552222;}#mermaid-svg-x3ndEE4hr…

swagger使用指引

1.swagger介绍 在前后端分离开发中通常由后端程序员设计接口,完成后需要编写接口文档,最后将文档交给前端工程师,前端工程师参考文档进行开发。 可以通过一些工具快速生成接口文档 ,本项目通过Swagger生成接口在线文档 。 什么…

DeepSeek API文档解读(对话模块)

对话(Chat) 对话补全 报文message对象数组 System message name 一个在线聊天系统,其中涉及多个用户和一个系统管理员。在这个系统中,每个用户都可以发送消息,并且系统管理员可以监控和回复这些消息。为了区分不同…

【Numpy核心编程攻略:Python数据处理、分析详解与科学计算】2.19 线性代数核武器:BLAS/LAPACK深度集成

2.19 线性代数核武器:BLAS/LAPACK深度集成 目录 #mermaid-svg-yVixkwXWUEZuu02L {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-yVixkwXWUEZuu02L .error-icon{fill:#552222;}#mermaid-svg-yVixkwXWUEZ…

Linux——文件与磁盘

1. 磁盘结构 磁盘在我们的计算机中有着重要的地位,当文件没有被打开时其数据就存储在磁盘上,要了解磁盘的工作原理先要了解磁盘的结构。 1.1 磁盘的物理结构 以传统的存储设备机械硬盘为例,它通过磁性盘片和磁头来读写数据。磁盘内部有多个旋…

【Envi遥感图像处理】010:归一化植被指数NDVI计算方法

文章目录 一、NDVI简介二、NDVI计算方法1. NDVI工具2. 波段运算三、注意事项1. 计算结果为一片黑2. 计算结果超出范围一、NDVI简介 归一化植被指数,是反映农作物长势和营养信息的重要参数之一,应用于遥感影像。NDVI是通过植被在近红外波段(NIR)和红光波段(R)的反射率差异…

UE虚幻引擎No Google Play Store Key:No OBB found报错如何处理

UE虚幻引擎No Google Play Store Key:No OBB found报错如何处理? 问题描述: UE成功打包APK并安装过后,启动应用时提示: No Google Play Store KeyNo OBB found and no store key to try to download. Please setone …

【Redis】主从模式,哨兵,集群

主从复制 单点问题: 在分布式系统中,如果某个服务器程序,只有一个节点(也就是一个物理服务器)来部署这个服务器程序的话,那么可能会出现以下问题: 1.可用性问题:如果这个机器挂了…

java项目验证码登录

1.依赖 导入hutool工具包用于创建验证码 <dependency><groupId>cn.hutool</groupId><artifactId>hutool-all</artifactId><version>5.5.2</version></dependency> 2.测试 生成一个验证码图片&#xff08;生成的图片浏览器可…

BUU14 [极客大挑战 2019]PHP1

用dirsearch扫描文件&#xff0c;扫了一万年什么也没扫出来 从网上看的wp&#xff0c;他们扫出来www.zip 这里直接用上了&#xff0c;以后有空再扫一遍 下载www.zip 在index.php中 说明要输入select 打开class.php <?php include flag.php;error_reporting(0);class…

20250202在Ubuntu22.04下使用Guvcview录像的时候降噪

20250202在Ubuntu22.04下使用Guvcview录像的时候降噪 2025/2/2 21:25 声卡&#xff1a;笔记本电脑的摄像头自带的【USB接口的】麦克风。没有外接3.5mm接口的耳机。 缘起&#xff1a;在安装Ubuntu18.04/20.04系统的笔记本电脑中直接使用Guvcview录像的时候底噪很大&#xff01; …

蓝桥杯思维训练营(三)

文章目录 题目详解680.验证回文串 II30.魔塔游戏徒步旅行中的补给问题观光景点组合得分问题 题目详解 680.验证回文串 II 680.验证回文串 II 思路分析&#xff1a;这个题目的关键就是&#xff0c;按照正常来判断对应位置是否相等&#xff0c;如果不相等&#xff0c;那么就判…

重生之我在异世界学编程之C语言:深入指针篇(上)

大家好&#xff0c;这里是小编的博客频道 小编的博客&#xff1a;就爱学编程 很高兴在CSDN这个大家庭与大家相识&#xff0c;希望能在这里与大家共同进步&#xff0c;共同收获更好的自己&#xff01;&#xff01;&#xff01; 本文目录 引言正文&#xff08;1&#xff09;内置数…