字节算法岗面试,效率贼高

最近这一两周看到不少互联网公司都已经开始秋招提前批了。

不同以往的是,当前职场环境已不再是那个双向奔赴时代了。求职者在变多,HC 在变少,岗位要求还更高了。

最近,我们又陆续整理了很多大厂的面试题,帮助一些球友解惑答疑,分享技术面试中的那些弯弯绕绕。

合集:

《大模型面试宝典》(2024版) 正式发布!

喜欢本文记得收藏、关注、点赞。更多实战和面试交流,文末加入我们


分享我们一星球成员最新面经:

个人情况

985 本硕+项目一个+论文一篇+无实习经历

时间节点

  • 7.2 技术面一面

  • 7.4 技术面二面

  • 7.9 HR 面

  • 7.12 offer call+发offer

图片

面经总结

技术面试

主要问简历项目内容和专业相关知识,也有业务场景提出方案与策略。

在回答业务场景并设计方案的时候,确实之前没有遇到过,所以感觉自己也答的磕磕绊绊,比较好的是,面试官最开始会详细讲解具体是什么场景。

HR 面

想在实习中学到什么/如果offer不过你会做什么/到岗时间和时长/在做项目的过程中遇到的困难/有无考博打算

15分钟很快结束,我还以为凉了,后来发现好像基本都是这个时间。

总结一下:

字节的面试流程很规范,每次都会hr提前联系约面。流程进度也很快,从面试到offer时间为10天。

6、7月份实习还是要试着捡漏的(虽然我简历是5月份投的)

希望大家都能心想事成~

高频面试题总结

  • 目前主流的开源模型体系有哪些?

  • 你了解ReAct吗,它有什么优点?

  • 解释一下langchain Agent的概念

  • langchain 有哪些替代方案?

  • LLM 预训练阶段有哪几个关键步骤?

  • RLHF 模型为什么会表现比SFT更好?

  • 参数高效的微调(PEFT)有哪些方法?

  • LORA 微调相比于微调适配器或前缀微调有什么优势?

  • 请简述TPPO算法流程,它跟TRPO的区别是什么?

  • 目前主流的中文向量模型有哪些?

  • 为什么LLM的知识更新很困难?

  • RAG和微调的区别是什么?

  • 大模型一般评测方法及其准是什么?

  • 什么是Kv cache技术,它具体是如何实现的?

  • DeepSpeed推理对算子融合做了哪些优化?

  • 简述一下FlashAttention的原理

  • MHA、GQA、MQA三种注意力机制的区别是什么?

  • 请介绍一下微软的ZeRO优化器

  • Paged Attention的原理是什么,解决了LLM中的什么问题?

  • 什么是投机采样技术,请举例说明?

  • 简述GPT和BERT的区别

  • 讲一下GPT系列模型的是如何演进的?

  • 为什么现在的大模型大多是decoder-only的架构?

  • 讲一下生成式语言模型的工作机理

  • 哪些因素会导致LLM中的偏见?

  • LLM中的因果语言建模与掩码语言建模有什么区别?

  • 如何减轻LLM中的“幻觉”现象?

  • 解释ChatGPT的“零样本”和“少样本”学习的概念

  • 你了解大型语言模型中的哪些分词技术?

  • 如何评估大语言模型(LLMs)的性能?

  • 请简述下 Transformer 基本原理

  • 为什么 Transformer 的架构需要多头注意力机制?

  • 为什么transformers需要位置编码?

  • transformer中,同一个词可以有不同的注意力权重吗?

  • Wordpiece与BPE之间的区别是什么?

  • 有哪些常见的优化LLMs输出的技术?

  • 为什么transformer块使用LayerNorm而不是BatchNorm?

  • 介绍一下post layer norm和pre layer norm的区别

  • prefix LM和causal LM区别是什么?

  • llama输入句子长度理论上可以无限长吗?

  • 如何让大模型处理更长的文本?

  • 为什么大模型推理时显存涨的那么多还一直占着?

  • 有哪些省内存的大语言模型训练/微调/推理方法?

  • RLHF在实践过程中存在哪些不足?

  • 如何解决三个阶段的训练(SFT->RM->PPO)过程较长,更新迭代较慢问题?

  • 什么是位置编码?

  • 什么是绝对位置编码?

  • 什么是相对位置编码?

  • 旋转位置编码RoPE思路是什么?

  • 旋转位置编码RoPE有什么优点?

  • Layer Norm 的计算公式写一下?

  • RMS Norm 的计算公式写一下?

  • RMS Norm 相比于 Layer Norm 有什么特点?

  • Deep Norm 思路?

  • 写一下 Deep Norm 代码实现?

  • Deep Norm 有什么优点?

  • LN在LLMs中的不同位置有什么区别么?如果有,能介绍一下区别么?

  • RMS Norm 相比于 Layer Norm 有什么特点?

  • Deep Norm 思路?

  • 写一下 Deep Norm 代码实现?

  • Deep Norm 有什么优点?

  • LN在LLMs中的不同位置有什么区别么?如果有,能介绍一下区别么?

  • LLMs各模型分别用了哪种Layer normalization?

技术交流&资料

技术要学会分享、交流,不建议闭门造车。一个人可以走的很快、一堆人可以走的更远。

成立了算法面试和技术交流群,相关资料、技术交流&答疑,均可加我们的交流群获取,群友已超过2000人,添加时最好的备注方式为:来源+兴趣方向,方便找到志同道合的朋友。

方式①、微信搜索公众号:机器学习社区,后台回复:加群
方式②、添加微信号:mlc2040,备注:来自CSDN + 技术交流

精选

  • 轻松构建聊天机器人,大模型 RAG 有了更强大的AI检索器
  • 一文搞懂大模型训练加速框架 DeepSpeed 的使用方法!
  • 保姆级学习指南:《Pytorch 实战宝典》来了
  • MoE 大模型的前世今生
  • 从零解读 SAM(Segment Anything Model)
  • AI 绘画爆火背后:扩散模型原理及实现
  • 从零开始构建和训练生成对抗网络(GAN)模型
  • CLIP/LLaVA/LLaVA1.5/VILA 模型全面梳理!
  • 从零开始创建一个小规模的稳定扩散模型!
  • Stable Diffusion 模型:LDM、SD 1.0, 1.5, 2.0、SDXL、SDXL-Turbo 等
  • 文生图模型:AE、VAE、VQ-VAE、VQ-GAN、DALL-E 等 8 模型
  • 一文搞懂 BERT(基于Transformer的双向编码器)
  • 一文搞懂 GPT(Generative Pre-trained Transformer)
  • 一文搞懂 ViT(Vision Transformer)
  • 一文搞懂 Transformer
  • 一文搞懂 Attention(注意力)机制
  • 一文搞懂 Self-Attention 和 Multi-Head Attention
  • 一文搞懂 Embedding(嵌入)
  • 一文搞懂 Encoder-Decoder(编码器-解码器)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/46393.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

python--实验 11 模块

目录 知识点 模块基础 模块使用方式 自定义模块示例 模块的有条件执行 Python包结构 定义和导入包 常用第三方库及安装 实例代码 第三方库自动安装脚本 Python标准库介绍 PyInstaller 小结 实验 1.(基础题)制作文本进度条。 2.(基础题) 蒙特卡罗方法计算圆周率…

[GXYCTF2019]BabySQli

原题目描述:刚学完sqli,我才知道万能口令这么危险,还好我进行了防护,还用md5哈希了密码! 我看到是个黑盒先想着搞一份源码 我dirsearch明明扫到了.git,算了直接注入试试看 随便输入了两个东西&#xff0c…

Type-C PD芯片:引领充电技术的新纪元

随着科技的飞速发展,人们对电子设备的依赖日益加深,对充电速度、效率和安全性的要求也越来越高。在这样的背景下,Type-C PD(Power Delivery)芯片应运而生,以其高效、安全、智能的特点,成为了充电…

vscode编译环境配置-golang

1. 支持跳转 如果单测函数上方不显示run test | debug test,需要安装Code Debugger(因为以前的go Test Explorer不再被维护了) 2. 单测 指定单个用例测试 go test -v run TestXXXdlv 调试 需要安装匹配的go版本和delve版本(如…

Linux多线程编程-生产者与消费者模型详解与实现(C语言)

1.什么是生成者与消费者模型 生产者-消费者模型是并发编程中的经典问题,描述了多个线程(或进程)如何安全、有效地共享有限的缓冲区资源。在这个模型中,有两种角色: 生产者(Producer)&#xff1…

<数据集>光伏板缺陷检测数据集<目标检测>

数据集格式:VOCYOLO格式 图片数量:2400张 标注数量(xml文件个数):2400 标注数量(txt文件个数):2400 标注类别数:4 标注类别名称:[Crack,Grid,Spot] 序号类别名称图片数框数1Crack8688922Grid8248843S…

研究生发表期刊/会议必看,一文看懂A/B/C类和顶刊

主要看:中国计算机学会(CCF)推荐国际学术期刊 里面的划分等级 等级为:A类(最难)>B类(中等难度)>C类(难度一般) 本人这边计划:最低发C刊&a…

css-grid布局(栅格布局)

css新世界-auto-fit grid 一个比flex更强大的布局,适合做整体布局 grid-template-columns: repeat(auto-fill, minmax(100px, 1fr)); auto-fit的话有strech效果gap 不仅可以用于grid 也可用flex. 在grid-template-areas表示这个位置空着grid area 的 [a b]命名可重复命名 表示的…

双向收发的信号应该在哪进行串联端接?分享几个实用设计方法!

高速先生成员--黄刚 经过上次高速先生的描述,相信大家已经掌握了串联端接的秘诀了,简单来说,那就是第一步:先看看芯片的驱动内阻,第二步:再用加起来50欧姆匹配的方法来选择适合的串阻值,第三步&…

【C语言报错已解决】格式化字符串漏洞(Format String Vulnerability)

🎬 鸽芷咕:个人主页 🔥 个人专栏: 《C干货基地》《粉丝福利》 ⛺️生活的理想,就是为了理想的生活! 文章目录 引言:一、问题描述:1.1 报错示例:1.2 报错分析:1.3 解决思路&#xff…

HEROIC FANTASY WERE CREATURES PACK VOL 2 (幻想生物)

这个包收集了5种英雄幻想生物:狼人,狼人,狼人山羊,狼人鲨鱼和狼人蜘蛛。 狼人:27.5 Ktris Max//101个骨骼//4种材质//最多4096*4096个纹理//40个动画(11个是根运动变体) 狼人:15.83 Ktris//66个骨骼//3种材质//最多4096*4096个纹理//35个动画(9个是根运动变体) wereg…

Centos 使用nfs配置共享目录使docker集群所有容器日志统一主机访问

Centos 使用nfs配置共享目录,使docker集群所有容器日志统一存放在主机一个共享目录下,供开发人员访问查看 准备两台或以上Centos服务器 192.168.0.1 nfs服务器 192.168.0.2 nfs客户端 以root用户登录192.168.0.1服务器,执行以下操作 注意先…

excel根据数据批量创建并重命名工作表

需求 根据一列数据,批量创建并重命名工作表 做法 1. 右键该sheet,选择查看代码 2. 输入VBA代码 正向创建 Sub create_sheets_by_col()Dim num% 定义为integer*num Application.WorksheetFunction.CountA(Sheet1.Range("A:A")) num是非空…

接着探索Linux的世界 -- 基本指令(文件查看、时间相关、打包压缩等等)

话不多说,直接进入主题 一、cat指令 -- 查看目标文件的内容 语法:cat [选项][文件] 功能: 查看目标文件的内容 -b 对非空输出行编号 -n 对输出的所有行编号 -s 不输出多行空行 1、查看目标文件的内容 2、 -b 对非空输出行编号 3、-n 对…

项目部署笔记

1、安全组需开放(如果不开放配置nginx也访问不到) 2、域名解析配置IP(子域名也需配置IP,IP地址可以不同) 3、如果出现图片获其他的文件找不到的情况请仔细检查一下路径是否正确 4、服务器nginx配置SSL证书后启动报错: nginx: […

巧用 VScode 网页版 IDE 搭建个人笔记知识库!

[ 知识是人生的灯塔,只有不断学习,才能照亮前行的道路 ] 巧用 VScode 网页版 IDE 搭建个人笔记知识库! 描述:最近自己在腾讯云轻量云服务器中部署了一个使用在线 VScode 搭建部署的个人Markdown在线笔记,考虑到在线 VScode 支持终…

Day05-filebeat常用的输出组件,logstash的输入输出组件及date,grok,geoip过滤插件实战案例

Day05-filebeat常用的输出组件,logstash的输入输出组件及date,grok,geoip过滤插件实战案例 1、使用filebeat采集docker日志2、filebeat的input类型之filestream实战案例2.1 课堂练习案例2.2 将数据写入到本地文件案例2.3 写入数据到ES集群2.4…

Windows Server 2012 R2 Update 出现错误 80072EFE

解决方案一 错误代码 80072EFE 表示与服务器的连接异常终止。请确保没有防火墙规则或代理阻止 Microsoft 下载 URL。 您还可以尝试以下操作: 单击“开始”,然后单击“运行”。 在“打开”框中键入 cmd 在命令提示符下键入“net stop wuauserv”&#…

《昇思25天学习打卡营第04天|qingyun201003》

日期 心得 从中认识到什么是数据转换,如何进行数据转换;对于数据转换应该如何理解。同时对于数据转换的代码有了深层次的理解。对于数据增强、转换、归一化有了明确的认知。 昇思MindSpore 基础入门学习 数据转换 (AI 代码解析) 数据变换 Transforms …