腾讯视频 2025届暑期实习 自然语言处理/LLM (已OC)

文章目录

  • 写在前面
  • 一面 2024/3/28 晚上19:00-20:00
  • 二面 2024/4/9 下午16:30-17:50
  • 三面/HR面 2024/4/17 下午16:30-16:50

写在前面

  1. 学校情况:2本9硕,本硕都是计算机科班,但研究方向并不是NLP,而是图表示学习,也算是转行成功了
  2. 论文情况:2A1B均为一作,其中1A(NeurIPS)+1B(ICDM)已发表,另有1A刊在投
  3. 实习情况:一段快手推荐算法日常实习

一面 2024/3/28 晚上19:00-20:00

  1. 首先是一个自我介绍
  2. 让讲两个拿手的东西,第一个首先介绍了NeurIPS那篇论文
  3. 中间穿插着问了10多个问题,包括具体原理,数据集规模,下游任务等
  4. 第二讲了快手的实习,主要干了些什么,中间穿插着10来个问题,面试官显然也了解GNN,因此这两部分耽误的时间较久
  5. 问我主要是搞GNN这块的,是怎么接触到大模型的,我说本科搞时序预测的,比较相关,再加上比较感兴趣
  6. 接下来是大模型八股拷打
  7. 说一下Transformer的具体结构,以机器翻译为例,说了编码器和解码器的工作步骤,包括训练和测试
  8. BERT和GPT的区别在哪里?从结构上说了一些,然后从BERT的任务说了一些(MLM和NSP)
  9. GPT和其他常见的大模型,比如LLaMA还有ChatGLM的区别在哪里?从结构,激活函数,位置编码以及训练的任务四个角度说了一下
  10. 预训练微调了解吗,提了一嘴LoRA
  11. 说了一下LoRA的具体原理,以及具体是用在什么地方
  12. LLaMA-70B这样的模型,加载不进去,该怎么训练呢?我从模型并行说了一下,顺便讲了数据并行
  13. GNN和LLM有没有什么好的结合方式,思路是类似把节点当做token,然后把节点序列送入LLM,然后又讲了讲当出现新的节点时可能会怎么处理
  14. 算法题:一个数值不重复的序列,每次插入一个值,如果该值存在,则将其移动到末尾,否则插入到末尾,要求O(1)时间复杂度。这题类似于LRU,用了哈希+双向链表,哈希存储值和node的映射
  15. 能实习多久,什么时候到岗?
  16. 反问:实习生进去后主要做了些什么

二面 2024/4/9 下午16:30-17:50

  1. 自我介绍
  2. 讲解NeurIPS论文,问了大概十几个问题,从动机,到细节,再到实验,让直接打开论文讲
  3. 讲解ICDM论文,问了大概十几个问题
  4. 讲一下对大模型的理解,从上个世纪的词频统计等方法,再到skip-gram,再到rnn,再到Transformer,再到BERT,再到GPT,再到一些有监督微调方法如LoRA,还有强化学习
  5. BERT和GPT有什么区别?
  6. 各有什么优势?
  7. 为什么BERT更适合做文本理解,GPT适合做生成任务
  8. 谈谈你对强化学习在LLM中的理解
  9. 图神经网络中一般用什么norm,why
  10. norm的作用,各种,追问了很多,感觉回答得不是特别好
  11. 算法题:m * n的格子,从左上角到右下角有多少条路径,需要将格子中的障碍物避开,二维DP
  12. 反问:进去主要做些什么,面试官谈了大概十多分钟
  13. 问了offer的情况,以及能实习多久,大概多久来

三面/HR面 2024/4/17 下午16:30-16:50

  1. 自我介绍
  2. 问有没有深造的打算
  3. 问到了职业规划
  4. 具体说了一下实习经历,包括做了什么
  5. 实习中具体是自己一个人在做吗?还有什么可以提升的地方吗?
  6. 你觉得自己的优缺点是什么?有什么的爱好和兴趣?优缺点描述完后问了MBTI
  7. 为什么会想到做公众号?一般做什么方向的?后续对这个公众号有更具体的规划吗
  8. 你一般通过什么来了解你这个领域的前沿技术?论文和学术交流
  9. 进去后具体想要做什么方向有规划吗?城市意向
  10. offer情况,什么时候能入职,入职后能待多久,能一直实习下去吗?
  11. 确认了一下个人信息
  12. 反问环节:具体进去做什么,HR说需要和mentor沟通

20分钟后收到了云证通知,状态也变成了录用评估中,4.20 OC,告知下周给offer

我每次面试刚结束,都会赶紧记录一下面试中的问题,因此上面写的基本就是比较完整的面试过程了,有没有涉及到的可以在评论区问我

最后祝愿大家都能拿到理想的offer!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/826712.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

使用Python实现文本分类与情感分析模型

文本分类与情感分析是自然语言处理中常见的任务,它们可以帮助我们对文本进行自动分类和情感判断。在本文中,我们将介绍文本分类与情感分析的基本原理和常见的实现方法,并使用Python来实现这些模型。 什么是文本分类与情感分析? …

基于SpringBoot+Vue七匹狼商城系统的设计与实现

系统介绍 近年来随着社会科技的不断发展,人们的生活方方面面进入了信息化时代。计算机的普及,使得我们的生活更加丰富多彩,越来越多的人使用通过网络来购买各类的商品。早期商品的销售和购买都是通过实体店,这种购买方式需要耗费…

Pyinstaller编译python项目为exe遇到的问题,flask服务无法启动

SocketIO(app)无法启动,提示ValueError: Invalid async_mode specified 需要安装以下包: gevent gevent-websocket 然后SocketIO不需要设置async_mode,并且使用pyinstaller的时候需要设置–hidden-import –hidden-import 是 PyInstaller 打包工具的一个命令行选项…

分析和比较深度学习框架 PyTorch 和 Tensorflow

🍉 CSDN 叶庭云:https://yetingyun.blog.csdn.net/ 深度学习作为人工智能的一个重要分支,在过去十年中取得了显著的进展。PyTorch 和 TensorFlow 是目前最受欢迎、最强大的两个深度学习框架,它们各自拥有独特的特点和优势。 1. Py…

网络编程学习——IO多路复用

目录 ​编辑 一,多路复用 1,IO的分类 2,IO的效率 二,Linux环境下实现通信的多路复用 1,select select的特点: 参数: 操作函数: 返回值: 使用select实现网络通信…

B树和B+树试题解析

一、单项选择题 01.下图所示是一棵(A ). A.4阶B树 B.3阶B树 C.4阶B树 D.无法确定 02.下列关于m阶B树的说法中,错误的是( C ). A.根结点至多有m棵子树 B.所有叶结点都在同一层次上 C.非叶结点至…

JAVAEE——IP协议

文章目录 IP协议IP协议报头格式IP协议报头的各个区段四位版本四位首部长度八位服务类型16位总长度16位标识,3位标志,13位片偏移八位生存时间八位协议 地址管理IP地址解决提议1:动态分配Ip地址解决提议2:NAT机制 IP协议 IP协议报头…

SparkSQL允许左联接的数据量大于左表数据量?

Spark SQL联接 1、Spark SQL联接2、问题描述3、问题原因4、问题解决5、Spark SQL联接总结1、Spark SQL联接 本文主要记录一次Spark SQL在多表关联时出现的OOM问题以及解决。看似是OOM问题,实则是数据倾斜问题。在讨论这个问题之前,我们有必要先来看一下Spark SQL有哪些Join类…

超越GPT-4V,苹果多模态大模型上新,神经形态计算加速MLLM(二)

上文介绍基于MINOnets神经网络架构加速多模态大模型的策略,本文将以Spinnaker2多核神经网络芯片EGRU架构为起点,覆盖存内计算架构,介绍新型计算架构在加速大模型推理的作用。SpiNNaker 2是一个设计用于大规模异步处理的多核神经形态芯片&…

openGauss学习笔记-267 openGauss性能调优-TPCC性能调优测试指导-网络配置-网卡多中断队列设置

文章目录 openGauss学习笔记-267 openGauss性能调优-TPCC性能调优测试指导-网络配置-网卡多中断队列设置267.1 操作步骤 openGauss学习笔记-267 openGauss性能调优-TPCC性能调优测试指导-网络配置-网卡多中断队列设置 本章节主要介绍openGauss数据库内核基于鲲鹏服务器和openE…

T3BI T3BI RS-232通讯操作指南与培训PPT课件

T3BI T3BI RS-232通讯操作指南与培训PPT课件

Python连接Oracle数据库问题解决及Linux服务器操作知识

背景说明 最近在做一个视频分析的项目,然后需要将视频分析的数据写入到oracle数据库,直接在服务器上测试数据库连接的时候出现了这个bug提示,自己通过不断的研究探讨,最终把这个问题成功进行了解决,在这里进行一下记录…

701强连通分量(python)

看见题目知道时间复杂度不超过(mlogm)。 这题用强连通分量 Tarjan 算法,强联通:对于任意两个点u和v,u可以到达v,v也可以到达u。这题需要考虑有重边,自环,同样别忘记可能会有两个点u…

Linux 操作系统编译器、静态库、动态库

1、编辑器 1.1、vim的安装 指令:sudo apt-get install vim 1.2 vim的使用 格式:vim 文件名 如果文件存在,只打开,文件不存在,创建并打开 vim的4中模式: 命令模式,插入模式,底行模…

JumpServer 运维指南

修改HTTP访问端口 rootuvm-01:/opt/tools/jumpserver-offline-installer-v3.10.7-amd64# ./jmsctl.sh reconfig./jmsctl.sh: line 204: down: command not found 1. Configure Private Key complete2. Configure Persistent Directory Do you need custom persistent store, …

Excel数据处理:高级筛选、查找定位、查找函数(VLOOKUP)

高级筛选 先去选中筛选区域 如果筛选的条件在同一行那么就是且的关系 如果筛选的条件不在同一行那么就是或的关系 查找定位空值 使用VLOOKUP函数

渗透测试入门教程,从零基础入门到精通(非常详细)

目录 什么是渗透测试 渗透测试的重要性 渗透测试的前置技能 开始入门学习路线 什么是渗透测试 渗透测试,通常被视为模拟黑客的一种安全评估行为,其目的在于全面挖掘目标网站或主机的潜在安全漏洞。与真实的黑客攻击不同,渗透测试旨在发现…

Spring定时器 Cron表达式的用法

前言 Cron表达式是一种用于描述定时任务执行时间的字符串格式,这种表达式基于时间字段来定义任务应该在哪些时间点执行,通常包含六个或七个用空格隔开的字段,分别代表秒、分钟、小时、日期、月份和星期(年份是可选的)…

嵌入式系统中AI可以提高开发效率方法

未来是 AI 的时代,博主最近写代码都喜欢用 AI 写个草稿,修修改改就能用,大幅提高了工作效率。举个例子: 指令:写一个使用 kfifo 的内核模块 #include <linux/init.h> #include <linux/module.h> #include <linux/kernel.h> #include <linux/kfifo.…

系统架构最佳实践 -- 相关JAVA架构

1. java 类加载器架构 2. JVM 架构 3. Java 技术体系 4. 线程运行架构 5. Java 体系&#xff08;编译与运行&#xff09;结构 6. JMS 技术架构 7. JMX 技术架构 8. Spring 架构 9. Hibernate 架构 10. ibatis 架构 11. Struts2 架构 12. Struts1 架构 13. JBPM 14. EJB 技术架构…