阿里斑马智行 2025届秋招 NLP算法工程师

文章目录

  • 个人情况
  • 一面/技术面 1h
  • 二面/技术面 1h
  • 三面/HR面 20min

个人情况

先说一下个人情况:

  1. 学校情况:211本中9硕,本硕学校都一般,本硕都是计算机科班,但研究方向并不是NLP,而是图表示学习
  2. 论文情况:1A(NeurIPS)+1B(ICDM)已录用,还有一篇A会(AAAI 2025)最近快出结果了,以及一篇数据挖掘A刊TOIS在投,四篇论文都是一作
  3. 实习情况:快手推荐算法日常实习 + 腾讯大模型暑期实习
  4. 奖学金情况:本科生国家奖学金、研究生国家奖学金,4次校级一等奖学金
  5. 其他:我的CSDN等平台有一点粉丝量,至于其他诸如数学建模还有蓝桥杯获奖,以及优秀毕业论文和优秀毕业生之类的,对求职也没太大作用

阿里今年秋招hc基本都只给转正,招人很少,形势不太好,大模型领域更是如此了,面了几家基本也都是走个过场,毕竟不是大模型科班出身,还是差了点

阿里这边只有斑马走完流程拿到了offer,阿里旗下一个做汽车科技的独角兽企业,目前等待开奖
在这里插入图片描述

一面/技术面 1h

  1. 自我介绍
  2. 介绍大模型实习
  3. 应用场景是什么,有什么意义
  4. 构造SFT数据的细节
  5. SFT的prompt模板
  6. 目前的方案有没有什么创新的地方
  7. 后续有没有什么改进,具体介绍一下
  8. 效果如何评估
  9. 大模型SFT过程中自己有没有什么总结出来的经验
  10. SFT过程中如何判断是否过拟合
  11. 硕士期间发表的paper,可以结合ppt来介绍一下
  12. 如何看待目前大语言模型都是decoder-only结构
  13. encoder-only和decoder-only的对比,纯理解场景哪个更优
  14. 描述一下典型的encoder-only如Bert的结构细节
  15. 多层堆叠时如何避免梯度消失和梯度爆炸
  16. DPO和PPO
  17. 代码题:lc75,颜色分类

二面/技术面 1h

  1. 自我介绍
  2. 询问转正情况
  3. 介绍大模型实习,具体负责了哪些板块
  4. 为什么没有公司内部的LLM
  5. 为什么非得用长文本而不用RAG
  6. 为什么不用GPT-4
  7. prompt优化这部分做了什么工作
  8. prompt优化这部分还了解哪些方法吗
  9. 如何判断当前使用的prompt就是最优的,无法进一步调整了
  10. 不做全量微调的原因(还能什么原因,没卡)
  11. SFT的资源描述,卡数,机器数
  12. SFT过程中如何判断是否过拟合
  13. 有没有系统学过机器学习课程,开始拷问八股
  14. 如何判断一个模型是否收敛,从多个角度回答
  15. 判断收敛需要用验证集吗
  16. 如何定量判断是否收敛
  17. 如何判断目前的收敛点是局部最优解还是全局最优解
  18. 测试集为什么一定需要存在,亦或者为什么不直接把验证集测试集合在一起
  19. 主要使用什么语言(Python),有没有系统学过C++
  20. C++中STL中一些容器的底层实现原理
  21. pytorch中的计算图
  22. 最近看的一些开源代码和paper介绍,有没有学到什么东西
  23. 对第一份工作的预期,希望加入什么团队
  24. 反问:进来后可能会做的方向

三面/HR面 20min

  1. 自我介绍
  2. 询问高考成绩,成绩排名
  3. 保研学校抉择问题
  4. 硕士期间在专业方向上的产出介绍
  5. 大概介绍了下论文
  6. 介绍大模型实习
  7. 实习对自己的提升是什么
  8. 针对本次面试的岗位,你觉得自己有哪些优势
  9. 平时通过什么途径来学习新东西
  10. 周围人/自己如何评价自己,优缺点
  11. 职业规划
  12. 反问:后续流程

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/886475.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

富士施乐DocuContre S2520报打开盖子A,取出纸张。代码077-900故障检修

故障描述: 一台富士施乐DocuContre S2520复印机开机报错:打开盖子A,取出纸张。代码077-900故障,用户之前经常卡纸,卡着、卡着就一直提示打开盖子A,取出纸张了;复印机屏幕提示如下图: 故障检修: 富士施乐DocuContre S2520复印机报打开盖子A,取出纸张。077-900的错误代…

【Ubuntu24.04】VirtualBox安装ubuntu-live-server24.04

目录 0 背景1 下载镜像2 安装虚拟机3 安装UbuntuServer24.044 配置基本环境5 总结0 背景 有了远程连接工具之后,似乎作为服务器的Ubuntu24.04桌面版有点备受冷落了,桌面版的Ubuntu24.04的优势是图形化桌面,是作为一个日常工作的系统来用的,就像Windows,如果要作为服务器来…

01.防火墙概述

防火墙概述 防火墙概述1. 防火墙的分类2. Linux 防火墙的基本认识3. netfilter 中五个勾子函数和报文流向 防火墙概述 防火墙( FireWall ):隔离功能,工作在网络或主机边缘,对进出网络或主机的数据包基于一定的 规则检…

STM32设计井下瓦斯检测联网WIFI加Zigbee多路节点协调器传输

目录 目录 前言 一、本设计主要实现哪些很“开门”功能? 二、电路设计原理图 1.电路图采用Altium Designer进行设计: 2.实物展示图片 三、程序源代码设计 四、获取资料内容 前言 本系统基于STM32微控制器和Zigbee无线通信技术,设计了…

Vue 中的透传,插槽,依赖注入

1. 透传attributes 在组件上使用透传attribute&#xff1a; 当你在父组件中使用子组件时&#xff0c;你可以添加一些attribute到子组件上&#xff0c;即使这些attribute没有在子组件的props中声明。 父组件&#xff1a; <!-- 父组件&#xff0c;例如 ParentComponent.vue…

Figma汉化:提升设计效率,降低沟通成本

在UI设计领域&#xff0c;Figma因其强大的功能而广受欢迎&#xff0c;但全英文界面对于国内设计师来说是一个不小的挑战。幸运的是&#xff0c;通过Figma汉化插件&#xff0c;我们可以克服语言障碍。以下是两种获取和安装Figma汉化插件的方法&#xff0c;旨在帮助国内的UI设计师…

SpringBoot项目实现登录——集成JWT令牌和验证码的登录业务

目录 前言 一、初步认识JWT令牌 二、利用JWT令牌实现登录功能 1.配置登录拦截器&#xff1a; 2.实现后端的登录接口 三、在登录中添加验证码功能 点此查看&#xff1a;完整的&#xff0c;附带验证码和JWT令牌验证功能的登录流程&#xff0c;完整代码 前言 在我们的项目…

网络常用特殊地址-127.0.0.1

借用Medium博客的一张图 经常在问题解答群里留意到如下关于127.0.0.1的消息 ”如果单机版&#xff0c;不需要配置IP&#xff0c;所有配置IP的地方都写死127.0.0.1就可以” “ip: 根据实际情况填写&#xff08;在 xxx-init.conf 里可以给一个默认值 127.0.0.1 &#xff0c;方便…

【模拟仿真】基于区间观测器的故障诊断与容错控制

摘要 本文提出了一种基于区间观测器的故障诊断与容错控制方法。该方法通过构建区间观测器&#xff0c;实现对系统状态的上下边界估计&#xff0c;从而在存在不确定性和外部噪声的情况下进行高效的故障诊断。进一步地&#xff0c;本文设计了一种容错控制策略&#xff0c;以保证…

CC4学习记录

&#x1f338; CC4 CC4要求的commons-collections的版本是4.0的大版本。 其实后半条链是和cc3一样的&#xff0c;但是前面由于commons-collections进行了大的升级&#xff0c;所以出现了新的前半段链子。 配置文件&#xff1a; <dependency><groupId>org.apach…

自动化报表怎么写

自动化报表设计 标题 日期 筛选器 具体字段自由字段 迷你图 同环比 条件格式 步骤 填充数值 1、先筛选战区日期sumifs(纯数值-注册人数&#xff0c;纯数值-战区列&#xff0c;周报-战区单元格&#xff0c;纯数值-日期&#xff0c;周报-日期单元格) 需要注意⚠️纯数值里的单元格…

魔改log4j2的JsonLayout,支持自定义json格式日志

小伙伴们&#xff0c;你们好&#xff0c;我是老寇&#xff0c;我又回来辣&#xff0c;1个多月不见甚是想念啊&#xff01;&#xff01;&#xff01;跟我一起魔改源码吧 1.自定义json格式【PatternLayout】 大部分教程都是这个&#xff0c;因此&#xff0c;我就简单给个配置&a…

笔记分享: 西安交通大学COMP551705数据仓库与数据挖掘——02. 关联规则挖掘

文章目录 1. \textbf{1. } 1. 基本概念 2. \textbf{2. } 2. 布尔关联规则 2.1. \textbf{2.1. } 2.1. 一些基本概念 2.2. \textbf{2.2.} 2.2. Apriori \textbf{Apriori} Apriori算法 2.3. \textbf{2.3.} 2.3. Apriori \textbf{Apriori} Apriori算法示例 3. \textbf{3. } 3. 多…

基于标签相关性的多标签学习

✨✨ 欢迎大家来访Srlua的博文&#xff08;づ&#xffe3;3&#xffe3;&#xff09;づ╭❤&#xff5e;✨✨ &#x1f31f;&#x1f31f; 欢迎各位亲爱的读者&#xff0c;感谢你们抽出宝贵的时间来阅读我的文章。 我是Srlua小谢&#xff0c;在这里我会分享我的知识和经验。&am…

网站小程序app怎么查有没有备案?

网站小程序app怎么查有没有备案&#xff1f;只需要官方一个网址就可以&#xff0c;工信部备案查询官网地址有且只有一个&#xff0c;百度搜索 "ICP备案查询" 找到官方gov.cn网站即可查询&#xff01; 注&#xff1a;网站小程序app备案查询&#xff0c;可通过输入单位…

手撸 chatgpt 大模型:简述 LLM 的架构,算法和训练流程

本节我们自顶向下看看大模型的相关概念&#xff0c;了解其基本架构以及从零手撸大模型的基本流程。自从 openai 释放了 chatgpt 后&#xff0c;人工智能就立马进入了大模型时代&#xff0c;我还记得在此之前 NLP 的处理主要依赖于深度学习的 LSTM&#xff0c;GRU 等模型架构。这…

爬虫——JSON数据处理

第三节&#xff1a;JSON数据处理 在爬虫开发中&#xff0c;JSON&#xff08;JavaScript Object Notation&#xff09;是最常见的数据格式之一&#xff0c;特别是在从API或动态网页中抓取数据时。JSON格式因其结构简单、可读性强、易于与其他系统交互而广泛应用于前端与后端的数…

SpringBoot集成itext导出PDF

添加依赖 <!-- PDF导出 --><dependency><groupId>com.itextpdf</groupId><artifactId>itextpdf</artifactId><version>5.5.11</version></dependency><dependency><groupId>com.itextpdf</groupId>&l…

【快速解决】kafka崩了,重启之后,想继续消费,怎么做?

目录 一、怎么寻找我们关心的主题在崩溃之前消费到了哪里&#xff1f; 1、一个问题&#xff1a; 2、查看消费者消费主题__consumer_offsets 3、一个重要前提&#xff1a;消费时要提交offset 二、指定 Offset 消费 假如遇到kafka崩了&#xff0c;你重启kafka之后&#xff0…

查询DBA_FREE_SPACE缓慢问题

这个是一个常见的问题&#xff0c;理论上应该也算是一个bug&#xff0c;在oracle10g&#xff0c;到19c&#xff0c;我都曾经遇到过&#xff1b;今天在给两套新建的19C RAC添加监控脚本时&#xff0c;又发现了这个问题&#xff0c;在这里记录一下。 Symptoms 环境&#xff1a;…