国内20家公司大模型岗位面试经验汇总

面试情况:

投过的公司:淘天,字节,蚂蚁,商汤,美团,夸克,腾讯,minimax,零一万物,阿里控股,潞晨科技,阿里巴巴国际,网易实验室,Momenta。

Offer:淘天,字节AML,商汤,蚂蚁,美团,夸克,腾讯混元,天翼云。

面经:

淘天【offer】:

部门:未来生活实验室。

介绍:

淘天集团的大模型研究将主要围绕两个场景展开:一是搜广推,二是逛逛的内容化。团队组建工作由淘天集团CEO戴珊、淘天集团CTO若海、阿里妈妈CTO郑波等人共同牵头。介绍链接。

面经:

一面:

  • 如何训练ocr任务

  • 实验的setting,

  • ocr任务影响如何

  • 高分辨率训练,再在小分辨率上,会不会崩掉

  • 输出bbox有没有好的方式

HR面:

  • 基本信息确认:

  • 考研进入电子科技大,为什么

  • 为什么进入了诺亚

  • 代表性的工作

  • 如何解决问题的,国内在做语言大模型的多一些。

  • 国内在做多模态大模型的

  • 如何评测,评估这些大模型的。如何看待刷榜的问题。

  • 你们的衡量指标

面试体验:

面试体验很好。HR也没有那么咄咄逼人。阿里味不是特别明显。最终权衡也选择来了淘天,有兴趣来我们这边的欢迎投递简历,卡很足(****张)。

字节AML【offer】:

部门:AML火山方舟大模型

介绍:

淘天集团的大模型研究将主要围绕两个场景展开:一是搜广推,二是逛逛的内容化。团队组建工作由淘天集团CEO戴珊、淘天集团CTO若海、阿里妈妈CTO郑波等人共同牵头。介绍链接。

预备面经:

猎头也提供了一些其他候选人的面经, 整理如下:

  • 设计一个Hash表

  • 蓄水池问题

  • 从超大文本文件中随机行采样

  • 二叉搜索树-去掉超出[m, n]范围内的节点

  • 计算交叉熵

  • 计算IOU

一面:

  • 多模态你们的流程

  • 你们的OCR的结构

  • layernorm的区别

二面:

  • 什么时间开始做多模态模型

  • 目前在文档

  • Token长度太大。高分辨率如何解决。

  • patch能不能变得

  • VQGAN

  • GPT4V的结构形式。

  • LLM decoder

  • MagViT

  • LLM的基础知识需要尽快补上

三面:

  • 自我介绍

  • 多模态大模型用哪个模型

  • Transformer比较熟悉

  • python实现self attention和Transformer

面试体验:

字节一如既往的注重coding,基本每一面两道题,自己能拿到offer也算是运气吧。一面的面试体验很差,可以说是毫无面试经验的面试官。

商汤【offer】:

一面:

  • 简单的自我介绍

  • 关于高分辨率的解决办法

  • OCR是如何去做的,有没有grounding,Referring。

  • GPT4V 位置,检测明显的问题。

  • 你们是如何解决位置信息的。

  • 新的模态,进来。如何去拼接过来。

  • 新来一批数据,如何训练。

  • tree1是否是tree2的子树。

二面:

  • AGI缺不了视觉。

  • 工业场景,人的检测,奇怪的零件,机器的检测。检测的结果,需要理解人的行为。理解和context的关系。人和环境的关系。借助多模态来解决。

  • 自驾,感知端,到决策端,感知不需要全面的感知,着重额感知需要。

  • 假新闻,图是真的。caption场景。

  • OCR,街景的OCR,文档,网页截图等是不同的,这些场景混在一起。会有影响吗。

  • OCR的方案,一般是先出检测框,再出文本。不规则的文本,如何解决。

  • 多模态大模型的OCR。

  • Qwen-VL的文本检测形似,是否合理。

  • 模型本身的三种能力:

* 自己的能力,认识什么。

* LISA:借助decoder来做,用新的prompt来实现分割。

* 外挂RAG等。

  • 判断左右括号(),等组成的字符串是否是合法的。

二面结束,问题不大。

三面:

  • Leader面,聊了一些有的没的

面试体验:

面试过程很专业,毕竟是商汤,算法技术是国内领先的,奈何没产品,而且薪资包也没有诚意。

蚂蚁风控大模型【offer】:

一面:

  • 自我介绍

  • 介绍Focus-DETR,有没有在业务中应用。

二面:

  • 介绍

  • 目前在做的事情

  • 下游的任务,文档场景,再做一个什么任务。

  • ocr数据是如何生成的。

  • 效果如何。

  • 如何解决幻觉的问题。

HR面。

  • 具体的工作内容,印象

  • 安全内容,tob的内容审核。竞对。

  • 个人介绍。

  • 上海海思,为什么跳槽

  • 算法支撑

MiniMax:【挂】

一面:

  • 空间感知能力是如何解决的

  • 不同token长度是否有做balance的方式

  • 很多有价值的问题。

  • python实现标题 MLP Regressor 题目描述 题目描述与要求:实现一个MLP regressor 的完整训练过程,包括:forward , backward , SGD更新参数;验证backward梯度正确性;构建数据,验证端到端正确性 (收敛&泛化);(optional) 参考你过往的实验经验,尽可能让功能更完善;不使用第三方库中已实现好的自动求导方法;P.S. 实现方法不限,但由于在线IDE运行环境不稳定,推荐使用numpy。

PS

面试官对算法底层了解比较深入,比较考验代码能力,不是字节那种。

零一万物【挂】:

一面:

  • 多模态的情况。

  • document的难度。

  • 手写 self attention

二面:

  • 自我介绍

  • 传统的OCR模型和多模态大模型的区别

  • 带不带OCR,多模态文档智能差多少。

  • 未来OCR模型是否会被大模型吃掉。OCR大模型有什么是做不了的。

  • 在哪些模型上做过一些预训练。

  • 多模态未来怎么做。

  • EVA的有趣的现象。没有出现涌现的现象。

  • 后面的工作主要集中在哪里。

  • 怎么训练比较好,gemini那种形式,llm那种形式。

PS:问了很多开放性的问题,给的回复是业务积累不够,hhhh。

美团【offer】:

一面:

  1. 文档大模型是一个独立的模型,会整合到一个大模型还是分离式的。

  2. 不考虑通用场景的。

  3. 目前用的多大的模型。

  4. 是一个什么结构。对结构的一些了解。

  5. flamingo或者blip2的结构上的对比。

  6. 足够资源的情况下,哪个结构是最优的。

  7. 分辨率是如何解决的。文档的分辨率比较高。

  8. QA对匮乏如何解决的。

  9. ocr的性能目前是低于多模态大模型。

  10. 如何解决bbox感知能力差的问题。

  11. 充足的算力。数据如何获取。如何有效的清洗。

  12. fuyu这种结构有什么优化的空间。

二面:

  1. OCR文档大模型

  2. Instruction tuning的决定性因素,哪些Instruction tuning策略效果更好。如何评估复杂度的性能。

  3. 如何保证数据集的多样性和复杂度。

  4. 分层的Instruction tuning。

  5. 数量的影响。数量和质量。

  6. 不同类型数据的影响。对下游任务的影响。自动化的数据配比。自动化的指标去做类似的事情。

  7. 专门优化的指标不再是一个好的指标。

  8. 使用其他的指标来引导模型的优化,而不是使用下游的指标。LLM使用的loss,作为指标。而不是benchmark的分数。

  9. 合理的评估指标是什么。openAI的压缩理论,trainnig loss代表优化目标。

  10. AGI的几个阶段,deepmind发表。

三面:

  1. 各种问题

四面:

  1. 介绍自己。

  2. 有一个多模态大模型,具备一些很多baseline的效果,基础的CV能力。可能效果都不是特别好。不如专精的大模型。OCR为例。目标得到一个类似GPT4V的模型,整理提高模型的效果。第二个,全流程,强化ocr能力。已有的多模态大模型。

  3. 文档场景。

阿里控股【PASS】

一面:

这里没什么面经,整体面试体验很差。不考虑继续往下面。

  • 人非常高傲,傲慢,问问题,满脸的嫌弃

  • 感觉别人都不行

  • 觉得自己很强

  • 文生图

  • 文生图的畸形,检测的方式。

潞晨科技【PASS】

一面:

  • 手写self-attention

emmm,但凡面试官是NLP的,面试体验都不太好。如果NLP背景的面试官,面试会比较困难。

夸克【offer】

一面:

项目

做题

二面:

  • 高分辨率的解决方案

  • 重叠文本框。采用什么方案来解决。

  • 端到端的OCR是怎么做的。

三面:

  • 介绍Focus-DETR。

  • 介绍端到端的OCR。

  • 介绍多模态大模型。

  • 小语种数据集采购是为什么。检测数据多了,识别数据少了。

介绍业务规划,偏传统业务,不是大模型方向。

四面:

大佬面,出了一个概率题。

HR面:

为什么跳槽。

职业规划。

为什么有这个绩效和各种奖项。

腾讯-混元大模型【offer】:

一面:

  1. 简单描述简历,在做的东西

  2. 图像细节提取有什么办法

  3. 目前的进展是什么样的,项目进展到什么情况

  4. 表格这种数据如何解决,如何对表格这种做有效的信息抽取。

  5. 目前有多少的数据量

二面:

  • OCR算法

  • 项目

  • 介绍文本检测的一些问题如何解决

  • MAE如何优化,什么鬼问题

三面

纯聊天,没有太多技术问题。

  • 多模态大模型,TEG,数据平台事业部。混元大模型。机器学习平台。

阿里巴巴国际部【中止】:

一面:

题目,旋转图像 Alpha度,

介绍项目

介绍Focus-Detr。

二面:

简单询问项目,很快结束。

PS:不靠谱,很久没消息。没有后续的任何回复。这种最恶心了,建议大家不要再投。

网易实验室【PASS】:

一面:

  • 自我介绍

  • 剪枝的工作,Focos-DETR是如何剪枝的。

  • Transformer相比CNN,相比RNN的优势。

  • 训练推理,增加吞吐量。

  • 推理加速。预训练模型的部署推理,优化。

做推理加速的不合适。

Momenta【PASS】:

一面:

  1. 手写NMS

  2. 介绍DETR

  3. 介绍Focus-DETR

  4. 介绍position Embedding

  5. 介绍DETR里面query的含义

PS:Momenta属于给钱多,但是比较累的。以后不太想做自动驾驶了,所以pass。不再考虑。

蚂蚁【大模型-codefuse】【HR面挂】

一面:

简单聊项目

二面:

  • 业务题,如何解决多页文档的问题

  • 业务题,现在 ui 多模态大模型,ocr 如何引入,目前 ocr 存在很多问题

  • leetcode 题目,字符串转数字

  • leetcode 题目,最大子数组和

  • 多模态大模型的基础知识

三面:

  • 个人介绍

  • 部门规模

  • 论文的情况

  • 换过部门

  • 海思做的内容

  • OCR成熟度很高

面试体验:

面试官都很专业,问了很多问题,感觉很强。在HR面上吃了亏,很多问题没有回答好,吸取了经验,很多问题调整了回答的方式。也反思了自己在过往工作中存在的问题,面对大公司建议HR面认真准备,看看网上的一些经验,阿里的HR有一票否决权。

HR面注意点:

1、跳槽动机:如果是因为晋升不上去看机会,建议这么说:内部机会少,太稳定,想看更有发展的机会,别直接说晋升不上去才看机会,⚠切勿说和leader处不来或者说目前leader坏话。

2、关于薪资:可以回答看企业安排,或者回答一个区间,保底多少,期望多少,加一句薪资可谈,留足谈判空间,如果企业给的薪资不太满意,⚠别直接拒绝,就说考虑一下,我这边去谈,最后面试结束时,记得感谢下面试官的时间。

3,关于加班:大厂都大差不差,HR问就是试探⚠切勿说接受不了。

一些参考资料:

  1. 国内大模型公司,粗略面经+感受+一些包裹

  2. 淘天集团大模型算法工程师面试经验贴

  3. 大模型面试八股

  4. 大模型八股答案(一)——基础知识

社招关于大模型的知识点问到的也是一些常识知识,没有特别难得,更多的还是项目为主。面试其他公司的时候基本没有刷题,因为工作期间面试的,没有太多时间刷题, 只能周末时间。为了准备字节还是刷了一些题,大概60多道,如果是字节的话,还是好好准备刷题, 我有朋友甚至遇到了好几道hard。关于刷题,推荐labuladong的刷题笔记。应该算是最精良了,看这个不用看其他的了。

选择offer过程中也是各种权衡,考虑很多因素,也咨询了很多朋友,面临offer选择困难的朋友也可以咨询我。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/794606.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【GEE实践应用】GEE下载遥感数据以及下载后在ArcGIS中的常见显示问题处理(以下载哨兵2号数据为例)

本期内容我们使用GEE进行遥感数据的下载,使用的相关代码如下所示,其中table是我们提前导入的下载遥感数据的研究区域的矢量边界数据。 var district table;var dsize district.size(); print(dsize);var district_geometry district.geometry();Map.…

整合Mybatis(Spring学习笔记十二)

一、导入相关的包 junit 包 Mybatis包 mysql数据库包 Spring相关的包 Aop相关的包 Mybatis-Spring包(现在就来学这个) 提示jdk版本不一致的朋友记得 jdk8只支持spring到5.x 所以如果导入的spring(spring-we…

第1章:芯片及引脚介绍

芯片及引脚介绍 1: 芯片介绍1.1:芯片系列1.2 :STM32F103C8T6型号的介绍 2:引脚2.1:寄存器2.2:最小系统板 3:最小系统板的引脚3.1:特殊引脚3.2:普通引脚3.3:最…

BoostCompass —— 搜索引擎

文章目录 一、项目简介二、Boost库简介1. 简介2. Boost 库的特点 三、项目主要模块1. 网页内容获取,数据预处理模块2. 建立正排索引和倒排索引,项目核心模块3. 编写 http_server 模块,进行网络开放 四、项目功能预览1. 项目文件预览2. 项目执…

java自动化测试学习-03-06java基础之运算符

运算符 算术运算符 运算符含义举例加法,运算符两侧的值相加ab等于10-减法,运算符左侧减右侧的值a-b等于6*乘法,运算符左侧的值乘以右侧的值a*b等于16/除法,运算符左侧的值除以右侧的值a/b等于4%取余,运算符左侧的值除…

开启短剧盈利新模式:短剧CPS分销系统开发助力创作者与分销商共赢

在数字内容蓬勃发展的今天,短剧以其独特的魅力迅速占领了市场的一席之地。短剧以其紧凑的剧情、精彩的演绎,吸引了大量用户的关注和喜爱。然而,如何在短剧市场中实现商业价值的最大化,一直是业内关注的焦点。为此,我们…

个人品牌打造IP孵化运营培训教程架构课件

【资料持续更新,以防走丢】 个人品牌打造IP孵化运营培训教程架构课件 部分资料预览 资料部分是网络整理,仅供学习参考。 个人品牌运营合集 (完整资料包含以下内容)目录 详细的个人IP运营方案: 1. 确定个人定位和…

【Linux】进程控制之进程程序替换

目录 前言 替换的原理 替换函数 记忆技巧 函数使用 execl execlp execv execvp execle execvpe 调用其它语言的程序 模拟实现一个shell 前言 关于本文可以先去看看上一篇【Linux】进程控制详解-CSDN博客可以更好的理解这里的内容 学完本篇文章,你就…

浅聊什么是Redis?

需求:MySQL面临大量的查询,即读写操作,因此类比CPU,给数据加缓存,Redis诞生。应用程序从MySQL查询的数据,在Redis设置缓存(记录在内存中,无需IO操作),后再需要…

【吊打面试官系列】Redis篇 - 使用过 Redis 分布式锁么,它是什么回事?

大家好,我是锋哥。今天分享关于 【使用过 Redis 分布式锁么,它是什么回事?】面试题,希望对大家有帮助; 使用过 Redis 分布式锁么,它是什么回事? 先拿 setnx 来争抢锁,抢到之后&#…

2.Swift基础控件:图标文字按钮

Swift图标标题按钮 一、自定义IconTitleButton类 import Foundation/* 枚举 设置 图片的位置 */ enum ButtonImagePosition : Int {case imageTop 0case imageLeftcase imageBottomcase imageRight } extension UIButton {/**type :image 的位置Space &#xff1…

leetcode代码记录(买卖股票的最佳时机

目录 1. 题目:2. 我的代码:小结: 1. 题目: 给定一个数组 prices ,它的第 i 个元素 prices[i] 表示一支给定股票第 i 天的价格。 你只能选择 某一天 买入这只股票,并选择在 未来的某一个不同的日子 卖出该股…

蓝桥-时间显示

目录 题目链接 代码 题目链接 1.时间显示 - 蓝桥云课 (lanqiao.cn) 代码 #include <bits/stdc.h> using namespace std;int main() {long long x;cin>>x;int h,m,s;x x / 1000 % (3600*24); // 毫秒化秒&#xff0c;并且保留最后一天的时间h x / 3600; //求得…

第四百四十三回

文章目录 1. 概念介绍2. 思路与方法2.1 整体思路2.2 使用方法 3. 示例代码4. 内容总结 我们在上一章回中介绍了"自定义Action菜单"相关的内容&#xff0c;本章回中将介绍如何获取屏幕相关参数.闲话休提&#xff0c;让我们一起Talk Flutter吧。 1. 概念介绍 我们在本…

Qtxlsx第三方库的安装和使用

本文仅作为一个记录&#xff0c;安装QtXlsx方便操作excel&#xff0c;主要参考了这篇博文&#xff1a;https://blog.csdn.net/u014779536/article/details/111769792 1&#xff0c;下载安装Perl脚本Strawberry Perl for Windows&#xff0c;默认安装strawberry-perl-5.30.0.1-…

程序·人生

诡异之极 2024.03.12 清新环境&#xff08;股票代码002573&#xff09;委托卖出 20000股&#xff0c;委托价4.58&#xff0c;当日最高价4.57 2024.03.11 清新环境&#xff08;股票代码002573&#xff09;委托卖出 20000股&#xff0c;委托价4.55&#xff0c;当日最高价4.54 …

汉明码检错与纠错的结论(hamming code)

假如一组二进制数据为101&#xff0c;另外一组为111&#xff0c;那么显然把第一组的第二位数据0改成1就可以变成第二组数据111&#xff0c;所以两组数据的汉明距离就为1 简单点说&#xff0c;汉明距离就是一组二进制数据变成另一组数据所需的步骤数&#xff08;它表示两个相同长…

策略模式图

策略模式 小小的图解 主要的三个角色 Strategy—抽象策略角色ConcreateStrategy—具体策略角色Context—上下文角色 封装了对具体策略的调用可以使用set的依赖注入也可以使用构造方法 核心是上下文角色 只要调用上下文角色就行&#xff0c;实现解耦 策略 工厂 将上下文角…

深入理解MP4视频文件裁剪原理[下下]

深入理解MP4视频文件裁剪原理[上] 深入理解MP4视频文件裁剪原理[中] 深入理解MP4视频文件裁剪原理[下] 深入理解MP4视频文件裁剪原理[下下] 3.22 stco box* stco box记录了每个chunk在MP4文件中的偏移量。如下图24: 图24 这里的offset指的是chunk的起始位置相对于整个MP4文…

Pytoch安装记录

使用pycharm 1、CUDA的安装 官网&#xff1a;CUDA Toolkit Archive | NVIDIA Developer 选择对应的版本 选择对应的版本进行下载&#xff1a; 有3个多G cuda的安装需要注意&#xff0c;如果没有安装vs&#xff0c;则需要选择自定义安装&#xff0c;在自定义的安装中取消 安…