文章目录
- 题记
- 自我介绍
- 图形学+AI技术问题
- 项目细节
- 3D资产有哪些表示形式
- 在结合神经网络的时候,3D数据都如何表示
- 目前观察到比较成功的AI+graphics领域的成功落地案例
- 目前在生成式AI(GenAI)上的一个趋势
- 目前想到未来可以落地的技术
- C++基础
- 用8 bit的二进制表示-1的形式
- 后记
题记
面试经验第二贴,索尼旗下的PS英国组。
简单交代背景:
HR在LinkedIn上联系我,二月中旬聊了第一次。HR面试大多是了解目前的就业情况,确认毕业时间,然后简单了解个人能力和目标组的匹配情况。
因为走的社招渠道,毕业在夏季,HR暗示目前希望尽快入职(2-3个月内),做了个比较开放的结尾,说看情况到时候有没有招到合适的人,到时候再看看。
本想着机会不大了,三月下旬又收到了新的一轮面试安排。因为初步只约了30分钟,我以为又是类似HR面试,基本没有怎么准备。结果面试开始之后,两位面试官都是技术项,其中之一是未来的manager,另一位是西班牙裔的博士(十几年前毕业),吓得我直冒冷汗。
以下记录45分钟的面试问题。
自我介绍
自我介绍部分真是每个面试必做的事情,可以提前准备好,重点突出自己的经历和优势,以及适当引导面试官往比较匹配的项目经验上提问。
图形学+AI技术问题
项目细节
因为之前有做过几个相关的客户项目,这个部分主要是基于简历上写的两个项目进行介绍。
幸好没有细问,技术细节我有一些忘了,看来简历上的内容都得好好准备和复习一下。
3D资产有哪些表示形式
mesh surface+贴图,volume/场。
在结合神经网络的时候,3D数据都如何表示
- 如果使用图神经网络(GNN)来进行特定任务的处理,如3D资产分类,则可以将3D数据的顶点直接作为输入数据,初始化GNN。这个思路的问题是3D资产的顶点可能会很多,会对图神经网络造成很大的初始化和后续连阶层/卷积层的计算量。
- 使用radiance field,主要借鉴NeRF,所有的空间信息/特性,如不透明度、颜色,都保存在全连接层的参数中。
- 使用网格进行初始化,如nvdiffrec,但这类算法的局限在于不能表示非常复杂、非常高精度的模型,容易产生破面,且重建的模型拓扑受初始化网格的限制。
目前观察到比较成功的AI+graphics领域的成功落地案例
- DLSS:NVIDIA的超采样技术,结合超分辨率思路到提升图形渲染的画质。
- audio2face/audio2gesture:基于输入的音频生成渲染角色的面部动作。
目前在生成式AI(GenAI)上的一个趋势
毫无疑问在视觉的生成任务里,如2D图像生成、视频生成、以及3D生成,目前stable diffusion及其变形算法在主导。
另一方面,LLM(大语言模型)会更深入影响到各个任务,比如辅助2D图像生成,以及改进3D场景的构建。
目前想到未来可以落地的技术
这道题是开放问题,需要平时多观察和留意。
我回答的是3D资产生成,还有基于LLM自动化构建游戏场景。
C++基础
用8 bit的二进制表示-1的形式
这题非常自信地答错了。正确答案是全为1,即:1111 1111。
其中第一个1是符号位,后面是取逆的结果。
和同学讨论出一个很好理解的思路,即-1+1=0,因此8 bit的1表示为0000 0001,则:
0000 0000 - 0000 0001 = 1111 1111
所有的负数表示主要围绕计算来设计,这个思路可以拓展到任意其他的负数表示上。
后记
目前还在等待面试结果中,继续加油~
P.S. 转眼距离19年清明假期写下的那篇论文解读已经过去了5年。回看过去几年,真的发生了很多,有时候时间很长,回顾的时候才发现走过了这么多;有时候时间很短,专注于当下,认真做事,不想那么多,静待一切发生。
又是春天了,万物生长,慢慢前行吧。