达摩院 2025届暑期实习 大模型算法

文章目录

  • 写在前面
  • 一面/技术面 2024/4/7 晚上19:00-20:00
  • 二面/技术面 2024/4/23 早上11:15-12:15

写在前面

  1. 学校情况:211本中9硕,本硕都是计算机科班,但研究方向并不是NLP,而是图表示学习
  2. 论文情况:1A(NeurIPS)+1B(ICDM)已发表,另有1A刊在投,除此之外,还有1A会撰写中,所有论文均为一作。
  3. 实习情况:一段快手推荐算法日常实习
  4. 奖学金情况:本硕国家奖学金

一面/技术面 2024/4/7 晚上19:00-20:00

  1. 你对大模型有什么了解?简单说了大致的流程,预训练、有监督微调,RLHF之类的
  2. 说一下RLHF的具体流程
  3. 给了一个场景:如果现在给你一个预训练模型,然后场景是要给小学生做数学题,你会如何从头到尾来做这件事?大概提了数据收集,清洗,然后有监督微调,思维链分解过程之类的东西,还有幻觉问题
  4. 你刚刚提到了幻觉问题,请问你知道有哪些缓解幻觉问题的思路吗?(结合之前写的本子回答了一波)
  5. 你刚刚提到了思维链,大概说一下流程
  6. 说一下NIPS那篇论文,中间问了大概十多个问题
  7. 写代码,以为会是LeetCode那种,没想到是让生成一个numpy随机矩阵,然后进行什么诸如判断数字是否在数组内,求数组均值方差,还有索引之类的东西
  8. 如果进来后,想做什么方向,要求将现在做的方向和LLM进行一个结合
  9. 进来后如果让你发一篇论文,你倾向于做些什么东西出来,有思考吗
  10. 问了下能实习多久
  11. 反问环节:进去后会偏向于做哪方面的东西

二面/技术面 2024/4/23 早上11:15-12:15

  1. 没有自我介绍,面试官说和一面面试官聊了一会儿关于我前一面的表现,所以不需要介绍了
  2. 让我介绍一下NeurIPS的论文
  3. 问了下我主要在论文中干了些什么
  4. 面试官介绍了他们目前主要做的东西,主要是逻辑推理,思维链之类的
  5. 面试官问我对做这些事感不感兴趣,并且举了更细致的一些例子
  6. 反问了一些业务上的细节,进去后主要做什么
  7. 问能实习多久,能不能接受去杭州

目前官网仍显示面试中,给官方发邮件后回复正在推进中,不过不打算继续等下去了

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/6740.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C#技巧之同步与异步

区别 首先,同步就是程序从上往下顺序执行,要执行完当前流程,才能往下个流程去。 而异步,则是启动当前流程以后,不需要等待流程完成,立刻就去执行下一个流程。 同步示例 创建一个窗体,往窗体里…

面试 Java 基础八股文十问十答第二十八期

面试 Java 基础八股文十问十答第二十八期 作者:程序员小白条,个人博客 相信看了本文后,对你的面试是有一定帮助的!关注专栏后就能收到持续更新! ⭐点赞⭐收藏⭐不迷路!⭐ 1)动态代理是什么&am…

2131 - 枚举-练习-涂国旗

2131 - 枚举-练习-涂国旗 c刷题 超能力编程 分析 枚举涂w的底边和涂b的底边即可 剩下的部分都涂r 数据范围这么小,暴力枚举,代码简单难度低。搜索什么的用不着啦! 那么问题来了:怎么枚举呢? 我们只要枚举白与蓝、蓝与红的边界&…

【SQL基础】mysql中如何将日期时间类型转换为日期类型

在MySQL中,将DATETIME类型的数据转换为日期格式可以通过使用DATE()函数来实现。DATE()函数可以从DATETIME或TIMESTAMP类型的值中提取出日期部分。 以下是几种将DATETIME转换为日期格式的示例: 直接转换DATETIME列为日期: SELECT DATE(date…

Containerd方式部署K8s集群

1.1 Kubernetes基础环境部署 kubernetes有多种部署方式,目前主流的方式有kubeadm、minikube、二进制包 minikube:一个用于快速搭建单节点kubernetes的工具 kubeadm:一个用于快速搭建kubernetes集群的工具 二进制包 :从官网下载…

【DPU系列之】DPU中的ECPF概念是什么?全称是什么?(E CPF对标H CPF;embedded CPU function ownership)

ECPF:embedded CPU function ownership。 嵌入式CPU运转ownership。也叫DPU模式,是DPU工作运转3种模式之一,也是默认的模式。这里的嵌入式CPU指的是DPU上ARM CPU,表示网卡所有资源和功能被embedded CPU全权管理,行使所…

【动态规划】投资问题

本文利用markdown基于https://blog.csdn.net/qq_41926985/article/details/105627049重写,代码部分为本人编辑 代码要求 应用动态规划方法,求解投资问题,实现下面的例子。 #define MAX_N 4 //最大投资项目数目 #define MAX_M 5 //最大投资钱数(万元) /…

【机器视觉】yolo-world-opencvsharp-.net4.8 C# 窗体应用程序

这段代码是基于 OpenCvSharp, OpenVinoSharp 和 .NET Framework 4.8 的 Windows Forms 应用程序。其主要目的是加载和编译机器学习模型,对输入数据进行推理,并显示结果。 下面是该程序的主要功能和方法的详细总结: 初始化 OpenVINO 运行时核心…

基于Pytorch深度学习——卷积神经网络(卷积层/池化层/多输入多输出通道/填充和步幅/)

本文章来源于对李沐动手深度学习代码以及原理的理解,并且由于李沐老师的代码能力很强,以及视频中讲解代码的部分较少,所以这里将代码进行尽量逐行详细解释 并且由于pytorch的语法有些小伙伴可能并不熟悉,所以我们会采用逐行解释小…

【DPU系列之】如何通过带外口登录到DPU上的ARM服务器?(Bluefield2举例)

文章目录 1. 背景说明2. 详细操作步骤2.1 目标拓扑结构2.2 连接DPU带外口网线,并获取IP地址2.3 ssh登录到DPU 3. 进一步看看系统的一些信息3.1 CPU信息:8核A723.2 内存信息 16GB3.3 查看ibdev设备 3.4 使用小工具pcie2netdev查看信息3.5 查看PCIe设备信息…

python笔记:gensim进行LDA

理论部分:NLP 笔记:Latent Dirichlet Allocation (介绍篇)-CSDN博客 参考内容:DengYangyong/LDA_gensim: 用gensim训练LDA模型,进行新闻文本主题分析 (github.com) 1 导入库 import jieba,os,re from ge…

安卓手机APP开发__用媒体会话服务进行后台播放

安卓手机APP开发__媒体开发部分__用媒体会话服务进行后台播放 目录 概述 使用一个媒体会话服务 实现服务的生命周期 提供对媒体会话的读取 在配置文件中声明服务 概述 当APP不在前台时,经常希望能够播放媒体。例如,一个音乐播放器 在用户锁屏或者…

【云原生】Docker 的网络通信

Docker 的网络通信 1.Docker 容器网络通信的基本原理1.1 查看 Docker 容器网络1.2 宿主机与 Docker 容器建立网络通信的过程 2.使用命令查看 Docker 的网络配置信息3.Docker 的 4 种网络通信模式3.1 bridge 模式3.2 host 模式3.3 container 模式3.4 none 模式 4.容器间的通信4.…

Stream流操作

看到Stream流这个概念,我们很容易将其于IO流联系在一起,事实上,两者并没有什么关系,IO流是用于处理数据传输的,而Stream流则是用于操作集合的。 当然,为了方便我们区分,我们依旧在这里复习一下…

长期找 AI 专家,邀请参加线上聊天直播

诚邀 AI 专家参加线上聊天,成为嘉宾。 分享前沿观点、探讨科技和生活 除节假日外,每周举办在线聊天直播 根据话题和自愿形式结合,每期 2~3 位嘉宾 成为嘉宾,见下:

小程序端的懂车帝二手车数据采集

import datetime import random import string import time import pymysql import requests import json def mysql_sql(conn, cur): """创建一个存储数据表和一个存储链接表""" cur.execute( CREATE TABLE if not exists dcd_x…

AcWing 851:spfa求最短路 ← 链式前向星存图

【题目来源】https://www.acwing.com/problem/content/853/【题目描述】 给定一个 n 个点 m 条边的有向图,图中可能存在重边和自环, 边权可能为负数。 请你求出 1 号点到 n 号点的最短距离,如果无法从 1 号点走到 n 号点,则输出 i…

ADS软件(PathWave 先进设计系统软件)分享与安装

ADS软件的简介 ADS软件(Advanced Design System)主要用于射频(RF)、微波(Microwave)和毫米波(Millimeter-wave)电路的设计、仿真和分析。它提供了一套强大的工具和功能,…

【STM32项目】基于STM32多传感器融合的新型智能导盲杖设计(完整工程资料源码)

基于STM32多传感器融合的新型智能导盲杖设计演示效果 基于stm32智能盲杖 前言: 目前,中国盲人数量已突破两千万大关,而城市盲道设计不合理、盲道被非法侵占等危害盲人出行安全的问题屡禁不止[1-3]。随着科技发展,智能盲杖不断涌现,但这些智能盲杖并不智能[4,5]。针对市售…

Angular进阶-NVM管理Node.js实现不同版本Angular环境切换

一、NVM介绍 1. NVM简介 Node Version Manager(NVM)是一个用于管理多个Node.js版本的工具。它允许用户在同一台机器上安装和使用多个Node.js版本,非常适合需要同时进行多个项目的开发者。NVM是开源的,支持MacOS、Windows和Linux…