58同城算法工程师一面&二面 面试题

来源:投稿 作者:LSC
编辑:学姐

一面 40min

1.Gbdt和xgboost的区别

XGBoost是对GBDT的改进和扩展,它提供了更高的效率、更好的性能、正则化技术、内置特征选择等功能。

  • (1)正则化:

GBDT使用基本的树模型,并在每一轮迭代中逐渐增加树的复杂性。它使用简单的正则化技术,如叶子节点的最小样本数限制,来防止过拟合。

XGBoost引入了正则化技术,包括L1和L2正则化,以减少过拟合风险。它还使用了二阶导数信息来提高训练的稳定性。

  • (2)高效性:

XGBoost通过多线程和分布式计算提供了更高的训练效率。它实现了高度优化的数据存储和计算,以减少内存使用和加速训练过程。

GBDT通常以串行方式训练,训练时间可能较长,特别是在处理大规模数据时。

  • (3)缺失值处理:

XGBoost能够自动处理缺失值,无需手动进行处理。

在GBDT中,需要在数据预处理阶段手动处理缺失值,通常通过填充或删除缺失值。

  • (4)内置特征选择:

XGBoost具有内置的特征选择功能,它可以估计每个特征的重要性,并根据其重要性进行特征选择。GBDT通常需要手动进行特征选择或依赖其他特征选择方法。

  • (5)求导优化:

GBDT只需要对目标函数求一阶导,xgboost要求二阶导。

2.Lstm的特点

  • (1)门控机制:

LSTM引入了门控机制,包括遗忘门、输入门和输出门,这些门控制着信息的流动和保存。遗忘门决定哪些信息应该被遗忘,输入门控制哪些信息应该被添加到记忆单元,输出门控制什么信息应该传递到下一个时间步。这种机制有助于控制信息的流动,提高了模型的训练效率。

  • (2)长期记忆:

LSTM的主要特点是能够捕捉和维护长期依赖关系,它在处理序列数据中表现出色。传统的RNN存在梯度消失问题,导致难以学习长序列的依赖关系,而LSTM通过设计具有记忆单元的结构来解决这个问题,允许信息在长时间内保持不变。

  • (3)平行化训练:

LSTM具有良好的并行性,可以加速训练过程,特别是在GPU上进行训练。这有助于处理大规模数据和加速深度学习模型的训练。

3.Transformer的最重要的特点,对比CNN的效果

最重要的特点是自注意力机制。

对比CNN,transformer更注重全局特征,特征之间能并行计算,CNN更注重局部特征,图像分类领域中,在图像数量充足的情况下,tranformer的效果通常比CNN好。

4.ReLU激活函数的优缺点,怎么改进

优点:

  • (1) 当特征值大于0时,可以避免梯度消失

  • (2)计算简单

缺点:

  • (1) 非零均值

  • (2)当特征值大量小于0时,可能引起梯度消失

  • (3)当特征值大于0时,非线性拟合能力可能下降

改进:改用Leaky ReLU函数

5.Sort Linux命令的使用

# file.txt
# int int string
1  2  str1
1  1  str2
2  2  str3# 按第一列的倒序,第二列的正序排序输出
2  2  str3
1  1  str2
1  2  str1答案: 
sort -r 1 -k 2 file.txt6.Coding  斐波那契数列
# 1 1 2 3 5 ... 
# input : n
# output: 第n位的值 
# n = 3,  => 3def func(n):if n == 0 or n == 1:return 1a, b = 1, 1for i in range(2, n+1):tmp = bb = a + ba = tmp
return b

7.了解隐码模型和CRF吗?介绍一下

8.简单介绍一下Mapreduce

它用于处理海量数据,其核心思想是将大规模数据集分为多个小的子集,然后并行处理这些子集,最后将结果进行合并。

9.C++的指针和引用的区别

  • (1)引用访问一个变量是直接访问,而指针是间接访问。

  • (2)引用是一个变量的别名,不额外占用内存空间,而指针是一个变量,有自己的内存空间。

  • (3)引用定义的时候必须赋值,并且赋值之后不可以改变,指针定义的时候可以不赋值,赋值后可以改变其所指的值。

  • (4)引用不可以为空,但是指针可以指向空值。

  • (5)引用是类型安全的,一般不会引起内存泄露的问题,指针可能会,一般尽可能用引用代替指针。

二面 30min

1.聊项目

2.介绍自己最熟悉的几个模型

我介绍了resnet,inceptionnet, yolo模型等

3.介绍Yolo模型,主要是3-5

4.样本不均衡的处理方法

  • (1)欠采样

  • (2)过采样

  • (3)平衡读取数据

  • (4)设置权重,对样本较少的数据设置较高的训练权重

  • (5)使用平衡损失函数,比如focal loss等

  • (6)数据增强

5.介绍Focal loss

Focal Loss 最初由物体检测领域的研究者提出,其主要目标是减轻模型在训练过程中对大多数背景类别的关注,从而更好地处理少数类别的样本。这种损失函数有助于提高模型对罕见类别的检测性能。

Focal Loss 的主要特点如下:

**关注难分样本: **Focal Loss 通过调整样本的权重,更加关注难以分类的样本。通常情况下,容易分类的样本(大多数属于背景类别)会降低其权重,而难分类的样本(属于少数类别)会增加其权重。

**降低易分类样本的权重: **通过调整损失函数,Focal Loss 能够有效地降低容易分类的样本(背景类别、样本数量多的类别)的权重,这样模型将更加关注罕见类别,从而提高了模型在罕见类别的检测能力。

Focal Loss 的引入有助于提高目标检测模型对于罕见目标的检测性能,减轻了类别不平衡问题对模型训练的影响。

6.二叉搜索树和二叉堆的区别

二叉搜索树的左子树的结点的值都比根结点小,右子树结点的值都比根结点大。一般情况下,插入删除搜索的时间复杂度是O(logn),最坏情况下是O(n)。

二叉堆分为最大堆、最小堆。如果是最大堆,只要保证根结点的值大于左右子树的结点的值。插入删除排序的时间复杂度是O(nlogn)

关注下方《学姐带你玩AI》🚀🚀🚀

算法工程师万能简历公式+200多个简历模板(中英文)

回复“简历”轻松获取!

码字不易,欢迎大家点赞评论收藏!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/160566.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

vue3.0 + qiankun遇到的问题

进入子应用再回到主应用切换动态路由时 TypeError: Cannot read properties of undefined (reading ‘appWrapperGetter’) application ‘plat’ died in status UNMOUNTING: instance.$destroy is not a function 第一个报错是因为子应用切走时没有销毁 vue的实例&#xff0…

常用RFC规范汇总

官网:https://www.rfc-editor.org/ The RFC Series (ISSN 2070-1721) contains technical and organizational documents about the Internet, including the specifications and policy documents produced by five streams: the Internet Engineering Task Force …

TCP/IP

分层模型 TCP 传输控制协议 UDP 用户数据包协议 四层 应用层 负责发送/接收消息 传输层 负责拆分和组装 .期间会有编号 网络层 TCP/UDP 属于网络层, 不会判断和处理编号 数据链路层 以太网 ,网络设备 TCP 连接 TCP连接需要端口,进行通信 Java 通过Socket 接收消息 发送 …

基于SpringBoot+Vue的体检预约管理系统

基于SpringBootVue的体检预约管理系统的设计与实现~ 开发语言:Java数据库:MySQL技术:SpringBootMyBatisVue工具:IDEA/Ecilpse、Navicat、Maven 系统展示 主页 管理员界面 用户界面 摘要 体检预约管理系统是一种基于Spring Boot…

Vue3常用操作

一、Vue3项目构建 1、安装最新版本vue npm create vuelatest 2、选择需要的配置 3、进入项目 cd 项目名称 4、下载依赖 npm install 5、启动项目 npm run dev

chatGLM3微调

文章目录 一、问答数据集生成器使用设置问题启动使用产出效果 二、进行微调第一步:下载模型第二步:项目准备2.1 下载项目2.2 然后使用 pip 安装依赖2.3 开始 第三步进行微调3.1安装相关依赖3.2准备数据集,并且上传3.3对数据集进行预处理3.4 进…

如何使用技术SEO来优化评论

你在网上购买吗?我的意思是,在当今时代,谁不这样做?作为买家,无论您想购买什么,您都了解全面和高质量评论的价值。这是您在决定是否购买产品时考虑的重要因素。 这就是为什么许多人在网上购物之前使用评论…

移动端click事件、touch事件、tap事件的区别

在移动端,有三种常见的事件类型,click事件、touch事件、tap事件。它们的区别如下: click事件:click事件是在用户点击屏幕的时候触发,如果是移动设备,则会在用户点击屏幕的同时触发touch事件。但是&#xff…

【开源】基于Vue和SpringBoot的康复中心管理系统

项目编号: S 056 ,文末获取源码。 \color{red}{项目编号:S056,文末获取源码。} 项目编号:S056,文末获取源码。 目录 一、摘要1.1 项目介绍1.2 项目录屏 二、功能模块2.1 普通用户模块2.2 护工模块2.3 管理员…

uni-app中vue3+setup实现下拉刷新、上拉加载更多效果

在小程序或各类app中,下拉刷新和上拉加载更多是极为常见和使用非常频繁的两个功能,通过对这两个功能的合理使用可以极大的方便用户进行操作。 合理的设计逻辑才能更容易挽留住用户,因为这些细节性的小功能点就变得极为重要起来。 那么在uni…

基于WEB的停车场管理系统的设计和实现【附源码】

基于WEB的停车场管理系统的设计和实现 摘 要 随着现代社会的快速发展,人民生活水平快速提高,汽车的数量飞速增加,与此同时停车问题也越来越受到人们的关注,为了实现对停车场进行有效的管理,结合一些停车场的模式和现状…

游戏被攻击了怎么办

随着网络技术和网络应用的发展,网络安全问题显得越来越重要,在创造一个和谐共赢的互联网生态环境的路途中总是会遇到各种各样的问题。最常见的当属于DDOS攻击(Distributed Denial of Service)即分布式阻断服务。由于容易实施、难以…

【LeetCode刷题】--40.组合总和II

40.组合总和II 本题详解&#xff1a;回溯算法 class Solution {public List<List<Integer>> combinationSum2(int[] candidates, int target) {int len candidates.length;List<List<Integer>> res new ArrayList<>();if (len 0) {return re…

深度学习之基于YoloV5车辆和行人目标检测系统

欢迎大家点赞、收藏、关注、评论啦 &#xff0c;由于篇幅有限&#xff0c;只展示了部分核心代码。 文章目录 一项目简介YOLOv5 简介YOLOv5 特点 车辆和行人目标检测系统 二、功能三、系统四. 总结 一项目简介 # 深度学习之基于 YOLOv5 车辆和行人目标检测系统介绍 深度学习在…

2023 年 亚太赛 APMCM 国际大学生数学建模挑战赛 |数学建模完整代码+建模过程全解全析

当大家面临着复杂的数学建模问题时&#xff0c;你是否曾经感到茫然无措&#xff1f;作为2022年美国大学生数学建模比赛的O奖得主&#xff0c;我为大家提供了一套优秀的解题思路&#xff0c;让你轻松应对各种难题。 cs数模团队在亚太赛 APMCM前为大家提供了许多资料的内容呀&…

【西行纪年番】孙悟空对战阴界王,素衣奄奄一息,巨灵拳霸气一击

Hello,小伙伴们&#xff0c;我是拾荒君。 《西行纪年番》第20集已更新。为了救回素衣&#xff0c;孙悟空想尽办法&#xff0c;最后他拜托沙悟净帮忙&#xff0c;终于成功把自己传送到阴界。原来&#xff0c;素衣的魂魄被阴界王藏在了他制造的人偶之中。沙悟净提醒孙悟空必须在…

8.2 Windows驱动开发:内核解锁与强删文件

在某些时候我们的系统中会出现一些无法被正常删除的文件&#xff0c;如果想要强制删除则需要在驱动层面对其进行解锁后才可删掉&#xff0c;而所谓的解锁其实就是释放掉文件描述符&#xff08;句柄表&#xff09;占用&#xff0c;文件解锁的核心原理是通过调用ObSetHandleAttri…

Axios使用方式

ajax是JQUERY封装的XMLHttprequest用来发送http请求 Axios简单点说它就是一个js库,支持ajax请求,发送axios请求功能更加丰富,丰富在哪不知道 1.npm使用方式 vue项目中 npm install axios 2.cdn方式 <script src"https://unpkg.com/axios/dist/axios.min.js">…

【三维几何学习】自制简单的网格可视化软件 — Mesh Visualization

自制简单的网格可视化软件 — Mesh Visualization 引言一、整体框架1.1 三角形网格1.2 界面管理1.3 VTK可视化界面 二、核心源码2.1 三角形网格&#xff1a;TriMesh类2.2 界面Widget_Mesh_Manager2.3 VTK可视化2.4 main 引言 使用PyQt自制简单的网格可视化软件 - 视频展示 本是…

Node.js入门指南(一)

目录 Node.js入门 什么是Node.js Node.js的作用 Node.js安装 Node.js编码注意事项 Buffer(缓冲器&#xff09; 定义 使用 fs模块 概念 文件写入 文件读取 文件移动与重命名 文件删除 文件夹操作 查看资源状态 路径问题 path模块 Node.js入门 什么是Node.js …