深度学习图像算法工程师--面试准备(1)

1 请问人工神经网络中为什么 ReLU 要好过于 tanh 和 Sigmoid function?

在这里插入图片描述

在这里插入图片描述

  1. 采⽤Sigmoid 等函数,算激活函数时(指数运算),计算量⼤,反向传播求误差梯度时,求导涉及除法和指数运算,计算量相对⼤,⽽采⽤ReLU 激活函数,整个过程的计算量节省很多。

  2. 对于深层⽹络,Sigmoid 函数反向传播时,很容易就会出现梯度消失
    的情况(在 Sigmoid 接近饱和区时,变换太缓慢,导数趋于 0,这种情况会造成信息丢失),这种现象称为饱和,从而无法完成深层网络的训练。而ReLU 就不会有饱和倾向,不会有特别小的梯度出现,求导后都为1。

  3. ReLU 会使⼀部分神经元的输出为 0,这样就造成了⽹络的稀疏性,并且减少了参数的相互依存关系,缓解了过拟合问题的发⽣,当然现在也有⼀些对 ReLU 的改进,比如 PReLU,random ReLU等,在不同的数据集上会有⼀些训练速度上或者准确率上的改进。

    现在主流的做法,会多做⼀步 batch normalization,尽可能保证每⼀层网络的输⼊具有相同的分布 。⽽较新的 paper ,他们在加⼊bypass connection 之后,发现改变 batch normalization 的位置会有更好的效果。


2 能写一下逻辑回归的损失函数吗?为什么不用 MSE(L2 loss)作为损失函数

推荐博客 https://zhuanlan.zhihu.com/p/670167066

https://blog.csdn.net/m0_52447591/article/details/129796877

在这里插入图片描述

不用 MSE 做损失函数的原因:

  1. 损失函数的角度:逻辑回归预测函数是非线性的,采用 MSE 得到的损失
    函数是非凸函数,会存在很多局部极小值,梯度下降法可能无法获得全局最优解。
  2. 极大似然的角度: 采用极大似然法估计逻辑回归模型的参数,最终得到的
    对数似然函数形式与对数损失函数一致。

3 逻辑回归用梯度下降优化,学习率对结果有什么影响?

  1. 学习率过低则模型训练速度会慢
  2. 学习率过高则模型训练会在全局最优点附近震荡,甚至不收敛

4 逻辑回归中样本不均衡我们怎么处理?

  1. 调整分类阈值,不统一使用 0.5,根据样本中类别的比值进行调整。
  2. 多类样本负采样。进一步也可将多类样本负采样构建多个训练集,最后聚
    合多个模型的结果。
  3. 少类样本过采样。过采样的方法大致有三种:
    c1: 随机复制
    c2: 基于聚类的过采样
    c3: SMOTE
  4. 改变性能指标,推荐采用 ROC AUC、F1 Score,等综合考虑,不单单使用精度。
  5. 模型训练增加正负样本惩罚权重,少类样本权重加大,增大损失项。

5(百度)Kmeans 的流程方法停止条件

流程:
(1)K 如何确定
(2)初始质心的选取
(3)距离的度量
(4)质心的计算
(5)算法停止条件
(6)空聚类的处理
停止条件:
目标函数达到最优,对于不同的距离度量,目标函数往往不同。我们往往认
为簇的质心到各个点的距离越小,簇越紧凑。
采用欧式距离时:目标函数一般为最小化对象到其簇质心的距离的平方和。
采用余弦相似度时,目标函数一般为最大化对象到其质心的余弦相似度和。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/692362.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

企业级 文件传输加密应用,干货分享

企业级 文件传输加密应用 简历一直在投,一直无音讯,今天我又从硬盘里翻出一个 好玩的加密软件,这个是 2017年的时候和荷兰某世界500强公司合作的小项目。 今天分享给大家 。 文章目录 企业级 文件传输加密应用1.目的2.软件介绍3.下载好 安装…

Discuz! X3.4上次访问时间显示1970积分不增加问题

您好,我discuz论坛的【注册用户注册信息的运行】存在问题,您看能调试吗? 这个论坛的“注册用户信息是”从其它discuz论坛【迁移过来的】, 所以,目前: 全部用户 新注册用户 迁移过来的用户 故障现象是…

我的NPI项目之Android USB 系列(一) - 遥望和USB的相识

和USB应该是老朋友了,从2011年接触Android开发开始,就天天和USB打交道了。那时候还有不 对称扁头的usb/方口的usb,直到如今使用广泛的防反插USB3.0 type-C。 但是,一直有一个不是很清楚的问题萦绕在心头,那就是。先有…

Java基于SpringBoot+Vue的图书管理系统

博主介绍:✌程序员徐师兄、7年大厂程序员经历。全网粉丝12w、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取源码联系🍅 👇🏻 精彩专栏推荐订阅👇…

leetcode第124场双周赛

第一题:相同分数的最大操作数目I 给你一个整数数组 nums ,如果 nums 至少 包含 2 个元素,你可以执行以下操作: 选择 nums 中的前两个元素并将它们删除。 一次操作的 分数 是被删除元素的和。 在确保 所有操作分数相同 的前提下…

Spring相关注解

文章目录 Spring注解Bean1、Bean 概述2、Bean 的声明1)搭配 Configuration2)搭配 Component3)搭配 ApplicationContext 3、Bean 的注入1)NO(主要关注这个)【1】同一配置类【2】不同配置类 2)BY_…

软件测试进阶自动化测试流程

如果想让测试在公司的项目中发挥出它最大的价值,并不是招两个测试技术高手,或引入几个测试技术,而是测试技术对项目流程的渗透,以及测试流程的改进与完善。虽然,当然测试行业前景乐观,许多中小企业也都在引…

C++11---(3)

目录 一、可变参数模板 1.1、可变参数模板的概念 1.2、可变参数模板的定义方式 1.3、如何获取可变参数 二、lambda表达式 2.1、Lamabda表达式定义 2.2、为什么有Lambda 2.3、Lambda表达式的用法 2.4、函数对象与lambda表达式 三、包装器 3.1、function 3.2、bind …

Spring源码:手写SpringIOC

文章目录 一、分析二、实现1、版本1:实现Bean注入IOC容器,并从容器中获取1)定义BeanDefinition2)定义BeanDefinition实现类3)定义BeanDefinitionRegistry4)定义Beanfactory5)定义默认Beanfactor…

GC调优学习

一.常见工具P62P63 1.jstat 2.visualvm插件 3.Prometheus Grafana 4.GC日志 5.GC Viewer 6.GCeasy(强推) 二.常见的GC模式P64 三.GC调优 1.优化基础JVM参数P65 2.减少对象产生 看以前视频,内存泄露相关 3.垃圾回收器的选择P66 4.优化垃圾回…

代码随想录算法训练营第二十三天 | LeeCode 669. 修剪二叉搜索树,108. 将有序数组转换为二叉搜索树, 538. 把二叉搜索树转换为累加树

题目链接&#xff1a;669. 修剪二叉搜索树 - 力扣&#xff08;LeetCode&#xff09; class Solution { public:TreeNode* trimBST(TreeNode* root, int low, int high) {if (root nullptr ) return nullptr;if (root->val < low) {TreeNode* right trimBST(root->r…

防御保护---内容保护

文章目录 目录 文章目录 一.防火墙内容安全概述 二.深度识别技术&#xff08;DFI/DPI&#xff09; 深度包检测技术&#xff08;DPI&#xff09; 深度流检测技术&#xff08;DFI&#xff09; 两者区别 三.入侵防御IPS 一.防火墙内容安全概述 防火墙内容安全是防火墙的一个重…

软件测试方法_边界值分析法

目录&#xff1a; ①边界值分析法的介绍和概念 ②边界值分析法的原理和思想 ③单缺陷假设和多缺陷假设 ④边界值测试数据类型 ⑤内部边界值分析 ⑥各类边界值测试介绍 ⑦基于边界值分析方法选择测试用例的原则 ⑧边界值分析法的实例分析 1、边界值分析法的介绍和概念 …

Kubernetes集群的扩容、优化 -1

1. 什么是Kubernetes集群的扩容&#xff1f; Kubernetes集群的扩容指的是增加集群中的计算资源&#xff0c;以满足应用程序不断增长的需求。 Kubernetes是一个开源的容器编排平台&#xff0c;它允许用户部署、管理和扩展容器化的应用程序。在Kubernetes中&#xff0c;当应用程…

全面解读视频生成模型Sora

2024年2月15日&#xff0c;OpenAI在其官网发布了《Video generation models as world simulators》的报告&#xff0c;该报告提出了作为世界模拟器的视频生成模型Sora。 OpenAI对Sora介绍如下&#xff1a; We explore large-scale training of generative models on video dat…

Java进阶之旅第十四天(doge

Java进阶之旅第十四天&#xff08;doge 打印流 特点&#xff1a; 分类: PrintStream&#xff08;字节打印流&#xff09;PrintWriter&#xff08;字符打印流&#xff09;1.打印流只操作文件的目的地&#xff0c;不操作数据源2.特有的写出方法可以实现->数据原样写出3.特有…

力扣96不同的二叉搜索树详解

最近在写动态规划的题目&#xff0c;这些题目的标签都标有数学&#xff0c;说来也是找规律题&#xff0c;但是这个规律真不是正常情况下可以找到的&#xff0c;即使看了解析有时候也写不出来&#xff0c;今天难得看了点解析就自己写出来的&#xff0c;因此分享一下这道题的想法…

C# Winfrom实现的肺炎全国疫情实时信息图

运行结果&#xff1a; using System; using System.Drawing; using System.Text; using NSoup; using NSoup.Nodes; using System.IO; using System.Net; using System.Text.RegularExpressions; using System.Windows.Forms;namespace Pneumonia {public partial class MainFo…

docker (七)-部署容器

实战开始&#xff1a; 1 docker 部署 kafka 集群&#xff0c;并验证 参考 Docker搭建Kafka集群 优秀文档 2 docker 部署 mysql 参考上一篇docker(六) 3.docker 部署 zabbix 参考 docker部署zabbix 优秀文档 BUG&#xff1a;根据这篇文章部署后&#xff0c;发现zabbix-s…

vue封装el-table表格组件

先上效果图&#xff1a; 本文包含了具名插槽、作用域插槽、jsx语法三种&#xff1a; Render.vue&#xff08;很重要&#xff0c;必须有&#xff09;: <script> export default {name: "FreeRender",functional: true,props: {scope:Object,render: Functio…