深度学习算法面经（高频核心问题总结，持续更新）

深度学习算法面经（高频核心问题总结，持续更新）

diannao/2025/7/16 5:22:58/文章来源:https://blog.csdn.net/m0_72806612/article/details/139724454

学习的过程短期目标是丰富己身，长远来看有的人为了就业财富自由；有的则为了创造一些有意义的事物，更多的是为了前者。

此文章用于记录和总结深度学习相关算法岗的各种面试问题，搜集答案并加入博主一些浅显的理解,欢迎评论区纠正、补充。

一、经典网络架构篇

1.介绍Transformer

2.什么是Self-attention

注意力是很稀缺的，万物将注意力聚集在所获得信息的一部分上（通过感官获得的信息很多，将有限的注意力集中在少部分有用的信息上有利于资源分配而进行各种生命活动）。

注意力提示有自主性和非自住性提示。非自主性提示是基于环境中物体的突出性和易见性：如黑白色物体中一个鲜艳颜色的物体；在喝完咖啡后注意力在意志的推动下注意力聚集在黑白色书本上，这就是属于自主性提示的辅助。

在注意力机制的背景下，自主性提示被称为查询（query）。给定任何查询，注意力机制通过注意力汇聚（attention pooling）将选择引导至感官输入（sensory inputs，例如中间特征表示）。在注意力机制中，这些感官输入被称为值（value）。更通俗的解释，每个值都与一个键（key）配对，这可以想象为感官输入的非自主提示。如 :numref:fig_qkv所示，可以通过设计注意力汇聚的方式，便于给定的查询（自主性提示）与键（非自主性提示）进行匹配，这将引导得出最匹配的值（感官输入）

查询（自主提示）和键（非自主提示）之间的交互形成了注意力汇聚；注意力汇聚有选择地聚合了值（感官输入）以生成最终的输出

3.介绍Bert

二、通用的深度学习网络层

1.BatchNormlization和LayerNormlization的区别

二者的相同处是都是根据特征的分布对样本特征进行标准正态
化的一个过程，但是不同的是标准正态化过程中的均值和方差两个参数的计算目标不同：

BN的均值和方差是对于处于一个批次的所有特征的对应角标计算；LN则是对于同一个特征的所有特征进行计算。

三、优化器

四、损失函数

五、评价指标

六、微调方法

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/diannao/30230.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

第6章设备驱动程序（4）

第6章设备驱动程序（4）

目录 6.5 块设备操作 6.5.5 请求结构 6.5.6 BIO 6.5.7 提交请求 6.5.8 I/O调度 6.5.9 ioctl实现本专栏文章将有70篇左右，欢迎关注，查看后续文章。 6.5 块设备操作 6.5.5 请求结构 struct request { //放在请求队列上&#xff0…

阅读更多...

vue使用 router 实现导航栏跳转

vue使用 router 实现导航栏跳转

前置课程： 首先应该明白什么是 router 就是路由的意思，那什么是路由，路由就是控制不同 url 路径展示不同的内容，比如访问 localhost/home 打开的应该是主页；访问localhost/guangchuang显示的应该是广场相关的内容&…

阅读更多...

curl发送邮件需要哪些参数设置？如何配置？

curl发送邮件需要哪些参数设置？如何配置？

curl发送邮件有哪些认证方式？如何通过curl命令发信？ curl是一个命令行工具，用于在网络上传输数据，包括发送电子邮件。要使用curl发送邮件，需要设置一些参数以确保邮件被正确发送到目标收件人。AokSend来介绍一些必需的…

阅读更多...

【Unity】Animator动画倒播，与StartRecording动画录制

【Unity】Animator动画倒播，与StartRecording动画录制

一、Animator动画倒播正常我们修改速度，只需要修改Animator.speed即可，但如果设置为负值，Animator系统会自动将其改为0值。 1.创建动画速度参数 (1)设置动画我们需要创建表示速度的动画参数Speed，将其付给需要倒播的动画片段…

阅读更多...

改进位删除谜题的求解方法

改进位删除谜题的求解方法

问题背景给定长度为 n 的二进制向量，如何删除恰好 n/3 个位，使剩余二进制向量的不同数量最小化。该问题被称为“位删除谜题”。以下是该问题的示例： 对于 n 3 的情况，最优解是 2，对应两个不同的向量 11 和 00。对…

阅读更多...

韩国裸机云站群服务器托管租用方案

韩国裸机云站群服务器托管租用方案

随着网络技术的飞速发展，站群服务器在网站运营中扮演着越来越重要的角色。韩国裸机云站群服务器，以其独特的优势，如地理位置优越、价格相对较低、技术实力雄厚等，吸引了众多企业的关注。本文将为您详细介绍韩国裸机云站群服务器的…

阅读更多...

如何快速翻译pdf英文论文(5分钟就可以翻译一篇几十页的英文论文)

如何快速翻译pdf英文论文(5分钟就可以翻译一篇几十页的英文论文)

一、问题：如何快速翻译pdf英文论文二、解决方法： 可以通过下面三个在线翻译来进行翻译pdf文档百度翻译有道翻译谷歌翻译方法：以有道翻译为例，可以直接百度搜索有道在线翻译，然后点击文档翻译，将pdf文…

阅读更多...

Python抓取天气信息

Python抓取天气信息

Python的详细学习还是需要些时间的。如果有其他语言经验的，可以暂时跟着我来写一个简单的例子。 2024年最新python教程全套，学完即可进大厂！（附全套视频下载） (qq.com) 我们计划抓取的数据：杭州的天气信息…

阅读更多...

六、C#变量作用域

六、C#变量作用域

在 C# 中，变量的作用域定义了变量的可见性和生命周期。变量的作用域通常由花括号 {} 定义的代码块来确定。以下是关于C#变量作用域的一些基本规则： 局部变量在方法、循环、条件语句等代码块内声明的变量是局部变量，它们只在声明它们的…

阅读更多...

docker pull xxx拉取超时time out

docker pull xxx拉取超时time out

文章目录前言总结前言换了镜像源，改配置的都不行，弄了一个下午，最后运行一下最高指令就可以了 sudo docker_OPTS"--dns 8.8.8.8"总结作者：加辣椒了吗？ 简介：憨批大学生一枚，喜欢…

阅读更多...

02-ES6新语法

02-ES6新语法

1. ES6 Proxy与Reflect 1.1 概述 Proxy 与 Reflect 是 ES6 为了操作对象引入的 API 。 Proxy 可以对目标对象的读取、函数调用等操作进行拦截，然后进行操作处理。它不直接操作对象，而是像代理模式，通过对象的代理对象进行操作，…

阅读更多...

JAVA8 常用Stram处理方法

JAVA8 常用Stram处理方法

JAVA8 常用Stram处理方法排序排序对象集合属性一升序属性二降序List转MapList分组求和提取字符串根据属性去重分组排序求和排序 List<MachineOrderResponse.BackRecord> noSList ss.stream().sorted(Comparator.comparing(MachineOrderResponse.BackRecord::getTime)…

阅读更多...

WEB3-众筹合约

WEB3-众筹合约

构建众筹合约的框架，包括定义 IERC20 接口，并通过构造函数初始化代币合约。 By:HackQuesthttps://www.hackquest.io/zh

阅读更多...

如何用Vue3和ApexCharts打造引人注目的3D径向条形图

如何用Vue3和ApexCharts打造引人注目的3D径向条形图

本文由ScriptEcho平台提供技术支持项目地址：传送门使用 ApexCharts 构建美观的 Vue.js 径向条形图应用场景径向条形图是一种用于可视化单一数据点及其与目标或理想值的关系的图表类型。它在显示进度、完成率或其他类似度量时非常有用。基本功能这段代码…

阅读更多...

同三维T80002JEHV H.265高清解码器

同三维T80002JEHV H.265高清解码器

同三维T80002JEHV H.265高清解码器 1路HDMI1路VGA解码输出，1/2/4画面分割或16路轮询显示产品简介： 同三维T80002JEHV解码器使用Linux系统，支持VGA/HDMI二种接口同时输出，支持多流输入多流解码及多屏显示，具有完善的…

阅读更多...

【时序预测】-Transformer系列

【时序预测】-Transformer系列

Transformer 2017 NIPS 重点：Attention Is All You Need 核心：Attention Is All You Need Informer 2021 AAAI（Best Paper） 重点：Transformer Sparse attention （稀疏） 核心：S…

阅读更多...

Django REST framework数据展示技巧：分页、过滤与搜索的实用配置与实践

Django REST framework数据展示技巧：分页、过滤与搜索的实用配置与实践

系列文章目录 Django入门全攻略：从零搭建你的第一个Web项目Django ORM入门指南：从概念到实践，掌握模型创建、迁移与视图操作Django ORM实战：模型字段与元选项配置，以及链式过滤与QF查询详解Django ORM深度游&#xff1…

阅读更多...

【修复Win11错误 0x80010135: 路径太长】

【修复Win11错误 0x80010135: 路径太长】

1. 问题现象： 一个意外错误使你无法复制该文件。如果你继续收到此错误，可以使用错误代码来搜索有关此问题的帮助。错误 0x80010135: 路径太长或者这样 2. 分析问题造成这个问题的主要原因包括： 文件路径长度超过 260 个字符&#xf…

阅读更多...

Qt利用Coin3D（OpenInventor）进行3d绘图

Qt利用Coin3D（OpenInventor）进行3d绘图

文章目录 1.安装1.1.下载coin3d1.2.下载quarter1.3.解压并合并 2.在Qt中使用3.画个网格4.加载wrl模型 1.安装 1.1.下载coin3d 首先，到官网下载[coin3d/coin] 我是Qt5.15.2vs2019的，因此我选择这个coin-4.0.2-msvc17-x64.zip 1.2.下载quarter 到官网…

阅读更多...

Docker：现代软件开发的基石

Docker：现代软件开发的基石

在当今快速发展的科技世界中，Docker 已成为现代软件开发和部署的关键工具。作为一种开源平台，Docker 使开发者能够在容器中创建、部署和运行应用程序，从而极大地提高了开发效率和环境一致性。本文将深入探讨 Docker 的基本概念、主要优势及其…

阅读更多...

最新文章