【机器学习速记】面试重点/期末考试

自用,有错误欢迎评论区指出

目录

 一、机器学习基础概念

二、机器学习类型分类

三、经典算法与原理

 1. 线性模型

 2. 决策树

3. SVM(支持向量机)

 4. K近邻(KNN)

 5. 贝叶斯分类

 6. 集成学习

四、模型评价指标

五、模型泛化能力与调参

六、特征工程与数据预处理

 七、维度约简与降维方法

 八、强化学习简要介绍

 九、常见面试/复试问答题

1. 什么是过拟合?如何解决?

2. 逻辑回归与SVM的区别?

3. PCA与LDA的区别?

4. 什么是核函数?SVM为何需要核函数?

5. 机器学习与深度学习的区别?

6. XGBoost相比传统GBDT的优势有哪些?

7. Bias-Variance(偏差-方差)权衡是什么意思?

8. 为什么特征要标准化/归一化?

9. 训练集和测试集如何划分?交叉验证的作用?

10. 梯度消失与梯度爆炸的含义?如何缓解?


 一、机器学习基础概念

概念说明
什么是机器学习?机器学习是一门使计算机从数据中学习经验并做出预测或决策的学科。
机器学习 vs 传统编程传统编程:规则 + 数据 → 结果;机器学习:数据 + 结果 → 学习规则。
机器学习三要素模型(Model)、策略(Strategy)、算法(Algorithm)

二、机器学习类型分类

类型特点典型算法
监督学习有标签数据,预测输出线性回归、逻辑回归、SVM、决策树、KNN、神经网络
无监督学习无标签数据,发现结构聚类(K-means)、降维(PCA)
半监督学习小部分有标签,大量无标签数据
强化学习智能体通过与环境交互获得最大奖励Q-learning、DQN、策略梯度等

三、经典算法与原理

 1. 线性模型

  • 线性回归:损失函数是均方误差(MSE),求解方法是最小二乘法。

  • 逻辑回归:用于分类,输出为概率(sigmoid),损失函数是对数似然函数。

 2. 决策树

  • 分裂依据:信息增益(ID3)、信息增益率(C4.5)、基尼指数(CART)

【机器学习】熵-信息增益-ID3-C4.5_. 什么是熵?熵在决策树算法中有什么作用?-CSDN博客

  • 优点:可解释性强;缺点:容易过拟合

3. SVM(支持向量机)

  • 最大间隔分类器,核心是构造间隔最大的超平面

  • 使用核函数解决非线性问题(如 RBF、Poly)

 4. K近邻(KNN)

  • 基于“相似数据点具有相似标签”,没有训练过程,计算开销大

 5. 贝叶斯分类

  • 基于贝叶斯定理,朴素贝叶斯假设特征之间条件独立

 6. 集成学习

  • Bagging(并行):随机森林

  • Boosting(串行):AdaBoost,Gradient Boosting(如XGBoost)


四、模型评价指标

任务类型指标
回归MSE、RMSE、MAE、R²
分类准确率、精确率、召回率、F1分数、AUC-ROC

五、模型泛化能力与调参

问题描述解决方法
过拟合

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/902893.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Redis 原子操作

文章目录 前言✅ 一、什么是「原子操作」?🔍 二、怎么判断一个操作是否原子?🧪 三、项目中的原子 vs 非原子案例(秒杀系统)✅ 原子性(OK)❌ 非原子性(高风险)…

中建海龙MiC模块化建筑赋能“好房子”新范式

中国建筑国际集团旗下中建海龙科技有限公司(以下简称“中建海龙”)以科技创新为引擎,持续推动建筑行业向工业化、数字化、绿色化转型升级。近期,其自主研发的模块化集成建筑(MiC)技术成功入选中国建筑首批产…

DDL自联表

自联表 create table t_menu (id int AUTO_INCREMENT,name varchar(20),image varchar(20),url varchar(20),pid varchar(20),constraint pk_id primary key(id),constraint fk_id foreign key(pid) references t_menu(id) );

【版本控制】SVN + TortoiseSVN版本管理实用教程(附安装+开发常用操作)

摘要: 本文将带你从零开始掌握 SVN 版本控制系统,结合 TortoiseSVN 图形客户端工具,深入学习包括安装、检出、提交、更新、回滚、冲突解决等常用开发操作,快速上手团队协作! 🧩 什么是 SVN? SV…

C语言实现对哈希表的操作:创建哈希表与扩容哈希表

一. 简介 前面文章简单了解了哈希表 这种数据结构,文章如下: 什么是哈希表-CSDN博客 本文来学习一下哈希表,具体学习一下C语言实现对哈希表的简单实现。 二. C语言实现对哈希表的操作 1. 哈希表 哈希表(Hash Table&#xff…

UML 活动图详解:以机票预订系统用户注册为例

目录 一、UML 活动图的基本元素 二、题目原型 三、机票预订系统用户注册的活动图分析 四、活动图绘画 五、总结 在软件开发过程中,UML(统一建模语言)活动图是一种非常重要的工具,它能够帮助我们清晰地理解系统的业务流程和工…

FX10(CYUSB4014)USB3.2(10Gbps)开发笔记分享(1):硬件设计与开发环境搭建

作者:Hello,Panda 大家早上好,中午好,下午好,晚上好,熊猫君又来了。这次计划做一个连载,大概6期左右,主要介绍英飞凌最新的FX5/10/20的器件应用。目前,熊猫君手上调试的…

前端项目部署

一、本地服务器部署: 解决页面刷新404问题: 1、使用 hash 模式 2、当路径不匹配的时候,直接访问 index.html 3、使用插件:connect-history-api-fallback https://www.npmjs.com/package/connect-history-api-fallback npm ins…

观测云数据在Grafana展示的最佳实践

背景 在当今的数据驱动世界中,组织越来越依赖于实时数据来做出决策。数据可视化是理解和分析这些数据的关键工具,它帮助用户将复杂的数据集转换成直观的图表和仪表板,从而更容易识别趋势、模式和异常。Grafana,作为一个功能强大的…

架构师面试(三十六):广播消息

题目 在像 IM、短视频、游戏等实时在线类的业务系统中,一般会有【广播消息】业务,这类业务具有瞬时高流量的特点。 在对【广播消息】业务实现时通常需要同时写 “系统消息库” 和更新用户的 “联系人库” 的操作,用户的联系人表中会有未读数…

大模型微调 - transformer架构

什么是Transformer Transformer 架构是由 Vaswani 等人在 2017 年提出的一种深度学习模型架构,首次发表于论文《Attention is All You Need》中 Transformer 的结构 Transformer 编码器(Encoder) 解码器(Decoder) …

基于华为云 ModelArts 的在线服务应用开发(Requests 模块)

基于华为云 ModelArts 的在线服务应用开发(Requests 模块) 一、本节目标 了解并掌握 Requests 模块的特点与用法学会通过 PythonRequests 访问华为云 ModelArts 在线推理服务熟悉 JSON 模块在 Python 中的数据序列化与反序列化掌握 Python 文件 I/O 的基…

python pymysql如何保证数据库更新成功

python pymysql如何保证数据库更新成功 在使用Python的PyMySQL库与MySQL数据库交互时,确保数据库更新操作成功执行,可以通过以下几种方式: 使用execute()和commit() 当执行一个更新(UPDATE)、插入(INSERT)或删除(DELETE)操作时,你需要调用execute()方法来执行SQL语句…

【数据可视化-30】Netflix电影和电视节目数据集可视化分析

🧑 博主简介:曾任某智慧城市类企业算法总监,目前在美国市场的物流公司从事高级算法工程师一职,深耕人工智能领域,精通python数据挖掘、可视化、机器学习等,发表过AI相关的专利并多次在AI类比赛中获奖。CSDN…

【深度强化学习 DRL 快速实践】逆向强化学习算法 (IRL)

Inverse Reinforcement Learning (IRL) 详解 什么是 Inverse Reinforcement Learning? 在传统的强化学习 (Reinforcement Learning, RL) 中,奖励函数是已知的,智能体的任务是学习一个策略来最大化奖励 而在逆向强化学习 (Inverse Reinforc…

入侵检测系统(IDS)与入侵防御系统(IPS):功能对比与部署实践

入侵检测系统(IDS)与入侵防御系统(IPS):功能对比与部署实践 在网络安全防御体系中,入侵检测系统(Intrusion Detection System, IDS)与入侵防御系统(Intrusion Preventio…

P12167 [蓝桥杯 2025 省 C/Python A] 倒水

P12167 [蓝桥杯 2025 省 C/Python A] 倒水 题目描述 小蓝有 n n n 个装了水的瓶子,从左到右摆放,第 i i i 个瓶子里装有 a i a_i ai​ 单位的水。为了美观,小蓝将水循环染成了 k k k 种颜色,也就是说,第 i i i …

短视频矩阵系统可视化剪辑功能开发,支持OEM

在短视频营销与内容创作竞争日益激烈的当下,矩阵系统中的可视化剪辑功能成为提升内容产出效率与质量的关键模块。它以直观的操作界面和强大的编辑能力,帮助创作者快速将创意转化为优质视频。本文将结合实际开发经验,从需求分析、技术选型到核…

制作一款打飞机游戏22:表格导出

编辑器功能扩展 今天,我想让编辑器能够处理一个数组,这是编辑器将要编辑的东西,它只编辑数组。这些区域在后续的不同版本的编辑器中会有不同的含义,但现在我想创建一个模板,能够加载一个二维数组,并将二维…

AI数据分析的利器:解锁BI工具的无限潜力

在数字化浪潮席卷全球的今天,数据已成为企业最宝贵的资产之一。如何高效、准确地分析这些数据,挖掘其中的价值,成为企业决策的关键。AI数据分析,作为新时代的数据分析利器,正逐渐改变着企业的决策方式。而BI&#xff0…