机器学习 -- 矩阵和向量

场景

在之前的knn算法和余弦算法等算法中,都有很重要的概念,叫做矩阵和向量。这个是机器学习中很重要的概念。今天来深入学习一些矩阵和向量的一些知识。

向量(Vector)

向量是一个有序的数字列表,可以在几何中表示为从原点出发的箭头。在机器学习中,向量通常用于表示数据点或特征。一个向量可以是列向量或行向量,区别在于其排列方式:

列向量:一个 n 行 1 列的矩阵,表示为竖直排列的数字列表。
行向量:一个 1 行 n 列的矩阵,表示为水平排列的数字列表。
向量可以用来表示一个数据点的多个特征,其中每个数字代表一个特征。

向量在机器学习和数据科学中的应用非常广泛,它们可以用来表示数据点的特征、进行数据分析、以及在各种算法中实现数学计算。向量之间的计算可以揭示数据的结构、相似性、差异性等重要信息。

假设我们有两个向量 A 和 B,其中:

import numpy as np
# 定义两个向量
A = np.array([4, 5, 3])
B = np.array([5, 3, 2])

向量加减:用于合并或比较数据点的特征,例如,在图像处理中,可能需要调整像素值(向量表示)的亮度(通过加减标量)。

点乘:用于计算两个向量的相似度,例如在推荐系统中,比较用户或商品特征的相似性;在文本处理中,通过计算词向量的点积来衡量单词或文档之间的相似性。

向量乘以标量:用于调整数据的规模,例如在数据标准化过程中。

案例:我们可以通过计算这两个向量的点积来估计它们的相似度。

import numpy as np# 定义两个向量
A = np.array([4, 5, 3])
B = np.array([5, 3, 2])# 计算点积
dot_product = np.dot(A, B)# 打印结果
print(f"点积为: {dot_product}")

这个点积结果给出了两个用户评分向量在数值上的相似度。点积越大,表示两个向量越“相似”。这个概念可以用于推荐系统中,来推荐用户可能喜欢的电影或商品。让我们运行这段代码,看看具体的计算结果。运行上述代码得到的点积为 41。这表明用户 1 和用户 2 的评分向量之间有一定程度的相似性。在实际应用中,这种计算可以帮助我们在推荐系统中评估用户之间或者用户与商品之间的相似度,从而提供更个性化的推荐。

矩阵(Matrix)

矩阵是一个由数字组成的矩形阵列,排列成行和列。在机器学习和统计中,矩阵用于存储和操作数据集,其中每一行通常代表一个数据点,每一列代表一个特征。
例如,如果我们有一个数据集,其中包含有关人们年龄、身高和体重的信息,则可以使用一个矩阵来表示这个数据集,其中每一行代表一个人,每一列代表一种信息(年龄、身高、体重)。
矩阵提供了一种方便的方式来同时处理多个数据点和特征,使得可以高效地进行计算和分析,比如矩阵乘法可以用于实现多个数据点的线性变换或者应用机器学习模型。

向量是一个单列(列向量)或单行(行向量)的矩阵。
矩阵是由行和列组成的二维数组,可以包含多个向量。例如,一个矩阵的每一列可以是一个独立的向量。

矩阵的基本运算

矩阵的基本运算包括加法、减法、乘法(包括矩阵乘以标量、矩阵乘以矩阵)和除法(通常以矩阵求逆的形式出现,而不是直接的除法操作)。
加法和减法:矩阵的加减运算是元素对元素的,要求两个矩阵的维度完全相同。就是简单的加减。
乘法:
矩阵乘以标量:每个元素乘以这个标量。就是每个元素乘以这个值后的矩阵。
矩阵乘以矩阵:第一个矩阵的行与第二个矩阵的列对应元素相乘后相加。

矩阵和向量的乘法

矩阵和向量的乘法是线性代数中的一个重要操作,可以视为矩阵乘以矩阵的特例,其中一个矩阵是列向量或行向量。这种乘法用于多种计算和算法中,包括:
1.变换:用矩阵乘以向量来变换该向量(例如,旋转、缩放、平移等)。
2.线性方程组:解线性方程组可以通过矩阵和向量的乘法来表示。
3.数据处理:在机器学习中,数据通常以矩阵形式出现,模型参数也可以用矩阵表示,因此矩阵和向量的乘法是算法实现的基础。

这种类型的运算在很多领域都非常有用,特别是在机器学习和计算机图形学中。例如,在机器学习中,矩阵-向量乘法可以用来计算线性模型的预测值;在计算机图形学中,它可以用来对图形进行变换(如旋转、缩放和平移)。这种运算的效率和灵活性使得矩阵和向量成为数据表示和处理的强大工具。

结束

例子就不举了,只是了解一个概念,后面会给出房价预测模型demo中会详细给出解释。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/693687.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

halcon 标定多元点标定板、棋盘格映射矫正图像、矫正失真图像

一、标定多圆孔标定 其理论与棋盘格 和圆孔都是一样的,不一样的地方就是定方向的方式不一样。如图 2、结果 read_image (CalibImage, ./circle/1.png) get_image_size (CalibImage, Width, Height) dev_close_window () dev_open_window_fit_image (CalibImage, 0…

推荐一款Vite中加载svg的小工具

最近开发中使用到一个好玩的Vite三方小插件vite-plugin-svg-icons很实用,可以辅助我们开发过程中快速加载svg小图标。其原理是在Vite编译器的时候通过一次性的DOM操作将SVG插入DOM结构中,然后通过使用内联SVG进行加载访问,极大的方便了我们的小图标引用模式。 若只是少量的s…

PE 资源表-字符串

最近在写PE加载代码,写到LoadStringA时一直找不到字中的ID,网上搜索的资源只分析三层目录,之后的找不相关资料,只好自己分析。 资料显示pe资源表 分三层目录,之后是节点,再指向数据, 第二层的…

“成像光谱遥感技术中的AI革命:ChatGPT应用指南“

遥感技术主要通过卫星和飞机从远处观察和测量我们的环境,是理解和监测地球物理、化学和生物系统的基石。ChatGPT是由OpenAI开发的最先进的语言模型,在理解和生成人类语言方面表现出了非凡的能力。本课程重点介绍ChatGPT在遥感中的应用,人工智…

2024牛客寒假算法基础集训营4(视频讲解题目)

2024牛客寒假算法基础集训营4&#xff08;视频讲解题目&#xff09; 视频链接ABCDEFG、H&#xff08;下面是hard版本的代码两个都可以过&#xff09; 视频链接 2024牛客寒假算法基础集训营4&#xff08;视频讲解题目&#xff09; A #include<bits/stdc.h> #define en…

【教程】N2N V3内网穿透、异地组网,包括Win/Linux/Android,包括不同内网实现adb远程连接

目录 一、背景 二、Linux 配置 并运行 N2N - Supernode (必选) 三、Linux -- 配置 并运行 N2N - 边缘节点配置 Edge(可选步骤) 四、Windows -- 配置 并运行 N2N - 边缘节点配置 Edge (可选步骤) (一)配置 TAP 虚拟网卡 (二)配置 N

C++:C++入门基础

创作不易&#xff0c;感谢三连 &#xff01;&#xff01; 一、什么是C C语言是结构化和模块化的语言&#xff0c;适合处理较小规模的程序。对于复杂的问题&#xff0c;规模较大的程序&#xff0c;需要高度的抽象和建模时&#xff0c;C语言则不合适。为了解决软件危机&#xff…

子网络划分与互通,上网行为审计

网络环境需求:在办公网络环境中,由于公司部门的划分,以及服务器、电脑、手机等设备类型,一般都需要划分多个网段,便于进行网络管理,并提升网络通信效率。各个子网段管理员控制设备的接入,子网段之间需要进行局域网通信,发送消息和文件,通常使用飞秋。服务器网段,禁止…

Java Mybatis面试题解析(下)

15. 说一下Mybatis的一级缓存和二级缓存&#xff1f;【重点】 考核点&#xff1a;Mybatis缓存。 答&#xff1a; Mybatis的一级缓存是指SqlSession&#xff0c;一级缓存的作用域是SqlSession&#xff0c;Mybaits默认开启一级缓存&#xff1b; 在同一个SqlSession中&#xf…

第100讲:MHA+Atlas实现MySQL主从复制读写分离分布式集群

文章目录 1.Atlas读写分离简介2.搭建MHA高可用MySQL主从复制集群3.部署配置Atlas读写分离中间件3.1.安装Atlas读写分离中间件3.2.配置读写分离3.3.启动Atlas读写分离 4.读写分离集群测试5.生产环境中创建一个用户通过Atlas使用6.Atlas通过管理接口实现在线管理7.Atlas自动分表 …

Oracle中TimeStamp和Date的区别

在Oracle数据库中&#xff0c;DATE和TIMESTAMP数据类型都是用于存储日期和时间信息&#xff0c;但它们之间有几个重要的区别&#xff1a; 精度不同&#xff1a; DATE数据类型能存储日期和时间到秒的精度&#xff0c;格式通常是YYYY-MM-DD HH24:MI:SS&#xff0c;并且它总是包含…

华为OD机试真题-开源项目热榜-2023年OD统一考试(C卷)---python免费

题目&#xff1a; 考察内容&#xff1a; 理解题目双排序 代码&#xff1a; """ 题目分析&#xff1a; 计算热度值&#xff0c;进行降序排序&#xff0c;热度值一样&#xff0c;字母小写&#xff0c;字典排序输入&#xff1a; 项目个数N, int 0-100 权重列表…

高企详细流程

一、自我评价 企业根据《认定办法》和《工作指引》进行自我评价&#xff0c;初步判断是否达到认定条件的要求。 二、注册登记 企业登录"高新技术企业认定管理工作网"&#xff0c;按要求填写《企业注册登记表》&#xff0c;并通过网络系统提交至认定机构。认定机构…

快速部署华为云WAF实现Web应用安全防护

通常&#xff0c;用户将web应用暴露在公网上&#xff0c;不做任何准备或者安全措施可能会受到黑客的注入入侵攻击导致网站核心数据被脱库泄露。以及木马上传网页篡改&#xff0c;导致网站公信力受到影响。本文九河云将为您介绍如何通过华为云WAF应用防火墙实现web应用安全防护&…

[office] excel如何设置图片大小 #其他#其他

excel如何设置图片大小 如果你是EXCEL初学者&#xff0c;因为EXCEL功能强大&#xff0c;刚开始肯定很难记住许多的操作技巧&#xff0c;这里讲一下如何插入图片并根据需要改变图片的大小。下面让小编为你带来excel设置图片大小的方法。 excel设置图片大小步骤&#xff1a; 步骤…

解锁创意灵感,探索FlutterExampleApps项目的奥秘

解锁创意灵感&#xff0c;探索FlutterExampleApps项目的奥秘 项目简介 FlutterExampleApps项目是一个包含各种示例应用链接的仓库&#xff0c;旨在演示Flutter应用开发中的各种功能、特性和集成。 项目包含了以下几个部分&#xff0c;每个部分都涵盖了不同的内容和主题&…

Day23--learning English

一、积累 1.straw 2.umami | tangy | bland 3.lactose dairy 4.fatigue 5.stumble | curb 6.pore 7.toll 8.arrear 9.robe 10.stylish 11.dash 12.mischief 13.ranch 14.sponsorship 15.podcast 16.villian 17.clutch 18.envision 二、练习 1.牛津原译 1.straw /strɔː/ 1…

Unity3D 实现基于物理引擎的绳子关节解析详解

前言 在游戏开发中&#xff0c;有时候我们需要实现绳子关节效果&#xff0c;比如在射击游戏中射击绳子&#xff0c;或者在平衡游戏中使用绳子作为支撑。本文将详细介绍如何使用Unity3D的物理引擎实现绳子关节效果。 对惹&#xff0c;这里有一个游戏开发交流小组&#xff0c;希…

为python新手准备的练习题目

1、输入一个整数并打印 if 输入年级&#xff0c;如果大于18岁&#xff0c;输出 已成年&#xff0c;否则输出未成年 如果大于等于90&#xff0c;输出“优秀”&#xff0c;如果大于等于70&#xff0c;输出“良好”&#xff0c; 如果大于等于60&#xff0c;输出“及格”&#…

pytorch数学运算

目录 1. pytorch的数学运算包括2. 基本运算3. matmul4. power sqrt rsqrt5. exp log6. 近似值7. clamp 1. pytorch的数学运算包括 ▪Add/minus/multiply/divide ▪Matmul ▪Pow ▪Sqrt/rsqrt ▪Round 2. 基本运算 、-、*、/ 也可以使用函数add sub mul div 3. matmul 矩阵…