​Python20 Numpy基础

图片

NumPy(Numerical Python)是一个开源的Python库,广泛用于科学计算。它提供了一个高性能的多维数组对象,以及用于处理这些数组的工具和函数。NumPy是数据分析、机器学习、工程和科学研究中不可或缺的工具之一,因为它提供了简单而高效的数值运算功能。

1.NumPy的主要功能:

  1. 高效的数组运算:NumPy的数组比Python的内置数据结构更加高效和快速。

  2. 广播功能:能够处理不同大小数组之间的运算。

  3. 数学函数:包含大量的数学函数,用于在数组上执行各种数学运算。

  4. 线性代数、傅里叶变换和随机数生成:提供了丰富的库和API支持。

NumPy的使用广泛,几乎是所有使用Python进行数据科学的项目的基础库之一。

2.NumPy的使用方法

以下是Numpy库的常用方法,以下代码可直接复制到jupyter notebook运行。

生成随机数组:

# 构造4x4的随机数组
from numpy import *
random.rand(4,4)# 输出:
'''
array([[0.99764728, 0.06364547, 0.02182546, 0.16433105],[0.63289943, 0.29763976, 0.58491023, 0.28307729],[0.42512921, 0.27926124, 0.11818588, 0.58845666],[0.07451536, 0.65541451, 0.50638315, 0.27005101]])
'''

将数组转换成矩阵matrix:

# 调用mat函数将数组转换成矩阵matrix
randMat=mat(random.rand(4,4))
randMat
# 输出:
'''
matrix([[0.27496011, 0.9093084 , 0.0018111 , 0.13143669],[0.85885902, 0.94750823, 0.96820938, 0.06107537],[0.67165439, 0.69433003, 0.82237952, 0.25712598],[0.65327732, 0.30190633, 0.65090624, 0.05763251]])
'''

求矩阵的逆矩阵:

# 矩阵求逆运算
randMat.I# 输出:
'''
matrix([[-2.27475911,  1.74370229,  0.3710643 , -0.63203529],[ 1.15524442,  0.27630249, -1.52858325,  1.38871436],[ 2.0517843 , -2.27912633,  0.3015267 ,  3.06149341],[ 0.98720611, -0.61572784,  0.95857182, -0.9405201 ]])
'''

矩阵乘法:

# 矩阵乘法
invRandmat=randMat.I
randMat*invRandmat
# 输出:
'''
matrix([[ 1.00000000e+00,  0.00000000e+00,  8.32667268e-17,-1.59594560e-16],[ 0.00000000e+00,  1.00000000e+00, -1.66533454e-16,1.11022302e-16],[-1.11022302e-16,  2.22044605e-16,  1.00000000e+00,1.11022302e-16],[ 0.00000000e+00,  4.51028104e-17,  0.00000000e+00,1.00000000e+00]])
'''

用矩阵与逆矩阵相乘(得到单位阵,实际存在误差):

# 矩阵乘以其逆矩阵应该是单位矩阵
myEye=randMat*invRandmat  # 矩阵乘其逆矩阵,结果应为单位阵
myEye-eye(4)  # eye(4)将得到一个4阶单位阵
# 输出:
'''
matrix([[ 0.00000000e+00,  0.00000000e+00,  8.32667268e-17,-1.59594560e-16],[ 0.00000000e+00,  0.00000000e+00, -1.66533454e-16,1.11022302e-16],[-1.11022302e-16,  2.22044605e-16,  0.00000000e+00,1.11022302e-16],[ 0.00000000e+00,  4.51028104e-17,  0.00000000e+00,0.00000000e+00]])
'''

shape()函数获得数组的形状:

# shape函数是numpy.core.fromnumeric中的函数,它的功能是读取矩阵的长度,比如shape[0]就是读取矩阵第一维度的长度。
e=eye(3)
e.shape[0]# 输出:
'''
3
'''
x=random.rand(4,3)  # 生成一个4x3的数组
x.shape[0]
# 输出:
'''
4
'''

numpy tile方法:numpy.tile(A,B),将重复A数组B次,这里的B可以时int类型也可以是元组类型。

# tile方法
tile([1,2],5)  # 列方向重复5次,行默认1次
# 输出:
'''
array([1, 2, 1, 2, 1, 2, 1, 2, 1, 2])
'''
# tile方法
tile([1,2],(2,1))  # 列方向重复2次,行1次
# 输出:
'''
array([[1, 2],[1, 2]])
'''

zeros()函数创建0数组:

# zeros函数
zeros(5)
# 输出:
'''
array([0., 0., 0., 0., 0.])
'''
# zeros函数
zeros([2,3])
# 输出:
'''
array([[0., 0., 0.],[0., 0., 0.]])
'''

3.KNN算法

# kNN算法
from numpy import *  # 从NumPy库导入所有功能模块
import operator  # 该模块包含一系列对标准运算符的函数化实现例如加法乘法等
def CreateDataSet():group=array([[1.0,1.1],[1.0,1.0],[0,0],[0,0.1]])  # 一个NumPy数组,包含了四个二维坐标点。这些点是数据集中的样本labels=['A','A','B','B']  # 包含了与 group 数组中每个点相对应的类别标签return group,labels  # 返回两个值,group数组和labels列表group,labels=CreateDataSet()  # 将返回的两个值赋值给group和labels变量
group
# 输出:
'''
array([[1. , 1.1],[1. , 1. ],[0. , 0. ],[0. , 0.1]])
'''
labels
# 输出:
'''
['A', 'A', 'B', 'B']
'''
def  classify0(inX,dataSet,labels,k):  # inX:需要分类的输入样本;dataSet:训练数据集,包含多个已知分类的点;labels:训练数据集中每个点对应的标签;k:在kNN算法中,决定“邻居”数量的参数dataSetSize=dataSet.shape[0]  # 获取数据集的行数即样本数量print(dataSetSize)diffMat=tile(inX,(dataSetSize,1))-dataSet # 将输入的点与训练样本做差,使用 tile 函数将输入向量 inX 复制成与数据集相同大小的矩阵,然后与数据集中的每个点相减,计算输入点与数据集中每个点的差异print("这个是dataSet",dataSet)print("这个是测试的输入向量",tile(inX,(dataSetSize,1)))print("这个是点差",diffMat)sqDiffMat=diffMat**2  # 计算出距离平方print("这个是距离平方",sqDiffMat)sqDistances=sqDiffMat.sum(axis=1)  # 计算距离平方和print("这个是距离平方和",sqDistances)distances=sqDistances**2  # 开方得出距离sortedDistIndicies=distances.argsort()  # 从小到大排序,返回索引print("距离排序后对应的索引:",sortedDistIndicies)classCount={}  # 初始化一字典来存储每个类别的票数for i in range(k):  # 遍历最近的 k 个点,并对其类别进行计票voteIlabel=labels[sortedDistIndicies[i]]print(voteIlabel)classCount[voteIlabel]=classCount.get(voteIlabel,0)+1sortedClassCount=sorted(classCount.items(),key=operator.itemgetter(1),reverse=True)  # 根据票数对类别进行排序print(sortedClassCount)return sortedClassCount[0][0]
x=classify0([0,0],group,labels,3)  
x# 输出:
'''
4
这个是dataSet [[1.  1.1][1.  1. ][0.  0. ][0.  0.1]]
这个是测试的输入向量 [[0 0][0 0][0 0][0 0]]
这个是点差 [[-1.  -1.1][-1.  -1. ][ 0.   0. ][ 0.  -0.1]]
这个是距离平方 [[1.   1.21][1.   1.  ][0.   0.  ][0.   0.01]]
这个是距离平方和 [2.21 2.   0.   0.01]
距离排序后对应的索引: [2 3 1 0]
B
B
A
[('B', 2), ('A', 1)]'B'
'''

4.使用k-近邻算法改进约会网站的配对效果

from numpy import zerosdef file2matrix(filename):# 定义标签映射字典label_map = {'largeDoses': 2, 'smallDoses': 1, 'didntLike': 0}  # 将字符串标签映射到整数fr = open(filename)arrayOLines = fr.readlines()  # 用readlines()方法读取文件中的每一行并存储在列表arrayOLines中fr.close()  # 读取完数据后应关闭文件numberOfLines = len(arrayOLines)  # 获取行数# 创建返回的NumPy矩阵, 行数为numberOfLines, 列数固定为3returnMat = zeros((numberOfLines, 3))classLabelVector = []  # 初始化标签列表index = 0for line in arrayOLines:line = line.strip()  # 去掉每行首尾空白listFromLine = line.split('\t')  # 按'\t'分割字符串returnMat[index, :] = listFromLine[0:3]  # 前三个元素存入矩阵# 使用映射字典获取标签classLabelVector.append(label_map[listFromLine[-1]])index += 1  # 索引递增,为处理下一行数据做准备return returnMat, classLabelVector  # 返回数据矩阵和对应的分类标签# 调用函数示例
filename = r"F:\桌面\python100\files\data\datingTestSet.txt"
datingDataMat, datingLabels = file2matrix(filename)# 输出数据矩阵,查看结果
datingDataMat
# 结果矩阵1-3列分别表示:飞行常客里程数、玩视频游戏所耗时间、每周消费的冰激凌数
'''
array([[4.0920000e+04, 8.3269760e+00, 9.5395200e-01],[1.4488000e+04, 7.1534690e+00, 1.6739040e+00],[2.6052000e+04, 1.4418710e+00, 8.0512400e-01],...,[2.6575000e+04, 1.0650102e+01, 8.6662700e-01],[4.8111000e+04, 9.1345280e+00, 7.2804500e-01],[4.3757000e+04, 7.8826010e+00, 1.3324460e+00]])
'''

结果数据的可视化散点图(取后两维):

# 制作原始数据的散点图
import matplotlib
import matplotlib.pyplot as pltfig=plt.figure()
ax=fig.add_subplot(111)
ax.scatter(datingDataMat[:,1],datingDataMat[:,2])  # 取矩阵的第二列(玩视频游戏所耗时间)、第三列数据(每周消费的冰激凌数)
plt.show()

图片

取结果矩阵的后两维特征进行可视化优化:

# 个性化标记散点图上的点
import matplotlib
import matplotlib.pyplot as pltfig=plt.figure()  # 创建一个图形实例fig
ax=fig.add_subplot(111)  # 向fig添加一个子图 ax,参数 111 表示在一个1x1的网格上创建第一个(也是唯一一个)子图,这是一种快捷方式
ax.scatter(datingDataMat[:,1],datingDataMat[:,2],15.0*array(datingLables),15.0*array(datingLables))  # 将标签数组datingLables转换为NumPy数组,并乘以15.0,目的是让不同的标签对应的点大小有明显区分
plt.show()

图片

取结果矩阵的前两维特征进行可视化:

# 个性化标记散点图上的点
# 采用列1(飞行常客里程数--x轴)和列2(玩视频游戏时间--y轴)的属性值可以取得更好的效果
import matplotlib
import matplotlib.pyplot as pltfig=plt.figure()
ax=fig.add_subplot(111)
ax.scatter(datingDataMat[:,0],datingDataMat[:,1],15.0*array(datingLables),15.0*array(datingLables))  # 分别取数据矩阵的第一列和第二列作为x轴和y轴的数据
plt.show()

图片


以上内容总结自网络,如有帮助欢迎转发,我们下次再见!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/34661.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

python可视化和程序设计-2024年6月24日-80-90

好的,我将按照您提供的格式,继续转换题目81至题目90的内容。 81:问:下列图表中,可以清晰地反映出数据变化趋势的是? - 选项: - A. 直方图 - B. 折线图 - C. 饼图 - D. 散点图 答…

Spring Boot中防止接口重复提交

Spring Boot中防止接口重复提交 大家好,我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编,也是冬天不穿秋裤,天冷也要风度的程序猿! 在Web开发中,接口重复提交是一个常见的问题,特别是在高…

使用Hugging Face获取BERT预训练模型

【图书推荐】《从零开始大模型开发与微调:基于PyTorch与ChatGLM》_《从零开始大模型开发与微调:基于pytorch与chatglm》-CSDN博客 BERT是一个预训练模型,其基本架构和存档都有相应的服务公司提供下载服务,而Hugging Face是一家目前专门免费提…

推荐一款好用的编辑工具——onlyoffice桌面编辑器8.1

读者大大们好呀!!!☀️☀️☀️ 🔥 欢迎来到我的博客 👀期待大大的关注哦❗️❗️❗️ 🚀欢迎收看我的主页文章➡️寻至善的主页 文章目录 🔥前言🚀版本更新概览🚗文档编辑PDF编辑器…

搭建盲盒小程序的必要性

随着移动互联网的飞速发展,小程序作为一种新型的应用形态,已经深入人们的生活。而盲盒,作为一种独特的销售方式,因其神秘感和趣味性而备受年轻消费者的喜爱。当盲盒遇上小程序,便产生了一种全新的商业模式,…

Qt项目天气预报(5) - 根据JSON刷新天气信息+城市匹配

刷新当天天气 我们使用如下api接入,当然需要自己去 易客云天气API免费天气API接口|天气预报接口|全球天气API接口|气象预警|空气质量 (tianqiapi.com)注册后生成自己的对应id才可以使用 //专业天气v61 http://v1.yiketianqi.com/api?unescape1&versionv61&…

STM32学习-HAL库 串口通信

学完标准库之后,本来想学习freertos的,但是看了很多教程都是移植的HAL库程序,这里再学习一些HAL库的内容,有了基础这里直接学习主要的外设。 HAL库对于串口主要有两个结构体UART_InitTypeDef和UART_HandleTypeDef,前者…

深入解析Java中的Lambda表达式

深入解析Java中的Lambda表达式 大家好,我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编,也是冬天不穿秋裤,天冷也要风度的程序猿! Lambda表达式是Java 8引入的一个重要特性,它简化了代码编写&#x…

声网sdk-实现纯语音互动

声网官网地址: https://doc.shengwang.cn/doc/rtc/javascript/basic-features/audio-quick-start react实现一对多实时对讲如下: import React, { useState, useEffect, useCallback, useRef } from "react"; import AgoraRTC from "a…

构建高性能Java应用的秘诀

构建高性能Java应用的秘诀 大家好,我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编,也是冬天不穿秋裤,天冷也要风度的程序猿! 在当今的软件开发领域,构建高性能的Java应用是许多开发者和团队所追求的…

知识管理的效率软件从来都是狗屎

我个人接触过各种脑图,各种头脑风暴的软件。花一堆天花烂坠的知识爆炸图,头脑风暴图,最后可能看不上一两次,除了显摆,我个人觉得对我对体系化的深思和理解没有任何效率可言。矫揉造作,懂的自然懂&#xff0…

白帽子的海外第一单,750刀

国际惯例,给兄弟们看图 这是我们师傅挖国外SRC的部分赏金截图 就问你!挖国外漏洞赚美金香不香! 现在国内SRC越来越卷了,越来越多的白帽子开始挖海外漏洞赚美金。海外SRC真的比国内赏金高很多,不说高危漏洞&#xff0…

1388:家谱(gen)

【解题思路】 设map<string, string> fa&#xff0c;fa[x]表示名字为x的人的父亲的名字。模仿并查集中的查询操作&#xff0c;写出find函数&#xff0c;求x的祖先。如果输入的名字是父亲&#xff0c;且第一次出现。将该名字保存在father变量中&#xff0c;那么类似并查集…

MoneyPrinterPlus:AI自动短视频生成工具-腾讯云配置详解

MoneyPrinterPlus可以使用大模型自动生成短视频&#xff0c;其中的语音合成和语音识别部分需要借助于一些第三发云厂商的语音服务。 很多小伙伴可能不知道应该如何配置&#xff0c;这里给大家提供一个详细的腾讯云语音服务的配置教程。 项目已开源&#xff0c;代码地址&#…

计算几何系列——XCPC中计算几何一些题型杂谈(上)

本系列文章力求以简洁易懂的文字介绍计算几何中的基本概念&#xff0c;使读者快速入门&#xff0c;故不追求难度和深度&#xff0c;仅起到抛砖引玉的作用。 在XCPC中有一种题叫计算几何&#xff0c;这类题在大多数时候都作为一类金牌题甚至防AK题的难度出现&#xff0c;但是在…

Kotlin设计模式:代理模式详解

Kotlin设计模式&#xff1a;代理模式详解 在软件开发中&#xff0c;设计模式是解决常见问题的一种优雅方法。本文将介绍Kotlin中的代理模式&#xff08;Proxy Pattern&#xff09;&#xff0c;其应用场景&#xff0c;以及如何通过实例代码实现这一模式。 代理模式的目的 代理…

坚持使用WAF的10个理由

WAF&#xff08;Web应用程序防火墙&#xff09;无疑是过去几十年里应用最广泛、最成熟的网络安全产品之一&#xff0c;大部分拥有Web应用程序的组织都会部署应用WAF&#xff0c;以保护数据和资产避免被非法闯入。然而&#xff0c;随着DevOps敏捷应用开发时代的到来&#xff0c;…

计算机视觉背后的技术:原理与实践

计算机视觉是一门让计算机能够"看"的科学&#xff0c;它的目标是使计算机能够理解并解析图像和视频中的信息&#xff0c;就像人类视觉系统所做的那样。在过去的几十年里&#xff0c;随着深度学习技术的飞速发展&#xff0c;计算机视觉领域也取得了巨大的突破&#xf…

DEtection TRansformer (DETR)与YOLO在目标检测方面的比较

1. 概述 计算机视觉中的目标检测是一个复杂而有趣的领域&#xff0c;它涉及到让计算机能够识别图像中的物体&#xff0c;并确定它们的位置。下面是DETR和YOLO这两种目标检测方法简单比较&#xff1a; 1.1 YOLO YOLO是一种非常流行的目标检测算法&#xff0c;它的核心思想是将…

一种502 bad gateway nginx/1.18.0的解决办法

背景:上线的服务突然挂掉了 step1&#xff0c;去后端日志查看&#xff0c;发现并无异常&#xff0c;就是请求无法被接收 step2&#xff0c;查看了nginx的错误日志&#xff0c;发现该文件为空 step3&#xff0c;查看了niginx的运行日志&#xff0c;发现了以下问题 [error] 38#…