Python 数据分析入门教程:Numpy、Pandas、Matplotlib和Scikit-Learn详解

文章目录

  • Python数据分析入门教程
    • Numpy库
    • Pandas库
    • Matplotlib绘图
    • Scikit-Learn机器学习
  • NumPy数组与运算
    • NumPy数组对象
    • 数组创建函数
    • 数组运算
    • 数组索引
    • 数组操作总结
  • 总结
  • python精品专栏推荐
    • python基础知识(0基础入门)
    • python爬虫知识

Python数据分析入门教程

Numpy库

NumPy是一个Python的科学计算基础模块,提供了多维数组和矩阵操作功能。

import numpy as nparr = np.array([1, 2, 3]) 
print(arr)

NumPy中的数组比Python自带的列表更适合进行数值计算和数据分析。

Pandas库

Pandas建立在NumPy之上,提供了更高级的数据分析功能。

import pandas as pddata = pd.DataFrame({"name":["John", "Mary"],"age":[30, 25]  
})print(data)

Pandas中的DataFrame可以看成是一个二维表格,便于加载和分析数据。

Matplotlib绘图

Matplotlib可以用来绘制各种图表,常用于数据分析可视化。

import matplotlib.pyplot as pltx = [1, 2, 3, 4]
y = [2, 4, 6, 8]plt.plot(x, y)
plt.show()

条形图、散点图、直方图等多种图表可用少量代码绘制。

Scikit-Learn机器学习

Scikit-Learn提供了常用的机器学习算法。

from sklearn.linear_model import LinearRegressionmodel = LinearRegression()
model.fit(x_train, y_train)
y_pred = model.predict(x_test)

可以基于Pandas和Scikit-Learn构建数据分析与机器学习 Pipeline。

NumPy数组与运算

NumPy是Python语言的一个重要扩展程序库,主要用于数组与矩阵运算,对于数据分析非常关键。本文将详细介绍NumPy的数组对象以及相关的运算操作。

NumPy数组对象

NumPy中的ndarray(N维数组对象)是一个快速灵活的大数据集容器,比标准Python列表更适合用于科学与工程计算。

import numpy as nparr = np.array([1, 2, 3])
print(arr)arr = np.array([[1, 2], [3, 4]]) 
print(arr) 
ndarray是一个同质数据的多维容器,在创建时可以指定数据类型。
python
arr = np.array([1, 2, 3], dtype=np.float32)
ndarray的维数 called shape,可以通过shape属性获得:
python 
arr = np.array([[1,2,3], [4,5,6]])
print(arr.shape) # (2, 3) 

维数可以超过2,表示高维数组。数组大小调用size属性。

数组创建函数

np.array是创数组的最基本方法。np还提供了其他创建数组的函数:

arr = np.zeros(10) # 10个0 arr = np.ones((2, 3), dtype=int) # 2x3全1数组arr = np.full((3, 5), 6) # 3x5全6数组
np.random模块可以生成随机数组:
python
arr = np.random.random((2, 4)) # 2x4随机数组arr = np.random.normal(0, 1, (3, 3)) # 正态分布 

数组运算

NumPy中可以对整个数组进行算术运算,逐元素运算:

arr1 = np.array([1, 2, 3])
arr2 = np.array([2, 3, 4])
print(arr1 + arr2) # [3 5 7]print(arr1 * 2) # [2 4 6]

常用的数组运算还包括求和、统计、广播等:

arr = np.array([[1,2], [3,4]]) print(arr.sum()) # 10print(arr.min()) # 1
print(arr.max()) # 4 arr1 = np.array([[1, 2]])
arr2 = np.array([2, 3])
print(arr1 + arr2) # broadcasting

数组索引

ndarray支持多维索引,可以获取某个元素:

arr = np.array([[1,2,3], [4,5,6], [7,8,9]])print(arr[1, 2]) # 6print(arr[0:2, 1]) # [2 5] 切片
布尔数组索引:
python 
arr = np.array([1, 2, 3, 4])
bool_idx = arr > 2 print(arr[bool_idx]) # [3 4]

数组操作总结

  • ndarray是NumPy的基本数组对象,比列表更适合科学计算
  • 支持多种数组创建方式如zeros,random等
  • 可以进行数学与统计运算,如sum,mean
  • 通过索引和切片可以操作数组元素

NumPy的数组运算是Python科学计算的基石,必须深入学习,才能打下坚实的基础。

总结

在本文中,我们介绍了 Python 数据分析的入门教程,重点介绍了 Numpy 库、Pandas 库、Matplotlib 绘图和 Scikit-Learn 机器学习等方面的内容。现在,让我们来简要总结一下吧!

首先是 Numpy 库。我们了解到 Numpy 是 Python 中一个强大的数值计算库,它提供了多维数组对象以及丰富的数组运算功能。通过 Numpy,我们可以轻松地对数组进行创建、操作和索引,还可以进行各种数学运算和线性代数操作。

接着我们介绍了 Pandas 库。Pandas 是用于数据分析和处理的重要工具,它提供了 DataFrame 对象,使我们能够灵活地处理和分析数据。通过 Pandas,我们可以读取数据集、数据清洗、转换和整合,还可以进行高级数据操作,如数据筛选、排序和分组等。

然后是 Matplotlib 绘图。Matplotlib 是一个功能丰富的绘图库,可以用来创建各种类型的静态、动态和交互式图表。无论是线形图、柱状图、散点图还是饼图,Matplotlib 都能够满足我们的需求,并通过设置样式和标签来美化图表。

最后是 Scikit-Learn 机器学习。Scikit-Learn 是一个强大的机器学习库,提供了多种常用的机器学习算法和工具。通过 Scikit-Learn,我们可以进行数据预处理、特征工程、模型训练和评估等。它支持监督学习、无监督学习和半监督学习等多种学习任务。

总之,通过本文的学习,我们对 Python 数据分析有了更深入的理解。Numpy、Pandas、Matplotlib 和 Scikit-Learn 是我们必不可少的工具,可以帮助我们在数据分析和机器学习领域取得更好的成果。希望本文能够带给大家启发和帮助,让我们一起走进 Python 数据分析的精彩世界吧!


python精品专栏推荐

python基础知识(0基础入门)

【python基础知识】0.print()函数
【python基础知识】1.数据类型、数据应用、数据转换
【python基础知识】2.if条件判断与条件嵌套
【python基础知识】3.input()函数
【python基础知识】4.列表和字典
【python基础知识】5.for循环和while循环
【python基础知识】6.布尔值和四种语句(break、continue、pass、else)
【python基础知识】7.实操-用Python实现“文字PK”小游戏(一)
【python基础知识】7.实操-用Python实现“文字PK”小游戏(二)
【python基础知识】8.编程思维:如何解决问题-思维篇
【python基础知识】9.函数的定义和调用
【python基础知识】10.用函数编写程序 - 实操篇
【python基础知识】10.用Python实现石头剪刀布小游戏-函数实操篇
【python基础知识】11.如何debug -常见报错原因及排查思路 - 思维篇
【python基础知识】12.类与对象(一)
【python基础知识】12.类与对象(二)
【python基础知识】13.类与对象(三)
【python基础知识】13.类与对象(四)
【python基础知识】14.图书管理系统的搭建(类与对象实操)
【python基础知识】15.编码基础知识
【python基础知识】16.文件读写基础及操作
【python基础知识】16.“古诗默写题”的python实现(文件读写和编码-实操篇)
【python基础知识】17.模块的概念以及如何引入
【python基础知识】18.实操-使用python自动群发邮件
【python基础知识】19.产品思维以及流程图的使用 - 思维篇
【python基础知识】20.“午饭吃什么”的python实现(产品思维-实操篇)
【python基础知识】21.高效偷懒的正确打开方式-毕业篇
【python文件处理】CSV文件的读取、处理、写入
【python文件处理】Excel自动处理(使用 openpyxl)
【python文件处理】-excel格式处理


python爬虫知识

【python爬虫】1.爬虫基础知识
【python爬虫】2.网页基础知识
【python爬虫】3.爬虫初体验(BeautifulSoup解析)
【python爬虫】4.爬虫实操(菜品爬取)
【python爬虫】5.爬虫实操(歌词爬取)
【python爬虫】6.爬虫实操(带参数请求数据)
【python爬虫】7.爬到的数据存到哪里?
【python爬虫】8.温故而知新
【python爬虫】9.带着小饼干登录(cookies)
【python爬虫】10.指挥浏览器自动工作(selenium)
【python爬虫】11.让爬虫按时向你汇报
【python爬虫】12.建立你的爬虫大军
【python爬虫】13.吃什么不会胖(爬虫实操练习)
【python爬虫】14.Scrapy框架讲解
【python爬虫】15.Scrapy框架实战(热门职位爬取)
【python爬虫】16.爬虫知识点总结复习

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/85283.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Android12之仿Codec2.0实现传递编解码器组件本质(四十六)

简介: CSDN博客专家,专注Android/Linux系统,分享多mic语音方案、音视频、编解码等技术,与大家一起成长! 优质专栏:Audio工程师进阶系列【原创干货持续更新中……】🚀 人生格言: 人生从来没有捷径,只有行动才是治疗恐惧和懒惰的唯一良药. 更多原创,欢迎关注:Android…

多策略改进蜣螂优化--螺旋搜索+最优值引导+反向学习策略

声明:对于作者的原创代码,禁止转售倒卖,违者必究! 关于蜣螂算法的原理网上有很多,本文就不再详细介绍,本期算法是作者在参考了网上一些文献后自行改进的,接下来直接上改进策略: ①螺…

十六)Stable Diffusion教程:出图流程化

今天说一个流程化出图的案例,适用很多方面。 1、得到线稿,自己画或者图生图加线稿lora出线稿;如果想sd出图调整参数不那么频繁细致,则线稿的素描关系、层次、精深要表现出来,表现清楚。 2、文生图,seed随机…

前后端分离毕设项目之springboot同城上门喂遛宠物系统(内含文档+源码+教程)

博主介绍:✌全网粉丝10W,前互联网大厂软件研发、集结硕博英豪成立工作室。专注于计算机相关专业毕业设计项目实战6年之久,选择我们就是选择放心、选择安心毕业✌ 🍅由于篇幅限制,想要获取完整文章或者源码,或者代做&am…

Quartz 建表语句SQL文件

SQL文件在jar里面,github下载 https://github.com/quartz-scheduler/quartz/releases/tag/v2.3.2 解压,sql文件路径:quartz-core\src\main\resources\org\quartz\impl\jdbcjobstore tables_mysql_innodb.sql # # In your Quartz propertie…

七天学会C语言-第七天(结构体)

1.定义结构体 例 1&#xff1a;把一个学生的信息(包括学号、姓名、性别、住址等 4 项信息) 放在一个结构体变量中&#xff0c;然后输出这个学生的信息。 #include <stdio.h>struct Student {int student_id;char name[30];char gender;char address[60]; };int main() …

Flink的部署模式:Local模式、Standalone模式、Flink On Yarn模式

Flink常见的部署模式 Flink部署、执行模式Flink的部署模式Flink的执行模式 Local本地模式下载安装启动、停止Flink提交测试任务停止作业 Standalone独立模式会话模式单作业模式应用模式 YARN运行模式会话模式启动Hadoop集群申请一个YARN会话查看Yarn、Flink提交作业查看、测试作…

SQL模板-用户留存率计算

在这段实习中&#xff0c;我遇到了用户留存率计算的需求&#xff0c;这里做个总结。 首先来讲下&#xff0c;什么是用户留存&#xff1f; 在互联网行业中&#xff0c;用户在某段时间内开始使用应用&#xff0c;经过一段时间后&#xff0c;仍然继续使用该应用的用户。用户留存一…

代码随想录二刷day35

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 前言一、力扣860. 柠檬水找零二、力扣406. 根据身高重建队列三、力扣452. 用最少数量的箭引爆气球 前言 一、力扣860. 柠檬水找零 class Solution {public boolean…

5.docker可视化工具(Portainer)

本文操作&#xff0c;在 192.168.204.102 机器执行 安装最新版 portainer&#xff0c;请使用 portainer/portainer-ce 镜像。图片来源&#xff1a;https://hub.docker.com/r/portainer/portainer。   来这里可查看最新版本&#xff1a;https://github.com/portainer/p…

设计模式:适配器模式(C++实现)

适配器模式&#xff08;Adapter Pattern&#xff09;是一种结构设计模式&#xff0c;它允许将一个类的接口转换成客户端所期望的另一个接口。适配器模式通常用于连接两个不兼容的接口或类&#xff0c;使它们能够一起工作。 以下是一个简单的C适配器模式的示例&#xff1a; #in…

内网穿透,轻松实现PostgreSQL数据库公网远程连接!

文章目录 前言1. 安装postgreSQL2. 本地连接postgreSQL3. Windows 安装 cpolar4. 配置postgreSQL公网地址5. 公网postgreSQL访问6. 固定连接公网地址7. postgreSQL固定地址连接测试 前言 PostgreSQL是一个功能非常强大的关系型数据库管理系统&#xff08;RDBMS&#xff09;,下…

MongoDB的搭建 和crud操作

MongoDB docker 下载 docker run --restartalways -d --name mongo -v /docker/mongodb/data:/data/db -p 27017:27017 mongo:4.0.6使用navcat工具使用MongoDB Crud操作 jar包 <dependency><groupId>org.projectlombok</groupId><artifactId>lom…

数学经典例题

&#xff08; 1 &#xff09;求 x ( x 1 ) ( x 2 ) ( x 3 ) 的最小值 首先能想到的是&#xff0c;该函数在点 0 、 − 1 、 − 2 、 − 3 时函数值为 0 x ( x 1 ) ( x 2 ) ( x 3 ) 关于 x − 1.5 对称、以及函数在 ( − ∞ , ∞ ) 上的正负性 且容易知道函数图像是 W 形…

【面试经典150 | 双指针】三数之和

文章目录 写在前面Tag题目来源题目解读解题思路方法一&#xff1a;暴力枚举方法二&#xff1a;双指针 写在最后 写在前面 本专栏专注于分析与讲解【面试经典150】算法&#xff0c;两到三天更新一篇文章&#xff0c;欢迎催更…… 专栏内容以分析题目为主&#xff0c;并附带一些对…

系统架构常用的工具

HBase HBase是一个分布式的、面向列的开源数据库&#xff0c;该技术来源于 Fay Chang 所撰写的Google论文“Bigtable&#xff1a;一个结构化数据的分布式存储系统”。就像Bigtable利用了Google文件系统&#xff08;File System&#xff09;所提供的分布式数据存储一样&#xff…

Selenium自动化测试框架工作原理你明白了吗?

【软件测试面试突击班】如何逼自己一周刷完软件测试八股文教程&#xff0c;刷完面试就稳了&#xff0c;你也可以当高薪软件测试工程师&#xff08;自动化测试&#xff09; 一、Selenium是什么&#xff1f;   用官网的一句话来讲&#xff1a;Selenium automates browsers. Tha…

【Python Fastapi】js上传文件,fastapi处理,js显示回传信息

python from fastapi import FastAPI, File, UploadFile, HTTPException from fastapi.staticfiles import StaticFiles from fastapi.responses import HTMLResponse from typing import List import requestsapp FastAPI()# 配置静态文件目录 app.mount("/static"…

排序算法-----归并排序

目录 前言&#xff1a; 归并排序 1. 定义 2.算法过程讲解 2.1大致思路 2.2图解示例 拆分合成步骤 ​编辑 相关动态图 3.代码实现&#xff08;C语言&#xff09; 4.算法分析 4.1时间复杂度 4.2空间复杂度 4.3稳定性 前言&#xff1a; 今天我们就开始学习新的排序算法…

LLaMa

文章目录 Problems403 代码文件LLaMA: Open and Efficient Foundation Language Models方法预训练数据结构优化器一些加速的方法 结果Common Sense ReasoningClosed-book Question AnsweringReading ComprehensionMassive Multitask Language Understanding Instruction Finetu…