python数据分析与可视化一

公共部分

```

# 引入数据分析工具 Pandas

import pandas as pd

# 引入数据可视化工具 Matplotlib

import matplotlib.pyplot as plt

# 引入数据可视化工具 Seaborn (基于matplotlib)

import seaborn as sns

# 解决输出时的列名对齐问题

pd.set_option('display.unicode.east_asian_width', True)

# 解决输出中文乱码问题

plt.rcParams['font.sans-serif'] = ['SimHei']  # 设置显示中文字体

plt.rcParams['axes.unicode_minus'] = False  # 设置正常显示符号


 

# 读取CSV文件

data = pd.read_csv('E:\\practiceCode\\pythonCode\\source\\DataAnalyst.csv',encoding='gbk')

# 显示前5行数据

# print(df.head())

# 清洗薪水数据

data['薪水'] = data['薪水'].str.replace('k','000') # k替换为000

data['薪水'] = data['薪水'].str.replace('以上','') # 去除以上

data['薪水'] = data['薪水'].str.split('-') # 根据'-'分割字符串 [1000,2000]

# 定义 计算平均薪水函数

def calculate_salary(x):

    try:

        if len(x) > 1:

         return (int(x[0]) + int(x[1])) / 2

        else:

            return int(x[0])

    except:

        return None

# 应用函数到薪水列   计算平均薪水

data['薪水'] = data['薪水'].apply(calculate_salary)

```

柱状图

```

# 1. 数据分析师平均薪水

avg_salary = data[data['职位名称'] == '数据分析师']['薪水'].mean()

print('数据分析师平均薪水:',avg_salary)

# 2. 数据分析师不同城市薪资状态 (条形图)

plt.figure(figsize=(10,6)) # 设置画布大小

plt.title("数据分析师薪资分布(按城市)") # 设置标题

sns.barplot(x='城市',y='薪水',data=data[data['职位名称'] == '数据分析师'])

plt.show() # 展示

# 3. 数据分析师不同学历的薪资状态

plt.figure(figsize=(10,6)) # 设置画布大小

plt.title("数据分析师薪资分布(按学历)") # 设置标题

sns.barplot(x='教育要求',y='薪水',data=data[data['职位名称'] == '数据分析师'])

plt.show() # 展示

```

条形图

```

# 计算不同公司数据分析师的数量 并生成柱状图

company_count = data[data['职位名称'] == '数据分析师']['公司简称'].value_counts()

# 取前10个元素

company_count = company_count[:10]

# 绘制柱状图

plt.figure(figsize=(10,6))

sns.barplot(x=company_count.index, y=company_count.values)

plt.title('不同公司数据分析师数量(10)')

plt.xlabel('公司')

plt.ylabel('数量')  

plt.show()

```


```

# 不同学历的数据分析师 数量

degree_count = data[data['职位名称'] == '数据分析师']['教育要求'].value_counts()

#生成柱状图

plt.figure(figsize=(10,6))

sns.barplot(x=degree_count.index, y=degree_count.values)

plt.title('不同学历的数据分析师数量')

plt.xlabel('学历要求')

plt.ylabel('数量')

plt.show()

```

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/37018.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Python多线程编程详解

Python多线程编程详解 大家好,我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编,也是冬天不穿秋裤,天冷也要风度的程序猿! 多线程编程是利用计算机多核心和多线程处理器的优势,提高程序并发性能的重要…

如何申请免费SSL证书以消除访问网站显示连接不安全提醒

在当今互联网时代,网络安全已成为一个不可忽视的问题。当用户浏览一些网站时,有时会看到浏览器地址栏出现“不安全”的提示,这意味着该网站没有安装SSL证书,数据传输可能存在风险。那么,如何消除这种不安全提醒&#x…

2024年6月,Altair被Gartner魔力象限评为数据科学与机器学习平台领导者

Altair 因其愿景完整性和执行能力被评为领导者 2024 年 6 月 20 日,Altair(纳斯达克股票代码:ALTR)宣布,Altair RapidMiner 被 Gartner Magic Quadrant™(魔力象限)评为数据科学与机器学习平台领…

SpringBoot配置参数获取

1、使用Value注解 import org.springframework.beans.factory.annotation.Value; import org.springframework.stereotype.Component;Component public class MyBean {Value("${myapp.name}") private String appName;public void printAppName() {System.out.print…

幂等生产者和事务生产者

Kafka消息交付 Kafka消息交付可靠性保障以及精确处理一次语义的实现。 所谓的消息交付可靠性保障,是指Kafka对Producer和Consumer要处理的消息提供什么样的承诺。常见的承诺有以下三种: 最多一次(atmost once):消息…

SpringBoot:SpringBoot 调用第三方接口的几种方式

一、前言 在项目中调用第三方接口时,确实需要根据项目的技术栈、架构规范以及具体的业务需求来选择最适合的调用方式。比如:RESTful API调用、Feign声明式HTTP客户端、Apache HttpClient等调用方式,每种方式都有其适用场景和优势。下面我们就…

仓库管理系统16--入库管理

原创不易&#xff0c;打字不易&#xff0c;截图不易&#xff0c;多多点赞&#xff0c;送人玫瑰&#xff0c;留有余香&#xff0c;财务自由明日实现。 1、创建物资入库用户控件 <UserControl x:Class"West.StoreMgr.View.InStoreView"xmlns"http://schema…

CAS自旋解析

CAS全称CompareAndSwap(比较并交换)&#xff0c;是cpu的指令&#xff0c;调用时不涉及上下文的切换。Java中属于乐观锁的一种&#xff0c;具体流程如下图&#xff1a; 具体的实现使用的是Unsafe类去调用native修饰的compareAndSwap方法&#xff0c;4个字段分别是对象实例&#…

PTA—C语言期末复习(判断题)

1. C语言程序是从源文件的第一条语句开始执行的 &#xff08;F&#xff09; 在 C 语言中&#xff0c;程序是从 main 函数开始执行的&#xff0c;而不是从源文件的第一条语句开始执行 2. 若变量定义为double x;&#xff0c;则x % 2是符合C语言语法的表达式 &#xff08;F&#…

通过nginx去除 api url前缀 并保持后面剩余的url不变向后台请求

如 我前台浏览器向后台请求的接口是 http://127.0.0.1:5099/api/sample/sample/getbuttonlist 实际的请求接口传向 http://192.168.3.71:5099/sample/sample/getbuttonlist 方法是向config中加入下面这样一个server server {listen 5099;location /api/ {rewrite ^/a…

HTML流星雨

目录 写在前面 完整代码 代码分析 系列文章 写在最后 写在前面 岁月如梭&#xff0c;光阴似箭&#xff0c;不知不觉暑假就要来喽&#xff0c;本期小编用HTML给大家手搓了一个炫酷的流星雨动画&#xff0c;一起来看看吧。 完整代码 <!DOCTYPE html> <html lang…

项目风险管理系统有哪些?分享11款主流项目管理系统

本文将分享11款主流项目管理系统&#xff1a;PingCode、Worktile、StandardFusion、MasterControl、ClickUp、SAI360、Netwrix Auditor、MetricStream、Wrike、Celoxis、Zoho Projects。 在项目管理中&#xff0c;风险管理不仅是一个挑战&#xff0c;也是保证项目顺利进行的关键…

探索Vim的文本处理能力:精通查找与替换

探索Vim的文本处理能力&#xff1a;精通查找与替换 Vim&#xff0c;作为Linux终端下的王牌文本编辑器&#xff0c;以其强大的功能和灵活性深受开发者和系统管理员的喜爱。在Vim中进行查找和替换是文本编辑中的一项基础且重要的操作。本文将详细解释如何在Vim中执行查找和替换文…

Linux Redis 服务设置开机自启动

文章目录 前言一、准备工作二、操作步骤2.1 修改redis.conf文件2.2 创建启动脚本2.3 设置redis 脚本权限2.4 设置开机启动2.5 验证 总结 前言 请各大网友尊重本人原创知识分享&#xff0c;谨记本人博客&#xff1a;南国以南i、 提示&#xff1a;以下是本篇文章正文内容&#x…

编程的难点在哪?是逻辑、算法,还是模块、框架的掌握?

&#x1f446;点击关注 回复『新人礼』获取学习礼包&#x1f446; 很多新手程序员在一开始都是满怀热情地投入到编程的学习&#xff0c;但却在学习过程中处处碰壁&#xff0c;导致放弃。 编程的难点在于逻辑、数学、算法&#xff0c;还是模块、框架、接口的掌握&#xff1f;但…

idea Error running ‘Application‘

1、Error running ‘Application’ Error running ApplicationError running Application. Command line is too long.Shorten the command line via JAR manifest or via a classpath file and rerun.找到 .idea/libraies/workspace.xml 中的 PropertiesComponent 属性&#…

Android InputDispatcher分发输入事件

派发循环是指 InputDispatcher 不断地派发队列取出事件&#xff0c;寻找合适的窗口并进行发送的过程&#xff0c;是 InputDispatcher 线程的主要工作 事件发送循环是 InputDispatcher 通过 Connection 对象将事件发送给窗口&#xff0c;并接受其反馈的过程 InputDispatcher —…

Spring Boot跨域请求关键处理技术解析

Spring Boot跨域请求关键处理技术解析 在Web开发中&#xff0c;跨域请求是一个常见问题&#xff0c;尤其在微服务架构和前后端分离的开发模式中更为突出。Spring Boot作为一种流行的Java Web框架&#xff0c;提供了多种解决跨域请求的方法。本文将详细解析Spring Boot中跨域请…

在 Qt 中设置 QMainWindow 的大小

问题描述 一位 Qt 新手提问&#xff0c;是否有办法将 QMainWindow 的大小设置为用户桌面大小的 70%。他尝试过使用伸缩因子&#xff0c;但未成功。QWidget::setFixedSize 可以工作&#xff0c;但只能使用像素值。 解决方案 方案一&#xff1a;使用 QDesktopWidget 在 QMain…

大模型赋能全链路可观测性:运维效能的革新之旅

目录 全链路可观测工程与大模型结合---提升运维效能 可观测性&#xff08;Observability&#xff09;在IT系统中的应用及其重要性 统一建设可观测数据 统一建设可观测数据的策略与流程 全链路的构成和监控形态 云上的全链路可视方案 为什么一定是Copilot 大模型的Copilo…