kaggle入门项目:Titanic存亡预测(三)数据可视化与统计分析

---恢复内容开始---

原kaggle比赛地址:https://www.kaggle.com/c/titanic

原kernel地址:A Data Science Framework: To Achieve 99% Accuracy

Step 4: Perform Exploratory Analysis with Statistics

使用描述性与图表分析数据,重点在于数据可视化,突出数据类别与不同feature的关联性

简单的groupby()获得不同feature对于生存率的影响

箱型图与柱状图绘制。

箱型图:plt.boxplot(),清晰表示数据的集中程度、离群点、中位数的位置。

柱状图plt.hist(),表示每个feature的不同值/分类的Survived数量。

seaborn 的barplot展示的是某feature的平均值,是数值变量的集中趋势

pointplot():数值变量的中心趋势估计,并使用误差线提供关于该估计的不确定性的一些指示。

violinplot():小提琴图显示数据分布及其概率密度。

因为性别因素对是否生还造成很大影响,因此我们将性别和其他feature联合绘图比较,看看是否有什么新发现:

然后是其他feature的比较图:

 不同船舱等级和性别对生还率的影响:

不同年龄的连续生还曲线:

直方图比较性别、年龄、船舱等级:

微妙的看出低等仓与中等舱的男性大批死亡。头等舱的女性几乎全部生还。

pairplot()多变量图将所有的feature交叉绘图,隐含feature之间的关联性。

heatmap()热力图,反应feature之间的关联度:

 

转载于:https://www.cnblogs.com/fancyUtech/p/9003336.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/280382.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

docker遇到问题归纳

/bin/sh^M: bad interpreter #在win下编辑的时候,换行结尾是\n\r , 而在linux下 是\n,所以才会有 多出来的\r #可以用以下方式解决先在控制台cd到报错的目录#编辑报错的那个文件 vi xxx.sh#利用如下命令查看文件格式 :set ff 或 :set filef…

firefox 扩展_如何检查您的扩展程序是否将停止与Firefox 57一起使用

firefox 扩展With Firefox 57, scheduled for release in November 14, 2017, Mozilla will end support for legacy extensions, and only support newer WebExtensions. Here’s how to check if your extensions will stop working—and how to keep using them after Novem…

边缘服务网格 osm-edge

本文篇幅稍长,阅读本文将了解以下内容:•什么是 osm-edge 及其产生背景•边缘计算与中心云计算的差异,以及带来的挑战•osm-edge 的设计及采用的技术•5 分钟快速体验边缘服务网格关于 osm-edgeosm-edge 是针对边缘计算环境设计的服务网格&am…

powershell获取exe文件返回值

一、目的 1.powershell能简单写一些小脚本,不需要exe开发这么笨重。 2.在windows实现某个特定功能,做成一个exe能方便查看管理。 二、实现 1.C# code 运行结束加入返回值 Environment.ExitCode 1; //自定义数字 2.powershell 调用并获取 需要增加…

活水亭观书有感其一_如何将iPad置于“信息亭”模式,将其限制为单个应用程序...

活水亭观书有感其一An iPad makes a great “kiosk” device–a tablet restricted to one specific app for your home or small business. You can create a makeshift kiosk using the Guided Access feature, or enable Single App Mode for a true kiosk environment. iPa…

powershell 特殊符号处理

显示字符串有双引号 “ 两个双引号产生一个双引号,这里不包括最外层的双引号。 $a"PowerShell" """My name is $a"",this program said." 使用转义字符 转义序列由反引号定义,也就是键盘F1下面与波浪线同键…

IDEA 学习笔记之 安装和基本配置

安装和基本配置: 下载:https://www.jetbrains.com/idea/download/#sectionwindows 下载Zip安装包: 基础知识: Eclipse的工作区IDEA的项目 Eclipse的项目IDEA的模块 修改信息提示:Alt/ 关闭当前窗口:CtrlW 自…

大厂高级前端面试题答案

阿里 使用过的koa2中间件https://www.jianshu.com/p/c1e... koa-body原理https://blog.csdn.net/sinat_1... 有没有涉及到Clusterhttp://nodejs.cn/api/cluster.... 介绍pm2PM2是node进程管理工具,可以利用它来简化很多node应用管理的繁琐任务,如性能监控…

js app缓存自动刷新_如何通过清除缓存来刷新App Store中的内容

js app缓存自动刷新Are you finding that you’re not seeing new apps on the App Store, or that updates to apps won’t go away even after you’ve installed the updates? Here’s a simple fix. 您是否发现自己在App Store上没有看到新的应用程序,或者即使…

用最少的代码,写一个智能会议APP(MAUI)

Xamarin和MAUI移动开发是.NET核心方向之一,国外社区资源非常丰富,影响力挺大的。而国内则资源很是欠缺,GitHub上的国产开源案例太少了。随着小米/美的/碧桂园等WPF招聘大户开始要求移动开发,不少群友都在找相关资源。这里分享一套…

word多级列表修改编号_如何更改在Word中的编号列表中使用的数字类型

word多级列表修改编号By default, Word uses Arabic numbers (1, 2, 3, etc.) when you create numbered lists. However, you can change the numbers to a different type or to letters. The character after the number or letter can also be changed. 默认情况下&#xf…

微服务学习笔记

微服务是一种架构模式或者说是一种架构风格,他提倡将单一的应用程序划分为一组小的服务,每个服务运行在其独立的进程中,服务之间互相协调,互相配合,为用户提供最终价值。dubbo与spring Cloud之间的区别之一是dubbo基于…

每小时50哈希——看看一个内部员工是如何摧毁整个公司网络的?

本文讲的是每小时50哈希——看看一个内部员工是如何摧毁整个公司网络的?,我们以前曾调查过黑客会通过连接在USB端口的正在充电的手机实施攻击,在这项研究中,我们重新审视了USB端口的安全性。我们发现,手机充电时&#…

推荐一款 在线+离线数据 同步框架 Dotmim.Sync

移动智能应用可以分为在线模式、纯离线模式与“在线离线”混合模式。在线模式下系统数据一般存储在服务器端的大中型数据库(如 SQL Server、Oracle、MySQL 等),移动应用依赖于稳定可靠的网络连接;纯离线模式下系统数据一般存储在移…

如何在Windows 10中将您喜欢的设置固定到开始菜单

If you find you’re accessing the same settings over and over in Windows 10, you can add these settings to the Start menu as tiles for quick and easy access. We’ll show you how to do this. 如果发现要在Windows 10中反复访问相同的设置,则可以将这些…

20155202《网络对抗》Exp9 web安全基础实践

20155202《网络对抗》Exp9 web安全基础实践 实验前回答问题 (1)SQL注入攻击原理,如何防御 SQL注入产生的原因,和栈溢出、XSS等很多其他的攻击方法类似,就是未经检查或者未经充分检查的用户输入数据,意外变成…

MVC Html.AntiForgeryToken() 防止CSRF***

MVC中的Html.AntiForgeryToken()是用来防止跨站请求伪造(CSRF:Cross-site request forgery)***的一个措施,它跟XSS(XSS又叫CSS:Cross-Site-Script),***不同,XSS一般是利用站内信任的用户在网站内插入恶意的脚本代码进行***,而CSRF则是伪造成受信任用户对网站进行***…

如何反序列化派生类

前言上回,我们讲解了《如何序列化派生类》。那如何反序列化派生类呢?假设有一个 Person 抽象基类,其中包含 Student 和 Teacher 派生类:public class Person {public string Name { get; set; } }public class Student : Person {…

目标跟踪 facebook_如何关闭Facebook Messenger的位置跟踪(如果已启用)

目标跟踪 facebookIt seems like everyone is tracking our location now. Not surprisingly, Facebook Messenger can also transmit a significant amount of information on your location activity. If you use Messenger, here’s how to make sure it’s not reporting y…

云计算基础知识:CPU虚拟化

虚拟化技术的分类主要有服务器虚拟化、存储虚拟化、网络虚拟化、应用虚拟化。服务器虚拟化技术按照虚拟对象来分,可分为:CPU虚拟化、内存虚拟化、I/O虚拟化;按照虚拟化程度可分为:全虚拟化、半虚拟化、硬件辅助虚拟化。将不同的虚拟化对象和程…