疾病预测和天气分析练习赛

肝了半天再加一个晚上。。
之前学了一小段时间的TensorFlow,但是今天练习赛时发现根本没啥用。。。第一阶段早就做完了,今天做的都是第二阶段,都是啥玩意题
在这里插入图片描述
又是偏度,又是求系数,又是拟合KNN,真的把人看吐了,基本上都是现学现用,查阅了半天资料,翻了无数遍csdn才有些头绪
结构化数据的题应该做出八道(做出八道才可以开启第三阶段)
其中有四个题是蒙出来的。。。因为这四个题基本上输出就是0或1,虽然有提交次数,但还是顽强的试出来了。。。
做出四个1,2,3,5
求偏度和boxcox1p变化都是有固定函数的,直接套用即可
偏度:skew()
第二题:计算体重的偏度

import scipy.stats as st
import pandas as pd
pd.options.display.max_columns = None
pd.options.display.max_rows = None
path1 = "/home/kesci/input/liver_df9751/结构化数据训练营.csv"    # chipotle.tsv
df = pd.read_csv(path1)
df.head(30)
aveTime = df['Weight\n体重'].median()
chipo['Weight\n体重'].nunique()
df2 = df.fillna(aveTime)
col = df2.iloc[:, 3]
arrs = col.values
##print(arrs)
w=st.skew(arrs) # 计算偏度
## 0.7565543738808015
print('%.4f'%w)

boxcox1p变换:boxcox1p()
用boxcox1p对体重做变换,lambda=0.1,变化后的数据的偏度是多少?

import scipy.stats as st
import pandas as pd
from scipy.special import boxcox1p
pd.options.display.max_columns = None
pd.options.display.max_rows = None
path1 = "/home/kesci/input/liver_df9751/结构化数据训练营.csv"    # chipotle.tsv
df = pd.read_csv(path1)aveTime = df['Weight\n体重'].median()
wt = df['Weight\n体重'].fillna(aveTime)lam=0.1
wt = boxcox1p(wt, lam)
w=st.skew(wt.values) # 计算偏度
## 0.7565543738808015
print('%.4f'%w)

第五题我真的要好好说说,真的绝了,线上题:
用上题同样的数据拟合KNN(K=5),分类结果和真实结果不一致的有多少个?
上题同样的数据指的是:只选取年龄、体重和 ALF(缺失值用中位数填充,不做任何额外处理)

我一遍一遍的翻资料,看了无数个KNN的文章,重要在一个文章找到KNN的用法,KNN也是有函数的KNeighborsClassifier(n_neighbors=5),里面的n_neighbors也就是题目中的K
我们得到了分类结果,但是并不够,真实结果是什么?我们一直没想明白,因为我们把所有数据都作为训练集来训练KNN,就是KNN的生成是需要数据的,然后还需要数据来测试,但是题目只给了一套数据,后来我在想会不会是自身生成的KNN来检测自身?也就是用训练集生成的分类结果来检验自身的分类结果
于是我和同学输出了分类结果和原数据自身的结果,发现不相等,差值即为答案

import scipy.stats as st
import pandas as pd
import regex as re
pd.options.display.max_columns = None
pd.options.display.max_rows = None
path1 = "/home/kesci/input/liver_df9751/结构化数据训练营.csv"    # chipotle.tsv
# path2="/home/kesci/inputver_df9751/结构化数据训练营测试集.csv"
data = pd.read_csv(path1)
# data_test=pd.read_csv(path1)
col_names=list(data.columns)
col=[]
for i in range(len(col_names)):if re.findall(r"\u2028(.+)",col_names[i])!=[]:col.append(re.findall(r"\u2028(.+)",col_names[i])[0])elif re.findall(r"\n(.+)",col_names[i])!=[]:col.append(re.findall(r"\n(.+)",col_names[i])[0])else:col.append(col_names[i])
## 修改dataframe列名
data.columns=col
feature1 = ['体重','年龄','ALF']
for i in feature1:ave=data[i].median()data[i] = data[i].fillna(ave)print(data[i].values)
a_zi=[]
for i in range(len(data)):c=[data['体重'][i],data['年龄'][i]]a_zi.append(c)from sklearn.neighbors import KNeighborsClassifierneigh = KNeighborsClassifier(n_neighbors=5)
neigh.fit(a_zi, data['ALF'])
cnt=0
for i in range(len(a_zi)):if(neigh.predict([a_zi[i]])==data['ALF'][i]):cnt+=1
print(len(a_zi),cnt,len(a_zi)-cnt)

真的是绝了绝了。。。
明天继续肝

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/319326.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

微软智能云三驾马车Azure、Office 365、Dynamics 365齐聚中国

Dynamics 365计划于2019年春落地中国;Windows Server 2019、Office 2019正式商用;SQL Server 2019、Azure Sphere 公开预览;Microsoft Azure 更新数十项云服务与功能,聚焦物联网与边缘。2018年10月25日,上海 —— 2018…

ASP.NET Core SignalR中的流式传输

什么是流式传输?流式传输是这一种以稳定持续流的形式传输数据的技术。流式传输的使用场景有些场景中,服务器返回的数据量较大,等待时间较长,客户端不得不等待服务器返回所有数据后,再进行相应的操作。这时候使用流式传…

独立版Jexus配置SSL,支持https访问

一、申请证书【腾讯免费证书】二、验证DNS,即解析域名。记录类型选择 TXT ,主机记录与证书上的主机记录保持一致,记录值也与证书上的记录值保持一致三、等待DNS验证与CA轮询,轮询成功后即可下载证书四、Jexus用到的是Nginx中的证书…

莫比乌斯反演+例题

参考1 参考2 参考3 问题引入&#xff1a; 入门题 给定N和M和D&#xff0c;求满足1<x<N,1<y<M且gcd(x,y)D的点对(x,y)的个数 1<N,M<1000000 莫比乌斯函数 μ μ(n) 1 , n1 μ(n) (-1)k, np1 * p2 * … * Pk &#xff08;x有奇数个质因子时为-1&#xff…

.net core通过多路复用实现单服务百万级别RPS吞吐

多路复用其实并不是什么新技术&#xff0c;它的作用是在一个通讯连接的基础上可以同时进行多个请求响应处理。对于网络通讯来其实不存在这一说法&#xff0c;因为网络层面只负责数据传输&#xff1b;由于上层应用协议的制订问题&#xff0c;导致了很多传统服务并不能支持多路复…

微软官宣:史上最贵开发工具 75亿美金收购GitHub

微软副总裁红衣主教Scott Gu今天的一封邮件结束了这笔软件历史上最大收购案&#xff0c;微软给全球开发人员的开源代码仓库GitHub投入了75亿美金&#xff0c;确保这一平台的持续健康发展。GitHub为啥愿意被收购&#xff1f;“软件工程这个事情&#xff0c;从来就不是一笔好生意…

C# 中使用面向切面编程(AOP)中实践代码整洁

1. 前言最近在看《架构整洁之道》一书&#xff0c;书中反复提到了面向对象编程的 SOLID 原则&#xff08;在作者的前一本书《代码整洁之道》也是被大力阐释&#xff09;&#xff0c;而面向切面编程&#xff08;Aop&#xff09;作为面向对象编程的有力补充&#xff0c;对实践整洁…

微软对开发者献真爱,全面支持开源,加速研发云升级

全球首秀&#xff1a;支持 Java 和 Python 的 Visual Studio Live Share 协作服务与 IntelliCode 人工智能辅助编程&#xff0c;适用于物联网和智能边缘的自动机器学习能力&#xff08;Auto ML&#xff09;&#xff1b;Visual Studio App Center 提供一站式跨平台移动应用开发体…

Ocelot简易教程(七)之配置文件数据库存储插件源码解析

上篇文章Ocelot简易教程&#xff08;六&#xff09;之重写配置文件存储方式并优化响应数据 给大家分享了如何集成我写的一个Ocelot扩展插件把Ocelot的配置存储到数据库中。并没有对实现原理进行相应的阐述。今天抽空把实现的原理给大家说道说道。明白原理后&#xff0c;大家就可…

ASP.NET Core 2调用Azure云上的PowerBI报表展示

在开发企业应用中&#xff0c;报表功能是当之无愧的重头戏&#xff0c;如何将数据通过合适的报表呈现出来成为每个项目人员必需面临的问题。而找到一款合适的报表往往都需要考率价格、开发、风格、支撑等因素。那么&#xff0c;我在这里给大家介绍一款由微软提供的可视化报表工…

聊聊如何设计千万级吞吐量的.Net Core网络通信!

作者&#xff1a;大石头时间&#xff1a;2018-10-26 晚上 20:00地点&#xff1a;QQ群-1600800内容&#xff1a;网络通信&#xff0c;网络库使用方式网络库设计理念&#xff0c;高性能要点介绍首先看下面这张很具有代表性的图&#xff0c;2018年5月份做的测试。当时单服务器得到…

MonkeyFest2018 微软最有价值专家讲座

MonkeyFest2018微软最有价值专家讲座Monkey Fest 是一个一年一度由全球Microsoft Xamarin跨平台开发者发起的全球性社区活动&#xff0c;主要是推广在云、人工智能、大数据、移动开发等技术。本次活动同时在新加坡&#xff0c;美国&#xff0c;日本&#xff0c;加拿大&#xff…

2020牛客国庆集训派对day2 MATRIX MULTIPLICATION CALCULATOR

MATRIX MULTIPLICATION CALCULATOR 题意&#xff1a; 求两矩阵相乘 题解&#xff1a; 应该都学过把。。。矩阵相乘 矩阵相乘的前提是两个矩阵的列等于另一个矩阵的行 也就是cij∑aik*bkj 原理很简单注意格式&#xff0c;但是我遇到一个玄学问题。。。 就是卡格式了。。我人…

P3911 最小公倍数之和

最小公倍数之和 题目描述&#xff1a; 对于A1&#xff0c;A2…AN&#xff0c;求 ∑i1N∑i1Nlcm(Ai,Aj)\sum_{i1}^{N}\sum_{i1}^{N} lcm(Ai,Aj)∑i1N​∑i1N​lcm(Ai,Aj) 题解&#xff1a; 莫比乌斯反演&#xff0c;直接强推一波 推导过程我也是一知半解&#xff0c;大体如图…

终于明白了 C# 中 Task.Yield 的用途

最近在阅读 .NET Threadpool starvation, and how queuing makes it worse 这篇博文时发现文中代码中的一种 Task 用法之前从未见过&#xff0c;在网上看了一些资料后也是云里雾里不知其解&#xff0c;很是困扰。今天在程序员节的大好日子里终于想通了&#xff0c;于是写下这篇…

2018-2019 ACM-ICPC, Asia Seoul Regional Contest——A - Circuits

A - Circuits 不难发现x坐标根本没用&#xff0c;只需要存储y坐标。 题目所求的两条直线y1ay_1ay1​a&#xff0c;y2b(a<b)y_2b\ (a<b)y2​b (a<b) 我们枚举y2by_2by2​b这条线&#xff0c;这条线一定可以是矩形的边界&#xff0c;于是我们扫描矩形边界差分计算当前…

aspnet core 2.1中使用jwt从原理到精通一

原理jwt对所有语言都是通用的&#xff0c;只要知道秘钥&#xff0c;另一一种语言有可以对jwt的有效性进行判断;jwt的组成&#xff1b;Header部分Base64转化.Payload部分Base64转化.使用HS256方式根据秘钥对前面两部分进行加密后再Base64转化&#xff0c;其中使用的hs256加密是h…

2020牛客国庆集训派对day3 Points

Points 题目描述 Jack and Rose are playing games after working out so many difficult problems. They together drew a “Haizi” tree to show their collaboration. “Haizi” tree is the same as the tree defined in graph theory. Now Jack would like to count t…

.NET Core微服务之路:利用DotNetty实现一个简单的通信过程

上一篇我们已经全面的介绍过《基于gRPC服务发现与服务治理的方案》&#xff0c;我们先复习一下RPC的调用过程&#xff08;笔者会在这一节的几篇文章中反复的强调这个过程调用方案&#xff09;&#xff0c;看下图根据上面图&#xff0c;服务化原理可以分为3步&#xff1a;服务端…

[译]ASP.NET Core中使用MediatR实现命令和中介者模式

在本文中&#xff0c;我将解释命令模式&#xff0c;以及如何利用基于命令模式的第三方库来实现它们&#xff0c;以及如何在ASP.NET Core中使用它来解决我们的问题并使代码简洁。因此&#xff0c;我们将通过下面的主题来进行相关的讲解。什么是命令模式?命令模式的简单实例以及…