疾病预测和天气分析练习赛

肝了半天再加一个晚上。。
之前学了一小段时间的TensorFlow,但是今天练习赛时发现根本没啥用。。。第一阶段早就做完了,今天做的都是第二阶段,都是啥玩意题
在这里插入图片描述
又是偏度,又是求系数,又是拟合KNN,真的把人看吐了,基本上都是现学现用,查阅了半天资料,翻了无数遍csdn才有些头绪
结构化数据的题应该做出八道(做出八道才可以开启第三阶段)
其中有四个题是蒙出来的。。。因为这四个题基本上输出就是0或1,虽然有提交次数,但还是顽强的试出来了。。。
做出四个1,2,3,5
求偏度和boxcox1p变化都是有固定函数的,直接套用即可
偏度:skew()
第二题:计算体重的偏度

import scipy.stats as st
import pandas as pd
pd.options.display.max_columns = None
pd.options.display.max_rows = None
path1 = "/home/kesci/input/liver_df9751/结构化数据训练营.csv"    # chipotle.tsv
df = pd.read_csv(path1)
df.head(30)
aveTime = df['Weight\n体重'].median()
chipo['Weight\n体重'].nunique()
df2 = df.fillna(aveTime)
col = df2.iloc[:, 3]
arrs = col.values
##print(arrs)
w=st.skew(arrs) # 计算偏度
## 0.7565543738808015
print('%.4f'%w)

boxcox1p变换:boxcox1p()
用boxcox1p对体重做变换,lambda=0.1,变化后的数据的偏度是多少?

import scipy.stats as st
import pandas as pd
from scipy.special import boxcox1p
pd.options.display.max_columns = None
pd.options.display.max_rows = None
path1 = "/home/kesci/input/liver_df9751/结构化数据训练营.csv"    # chipotle.tsv
df = pd.read_csv(path1)aveTime = df['Weight\n体重'].median()
wt = df['Weight\n体重'].fillna(aveTime)lam=0.1
wt = boxcox1p(wt, lam)
w=st.skew(wt.values) # 计算偏度
## 0.7565543738808015
print('%.4f'%w)

第五题我真的要好好说说,真的绝了,线上题:
用上题同样的数据拟合KNN(K=5),分类结果和真实结果不一致的有多少个?
上题同样的数据指的是:只选取年龄、体重和 ALF(缺失值用中位数填充,不做任何额外处理)

我一遍一遍的翻资料,看了无数个KNN的文章,重要在一个文章找到KNN的用法,KNN也是有函数的KNeighborsClassifier(n_neighbors=5),里面的n_neighbors也就是题目中的K
我们得到了分类结果,但是并不够,真实结果是什么?我们一直没想明白,因为我们把所有数据都作为训练集来训练KNN,就是KNN的生成是需要数据的,然后还需要数据来测试,但是题目只给了一套数据,后来我在想会不会是自身生成的KNN来检测自身?也就是用训练集生成的分类结果来检验自身的分类结果
于是我和同学输出了分类结果和原数据自身的结果,发现不相等,差值即为答案

import scipy.stats as st
import pandas as pd
import regex as re
pd.options.display.max_columns = None
pd.options.display.max_rows = None
path1 = "/home/kesci/input/liver_df9751/结构化数据训练营.csv"    # chipotle.tsv
# path2="/home/kesci/inputver_df9751/结构化数据训练营测试集.csv"
data = pd.read_csv(path1)
# data_test=pd.read_csv(path1)
col_names=list(data.columns)
col=[]
for i in range(len(col_names)):if re.findall(r"\u2028(.+)",col_names[i])!=[]:col.append(re.findall(r"\u2028(.+)",col_names[i])[0])elif re.findall(r"\n(.+)",col_names[i])!=[]:col.append(re.findall(r"\n(.+)",col_names[i])[0])else:col.append(col_names[i])
## 修改dataframe列名
data.columns=col
feature1 = ['体重','年龄','ALF']
for i in feature1:ave=data[i].median()data[i] = data[i].fillna(ave)print(data[i].values)
a_zi=[]
for i in range(len(data)):c=[data['体重'][i],data['年龄'][i]]a_zi.append(c)from sklearn.neighbors import KNeighborsClassifierneigh = KNeighborsClassifier(n_neighbors=5)
neigh.fit(a_zi, data['ALF'])
cnt=0
for i in range(len(a_zi)):if(neigh.predict([a_zi[i]])==data['ALF'][i]):cnt+=1
print(len(a_zi),cnt,len(a_zi)-cnt)

真的是绝了绝了。。。
明天继续肝

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/319326.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Korney Korneevich and XOR(CF750F1/F2)

正题 CF750F1 CF750F2 题目大意 给你一个数列,问有多少个数可以由一个单调递增的子序列异或得到 解题思路 对于F1,可以用p存下得到一个数的最小值(即当前子序列前缀的最后一个数),然后直接暴力转移 对于F2&#xf…

《信号与系统》期中总结

某高校的某专业于2020/11/8日进行《信号与系统》期中考试,而某同学这次考试直接爆炸,原因某同学也差不多知道:对待这门学科浅尝辄止,只达到了看着答案(看答案看书)能够把作业做出来的程度。虽然已经爆炸了&…

YbtOJ#943-平方约数【莫比乌斯反演,平衡规划】

正题 题目链接:http://www.ybtoj.com.cn/contest/122/problem/3 题目大意 S(i)S(i)S(i)表示iii的约数个数,QQQ次询问给出n,mn,mn,m求 ∑a1n∑b1mS(a2)S(b2)S(ab)\sum_{a1}^n\sum_{b1}^mS(a^2)\times S(b^2)\times S(a\times b)a1∑n​b1∑m​S(a2)S(b2)S(ab) 1≤Q≤…

微软智能云三驾马车Azure、Office 365、Dynamics 365齐聚中国

Dynamics 365计划于2019年春落地中国;Windows Server 2019、Office 2019正式商用;SQL Server 2019、Azure Sphere 公开预览;Microsoft Azure 更新数十项云服务与功能,聚焦物联网与边缘。2018年10月25日,上海 —— 2018…

H - Holy Grail

H - Holy Grail 题意: 题干又臭又长 我简单说说 n个点,m条有向边,边权为负,然后给你六组起始点(s点和t点),你要在s和t之间建一个有向边,要使得权值最小,问这六组边依次…

【LCT】魔法森林(P2387)

正题 P2387 题目大意 给你一个图,每条边有两个全职a,b,现在让你找一条从1到n的路径使得max(a)max(b)最小 解题思路 对a进行排序,枚举a的最大值,然后取b最小的边,找1到n的最短路径 找最短路径可以用LCT求&#xff0…

ASP.NET Core SignalR中的流式传输

什么是流式传输?流式传输是这一种以稳定持续流的形式传输数据的技术。流式传输的使用场景有些场景中,服务器返回的数据量较大,等待时间较长,客户端不得不等待服务器返回所有数据后,再进行相应的操作。这时候使用流式传…

codeforces1435 D. Shurikens

D. Shurikens 自己感觉差不多写了个模拟过了59组数据。 明显这题可能和栈扯上关系,因为很想括号匹配求卡特兰数的形式 看了大佬博客后发现真的和栈有关于是学习了一波。 #define IO ios::sync_with_stdio(false);cin.tie();cout.tie(0) #pragma GCC optimize(2) …

YbtOJ#662-交通运输【线段树合并,树状数组】

正题 题目链接:http://www.ybtoj.com.cn/contest/122/problem/2 题目大意 给出nnn个点的一棵有根树,对于每个xxx求,删除点xxx后修改某个点的父节点(修改前该点必须有父节点)后最小化最大联通块大小。 解题思路 删掉一个点后肯定…

EOJ Monthly 2020.9 Sponsored by TuSimple E. 加密的情书

E加密的情书 本人太菜,只会签到 题意: 一个多位数可以通过加密变成个位数,加密方式为:各个位数上的数相加,直到加成个位数 例如: 123 --》 1236 现在给出加密后的一串密文 问是否存在连续的自然数数列 l …

【线段树】Frog Traveler(CF751D)

正题 CF751D 题目大意 现在有n个点,当你在i时,可以向前跳 0∼ai0\sim a_i0∼ai​ 步,跳到j,然后向后走bjb_jbj​步,现在让你从n开始跳,回答跳到0的最少步数 解题思路 设fif_ifi​为跳到i的最少步数&…

独立版Jexus配置SSL,支持https访问

一、申请证书【腾讯免费证书】二、验证DNS,即解析域名。记录类型选择 TXT ,主机记录与证书上的主机记录保持一致,记录值也与证书上的记录值保持一致三、等待DNS验证与CA轮询,轮询成功后即可下载证书四、Jexus用到的是Nginx中的证书…

codeforces1437 E. Make It Increasing——最长上升子序列

E. Make It Increasing 首先让aiai−ia_ia_i-iai​ai​−i这样可以是严格单增变成单调增。 参考官方题解 首先不难得出如果我们根据不同修改的位置分割成若干段,那么若干段是互不影响的,我们只需要求出每一个若干段修改次数的最小值。 如果当前考虑l~r…

P4451-[国家集训队]整数的lqp拆分【生成函数,特征方程】

正题 题目链接:https://www.luogu.com.cn/problem/P4451 题目大意 给出nnn,对于所有满足∑i1main\sum_{i1}^ma_in∑i1m​ai​n且∀ai∈N\forall a_i\in N^∀ai​∈N的序列求 ∑m1∞∏i1mFbiai\sum_{m1}^{\infty}\prod_{i1}^mFbi_{a_i}m1∑∞​i1∏m​Fbiai​​ 其…

莫比乌斯反演+例题

参考1 参考2 参考3 问题引入&#xff1a; 入门题 给定N和M和D&#xff0c;求满足1<x<N,1<y<M且gcd(x,y)D的点对(x,y)的个数 1<N,M<1000000 莫比乌斯函数 μ μ(n) 1 , n1 μ(n) (-1)k, np1 * p2 * … * Pk &#xff08;x有奇数个质因子时为-1&#xff…

【线段树】Optimal Insertion(CF751E)

正题 CF751E 题目大意 给你一个数组a和一个集合b&#xff0c;现在让你把b中的数插入a&#xff0c;使得逆序对最少 解题思路 先计算a中的逆序对 对于b和a的逆序对&#xff0c;可以对数字进行排序&#xff0c;用线段树存下放每个位置的最小代价&#xff0c;然后直接求最小值 …

.net core通过多路复用实现单服务百万级别RPS吞吐

多路复用其实并不是什么新技术&#xff0c;它的作用是在一个通讯连接的基础上可以同时进行多个请求响应处理。对于网络通讯来其实不存在这一说法&#xff0c;因为网络层面只负责数据传输&#xff1b;由于上层应用协议的制订问题&#xff0c;导致了很多传统服务并不能支持多路复…

2020 China Collegiate Programming Contest Weihai Site补题部分

A. Golden Spirit 签到题&#xff0c;首先把所有老人带到对岸&#xff0c;然后在对休息讨论一下即可。 #define IO ios::sync_with_stdio(false);cin.tie();cout.tie(0) #pragma GCC optimize(2) #include<set> #include<map> #include<cmath> #include<…

P5110-块速递推【特征方程,分块】

正题 题目链接:https://www.luogu.com.cn/problem/P5110 题目大意 数列aaa满足 an233an−1666an−2,a00,a11a_n233a_{n-1}666a_{n-2},a_00,a_11an​233an−1​666an−2​,a0​0,a1​1 TTT组询问给出nnn求ana_nan​ 1≤T≤51071\leq T\leq 5\times 10^71≤T≤5107&#xff0c;…

I - Washing clothes

题意&#xff1a; 有n个人会在某时间段来洗衣服&#xff0c;但是只有一台洗衣机&#xff0c;当洗衣机被用时其他人只能手洗&#xff0c;手洗时间为y&#xff08;题目给定&#xff09;&#xff0c;洗衣机的时间为x&#xff0c;x∈[1,y]&#xff0c;问当x分别为[1,y]时&#xff…