R_handbook_基本函数

1 导入数据


# 导入数据
setwd("E:\\FOR_Study\\Daniel_File\\about_Study\\Junior\\Data_Science\\Data")
load("ch2_sample.RData")# 文件名读入
data <- read.table("v6.csv", header = T, sep = ",")

2 数据离散化


# 连续数据离散化
brks <-c (-1, -0.01, 2000, 6000, 10000, 20000, 50000, Inf)
labels <- c("Missing", "0-2000", "2000-6000", "6000-10000","10000-20000", "20000-50000", "above 50000")
dpus$WAGP.fix <- cut(dpus$WAGP.fix, breaks=brks, labels, include.lowest=T)x <- table(cut(HExer, c(-Inf, 7, 10, Inf)))# 按条件筛选记录
data <- subset(data,with(data,(bmi>=10)&(bmi<=133)&(age>=18)&(age<=150)&(glucose_max<=900)&(data$glucose_min<=900)&(tempc_min>=30)&(ph_min>=6)))

3 数据集划分


# 单次划分
set.seed(128767)
custdata_fix$gp <- runif(dim(custdata_fix)[1])
train_set <- subset(custdata_fix,custdata_fix$gp <= 0.9)
test_set <- subset(custdata_fix,custdata_fix$gp > 0.9)

4 常用函数


# ROC评价指标
library('ROCR')
calcAUC <-function(predcol,outcol) {perf <-performance(prediction(predcol,outcol==pos),'auc')as.numeric(perf@y.values)
}# 最大似然指标
loglikelihood<-function(y, py) {    pysmooth<-ifelse(py==0, 1e-12, ifelse(py==1, 1-1e-12, py))sum(y * log(pysmooth) + (1-y)*log(1 -pysmooth))   
}# 常见指标封装
accuracyMeasures<-function(pred, truth, name="model",value) {   dev.norm<--2*loglikelihood(as.numeric(truth), pred)/length(pred)ctable<-table(truth==1,pred=(pred>value))accuracy <-sum(diag(ctable))/sum(ctable)precision <-ctable[2,2]/sum(ctable[,2])recall <-ctable[2,2]/sum(ctable[2,])f1 <-2*precision*recall/(precision+recall)data.frame(model=name, accuracy=accuracy,precision=precision,recall=recall, f1=f1, dev.norm)  
}# roc曲线
library(ggplot2)
plotROC<-function(predcol,outcol) {perf<-performance(prediction(predcol,outcol==pos),'tpr','fpr')pf<-data.frame(FalsePositiveRate=perf@x.values[[1]],TruePositiveRate=perf@y.values[[1]])ggplot() + geom_line(data=pf,aes(x=FalsePositiveRate,y=TruePositiveRate)) +geom_line(aes(x=c(0,1),y=c(0,1)))
}

5 which函数

which能够帮助定位索引号,如返回当前列表中最大值对应的索引。

country[which(prob_age2030_god == max(prob_age2030_god))] 

如找列名对应的索引

which(names(data) == 'v225') 

6 group by函数


planes <- group_by(data_select, Market)
Market_category <- summarise(planes,         sum_sales = sum(Sales),sum_quantity = sum(Quantity),sum_profit = sum(Profit))     #求和
Market_category

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/587329.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java强软弱虚引用

面试&#xff1a; 1.强引用&#xff0c;软引用&#xff0c;弱引用&#xff0c;虚引用分别是什么&#xff1f; 2.软引用和弱引用适用的场景&#xff1f; 3.你知道弱引用的话&#xff0c;能谈谈WeakHashMap吗&#xff1f; 目录 一、Java引用 1、强引用&#xff08;默认支持模式…

MySQL中常用的用户授权操作

mysql 用户授权 1 &#xff09;概述 让每个应用程序&#xff0c;单独开一个mysql的用户权限所有mysql用户存储在 mysql库的user表中 2 ) 多种用户授权方式示例 show databases; use mysql;select user, authentication_string, host from mysql.user;-- 创建和删除用户 -- c…

浏览器强缓存和协商缓存

强缓存是什么&#xff1f; 强缓存是利用 http 的返回头中的 Expires 或者 Cache-Control 两个字段来控制的&#xff0c;用来表示资源的缓存时间 Expires 缓存过期时间&#xff0c;用来指定资源到期的时间&#xff0c;是服务器端的具体的时间点。也就是说&#xff0c;Expiresmax…

【C++】STL 容器 - multiset 容器 ( std::multiset 容器简介 | std::multiset 容器 常用操作 api 简介 )

文章目录 一、mulset 容器1、std::multiset 容器简介2、代码示例 - multiset 容器 二、std::multiset 容器 常用操作 api 简介1、常用 api 简介2、代码示例 - multiset 容器常用操作 一、mulset 容器 1、std::multiset 容器简介 在 C 语言 的 标准模板库 ( STL , Standard Temp…

数据库的学习笔记——第一篇

SQL通用语法 SQL语句 DDL 数据定义 数据库、表字段 DML 数据操作 增删改 DQL 数据查询 查询表中记录 DCL 数据控制 创建用户、控制用户权限 DLL语句——数据库操作 SHOW DATABASES; # 查询数据库SELECT DATABASE(); # 查询当前数据库CREATE DATABASE [IF …

【数据结构】六、树和二叉树

目录 一、树的基本概念 二、二叉树 2.1二叉树的性质 2.2二叉树的存储结构 2.3遍历二叉树 先序遍历 中序遍历 后序遍历 层次遍历 2.4二叉树的应用 计算叶子数 前序遍历建树 根据序列恢复二叉树 计算树的深度 判断完全二叉树 三、线索二叉树 3.1线索化 四、树和森林…

Scala知识点——App类

我们在代码中一般程序都是是通过main方法进入。但是在scala中提供了一个App类&#xff0c;通过继承可以实现不用显式的调用main方法就能运行。 App类中实现了main方法&#xff1a;

迪杰斯特拉(Dijkstra)算法详解

【专栏】数据结构复习之路 这篇文章来自上述专栏中的一篇文章的节选&#xff1a; 【数据结构复习之路】图&#xff08;严蔚敏版&#xff09;两万余字&超详细讲解 想了解更多图论的知识&#xff0c;可以去看看本专栏 Dijkstra 算法讲解&#xff1a; 迪杰斯特拉算法(Di…

前端基础(三十七):属性结构数据进行关键字筛选

效果 核心源码 type MenuItem {label: string;key: string | number;icon?: React.ReactNode;children?: MenuItem[];type?: group; }function filterTreeData(tree: MenuItem[], keyword: string): MenuItem[] {return tree.filter((node: MenuItem) > {if (node.labe…

SUMO Reward Points v29.8.0WooCommerce 奖励系统插件WORDPRESS积分奖励系统

SUMO Reward Points v29.8.0WooCommerce 奖励系统插件WORDPRESS积分奖励系统 SUMO 奖励积分&#xff1a;WooCommerce 的忠诚度解决方案 一、引言 SUMO 奖励积分&#xff0c;v29.8.0&#xff0c;是一个卓越的WooCommerce插件&#xff0c;致力于为电商提供一套完整的忠诚度奖励系…

matplotlib单变量和双变量可视化

使用seaborn 库的tips数据集&#xff0c;其中包含了某餐厅服务员收集的顾客付小费的相关数据&#xff08;评论区&#xff09; 单变量可视化 直方图 直方图是观察单个变量最常用的方法。这些值是经过"装箱"&#xff08;bin&#xff09;处理的 直方图会将数据分组后绘…

IntelliJ IDEA [插件 MybatisX] mapper和xml间跳转

文章目录 1. 安装插件2. 如何使用3. 主要功能总结 MybatisX 是一款为 IntelliJ IDEA 提供支持的 MyBatis 开发插件 它通过提供丰富的功能集&#xff0c;大大简化了 MyBatis XML 文件的编写、映射关系的可视化查看以及 SQL 语句的调试等操作。本文将介绍如何安装、配置和使用 In…

Spring AOP 中定义切入点 @target 与 @within 的区别

如题&#xff0c;区别概要如下&#xff1a; 1、target 仅匹配被设定注解标注的类&#xff0c;不包含其子类。 2、within 匹配被设定注解标注的类&#xff0c;以及它的所有子类。 例如&#xff1a; 如果 TestService 标记了MyAnnotation 注解&#xff0c;target 则只匹配该类…

B/S架构云端SaaS服务的医院云HIS系统源码,自主研发,支持电子病历4级

医院云HIS系统源码&#xff0c;自主研发&#xff0c;自主版权&#xff0c;电子病历病历4级 系统概述&#xff1a; 一款满足基层医院各类业务需要的云HIS系统。该系统能帮助基层医院完成日常各类业务&#xff0c;提供病患挂号支持、病患问诊、电子病历、开药发药、会员管理、统…

xpath里如何定义包含一个或多个class属性

xpath如何取包含多个class属性如果HTML结构是这样 <div class"test"></div> 那么我知道可以写xpath //div[class"test"]&#xff0c;但是如果我的html是 <div class"test demo"></div> <div class"demo test&qu…

Spring漏洞合集

目录 什么是spring区分Spring与Struts2框架的几种新方法CVE-2016-4977&#xff1a;Spring Security OAuth2 远程命令执行漏洞漏洞介绍 & 环境准备漏洞发现漏洞验证 & 利用1利用2 CVE-2017-4971&#xff1a;Pivotal Spring Web Flow 远程代码执行漏洞漏洞介绍 & 环境…

前端八股文(CSS篇)

目录 1.px和em的区别 2.介绍下BFC及其应用 3.介绍下粘性布局&#xff08;sticky&#xff09; 4.清除浮动的方法 5.如何用css或js实现多行文本溢出省略效果&#xff0c;考虑兼容 6.如何触发重排和重绘&#xff1f; 7.重绘与重排的区别&#xff1f; 8.说说两种盒模型以及区…

微服务(7)

目录 31.Ribbon和Feign调用服务的区别&#xff1f; 32.什么是SpringCloud Bus&#xff1f; 33.什么是SpringCloud Config? 34.分布式配置中心有哪些框架&#xff1f; 35.分布式配置中心的作用&#xff1f; 31.Ribbon和Feign调用服务的区别&#xff1f; 调用方式同&am…

MyBatis中#{}和${}的用法

一、例子 1、#{}将传入的数据当作一个字符串&#xff0c;会对传入的数据加上一个双引号。 比如&#xff1a; select * from student where student_name #{studentName}如果传入的值为zhangsan&#xff0c;那么经过Mybatis解析完成之后的语句是&#xff1a; select * from…

一次内核block层Multi queue报错IO QID timeout, reset controller案例分析

最近内核block层调试IO性能(磁盘nvme&#xff0c;IO调度算法bfq&#xff0c;内核版本centos 8.3&#xff0c;4.18.0-240)&#xff0c;启动fio压测一段时间后&#xff0c;就发现fio莫名其妙会卡死了。一看内核日志&#xff0c;有如下异常打印 nvme nvme1: I/O 61 QID 5 timeout…