乐飞天下python笔试题_滴滴2020年春招笔试题分析(Python)

数据背景来自:优梨:滴滴2020年春招Sql笔试题分析​zhuanlan.zhihu.com

这里就不再重复了,主要描述如何使用python数据清洗

问题:

1.订单的平均应答率是多少?完单率是多少?

2.每个订单的平均应答时间是多少?

3.从这一周的时间来看,呼叫次数最多的时间是几点(当地时间),最少的随时间是几点(当地时间)

4.客户留存的情况:呼叫订单第二天继续呼叫的比例是多少?

数据清洗

1.首先导入文件

import pandas as pd

x1=pd.read_csv('C:/Users/LENOVO/Desktop/didi.csv')

2.为方便理解查询将列名改成中文

smallDic={'order_id':'订单号','passenger_id':'乘客号','call_time':'呼叫时间',

'grab_time':'应答时间','cancel_time':'取消时间','finish_time':'完成时间'}

x1.rename(columns=smallDic,inplace=True)

x1.head()

3.缺失数据处理

x1.shape

x2=x1.dropna(subset=['订单号','乘客号'],how='any')

x2.shape并没有缺失的数据

4.统一处理为巴西时间

import datetime

def time_add(x):

list=[]

for i in x:

sdate = datetime.datetime.strptime(i,'%Y/%m/%d %H:%M')

delta11 = datetime.timedelta(hours=11) #巴西时间比国内慢11小时

edate = sdate - delta11

list.append(edate)

pd1=pd.Series(list)

return pd1

t=x2.loc[:,'应答时间']

t1=x2.loc[:,'呼叫时间']

t2=x2.loc[:,'取消时间']

t3=x2.loc[:,'完成时间']

x2.loc[:,'应答时间']=time_add(t)

x2.loc[:,'呼叫时间']=time_add(t1)

x2.loc[:,'取消时间']=time_add(t2)

x2.loc[:,'完成时间']=time_add(t3)

x2.head()

5.对呼叫时间进行处理,分为呼叫日期和呼叫时刻

x2.loc[:,'呼叫时间']=x2.loc[:,'呼叫时间'].astype('str')

def time_spilt(x):

list=[]

for i in x:

date=i.split(" ")[0]

list.append(date)

pd1=pd.Series(list)

return pd1

date1=x2.loc[:,'呼叫时间']

x2['呼叫日期']=time_spilt(date1)

def hour_spilt(x):

list=[]

for i in x:

date=i.split(" ")[1]

hour=date.split(":")[0]

list.append(hour)

pd1=pd.Series(list)

return pd1

date1=x2.loc[:,'呼叫时间']

x2['呼叫时刻']=hour_spilt(date1)

x2.head()

6.呼叫日期中可能还会有空值,因此再次处理一下

x2.loc[:,'呼叫时间']=pd.to_datetime(x2.loc[:,'呼叫时间'],

format='%Y/%m/%d %H:%M',

errors='coerce' #表示不符合格式要求时转化成空值

)

clearData=x2.dropna(subset=['呼叫时间'],how='any')

#行数就代表总的呼叫订单数

call_O=clearData.shape[0]

7.对时间进行排序

#对时间进行排序

clearData=clearData.sort_values(by=['呼叫时间'],ascending=True)

clearData=clearData.reset_index(drop=True) #重新修改索引值

clearData.head()

构建模型

#构建模型 应答率=应答订单/呼叫订单 多条件筛选

judge1=(clearData.loc[:,'应答时间']>'2018-3-5') & (clearData.loc[:,'应答时间']

clearData1=clearData.loc[judge1,:]

grab_O=clearData1.shape[0]

grab_rate=grab_O/call_O

grab_rate应答率72.39%

#完成率也是一样的算法 完成订单/呼叫订单

judge2=(clearData.loc[:,'完成时间']>'2018-3-5') & (clearData.loc[:,'完成时间']

clearData2=clearData.loc[judge2,:]

finish_O=clearData2.shape[0]

finish_R=finish_O/call_O

finish_R完成率47.14%

#最多呼叫次数计算

call_Num=clearData.groupby('呼叫时刻').agg({'订单号':'count'})

max_time=call_Num.max()

p,d=call_Num.stack().idxmax()

print(p,max_time)表示最多的是18点,40笔

min_time=call_Num.min()

p1,d1=call_Num.stack().idxmin()

print(p1,min_time)最少的为2点,只有1笔

将结果在图上绘制出来峰值为18点此后开始大幅下降,而凌晨2-4点这段时间呼叫次数很低

from datetime import timedelta

data=clearData.loc[:,['呼叫日期','乘客号']]

data.loc[:,'呼叫日期']=pd.to_datetime(data.loc[:,'呼叫日期'],format='%Y-%m-%d')

data.dtypes为了后面更好的计算,需要转换日期格式

include_time=pd.Series(data.呼叫日期.unique()).sort_values()[:-1]

list=[]

for i in include_time:

first_user=set(data[data.呼叫日期==i].乘客号.unique())

add_day=datetime.timedelta(days=1)

s=i+add_day

second_user=set(data[data.呼叫日期==s].乘客号.unique())

a=0

for user in first_user:

for user1 in second_user:

if user==user1:

a=a+1

continue

rencent_rate=a/len(first_user)

print(i,rencent_rate)

python基础数据分析学习:优梨:Python数据分析工具入门:Numpy/Pandas​zhuanlan.zhihu.com

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/574221.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

(转自http://www.blogjava.net/moxie/archive/2006/10/20/76375.html)WebWork深入浅出

(转自http://www.blogjava.net/moxie/archive/2006/10/20/76375.html) WebWork深入浅出 本文发表于《开源大本营》 作者:钱安川 前言 本篇文章并没有太多WebWork 的实战代码细节。本人非常希望能充当一名导游的角色,带…

南京江南贡院值得去吗_这12个地方是一种瘾,值得一去再去,有你想要去的吗?...

有人说,旅行就是从一个自己呆腻了的地方,到别人呆腻了的地方去。但大家有没有发现,去过许多地方,看过那么多风景,总有一些地方,第一次初识,第二次上瘾,第三第四次还去不腻&#xff1…

每天至少保证4个小时在学习知识

每天至少保证4个小时在学习知识转载于:https://www.cnblogs.com/ssjie/p/4929596.html

计算机学院运动会通讯稿,2021大学运动会通讯稿篇

《2021大学运动会通讯稿篇》由会员分享,可在线阅读,更多相关《2021大学运动会通讯稿篇(11页珍藏版)》请在装配图网上搜索。1、大学运动会通讯稿10篇年夜教活动会通信稿10篇年夜教活动会通信稿1咱们为您叫嚣,但愿给您力气给您疑心,…

Delphi获得计算机系统配置,用Delphi获取本地计算机名称和IP地址

下载本文示例代码本程序介绍如何获取本地计算机的名称和IP地址。   向窗体上添加两个TLabel组件、两个TEdit组件和一个TButton组件,设计完成的主界面如图1所示。图1 主界面  首先在程序的uses段中添加对WinSock的引用,然后添加一个GetHostName自定义…

vue 执行函数this_在vue中使用回调函数,this调用无效的解决

let self this //使用新变量替换this,以免this无效//updatestudentinfotoserver是一个将本身部分数据异步上传的接口,接收三个参数,其中第一个是数据,第二、三个是函数,第二、三个函数使用function(){}形式书写update…

ECMall2.x模板制作入门系列之2(模板标签/语法)

ECMall2.x模板制作入门系列之2(模板标签/语法)今天给大家带来一个模板语法的教程。希望能为ECMall模板制作者提供一份参考资料。如有问题、建议和意见,欢迎提出。在ECMall模板中,用"{"开头,以"}"结…

win10运行vue项目_vue+webpack在window10环境下搭建及遇到的问题

首先我搭建vuewebpackvue-strapvue-routesass时,我用的是直接在项目中的package.json中的“devDependencies”直接将直接需要的一些插件写上。然后用“npm install”的方式。1、首先你要安装好nodejs。2、新建项目,在新建的项目vue中打开输入&#xff1a…

计算机教师专业发展规划,信息技术教师成长规划_信息技术教师专业成长浅谈...

科技日新月异,网络技术发展一日千里。信息技术教师责任重大,只有不断加强理论学习,在教学中勤于实践,才能跟上时代发展步伐。笔者结合自己的教学实践,谈几点认识与体会。  一、在理论学习中成长理论是指导我们教学行…

javascript设计模式-学习笔记

1.javascript模块模式 Module 模式最初被定义为传统软件工程为类解决私有和公有的方法. var M (function(){var q0;return {value:q} })()引入全局变量jquery var M (function($){var q$.trim(111);return {value:q} })(jQuery)引出 var M (function(){var q0;obj {value:q…

ipv6地址为什么显示两个_【聚焦】IPv6进行时,别被这些因素绊住脚

智慧宇易精挑细选2020年5933篇不能仅仅为了支持IPv6而使用IPv6,如何利用IPv6解决现实问题尤其重要。创新网络服务、应用服务、数据服务,可能是发展IPv6最重要的一个策略。11月15日,在第二届中国互联网基础资源大会上,IPv6被多位专…

HttpResponse 类

而封闭HTTP输出信息的类型就是HttpResponse类,使用HttpResponse类可以实现三种类型的输出,即文本,URL,二进制流. 实现这三类的属性和方法分别介绍如下:1.文本的输出,在日常开发中,后台中的文本可能需要输出到浏览器中,让用户浏览,这就需要实现动态HTML的输出,使用HttpResponse…

量子计算机迷宫,一个简单的例子,带你读懂量子计算机

原标题:一个简单的例子,带你读懂量子计算机量子计算机和你的笔记本电脑在本质上是一样的,使用的都是二进制编码。计算机语言只用0和1来表达,这被称为“位”,是计算机信息量最小的单位。计算机的工作,就是把…

各种门锁的内部结构图_便宜超好用:小米智能门锁 E上手体验报告

「真正的科技,是让你感受不到科技的存在」随着科技的日益飞速发展,科技改变着我们生活的方方面面,如今的我们出门必备的是手机,地铁、公交、日常消费、进出小区也逐渐使用手机或手环;2020年的当下钥匙已经变得不那么重要&#xff…

Unity3d通用工具类之定时触发器

时隔多日,好不容易挤出点时间来写写博文。不容易,请送我几朵红花,点个赞也行。 今天呢,我们主要来扩展下通用工具类>定时触发器。 顾名思义,所谓的定时触发器,就是告诉程序在过多长时间后,我…

北海计算机职称考试地点,【2017年广西北海职称计算机考试报名时间9月1日-5日】- 环球网校...

【摘要】环球网校提醒大家2017年广西北海职称计算机考试报名时间9月1日-5日以下介绍了北海职称计算机考试报名时间、准考证打印时间、考试时间等,希望对大家有帮助更多资料敬请关注环球职称计算机考试频道,【摘要】环球网校提醒大家“2017年广西北海职称…

disp语句怎么格式 matlab_Matlab使用技巧总结-1

抽空看了Matlab官方文档,并配合郭老师的课程,把Matlab语言系统梳理了一遍。先上资源:bilibili良心搬运大法:MATLAB_台大郭彦甫-视频教程知乎盐选推荐基础教程:MATLAB 2016_基础实例教程以下记录了一些matlab的技巧。【…

采用CXF+spring+restful创建一个web接口项目

这篇文章是http://blog.csdn.net/zxnlmj/article/details/28880303下面,加入的基础上的restful特征 1、参加restful必jar包裹 jsr311-api-1.0.jarCXF与JAX-RS版本号相应问题,參考自:http://bioubiou.iteye.com/blog/1866871 CXF支持REST风格的Web服务&am…

计算机结构介绍,计算机系统结构介绍.pdf

第三次作业5.7 一条线性流水线由4 个功能段组成,每个功能段的延迟时间都相等,都为 。开始5t个 ,每间隔一个 向流水线输入一个任务,然后停顿2 个 ,如此重复。求流水t t t线的实际吞吐率、加速比和效率。(10 分)…

古风一棵桃花树简笔画_为什么,很多农村家庭的院子里,会喜欢种一棵樱桃树呢?...

小伙伴们去农村的时候,应该都会注意到几乎每家每户的院子里都会种有几棵树吧。如果小伙伴们认真观察的话,你们可以发现很多农村家庭的院子里都有种一两棵樱桃树。那么这是为什么呢?是因为樱桃比较好吃吗?是有这个原因的&#xff0…