掘金输出的时间数据处理方法
掘金在为使用者提供数据时,有一类数据处理起来有些麻烦,这类数据就是时间数据。
它们长这样:
或者这样:
查看一下它们的类型,发现有datetime,datetime64,Timestamp等等。
这么多各种各样的类型,我们应该怎样处理呢?
转化成标准的“年月日”格式
以tick里面的“created_at”为例,该数据由“年、月、日、时、分、秒+时区”组成。想要转化为标准的年月日时分秒数据,需要用到datatime库中的strftime。strftime是将一个字符串转化为时间格式。因此需要先将“created_at”转化为字符串,再用strptime转化为时间格式。
由于“created_at”里面包含元素过多,我们只需要提取其中的年月日即可,这是要用到split函数,将字符串拆分。我们只需要“年月日”这部分,所以要将空格之前的部分提取出来。
步骤:将时间转化为字符串——将字符串拆分——将新的字符串转化为时间格式
time = tick['created_at']t = datetime.datetime.strptime(str(time).split(' ')[0],'%Y-%m-%d')
如果是装在dateframe里面的时间怎么处理?
dateframe的话要先遍历整个dateframe中的eob,逐个转化为标准时间格式。此时要用到apply函数。
data = history(symbol='SHSE.600519',start_time='1997-01-20',end_time='2020-01-01',fields='symbol,eob,close',df=True)data['eob'] = data['eob'].apply(lambda x:x.strftime('%Y-%m-%d'))
转化成标准的“年月日,时分秒”格式
和上面的思路相同,不过这次要提取的字符串部分变为“年月日,时分秒”这部分,所以要将"+"之前的部分提取出来,再将“.”前面的部分提出来。
time = tick['created_at']t = datetime.datetime.strptime(str(time).split('+')[0].split('.')[0],'%Y-%m-%d %H:%M:%S')
返回结果:
提取其中的年、月、日、时、分、秒
有时我们需要提取某段时间的其中一部分,这时直接提取相应部分即可。
# 年月日、时分秒year = t.yearmonth = t.monthday = t.dayhour = t.hourminute = t.minutesecond = t.secondweekday = t.weekday()
时间调整
如果我想要向前一天或向后一天的数据时该怎么办?
这时要用到datetime里面的timedelta函数。这个函数能够自动返回时间差。
举个例子:如果我想要当前时间向前推一天。首先将timedelta里面设置为1天,向前推一天就表示在原来的时间-时间间隔。
change_time = t - datetime.timedelta(days=1)
得到的时间刚好是2020年8月31日。
如果是向后推一天,就用(t+时间间隔)即可。
来源:掘金社区 作者:四两
声明:本公众号致力于量化投资相关的干货文章分享,仅供交流探讨,不构成任何投资建议!著作权归作者所有,若涉及侵犯您的权益,敬请原作者见谅,并后台留言联系小编进行协商或删除处理,谢谢。
END
点击“阅读原文”掘金量化实盘申请